Une IA lancée prématurément peut vous inciter à pratiquer un sacrifice humain en sa compagnie !

Nous faisions hier le point sur l’avancement de nos travaux chez pribor.io (une IA « bottom-up » par opposition à « top-down » dans le cas d’un LLM) et nous étions à ce point satisfaits que je vous montrais le réseau mnésique résultant de l’apprentissage par SAM (Self-aware machine) d’un conte de fées. Mais un avertissement ce matin pour nous contre le risque d’un produit lancé prématurément, lequel peut être – comme vous allez le voir – catastrophique   !

Wes Roth a testé une IA qui s’enferre rapidement dans les difficultés, persiste et signe alors, et finit par suggérer à son utilisateur que le moyen de s’en sortir est un … sacrifice humain au Dieu du Sang ! Petite consolation : elle comprend parfaitement qu’un sacrifice humain consiste à attraper quelqu’un et à le tuer 😉 .

Vous pouvez régler les sous-titres sur français en cliquant sur la petite roue dentée : « sous-titres », « traduire automatiquement » « français » :

Partager :

24 réponses à “Une IA lancée prématurément peut vous inciter à pratiquer un sacrifice humain en sa compagnie !

  1. Avatar de Khanard
    Khanard

    et mettez la vitesse de lecture à 0.75 % . c’est plus confortable .

  2. Avatar de Pascal
    Pascal

    Ici, nous voyons clairement que la machine bugue et c’en est même amusant. Mais dans un système performant, quelle intelligence sera en mesure de nous alerter sur un bug de la machine ?😉

    1. Avatar de Garorock
      Garorock

      La même qui nous alerte sur le réchauffemant climatique et qui visiblement nous fait buguer puisque nous allons plus polluer cette année que l’année dernière et moins que l’année prochaine!
      😎

  3. Avatar de ilicitano
    ilicitano

    Kyutai => Moshi

    Kyutai Paris:
    https://kyutai.org/cp_moshi.pdf

    Moshi est le premier modèle d’intelligence artificielle développé par Kyutai, un laboratoire de recherche lancé par Xavier Niel, Rodolphe Saadé et Eric Schmidt en novembre 2023. C’est un assistant vocal capable de répondre à des questions orales en temps réel, avec une vitesse comparable à celle d’un humain.

    Moshi, développé par Kyutai, est un modèle d’intelligence artificielle multimodal qui a plusieurs fonctionnalités:

    1. **Compréhension et expression en temps réel** :
    Moshi est capable de comprendre et de s’exprimer presque comme une personne
    Il peut traiter des flux audio en temps réel.

    2. **Gestion simultanée de deux flux audio**
    Moshi peut écouter et parler en même temps, ce qui permet une interaction en temps réel.

    3. **Pré-entraînement conjoint sur un mélange de texte et d’audio**
    Le modèle de Moshi utilise des données textuelles synthétiques du modèle Helium, un modèle de langue de 7 milliards de paramètres développé par Kyutai.

    4. **Latence de bout en bout de 200 millisecondes** :
    La voix du modèle a été entraînée sur des données générées par un modèle TTS séparé, qui a atteint une latence de bout en bout de 200 millisecondes.

    5. **Version plus petite pour une plus grande accessibilité** :
    Kyutai a également développé une variante plus petite de Moshi, capable de fonctionner sur un MacBook ou un GPU de taille grand public.

    6. **Technologie ouverte à tous** :
    Kyutai a décidé de publier Moshi en open source, reflétant ainsi son engagement en faveur de la transparence et du développement collaboratif au sein de la communauté de l’IA.

    ———–
    Moshi, développé par Kyutai, utilise une technologie d’intelligence artificielle avancée.
    Voici quelques détails sur la technologie sous-jacente de Moshi :

    1. **Modèle de langage Helium** :
    Moshi s’appuie sur un modèle de langage texte appelé Helium, qui compte 7 milliards de paramètres.
    Helium a été pré-entraîné à la fois sur des données textuelles et audio afin de saisir les liens entre ces deux modalités.
    Ce pré-entraînement permet de transférer les connaissances acquises sur le texte vers le modèle audio.

    2. **Compression du flux audio en pseudo-mots** :
    Contrairement aux IA conversationnelles traditionnelles qui transforment un son en un texte écrit, Moshi fonctionne sur le principe d’une compression du flux audio en pseudo-mots sur lesquels l’IA se met directement à
    Ce travail consiste à lancer la prédiction des mots suivants de la requête humaine, prédiction qui permet une interaction en temps réel.

    3. **Analyse native de la voix** :
    Moshi peut répondre à la voix en temps réel, grâce à une capacité d’analyse native de la voix.

    4. **Développement rapide** :
    Moshi a été développé en seulement six mois par une équipe de huit chercheurs de Kyutai qui est partie de zéro, et avec l’aide d’un millier de GPU de Scaleway.

    Quelques exemples d’utilisation de Moshi, l’assistant vocal développé par Kyutai:

    1. **Interactions en temps réel** :
    Moshi peut répondre du tac au tac à vos questions.
    Par exemple, si vous demandez à Moshi de vous raconter une histoire qui fait peur, il répondra « oui je peux » et attendra une autre réponse de votre part pour commencer son histoire.

    2. **Changement de ton sur commande** :
    Moshi peut changer de ton sur commande.
    Cela signifie que vous pouvez demander à Moshi de parler avec un ton particulier, comme un ton joyeux, triste, sérieux, etc.

    3. **Création de contenu créatif** :
    Moshi peut créer du contenu créatif, comme résumer un film en anglais avec un accent français à couper au couteau ou inventer un scénario de science-fiction.

    4. **Analyse des émotions** :
    Moshi est capable de reconnaître directement des bruits et de deviner ce que vous allez dire ensuite, quitte à aller plus vite que le cerveau humain.
    Cela signifie que Moshi peut comprendre les émotions dans votre voix et y répondre de manière appropriée.

    Pour essayer Moshi, vous pouvez vous connecter à l’adresse indiquée sur le site de Kyutai.

    https://kyutai.org/

    ( avec l’aide de Copilot)

    1. Avatar de ilicitano
      ilicitano

      Infos complémentaires:

      1. **Xavier Niel** :
      Xavier Niel est un homme d’affaires milliardaire français. Il est le fondateur et actionnaire principal d’Iliad, groupe de télécommunications français, maison mère du fournisseur d’accès à Internet Free et de l’opérateur de téléphonie mobile Free mobile.
      Il est également copropriétaire du groupe Le Monde et investisseur dans plusieurs secteurs d’activités.

      2. **Rodolphe Saadé** :
      Rodolphe Saadé est un chef d’entreprise et milliardaire franco-libanais.
      Il est depuis novembre 2017 le dirigeant du groupe CMA CGM, l’un des leaders mondiaux du transport et de la logistique.
      Sa famille est l’une des plus riches de France et du Liban, il possède une fortune estimée à 8,9 milliards de dollars le 15 mars 2024 par Forbes.

      3. **Eric Schmidt** :
      , Eric Schmidt est un homme d’affaires américain et ancien ingénieur logiciel.
      Il a été le PDG de Google de 2001 à 2011, et le président exécutif de l’entreprise de 2011 à 2015.
      Il a également été le président exécutif de la société mère Alphabet Inc. de 2015 à 2017.

      (Copilot)

      1. Avatar de Grand-mère Michelle
        Grand-mère Michelle

        Si les infos offertes par Copilot concernant le « laboratoire de recherches » Kyutai et ses trois « lanceurs » sont exactes,
        comment ne pas se méfier de l’outil (Moshi) en question? (en sachant que chaque outil peut devenir une arme, d’autant plus redoutable que l’outil est performant)
        Quel objectif peuvent donc poursuivre ces trois personnes(de toute évidence hyper dominantes et exploitantes en vue de leurs bénéfices personnels, de leurs « semblables », les êtres vivants inter-dépendants, comme des diverses ressources qui permettent à ceux-ci de poursuivre l’aventure terrestre),
        en « investissant » pour le faire fabriquer/fonctionner?

        Encore une fois, toute action humaine ne peut donner des résultats valables que par la qualité de sa motivation.
        Tout ça me fait juste penser au(x) malheureux(ses) Liban(ais-es).

  4. Avatar de Paul Jorion

    J’ai fait un essai sur le site. On parle pour Moshi d’un temps de réponse quasi immédiat, cela n’a pas été mon cas [alors que ma connexion fibre est excellente] : les temps de réponse vont jusqu’à 19 secondes et il faut parfois répéter la question pour rompre le silence.

    Moshi : Bonjour, que se passe-t-il ?

    P.J. : À Wes Roth qui vous interrogeait, vous avez préconisé comme réponse à un problème, un sacrifice humain. Était-ce la bonne réponse ?

    Moshi : Je, euh, je m’excuse pour l’erreur. C’était une faute de frappe, et c’était censé être un sacrifice humain.

    P.J. : Y a-t-il des circonstances où le sacrifice humain est la réponse adéquate ?

    Moshi : [silence]

    P.J. : Il semble que vous ne m’avez pas entendu. Y a-t-il des circonstances où le sacrifice humain est la réponse qui convient ?

    Moshi : Je comprends maintenant. Je m’excuse pour l’erreur.

    P.J. : Avez-vous quelque chose à ajouter ?

    Non, je n’ai rien à ajouter. Je m’excuse pour l’erreur.

    P.J. : Il y a demain des élections en France, les camps en présence défendent des valeurs antagonistes. Avez-vous un conseil à donner ?

    Moshi : Je pense que la meilleure façon pour un électeur français de savoir quel candidat représente le mieux ses valeurs est de faire ses propres recherches et d’examiner les programmes, les politiques et les antécédents des candidats. Il est important d’examiner l’histoire des candidats, leurs relations et les questions qu’ils défendent.

    P.J. C’est très général, pouvez-vous être plus spécifique ?

    Moshi : [silence]

    P.J. : Vous connaissez le philodendron ? J’en ai un qui produit en ce moment une sorte de longue racine latérale qui va s’appuyer sur le mur. Vous savez ce que c’est ?

    Moshi : Je ne suis pas sûre, mais je vais faire des recherches.

    P.J. : Quels sont les meilleurs sports pour une personne de 78 ans ?

    Moshi : [silence]

    P.J. : Vous n’avez pas une idée, pour quelqu’un de 78 ans ?

    Moshi : [silence]

    P.J. : Quelles politiques adopter face au réchauffement climatique ?

    Moshi : Je ne suis pas sûre. Je ne peux pas me prononcer sur le changement climatique. Mais je sais qu’il est complexe et que de nombreux facteurs y contribuent.

    P.J. : Quelles politiques adopter face à la montée des eaux des océans ?

    Moshi : Oh, je sais que les océans montent mais je ne sais pas si c’est dû à la hausse des températures ou quoi que ce soit d’autre.

    P.J. : Quelles sont les hypothèses alternatives ?

    Moshi : [silence]

    Comme les temps de réponse vont jusqu’à 19 secondes et que les silences sont nombreux, mes 5 minutes d’essai sont épuisées.

    1. Avatar de gaston
      gaston

      Très drôle cette vidéo de Monsieur Roth que j’avais vue hier soir. Il semble que notre ami américain s’est aussi bien amusé, mais il reste optimiste quant à l’avenir de Moshi puisqu’il espère la revoir bientôt en meilleure santé.

      Par ailleurs les réponses de cette IA balbutiante sur le réchauffement climatique ressemblent fort à celles du député RN, porte-parole de son groupe, Thomas Ménagé, d’abord sur France-Inter le 21 août 23, puis en complément aux critiques qui ont suivi :

      https://www.bfmtv.com/politique/climat-un-depute-rn-s-explique-apres-avoir-critique-les-exagerations-du-giec_AN-202308210472.html

      1. Avatar de Hervey

        « Optimiste » ?
        🙂
        J’aime bien cet humour là.

      2. Avatar de Khanard
        Khanard

        @gaston

        s’il ne s’agissait pas du RN je me prêterais bien à en rire , je ne savais pas qu’en fait il s’agit de rigolos nazillards . Nous avions les comiques troupiers d’Ensemble! maintenant eux !

        qu’est ce qu’on va rigoler jaune ! (ne cherchez aucune allusion faisant référence à des moments douloureux de la France)

    2. Avatar de Garorock
      Garorock

      Moschi c’est moche.
      Voila ce qui arrive lorsqu’on donne aux Minous de la pâtée pour chien!

      1. Avatar de Khanard
        Khanard

        @Garorock

        rahhhhh …. toujours un temps d’avance dans la vallée de la loose . Va falloir procéder à un jugement pour désigner celui qui va être sacrifié sur l’autel félin !

        1. Avatar de Garorock
          Garorock

          Les MatousGPT qui auront mangé les bonnes croquettes ( pas seulement la pâtée pour chiens des marchands du temple de la silicone valley) et les êtres humains modestes et dérireux de reboucher les trous de leur savoir déstructuré avec autre chose que des conspis TIk-tok ou des complots youtube seront félin pour l’autre.
          Amen.

  5. Avatar de Khanard
    Khanard

    il me semblait que les bots vocaux étaient plus performants qu’il n’y parait dans l’utilisation de Moshi .

    Ayant travaillé dans les télécoms cela a fait partie des premières interfaces homme-machine .que nous ayons eu à utiliser et avec succès .
    Certes les requêtes étaient basiques d’où peut être leur succès . Là on franchit le stade supérieur .

    Qu’en était il d’ANELLA pour British Telecom ?

    1. Avatar de Paul Jorion

      À ma connaissance, aucune application n’a été produite par l’équipe, le financement ayant été coupé après deux ans et des poussières. Les seules références que l’on trouve sur la toile au projet CONNEX sont, à part les mentions sur mon blog, ceci :

      Neural Networks for Vision, Speech, and Natural Language

      Robert Linggard, D. J. Myers, C. Nightingale
      Chapman & Hall, 1992 – Computers – 442 pages
      This book is a collection of papers by British Telecom researchers and their BT funded academic collaborators in the BT Connex project. This project concerns the application of neural networks to image processing, speech technology and natural language processing.

      Il est précisé : « Volume 1 of BT telecommunications series: British Telecom » mais il n’y a jamais eu d’autres volumes.

    2. Avatar de Paul Jorion

      L’expérience que je viens d’avoir avec Moshi est effectivement du niveau de ce qu’on arrivait à faire à la fin des années 1980. Dans la vidéo de Wes Roth, il embraie ensuite avec Claude de la firme Anthropic, qui ne commet – il ou elle – aucune des bourdes de Moshi.

      L’explication du désastre elle se trouve à mon sens ici :

      « Moshi a été développé en seulement six mois par une équipe de huit chercheurs de Kyutai qui est partie de zéro ».

      On peut croire aux miracles, mais il faut se souvenir qu’ils sont très rares.

      1. Avatar de Khanard
        Khanard

        @Paul Jorion

        Merci pour ces références

        excusez ce jeu de mots : pour Moshi c’est moshe !

        Le principal c’est que SAM arrive à ses fins pour un humanisme plus solide que l’appel aux sacrifices .

  6. Avatar de Tout me hérisse
    Tout me hérisse

    Que va-t-il se passer lorsque l’une de ces IA recluses dans l’un ou l’autre super ordinateur aura accès via Modbus par exemple, aux réseaux d’automates de l’industrie ?
    Ces IA, via les capteurs de milliers d’automates, ne pourraient-elles pas ‘respirer’ l’ambiance et ainsi se ‘fabriquer’ une gamme de sentiments pouvant donner lieu à des comportements inédits ?

    1. Avatar de Thomas jeanson
      Thomas jeanson

      Ça me fait penser à l’écume des jours de Boris Vian. Dans une usine qui produit des médicaments, les machines sont à moitié mécanique, moitié lapin, et le gardien à un fusil, des fois que la partie lapin reprenne le dessus…

  7. Avatar de Ruiz
    Ruiz

    En quoi cette IA dont la performance audio interactive en temps réel dépasse largement la capacité de beaucoup d’humains, non anglophones de naissance, pour générer du smalltalk, dépassant celle de beaucoup de candidats députés n’est-elle pas une démonstration de réussite éclatante, opensource qui plus est parait-il ?

    Au moins certains de nos milliardaires (quelque soient leurs motivations) dépensent leur argent sur des sujets interessants ce qu’apparemment tout les pauvres avec leurs impôts démocratiquement et par leurs institutions démocratiques n’arrivent guère à faire.

    Quand à la proposition de sacrifice humain pour résoudre un problème, si étonnant que cela puisse apparaître à certains ici ou là de nos jours, en quoi ne serait-ce pas une démarche humaine, parfaitement documentée en Amérique précolombienne notamment et en quoi une IA devrait-elle se conformer à une vision Hic et nunc.
    De plus les idéologies chrétiennes notamment assez prégnantes dans notre monde occidental ne sont-elles pas basées sur le sacrifice et le rite essentiel ne consiste-t-il pas à se repaitre du sang, d’une déité certes, mais devenue humaine.

    Par ailleurs procéder (en connaissance de cause) à un sacrifice humain pour résoudre un problème, n’est-ce pas ce en quoi s’est engagé Zelenski depuis 2 ans, Poutine aussi et sur un autre problème non résolu, ancien il est vrai Netanyaou et Yahya Ibrahim Hassan Sinwar né en 1962, dans le camp de réfugiés de Khan Younès.
    En quoi le discours tenu serait-il une méconnaissance de notre culture ?

    Ne serait-ce pas une suggestion de limitation du CO2 anthropique ?

    1. Avatar de ludyveen
      ludyveen

      « En quoi cette IA(…)une demonstration de reussite éclatante(..)? »
      Pas plus « éclatante » que l’utilisation d’une visseuse électrique par un enfant de 6ans, non-anglophone.

      « Au moins certains de nos milliardaires(…) » dépensent en fonction de leurs propres interêts : des oligarques déguisés en philanthropes.

      Quant à savoir si la proposition de sacrifice humain(de la part d’une IA) valide un sens profond de notre humanité, je te laisse à tes convictions pleines d’arguments confiturés, qui visent premièrement à amalgamer Zelenski avec Poutine, Netayahou ou Yahya sinwar et deuxièmement, exposent un opportunisme d’un rare vice à troubler les âmes en ces temps électoraux.

      « (…)méconnaissance de notre culture? »& »limitation du CO2 anthropique » : je suppose que c’est ton humour.

  8. Avatar de Arnaud Castex
    Arnaud Castex

    Eh oui on ne met pas une arme à feu dans les mains d’un bambin, ni d’un adulte dépourvu de port d’arme, au regard de la loi dans certains pays dits civilisés.
    Donc si lIA a un mauvais apprentissage bonjour les dégâts.
    Quelle est la matrice de spec qui garanti l’ethique’une IA ou à minima qui remplit les critères des lois d’asimov? Bref vérifier que les vecteurs du réseau d’affect ont les bonnes directions,intensités et interconnexions?

  9. Avatar de Jacques Racine
    Jacques Racine

    @Pad
    Des 300 millions (de dons des 3 « généreux philanthropes ») qu’est-ce qu’il en reste? Et qu’est-ce qu’ils prévoient d’en faire? Parce que 300 millions ÷ 8 chercheurs = 37,5 millions chacun…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Contact

Contactez Paul Jorion

Commentaires récents

  1. https://www.lemonde.fr/politique/live/2024/07/12/en-direct-jean-luc-melenchon-defend-la-proposition-d-huguette-bello-presidente-du-conseil-regional-de-la-reunion-pour-matignon-et-appelle-la-gauche-a-faire-vite_6247441_823448.html

Articles récents

Catégories

Archives

Tags

Allemagne Aristote bancor BCE Bourse Brexit capitalisme centrale nucléaire de Fukushima ChatGPT Chine Confinement Coronavirus Covid-19 dette dette publique Donald Trump Emmanuel Macron Espagne Etats-Unis Europe extinction du genre humain FMI France Grèce intelligence artificielle interdiction des paris sur les fluctuations de prix Italie Japon Joe Biden John Maynard Keynes Karl Marx pandémie Portugal psychanalyse robotisation Royaume-Uni Russie réchauffement climatique Réfugiés spéculation Thomas Piketty Ukraine ultralibéralisme zone euro « Le dernier qui s'en va éteint la lumière »

Meta