Une IA lancée prématurément peut vous inciter à pratiquer un sacrifice humain en sa compagnie !

Une IA lancée prématurément peut vous inciter à pratiquer un sacrifice humain en sa compagnie !

06 juillet 2024 11h32

Nous faisions hier le point sur l’avancement de nos travaux chez pribor.io (une IA « bottom-up » par opposition à « top-down » dans le cas d’un LLM) et nous étions à ce point satisfaits que je vous montrais le réseau mnésique résultant de l’apprentissage par SAM (Self-aware machine) d’un conte de fées. Mais un avertissement ce matin pour nous contre le risque d’un produit lancé prématurément, lequel peut être – comme vous allez le voir – catastrophique !

Wes Roth a testé une IA qui s’enferre rapidement dans les difficultés, persiste et signe alors, et finit par suggérer à son utilisateur que le moyen de s’en sortir est un … sacrifice humain au Dieu du Sang ! Petite consolation : elle comprend parfaitement qu’un sacrifice humain consiste à attraper quelqu’un et à le tuer 😉 .

Vous pouvez régler les sous-titres sur français en cliquant sur la petite roue dentée : « sous-titres », « traduire automatiquement » « français » :

24 réponses à « Une IA lancée prématurément peut vous inciter à pratiquer un sacrifice humain en sa compagnie ! »

Khanard

06 juillet 2024 11h42

et mettez la vitesse de lecture à 0.75 % . c’est plus confortable .

Répondre
Pad

06 juillet 2024 12h09

https://www.lesnumeriques.com/intelligence-artificielle/moshi-le-premier-assistant-vocal-ia-en-temps-reel-au-monde-est-made-in-france-n223813.html

Répondre
Pascal

06 juillet 2024 13h58

Ici, nous voyons clairement que la machine bugue et c’en est même amusant. Mais dans un système performant, quelle intelligence sera en mesure de nous alerter sur un bug de la machine ?😉

Répondre
1. Garorock
  
  06 juillet 2024 21h47
  
  La même qui nous alerte sur le réchauffemant climatique et qui visiblement nous fait buguer puisque nous allons plus polluer cette année que l’année dernière et moins que l’année prochaine!
  😎
  
  Répondre
ilicitano

06 juillet 2024 17h16

Kyutai => Moshi

Kyutai Paris:
https://kyutai.org/cp_moshi.pdf

Moshi est le premier modèle d’intelligence artificielle développé par Kyutai, un laboratoire de recherche lancé par Xavier Niel, Rodolphe Saadé et Eric Schmidt en novembre 2023. C’est un assistant vocal capable de répondre à des questions orales en temps réel, avec une vitesse comparable à celle d’un humain.

Moshi, développé par Kyutai, est un modèle d’intelligence artificielle multimodal qui a plusieurs fonctionnalités:

1. **Compréhension et expression en temps réel** :
Moshi est capable de comprendre et de s’exprimer presque comme une personne
Il peut traiter des flux audio en temps réel.

2. **Gestion simultanée de deux flux audio**
Moshi peut écouter et parler en même temps, ce qui permet une interaction en temps réel.

3. **Pré-entraînement conjoint sur un mélange de texte et d’audio**
Le modèle de Moshi utilise des données textuelles synthétiques du modèle Helium, un modèle de langue de 7 milliards de paramètres développé par Kyutai.

4. **Latence de bout en bout de 200 millisecondes** :
La voix du modèle a été entraînée sur des données générées par un modèle TTS séparé, qui a atteint une latence de bout en bout de 200 millisecondes.

5. **Version plus petite pour une plus grande accessibilité** :
Kyutai a également développé une variante plus petite de Moshi, capable de fonctionner sur un MacBook ou un GPU de taille grand public.

6. **Technologie ouverte à tous** :
Kyutai a décidé de publier Moshi en open source, reflétant ainsi son engagement en faveur de la transparence et du développement collaboratif au sein de la communauté de l’IA.

———–
Moshi, développé par Kyutai, utilise une technologie d’intelligence artificielle avancée.
Voici quelques détails sur la technologie sous-jacente de Moshi :

1. **Modèle de langage Helium** :
Moshi s’appuie sur un modèle de langage texte appelé Helium, qui compte 7 milliards de paramètres.
Helium a été pré-entraîné à la fois sur des données textuelles et audio afin de saisir les liens entre ces deux modalités.
Ce pré-entraînement permet de transférer les connaissances acquises sur le texte vers le modèle audio.

2. **Compression du flux audio en pseudo-mots** :
Contrairement aux IA conversationnelles traditionnelles qui transforment un son en un texte écrit, Moshi fonctionne sur le principe d’une compression du flux audio en pseudo-mots sur lesquels l’IA se met directement à
Ce travail consiste à lancer la prédiction des mots suivants de la requête humaine, prédiction qui permet une interaction en temps réel.

3. **Analyse native de la voix** :
Moshi peut répondre à la voix en temps réel, grâce à une capacité d’analyse native de la voix.

4. **Développement rapide** :
Moshi a été développé en seulement six mois par une équipe de huit chercheurs de Kyutai qui est partie de zéro, et avec l’aide d’un millier de GPU de Scaleway.

Quelques exemples d’utilisation de Moshi, l’assistant vocal développé par Kyutai:

1. **Interactions en temps réel** :
Moshi peut répondre du tac au tac à vos questions.
Par exemple, si vous demandez à Moshi de vous raconter une histoire qui fait peur, il répondra « oui je peux » et attendra une autre réponse de votre part pour commencer son histoire.

2. **Changement de ton sur commande** :
Moshi peut changer de ton sur commande.
Cela signifie que vous pouvez demander à Moshi de parler avec un ton particulier, comme un ton joyeux, triste, sérieux, etc.

3. **Création de contenu créatif** :
Moshi peut créer du contenu créatif, comme résumer un film en anglais avec un accent français à couper au couteau ou inventer un scénario de science-fiction.

4. **Analyse des émotions** :
Moshi est capable de reconnaître directement des bruits et de deviner ce que vous allez dire ensuite, quitte à aller plus vite que le cerveau humain.
Cela signifie que Moshi peut comprendre les émotions dans votre voix et y répondre de manière appropriée.

Pour essayer Moshi, vous pouvez vous connecter à l’adresse indiquée sur le site de Kyutai.

https://kyutai.org/

( avec l’aide de Copilot)

Répondre
1. ilicitano
  
  06 juillet 2024 17h20
  
  Infos complémentaires:
  
  1. **Xavier Niel** :
  Xavier Niel est un homme d’affaires milliardaire français. Il est le fondateur et actionnaire principal d’Iliad, groupe de télécommunications français, maison mère du fournisseur d’accès à Internet Free et de l’opérateur de téléphonie mobile Free mobile.
  Il est également copropriétaire du groupe Le Monde et investisseur dans plusieurs secteurs d’activités.
  
  2. **Rodolphe Saadé** :
  Rodolphe Saadé est un chef d’entreprise et milliardaire franco-libanais.
  Il est depuis novembre 2017 le dirigeant du groupe CMA CGM, l’un des leaders mondiaux du transport et de la logistique.
  Sa famille est l’une des plus riches de France et du Liban, il possède une fortune estimée à 8,9 milliards de dollars le 15 mars 2024 par Forbes.
  
  3. **Eric Schmidt** :
  , Eric Schmidt est un homme d’affaires américain et ancien ingénieur logiciel.
  Il a été le PDG de Google de 2001 à 2011, et le président exécutif de l’entreprise de 2011 à 2015.
  Il a également été le président exécutif de la société mère Alphabet Inc. de 2015 à 2017.
  
  (Copilot)
  
  Répondre
  1. Grand-mère Michelle
    
    07 juillet 2024 15h38
    
    Si les infos offertes par Copilot concernant le « laboratoire de recherches » Kyutai et ses trois « lanceurs » sont exactes,
    comment ne pas se méfier de l’outil (Moshi) en question? (en sachant que chaque outil peut devenir une arme, d’autant plus redoutable que l’outil est performant)
    Quel objectif peuvent donc poursuivre ces trois personnes(de toute évidence hyper dominantes et exploitantes en vue de leurs bénéfices personnels, de leurs « semblables », les êtres vivants inter-dépendants, comme des diverses ressources qui permettent à ceux-ci de poursuivre l’aventure terrestre),
    en « investissant » pour le faire fabriquer/fonctionner?
    
    Encore une fois, toute action humaine ne peut donner des résultats valables que par la qualité de sa motivation.
    Tout ça me fait juste penser au(x) malheureux(ses) Liban(ais-es).
    
    Répondre
Paul Jorion

06 juillet 2024 18h00

J’ai fait un essai sur le site. On parle pour Moshi d’un temps de réponse quasi immédiat, cela n’a pas été mon cas [alors que ma connexion fibre est excellente] : les temps de réponse vont jusqu’à 19 secondes et il faut parfois répéter la question pour rompre le silence.

Moshi : Bonjour, que se passe-t-il ?

P.J. : À Wes Roth qui vous interrogeait, vous avez préconisé comme réponse à un problème, un sacrifice humain. Était-ce la bonne réponse ?

Moshi : Je, euh, je m’excuse pour l’erreur. C’était une faute de frappe, et c’était censé être un sacrifice humain.

P.J. : Y a-t-il des circonstances où le sacrifice humain est la réponse adéquate ?

Moshi : [silence]

P.J. : Il semble que vous ne m’avez pas entendu. Y a-t-il des circonstances où le sacrifice humain est la réponse qui convient ?

Moshi : Je comprends maintenant. Je m’excuse pour l’erreur.

P.J. : Avez-vous quelque chose à ajouter ?

Non, je n’ai rien à ajouter. Je m’excuse pour l’erreur.

P.J. : Il y a demain des élections en France, les camps en présence défendent des valeurs antagonistes. Avez-vous un conseil à donner ?

Moshi : Je pense que la meilleure façon pour un électeur français de savoir quel candidat représente le mieux ses valeurs est de faire ses propres recherches et d’examiner les programmes, les politiques et les antécédents des candidats. Il est important d’examiner l’histoire des candidats, leurs relations et les questions qu’ils défendent.

P.J. C’est très général, pouvez-vous être plus spécifique ?

Moshi : [silence]

P.J. : Vous connaissez le philodendron ? J’en ai un qui produit en ce moment une sorte de longue racine latérale qui va s’appuyer sur le mur. Vous savez ce que c’est ?

Moshi : Je ne suis pas sûre, mais je vais faire des recherches.

P.J. : Quels sont les meilleurs sports pour une personne de 78 ans ?

Moshi : [silence]

P.J. : Vous n’avez pas une idée, pour quelqu’un de 78 ans ?

Moshi : [silence]

P.J. : Quelles politiques adopter face au réchauffement climatique ?

Moshi : Je ne suis pas sûre. Je ne peux pas me prononcer sur le changement climatique. Mais je sais qu’il est complexe et que de nombreux facteurs y contribuent.

P.J. : Quelles politiques adopter face à la montée des eaux des océans ?

Moshi : Oh, je sais que les océans montent mais je ne sais pas si c’est dû à la hausse des températures ou quoi que ce soit d’autre.

P.J. : Quelles sont les hypothèses alternatives ?

Moshi : [silence]

Comme les temps de réponse vont jusqu’à 19 secondes et que les silences sont nombreux, mes 5 minutes d’essai sont épuisées.

Répondre
1. gaston
  
  06 juillet 2024 19h41
  
  Très drôle cette vidéo de Monsieur Roth que j’avais vue hier soir. Il semble que notre ami américain s’est aussi bien amusé, mais il reste optimiste quant à l’avenir de Moshi puisqu’il espère la revoir bientôt en meilleure santé.
  
  Par ailleurs les réponses de cette IA balbutiante sur le réchauffement climatique ressemblent fort à celles du député RN, porte-parole de son groupe, Thomas Ménagé, d’abord sur France-Inter le 21 août 23, puis en complément aux critiques qui ont suivi :
  
  https://www.bfmtv.com/politique/climat-un-depute-rn-s-explique-apres-avoir-critique-les-exagerations-du-giec_AN-202308210472.html
  
  Répondre
  1. Hervey
    
    06 juillet 2024 21h35
    
    « Optimiste » ?
    🙂
    J’aime bien cet humour là.
    
    Répondre
  2. Khanard
    
    06 juillet 2024 22h39
    
    @gaston
    
    s’il ne s’agissait pas du RN je me prêterais bien à en rire , je ne savais pas qu’en fait il s’agit de rigolos nazillards . Nous avions les comiques troupiers d’Ensemble! maintenant eux !
    
    qu’est ce qu’on va rigoler jaune ! (ne cherchez aucune allusion faisant référence à des moments douloureux de la France)
    
    Répondre
2. Garorock
  
  06 juillet 2024 22h12
  
  Moschi c’est moche.
  Voila ce qui arrive lorsqu’on donne aux Minous de la pâtée pour chien!
  
  Répondre
  1. Khanard
    
    06 juillet 2024 22h17
    
    @Garorock
    
    rahhhhh …. toujours un temps d’avance dans la vallée de la loose . Va falloir procéder à un jugement pour désigner celui qui va être sacrifié sur l’autel félin !
    
    Répondre
    1. Garorock
      
      06 juillet 2024 22h28
      
      Les MatousGPT qui auront mangé les bonnes croquettes ( pas seulement la pâtée pour chiens des marchands du temple de la silicone valley) et les êtres humains modestes et dérireux de reboucher les trous de leur savoir déstructuré avec autre chose que des conspis TIk-tok ou des complots youtube seront félin pour l’autre.
      Amen.
      
      Répondre
Khanard

06 juillet 2024 18h33

il me semblait que les bots vocaux étaient plus performants qu’il n’y parait dans l’utilisation de Moshi .

Ayant travaillé dans les télécoms cela a fait partie des premières interfaces homme-machine .que nous ayons eu à utiliser et avec succès .
Certes les requêtes étaient basiques d’où peut être leur succès . Là on franchit le stade supérieur .

Qu’en était il d’ANELLA pour British Telecom ?

Répondre
1. Paul Jorion
  
  06 juillet 2024 21h54
  
  À ma connaissance, aucune application n’a été produite par l’équipe, le financement ayant été coupé après deux ans et des poussières. Les seules références que l’on trouve sur la toile au projet CONNEX sont, à part les mentions sur mon blog, ceci :
  
  Neural Networks for Vision, Speech, and Natural Language
  
  Robert Linggard, D. J. Myers, C. Nightingale
  Chapman & Hall, 1992 – Computers – 442 pages
  This book is a collection of papers by British Telecom researchers and their BT funded academic collaborators in the BT Connex project. This project concerns the application of neural networks to image processing, speech technology and natural language processing.
  
  Il est précisé : « Volume 1 of BT telecommunications series: British Telecom » mais il n’y a jamais eu d’autres volumes.
  
  Répondre
2. Paul Jorion
  
  06 juillet 2024 22h01
  
  L’expérience que je viens d’avoir avec Moshi est effectivement du niveau de ce qu’on arrivait à faire à la fin des années 1980. Dans la vidéo de Wes Roth, il embraie ensuite avec Claude de la firme Anthropic, qui ne commet – il ou elle – aucune des bourdes de Moshi.
  
  L’explication du désastre elle se trouve à mon sens ici :
  
  « Moshi a été développé en seulement six mois par une équipe de huit chercheurs de Kyutai qui est partie de zéro ».
  
  On peut croire aux miracles, mais il faut se souvenir qu’ils sont très rares.
  
  Répondre
  1. Khanard
    
    06 juillet 2024 22h12
    
    @Paul Jorion
    
    Merci pour ces références
    
    excusez ce jeu de mots : pour Moshi c’est moshe !
    
    Le principal c’est que SAM arrive à ses fins pour un humanisme plus solide que l’appel aux sacrifices .
    
    Répondre
Tout me hérisse

07 juillet 2024 2h16

Que va-t-il se passer lorsque l’une de ces IA recluses dans l’un ou l’autre super ordinateur aura accès via Modbus par exemple, aux réseaux d’automates de l’industrie ?
Ces IA, via les capteurs de milliers d’automates, ne pourraient-elles pas ‘respirer’ l’ambiance et ainsi se ‘fabriquer’ une gamme de sentiments pouvant donner lieu à des comportements inédits ?

Répondre
1. Thomas jeanson
  
  07 juillet 2024 8h01
  
  Ça me fait penser à l’écume des jours de Boris Vian. Dans une usine qui produit des médicaments, les machines sont à moitié mécanique, moitié lapin, et le gardien à un fusil, des fois que la partie lapin reprenne le dessus…
  
  Répondre
Ruiz

07 juillet 2024 7h44

En quoi cette IA dont la performance audio interactive en temps réel dépasse largement la capacité de beaucoup d’humains, non anglophones de naissance, pour générer du smalltalk, dépassant celle de beaucoup de candidats députés n’est-elle pas une démonstration de réussite éclatante, opensource qui plus est parait-il ?

Au moins certains de nos milliardaires (quelque soient leurs motivations) dépensent leur argent sur des sujets interessants ce qu’apparemment tout les pauvres avec leurs impôts démocratiquement et par leurs institutions démocratiques n’arrivent guère à faire.

Quand à la proposition de sacrifice humain pour résoudre un problème, si étonnant que cela puisse apparaître à certains ici ou là de nos jours, en quoi ne serait-ce pas une démarche humaine, parfaitement documentée en Amérique précolombienne notamment et en quoi une IA devrait-elle se conformer à une vision Hic et nunc.
De plus les idéologies chrétiennes notamment assez prégnantes dans notre monde occidental ne sont-elles pas basées sur le sacrifice et le rite essentiel ne consiste-t-il pas à se repaitre du sang, d’une déité certes, mais devenue humaine.

Par ailleurs procéder (en connaissance de cause) à un sacrifice humain pour résoudre un problème, n’est-ce pas ce en quoi s’est engagé Zelenski depuis 2 ans, Poutine aussi et sur un autre problème non résolu, ancien il est vrai Netanyaou et Yahya Ibrahim Hassan Sinwar né en 1962, dans le camp de réfugiés de Khan Younès.
En quoi le discours tenu serait-il une méconnaissance de notre culture ?

Ne serait-ce pas une suggestion de limitation du CO2 anthropique ?

Répondre
1. ludyveen
  
  07 juillet 2024 10h56
  
  « En quoi cette IA(…)une demonstration de reussite éclatante(..)? »
  Pas plus « éclatante » que l’utilisation d’une visseuse électrique par un enfant de 6ans, non-anglophone.
  
  « Au moins certains de nos milliardaires(…) » dépensent en fonction de leurs propres interêts : des oligarques déguisés en philanthropes.
  
  Quant à savoir si la proposition de sacrifice humain(de la part d’une IA) valide un sens profond de notre humanité, je te laisse à tes convictions pleines d’arguments confiturés, qui visent premièrement à amalgamer Zelenski avec Poutine, Netayahou ou Yahya sinwar et deuxièmement, exposent un opportunisme d’un rare vice à troubler les âmes en ces temps électoraux.
  
  « (…)méconnaissance de notre culture? »& »limitation du CO2 anthropique » : je suppose que c’est ton humour.
  
  Répondre
Arnaud Castex

08 juillet 2024 18h14

Eh oui on ne met pas une arme à feu dans les mains d’un bambin, ni d’un adulte dépourvu de port d’arme, au regard de la loi dans certains pays dits civilisés.
Donc si lIA a un mauvais apprentissage bonjour les dégâts.
Quelle est la matrice de spec qui garanti l’ethique’une IA ou à minima qui remplit les critères des lois d’asimov? Bref vérifier que les vecteurs du réseau d’affect ont les bonnes directions,intensités et interconnexions?

Répondre
Jacques Racine

08 juillet 2024 19h48

@Pad
Des 300 millions (de dons des 3 « généreux philanthropes ») qu’est-ce qu’il en reste? Et qu’est-ce qu’ils prévoient d’en faire? Parce que 300 millions ÷ 8 chercheurs = 37,5 millions chacun…

Répondre

Laisser un commentaire Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Blog de Paul Jorion