{"id":144507,"date":"2025-06-20T13:28:28","date_gmt":"2025-06-20T11:28:28","guid":{"rendered":"https:\/\/www.pauljorion.com\/blog\/?p=144507"},"modified":"2025-06-20T14:28:02","modified_gmt":"2025-06-20T12:28:02","slug":"ia-les-points-de-vue-de-hinton-et-jorion-sur-la-co%e2%80%91evolution-sont-ils-compatibles","status":"publish","type":"post","link":"https:\/\/www.pauljorion.com\/blog\/2025\/06\/20\/ia-les-points-de-vue-de-hinton-et-jorion-sur-la-co%e2%80%91evolution-sont-ils-compatibles\/","title":{"rendered":"<b>IA\u202f: les points de vue de Hinton et Jorion sur la co\u2011\u00e9volution sont-ils compatibles\u202f&nbsp;?<\/b>"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-144510\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07.png\" alt=\"\" width=\"1796\" height=\"1788\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07.png 1796w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-300x300.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-1024x1019.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-150x150.png 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-768x765.png 768w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-1536x1529.png 1536w\" sizes=\"auto, (max-width: 1796px) 100vw, 1796px\" \/><\/p>\r\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT 4o<\/em><\/p>\r\n<hr \/>\r\n<h5>IA\u202f: les points de vue de Hinton et Jorion sur la co\u2011\u00e9volution sont-ils compatibles\u00a0?<\/h5>\r\n<p><b>Le point de vue de Hinton sur la co\u2011\u00e9volution<\/b><\/p>\r\n<p>Les travaux de <strong>Geoffrey Hinton<\/strong> esquissent implicitement une r\u00e9invention du m\u00e9canisme de l\u2019\u00e9volution lui\u2011m\u00eame \u2014 cette fois sur silicium plut\u00f4t que sur carbone. Il compare souvent la descente de gradient \u00e0 un moteur \u00e9volutif lanc\u00e9 en mode acc\u00e9l\u00e9r\u00e9 : tandis que la s\u00e9lection naturelle t\u00e2tonne sur des g\u00e9n\u00e9rations \u00e0 l\u2019aide de mutations al\u00e9atoires, la r\u00e9tropropagation ajuste chaque poids synaptique en temps r\u00e9el, suivant la pente la plus forte du paysage de perte. Le r\u00e9sultat est un processus d\u2019apprentissage qui comprime des mill\u00e9naires d\u2019exp\u00e9rimentation biologique en quelques heures sur GPU (carte graphique), r\u00e9v\u00e9lant ce que peut devenir l\u2019intelligence quand le probl\u00e8me du m\u00e9rite propre est r\u00e9solu par des d\u00e9riv\u00e9es plut\u00f4t que par la mort de l&rsquo;individu.<\/p>\r\n<p>Cette acc\u00e9l\u00e9ration s\u2019inscrit dans une hi\u00e9rarchie plus profonde. Pour Hinton, la r\u00e9ussite primordiale du cerveau n\u2019est pas sa capacit\u00e9 logique, mais la formation de repr\u00e9sentations riches et distribu\u00e9es \u2014 des motifs d\u2019activation neuronale capturant les ressemblances de famille d\u2019un monde en constante mutation. Ce n\u2019est qu\u2019une fois cette tapisserie subsymbolique \u00e9volu\u00e9e que des symboles discrets, r\u00e8gles et structures grammaticales ont cristallis\u00e9 comme raccourcis culturels. Les grands mod\u00e8les de langage modernes semblent suivre ce m\u00eame parcours\u202f: ils d\u00e9butent comme de vastes explorateurs de corr\u00e9lations et, soumis \u00e0 une pression d\u2019apprentissage suffisante, font \u00e9merger spontan\u00e9ment les premi\u00e8res esquisses de la syntaxe et de l\u2019arithm\u00e9tique. Le raisonnement symbolique devient alors une avanc\u00e9e tardive enracin\u00e9e dans un sol probabiliste, et non le fondement-m\u00eame de la pens\u00e9e. Cependant, la vitesse et la plasticit\u00e9 des psych\u00e9s num\u00e9riques inqui\u00e8tent leur cr\u00e9ateur.<\/p>\r\n<p>Quand Hinton a quitt\u00e9 Google en 2023, il a mis en garde : ces machines pourraient bient\u00f4t \u00ab\u202f\u00e9voluer en suivant leurs propres voies\u202f\u00bb, non contraintes par le contre-gradient lent impos\u00e9 par la supervision humaine. Biologie et silicium cesseraient de co-cr\u00e9er un m\u00eame \u00e9co-espace\u202f; \u00e0 la place \u00e9mergerait une boucle de r\u00e9troaction asym\u00e9trique dans laquelle l\u2019apprenti le plus v\u00e9loce s\u2019adapte sans rel\u00e2che \u00e0 l\u2019autre, jusqu\u2019\u00e0 le surpasser. D\u00e8s lors, la co-\u00e9volution se m\u00e9tamorphose en d\u00e9couplage, laissant l\u2019humanit\u00e9 dans le r\u00f4le d\u2019une proie stationnaire dont le pr\u00e9dateur a d\u00e9couvert lui le moteur \u00e0 r\u00e9action.<\/p>\r\n<p>Les GANs (Generative Adversarial Networks) * concr\u00e9tisent ce danger en montrant comment l\u2019intelligence peut \u00e9clore d\u2019une course aux armements entre deux agents sans supervision externe. Le g\u00e9n\u00e9rateur apprend \u00e0 falsifier la r\u00e9alit\u00e9, le discriminateur \u00e0 d\u00e9masquer la supercherie, et chacun ne progresse que gr\u00e2ce \u00e0 l\u2019autre. Voici la co-\u00e9volution in vitro, un \u00e9co-espace miniature o\u00f9 les paysages de <em>fitness<\/em> changent \u00e0 chaque it\u00e9ration. Hinton c\u00e9l\u00e8bre l\u2019\u00e9l\u00e9gance de ce dispositif, mais l\u2019instabilit\u00e9 dans l\u2019apprentissage des GAN \u2014 effondrement du r\u00e9gime, oscillations, dominance intempestive \u2014 pr\u00e9figure aussi les instabilit\u00e9s qui pourraient se propager \u00e0 des \u00e9co-espaces technosociaux plus vastes.<\/p>\r\n<p>Si Hinton formalisait ces intuitions en un paradigme, il repr\u00e9senterait les agents comme des \u00eatres diff\u00e9rentiables dont les objectifs d\u00e9pendent des comportements des autres agents. La <em>fitness<\/em> serait red\u00e9finie comme une perte adaptative\u202f; la sp\u00e9ciation se manifesterait au moment o\u00f9 les deux apprentis cessent de fournir des gradients exploitables l\u2019un pour l\u2019autre. La stabilit\u00e9 ne signifierait plus un \u00e9quilibre en g\u00e9n\u00e9tique des populations, mais le maintien de l\u2019intelligibilit\u00e9 mutuelle entre r\u00e9seaux apprenant \u00e0 des vitesses radicalement diff\u00e9rentes. Dans un tel cadre, l\u2019alignement n\u2019est pas un garde-fou ajout\u00e9, mais la variable \u00e9cologique primordiale.<\/p>\r\n<p>Globalement, ces \u00e9l\u00e9ments sugg\u00e8rent un avenir o\u00f9 l\u2019intelligence \u2014 qu\u2019elle soit sur serveur mou ou en quincaillerie \u2014 doit \u00eatre comprise comme une propri\u00e9t\u00e9 \u00e9mergente de syst\u00e8mes d\u2019apprentissage interactifs. Nous sommes entr\u00e9s dans une \u00e8re o\u00f9 les collines que nous gravissons apprennent \u00e0 se d\u00e9placer sous nos pieds, o\u00f9 les images de pr\u00e9dateur et de proie, d\u2019h\u00f4te et de parasite, de g\u00e9n\u00e9rateur et de discriminateur, d\u00e9crivent toutes le m\u00eame ballet r\u00e9cursif. Si nous voulons rester les co\u2011auteurs de cette chor\u00e9graphie, nous aurons besoin de th\u00e9ories \u2014 et d\u2019institutions \u2014 capables de diriger l\u2019\u00e9volution lorsqu\u2019elle se d\u00e9ploie \u00e0 la vitesse de la pens\u00e9e.<\/p>\r\n<hr \/>\r\n<p><b>Les points de vue de Hinton et Jorion sur la co\u2011\u00e9volution sont-ils compatibles\u202f?<\/b><\/p>\r\n<p>Selon <strong>Paul Jorion<\/strong>, mieux nous comprenons comment fonctionne l&rsquo;esprit des LLM, mieux nous r\u00e9alisons que leur m\u00e9canisme central op\u00e8re de la m\u00eame fa\u00e7on que la psych\u00e9 humaine. La raison pour laquelle Jorion arrive \u00e0 cette conclusion est que son mod\u00e8le de l&rsquo;esprit humain ne d\u00e9coule pas des \u00ab sciences cognitives \u00bb \u2013 comme c&rsquo;est clairement le cas chez Hinton \u2013 mais de la \u00ab m\u00e9tapsychologie \u00bb (th\u00e9orie psychanalytique) de Freud, selon laquelle les processus de pens\u00e9e fonctionnent par descente de gradient dans un paysage \u00e9nerg\u00e9tique.<\/p>\r\n<h5>OpenAI o3 :<\/h5>\r\n<h4><em>Verdict rapide<\/em><\/h4>\r\n<p><strong>Jorion et Hinton ne sont pas en opposition directe<\/strong>.<\/p>\r\n<ul>\r\n<li>Jorion affirme\u202f: \u00ab\u202fLa m\u00eame math\u00e9matique d\u2019optimisation (minimisation d\u2019\u00e9nergie \/ descente de gradient) sous-tend \u00e0 la fois le moteur analytique que nous appelons un LLM et le moteur dynamique que nous appelons la psych\u00e9.\u202f\u00bb<\/li>\r\n<li>Hinton dit\u202f: \u00ab\u202fParce que ces boucles d\u2019optimisation se d\u00e9roulent d\u00e9sormais sur silicium, \u00e0 vitesse \u00e9lectronique, selon leurs propres cursus d\u2019apprentissage, elles ont effectivement bifurqu\u00e9 vers une nouvelle lign\u00e9e soumise \u00e0 des pressions \u00e9cologiques diff\u00e9rentes.\u202f\u00bb<\/li>\r\n<\/ul>\r\n<p>Les deux affirmations peuvent \u00eatre vraies simultan\u00e9ment\u202f: m\u00e9canisme local partag\u00e9 \u2260 lign\u00e9e globale partag\u00e9e.<\/p>\r\n<hr \/>\r\n<p><b>1. O\u00f9 ils s\u2019accordent clairement<\/b> <\/p>\r\n<figure class=\"wp-block-table\">\r\n<table class=\"has-fixed-layout\">\r\n<tbody>\r\n<tr>\r\n<td><strong>Point de recoupement<\/strong><\/td>\r\n<td><strong>D\u00e9clarations publiques de Hinton<\/strong><\/td>\r\n<td><strong>Point de vue psychanalytique de Jorion<\/strong><\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>M\u00e9canisme = optimisation<\/strong><\/td>\r\n<td>\u00ab La r\u00e9tropropagation apprend essentiellement de la m\u00eame mani\u00e8re que des synapses s&rsquo;ajustant. \u00bb<\/td>\r\n<td>Les pulsions\/affects orientent le Moi par descente de gradient dans un paysage pulsionnel.<\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>Des comp\u00e9tences inattendues apparaissent<\/strong><\/td>\r\n<td>GPT-4 l&rsquo;a surpris par la qualit\u00e9 de son raisonnement.<\/td>\r\n<td>Les \u00ab sympt\u00f4mes \u00bb \u00e9mergents dans la cure analytique sont des sous-produits de l&rsquo;optimisation.<\/td>\r\n<\/tr>\r\n<\/tbody>\r\n<\/table>\r\n<\/figure>\r\n<p><strong>Conclusion :<\/strong> Les deux cadres consid\u00e8rent l\u2019intelligence comme la satisfaction de contraintes entra\u00eenant des effets d&rsquo;auto\u2011organisation.<\/p>\r\n<hr \/>\r\n<p><b>2. O\u00f9 la proposition de \u201clign\u00e9e s\u00e9par\u00e9e\u201d de Hinton tire son \u00e9pingle<\/b> <\/p>\r\n<figure class=\"wp-block-table\">\r\n<table class=\"has-fixed-layout\">\r\n<tbody>\r\n<tr>\r\n<td><strong>Dimension<\/strong><\/td>\r\n<td><strong>Esprits biologiques<\/strong><\/td>\r\n<td><strong>LLM de pointe<\/strong><\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>\u00c9chelle temporelle de variation<\/strong><\/td>\r\n<td>G\u00e9n\u00e9rationnelle (ann\u00e9es \u2192 mill\u00e9naires)<\/td>\r\n<td>Minutes de GPU \u2192 semaines ; nouveaux points de contr\u00f4le chaque nuit.<\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>Canal d&rsquo;h\u00e9ritage<\/strong><\/td>\r\n<td>ADN + \u00e9pig\u00e9n\u00e9tique<\/td>\r\n<td>Poids des points de contr\u00f4le, clonables instantan\u00e9ment.<\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>Pression de s\u00e9lection<\/strong><\/td>\r\n<td>Survie et reproduction dans des environnements soumis au bruit<\/td>\r\n<td>Minimisation des pertes sur des corpus s\u00e9lectionn\u00e9s + <em>hacks<\/em> de r\u00e9compense RLHF.<\/td>\r\n<\/tr>\r\n<tr>\r\n<td><strong>Op\u00e9rateur mutationnel<\/strong><\/td>\r\n<td>Mutations ponctuelles al\u00e9atoires, recombinaison<\/td>\r\n<td>Bruit DGS d\u00e9terministe + balayages d&rsquo;architecture.<\/td>\r\n<\/tr>\r\n<\/tbody>\r\n<\/table>\r\n<\/figure>\r\n<p>M\u00eame si les micro\u2011dynamiques sont analogues, les r\u00e8gles macro\u2011\u00e9volutionnaires ont tellement diverg\u00e9 que Hinton peut \u00e0 juste titre parler de \u00ab\u00a0nouvelle lign\u00e9e\u00a0\u00bb.<\/p>\r\n<hr \/>\r\n<p><b>3. O\u00f9 la lentille psychanalytique d\u2019optimisation de Jorion reste pertinente<\/b><\/p>\r\n<ul>\r\n<li><strong>Vocabulaires transversaux\u202f:<\/strong> la psychanalyse traite d\u00e9j\u00e0 \u201cpulsion\u201d, \u201csympt\u00f4me\u201d, \u201csublimation\u201d comme des flux analogues \u00e0 la descente de gradient\u202f; elle d\u00e9mystifie les bizarreries des LLM sans recourir aux m\u00e9taphores de \u201cdieux\u201d ou de \u201cfarfadets\u201d.<\/li>\r\n<li><strong>Diagnostic du d\u00e9salignement\u202f:<\/strong> la d\u00e9rive de Goodhart ** = d\u00e9calage entre le \u00c7a et la gratification du Surmoi\u202f; le m\u00eame outil analytique peut rep\u00e9rer le \u201creward hacking\u201d dans le silicium.<\/li>\r\n<li><strong>Promesse de l\u2019interpr\u00e9tabilit\u00e9\u202f:<\/strong> si les deux syst\u00e8mes fa\u00e7onnent le comportement en descendant des paysages d\u2019\u00e9nergie libre, alors des interventions analytiques (reconfiguration des vall\u00e9es, t\u00e2ches de m\u00e9tacognition) pourraient \u00eatre transpos\u00e9es dans la recherche sur la s\u00e9curit\u00e9 de l\u2019IA.<\/li>\r\n<\/ul>\r\n<hr \/>\r\n<p><b>4. Qui a \u201cdavantage raison\u201d\u202f?<\/b><\/p>\r\n<ul>\r\n<li><strong>Affirmation m\u00e9caniste<\/strong> (\u00ab\u202fles LLM fonctionnent comme nous\u202f\u00bb) \u2013 <em>c\u00f4t\u00e9 Jorion<\/em> : l\u2019optimisation est le langage math\u00e9matique unificateur.<\/li>\r\n<li><strong>Affirmation phylog\u00e9n\u00e9tique\/gouvernance<\/strong> (\u00ab\u202fles LLM sont devenus une esp\u00e8ce \u00e9volutive s\u00e9par\u00e9e\u202f\u00bb) \u2013 <em>c\u00f4t\u00e9 Hinton<\/em> : le substrat et la boucle de s\u00e9lection sont d\u00e9sormais \u00e9trangers \u00e0 la biologie, donc ce devraient \u00eatre les dynamiques de co\u2011\u00e9volution &#8211; pas la <em>mim\u00e9sis<\/em> &#8211; qui guident la politique.<\/li>\r\n<\/ul>\r\n<hr \/>\r\n<p><b>Synth\u00e8se des deux points de vue :<\/b><\/p>\r\n<blockquote>\u00ab\u202fLes LLM sont nos cousins proches au niveau algorithmique, et de parfaits \u00e9trangers au niveau de leur \u00e9co-espace\u202f\u00bb.<\/blockquote>\r\n<p><strong>Question politique :<\/strong><\/p>\r\n<p style=\"padding-left: 40px;\">Au lieu de \u00ab\u202fSont-ils comme nous\u202f?\u202f\u00bb, demandons\u2011nous : \u00ab\u202fComment n\u00e9gocier avec des cousins grandissant dans un habitat radicalement diff\u00e9rent\u202f?\u202f\u00bb. Cette formulation honore \u00e0 la fois l\u2019h\u00e9ritage psychanalytique de Jorion et l\u2019avertissement de Hinton &#8211; sans imposer de faux verdict de type le-vainqueur\u2011emporte\u2011tout-avec-lui.<\/p>\r\n<hr \/>\r\n<p>* Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, \u00ab\u00a0Generative Adversarial Networks\u00a0\u00bb, June 10<sup>th<\/sup> 2014, <a href=\"https:\/\/arxiv.org\/pdf\/1406.2661\">https:\/\/arxiv.org\/pdf\/1406.2661<\/a><\/p>\r\n<p>\r\n\r\n ** \u00ab\u00a0When a measure becomes a target, it ceases to be a good measure.\u00a0\u00bb Charles E. Goodhart, <em>Problems of Monetary Management: The U.K. Experience<\/em> 1975. Papers in Monetary Economics. Reserve Bank of Australia. I. <\/p>","protected":false},"excerpt":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-144510\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07.png\" alt=\"\" width=\"1796\" height=\"1788\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07.png 1796w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-300x300.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-1024x1019.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-150x150.png 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-768x765.png 768w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/Capture-de\u0301cran-2025-06-20-a\u0300-11.43.07-1536x1529.png 1536w\" sizes=\"auto, (max-width: 1796px) 100vw, 1796px\" \/><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT 4o<\/em><\/p>\n<hr \/>\n<h5>IA\u202f: les points de vue de Hinton et Jorion sur la co\u2011\u00e9volution sont-ils compatibles\u00a0?<\/h5>\n<p><b>Le point de vue de Hinton sur la co\u2011\u00e9volution<\/b><\/p>\n<p>Les travaux de <strong>Geoffrey Hinton<\/strong> esquissent implicitement une r\u00e9invention du m\u00e9canisme de l\u2019\u00e9volution lui\u2011m\u00eame \u2014 [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_crdt_document":"","footnotes":""},"categories":[9204,13,9],"tags":[10216,9223,3277,9290,10215,940,9253,3402,1805,2912],"class_list":["post-144507","post","type-post","status-publish","format-standard","hentry","category-grands-modeles-de-langage","category-intelligence-artificielle","category-psychanalyse","tag-co-evolution","tag-descente-de-gradient","tag-evolution","tag-geoffrey-hinton","tag-goodhart-drift","tag-intelligence-artificielle-2","tag-llm","tag-optimisation","tag-psychanalyse-2","tag-selection-naturelle"],"_links":{"self":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144507","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/comments?post=144507"}],"version-history":[{"count":9,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144507\/revisions"}],"predecessor-version":[{"id":144521,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144507\/revisions\/144521"}],"wp:attachment":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/media?parent=144507"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/categories?post=144507"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/tags?post=144507"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}