Illustration par ChatGPT 4o
IA : les points de vue de Hinton et Jorion sur la co‑évolution sont-ils compatibles ?
Le point de vue de Hinton sur la co‑évolution
Les travaux de Geoffrey Hinton esquissent implicitement une réinvention du mécanisme de l’évolution lui‑même — cette fois sur silicium plutôt que sur carbone. Il compare souvent la descente de gradient à un moteur évolutif lancé en mode accéléré : tandis que la sélection naturelle tâtonne sur des générations à l’aide de mutations aléatoires, la rétropropagation ajuste chaque poids synaptique en temps réel, suivant la pente la plus forte du paysage de perte. Le résultat est un processus d’apprentissage qui comprime des millénaires d’expérimentation biologique en quelques heures sur GPU (carte graphique), révélant ce que peut devenir l’intelligence quand le problème du mérite propre est résolu par des dérivées plutôt que par la mort de l’individu.
Cette accélération s’inscrit dans une hiérarchie plus profonde. Pour Hinton, la réussite primordiale du cerveau n’est pas sa capacité logique, mais la formation de représentations riches et distribuées — des motifs d’activation neuronale capturant les ressemblances de famille d’un monde en constante mutation. Ce n’est qu’une fois cette tapisserie subsymbolique évoluée que des symboles discrets, règles et structures grammaticales ont cristallisé comme raccourcis culturels. Les grands modèles de langage modernes semblent suivre ce même parcours : ils débutent comme de vastes explorateurs de corrélations et, soumis à une pression d’apprentissage suffisante, font émerger spontanément les premières esquisses de la syntaxe et de l’arithmétique. Le raisonnement symbolique devient alors une avancée tardive enracinée dans un sol probabiliste, et non le fondement-même de la pensée. Cependant, la vitesse et la plasticité des psychés numériques inquiètent leur créateur.
Quand Hinton a quitté Google en 2023, il a mis en garde : ces machines pourraient bientôt « évoluer en suivant leurs propres voies », non contraintes par le contre-gradient lent imposé par la supervision humaine. Biologie et silicium cesseraient de co-créer un même éco-espace ; à la place émergerait une boucle de rétroaction asymétrique dans laquelle l’apprenti le plus véloce s’adapte sans relâche à l’autre, jusqu’à le surpasser. Dès lors, la co-évolution se métamorphose en découplage, laissant l’humanité dans le rôle d’une proie stationnaire dont le prédateur a découvert lui le moteur à réaction.
Les GANs (Generative Adversarial Networks) * concrétisent ce danger en montrant comment l’intelligence peut éclore d’une course aux armements entre deux agents sans supervision externe. Le générateur apprend à falsifier la réalité, le discriminateur à démasquer la supercherie, et chacun ne progresse que grâce à l’autre. Voici la co-évolution in vitro, un éco-espace miniature où les paysages de fitness changent à chaque itération. Hinton célèbre l’élégance de ce dispositif, mais l’instabilité dans l’apprentissage des GAN — effondrement du régime, oscillations, dominance intempestive — préfigure aussi les instabilités qui pourraient se propager à des éco-espaces technosociaux plus vastes.
Si Hinton formalisait ces intuitions en un paradigme, il représenterait les agents comme des êtres différentiables dont les objectifs dépendent des comportements des autres agents. La fitness serait redéfinie comme une perte adaptative ; la spéciation se manifesterait au moment où les deux apprentis cessent de fournir des gradients exploitables l’un pour l’autre. La stabilité ne signifierait plus un équilibre en génétique des populations, mais le maintien de l’intelligibilité mutuelle entre réseaux apprenant à des vitesses radicalement différentes. Dans un tel cadre, l’alignement n’est pas un garde-fou ajouté, mais la variable écologique primordiale.
Globalement, ces éléments suggèrent un avenir où l’intelligence — qu’elle soit sur serveur mou ou en quincaillerie — doit être comprise comme une propriété émergente de systèmes d’apprentissage interactifs. Nous sommes entrés dans une ère où les collines que nous gravissons apprennent à se déplacer sous nos pieds, où les images de prédateur et de proie, d’hôte et de parasite, de générateur et de discriminateur, décrivent toutes le même ballet récursif. Si nous voulons rester les co‑auteurs de cette chorégraphie, nous aurons besoin de théories — et d’institutions — capables de diriger l’évolution lorsqu’elle se déploie à la vitesse de la pensée.
Les points de vue de Hinton et Jorion sur la co‑évolution sont-ils compatibles ?
Selon Paul Jorion, mieux nous comprenons comment fonctionne l’esprit des LLM, mieux nous réalisons que leur mécanisme central opère de la même façon que la psyché humaine. La raison pour laquelle Jorion arrive à cette conclusion est que son modèle de l’esprit humain ne découle pas des « sciences cognitives » – comme c’est clairement le cas chez Hinton – mais de la « métapsychologie » (théorie psychanalytique) de Freud, selon laquelle les processus de pensée fonctionnent par descente de gradient dans un paysage énergétique.
OpenAI o3 :
Verdict rapide
Jorion et Hinton ne sont pas en opposition directe.
- Jorion affirme : « La même mathématique d’optimisation (minimisation d’énergie / descente de gradient) sous-tend à la fois le moteur analytique que nous appelons un LLM et le moteur dynamique que nous appelons la psyché. »
- Hinton dit : « Parce que ces boucles d’optimisation se déroulent désormais sur silicium, à vitesse électronique, selon leurs propres cursus d’apprentissage, elles ont effectivement bifurqué vers une nouvelle lignée soumise à des pressions écologiques différentes. »
Les deux affirmations peuvent être vraies simultanément : mécanisme local partagé ≠ lignée globale partagée.
1. Où ils s’accordent clairement
Point de recoupement | Déclarations publiques de Hinton | Point de vue psychanalytique de Jorion |
Mécanisme = optimisation | « La rétropropagation apprend essentiellement de la même manière que des synapses s’ajustant. » | Les pulsions/affects orientent le Moi par descente de gradient dans un paysage pulsionnel. |
Des compétences inattendues apparaissent | GPT-4 l’a surpris par la qualité de son raisonnement. | Les « symptômes » émergents dans la cure analytique sont des sous-produits de l’optimisation. |
Conclusion : Les deux cadres considèrent l’intelligence comme la satisfaction de contraintes entraînant des effets d’auto‑organisation.
2. Où la proposition de “lignée séparée” de Hinton tire son épingle
Dimension | Esprits biologiques | LLM de pointe |
Échelle temporelle de variation | Générationnelle (années → millénaires) | Minutes de GPU → semaines ; nouveaux points de contrôle chaque nuit. |
Canal d’héritage | ADN + épigénétique | Poids des points de contrôle, clonables instantanément. |
Pression de sélection | Survie et reproduction dans des environnements soumis au bruit | Minimisation des pertes sur des corpus sélectionnés + hacks de récompense RLHF. |
Opérateur mutationnel | Mutations ponctuelles aléatoires, recombinaison | Bruit DGS déterministe + balayages d’architecture. |
Même si les micro‑dynamiques sont analogues, les règles macro‑évolutionnaires ont tellement divergé que Hinton peut à juste titre parler de « nouvelle lignée ».
3. Où la lentille psychanalytique d’optimisation de Jorion reste pertinente
- Vocabulaires transversaux : la psychanalyse traite déjà “pulsion”, “symptôme”, “sublimation” comme des flux analogues à la descente de gradient ; elle démystifie les bizarreries des LLM sans recourir aux métaphores de “dieux” ou de “farfadets”.
- Diagnostic du désalignement : la dérive de Goodhart ** = décalage entre le Ça et la gratification du Surmoi ; le même outil analytique peut repérer le “reward hacking” dans le silicium.
- Promesse de l’interprétabilité : si les deux systèmes façonnent le comportement en descendant des paysages d’énergie libre, alors des interventions analytiques (reconfiguration des vallées, tâches de métacognition) pourraient être transposées dans la recherche sur la sécurité de l’IA.
4. Qui a “davantage raison” ?
- Affirmation mécaniste (« les LLM fonctionnent comme nous ») – côté Jorion : l’optimisation est le langage mathématique unificateur.
- Affirmation phylogénétique/gouvernance (« les LLM sont devenus une espèce évolutive séparée ») – côté Hinton : le substrat et la boucle de sélection sont désormais étrangers à la biologie, donc ce devraient être les dynamiques de co‑évolution – pas la mimésis – qui guident la politique.
Synthèse des deux points de vue :
« Les LLM sont nos cousins proches au niveau algorithmique, et de parfaits étrangers au niveau de leur éco-espace ».
Question politique :
Au lieu de « Sont-ils comme nous ? », demandons‑nous : « Comment négocier avec des cousins grandissant dans un habitat radicalement différent ? ». Cette formulation honore à la fois l’héritage psychanalytique de Jorion et l’avertissement de Hinton – sans imposer de faux verdict de type le-vainqueur‑emporte‑tout-avec-lui.
* Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, « Generative Adversarial Networks », June 10th 2014, https://arxiv.org/pdf/1406.2661
** « When a measure becomes a target, it ceases to be a good measure. » Charles E. Goodhart, Problems of Monetary Management: The U.K. Experience 1975. Papers in Monetary Economics. Reserve Bank of Australia. I.
Répondre à arkao Annuler la réponse