Illustration par ChatGPT
La conception selon laquelle la vie mentale s’explique en tant qu’économie d’énergie est bien antérieure aux Grands Modèles de Langage (LLM) et aux neurosciences contemporaines. Le manuscrit inédit de Freud intitulé Esquisse d’une psychologie scientifique, datant de 1895 (in Freud 1956), décrivait l’activité psychique comme l’effort visant à décharger une « quantité » (Quantausgleich) et à minimiser le « déplaisir ». Freud n’avait pas accès aux mathématiques qui lui auraient permis d’étayer son ébauche de modèle, mais son intuition s’accordait étonnamment au formalisme actuel de la théorie de l’optimisation.
Dans les années récentes, le principe de l’énergie libre (FEP) de Karl Friston a reformulé cette intuition en termes mathématiques : tout système auto-organisé, qu’il s’agisse d’une cellule, du cortex ou d’une société humaine, doit minimiser l’énergie libre variationnelle : une limite supérieure informationnelle de la surprise ou de l’auto-information (Friston 2010). Concrètement, l’énergie libre s’assimile à une erreur de prédiction : l’écart entre les états sensoriels attendus et ceux qui s’observent empiriquement. La minimisation de cet écart est obtenue par une descente de gradient perpétuelle au sein d’un paysage énergétique interne – un analogue neurobiologique direct de la rétropropagation de l’erreur utilisée dans l’ajustement des réseaux neuronaux artificiels. Les modèles de traitement prédictif mettent en œuvre la FEP de manière hiérarchique : les principes premiers d’ordre supérieur (la meilleure estimation actuelle du système, exprimée sous forme de distribution de probabilité) tentent d’expliquer les entrées sensorielles au niveau inférieur (Friston & Kieble 2009). Lorsque les principes premiers se rigidifient ou sont mal ajustés, les erreurs de prédiction sont réinjectées dans des boucles récurrentes mathématiquement analogues aux points de selle : certaines régions du paysage énergétique qui ne sont ni des vallées ni des pics, à savoir, un point de selle topologique, plat dans une direction et incurvé dans l’autre (j’y reviendrai).
De ce point de vue, les symptômes névrotiques sont des minima locaux : le système s’est découvert un bassin stable, mais en réalité sous-optimal, empêchant toute réduction supplémentaire de l’erreur commise par la psyché. La rumination obsessionnelle est un cycle-limite à un point de selle : l’erreur de prédiction ne peut se stabiliser, mais toute évasion est prévenue par des principes premiers concurrents (Hopkins 2016). Le refoulement apparaît comme un terme de pénalité implicite : certaines représentations entraînent des coûts d’énergie libre astronomiquement élevés et sont donc maintenues hors de portée de la conscience. Le traitement psychanalytique devient alors une intervention sur le paysage énergétique : le thérapeute et l’analysant introduisent des perturbations contrôlées par le biais de nouvelles donnes telles que des interprétations, des associations libres, des rêves, des lapsus ou des actes manqués, qui remodèlent le paysage énergétique et ouvrent une trajectoire descendante vers l’apaisement : le système vient se loger dans un bassin à plus faible énergie. Des travaux théoriques récents reprennent même le langage de Freud : « l’appareil mental minimise l’énergie libre » (voir Frontiers 2020).
Un alignement de cette nature offre un type de modélisation unifiée et optimisée où les pulsions se traduisent par des principes premiers de très haute précision appelant une confirmation : les symptômes sont des cycles-limites où les erreurs de prédiction ne peuvent être résolues ; la thérapie équivaut à une révision du modèle à l’aide de nouvelles données fournies par les interprétations, les associations libres, les lapsus, etc. et les « intuitions fulgurantes » reflètent la transition vers un attracteur à énergie libre plus faible.
Des travaux récents rendent explicite cet alignement. Hopkins (2016) écrit : « L’appareil mental minimise l’énergie libre ». Pezzulo et al. (2021) décrivent le « travail » psychanalytique comme la résolution d’erreurs de prédiction. Même les concepts les moins évidents comme la résistance à l’analyse, la perlaboration, la latence des rêves, se découvrent désormais une interprétation quantitative.
* * *
Pourquoi cela vaut-il la peine de jeter un tel pont entre la théorie de l’optimisation et la psychanalyse (« psychologie des profondeurs ») ?
Tout d’abord en raison de l’unification conceptuelle que cela autorise : un tel alignement entre la psychanalyse et les neurosciences computationnelles traditionnelles dissout la dichotomie arbitraire existant aujourd’hui entre « thérapie par la parole » et « science dure ».
Deuxièmement, parce qu’un tel pont crée un effet de levier quantitatif. Des concepts tels que la pulsion, la résistance à l’analyse, la catharsis, accèdent à des définitions opérationnelles (pondération de précision, principes premiers inhibiteurs, minima globaux) se prêtant à la modélisation et à la vérification empirique.
Troisièmement, parce qu’un tel pont autorise une traductibilité réciproque entre l’IA et la psychanalyse. Le mécanisme même qui anime les réseaux de type « intelligence artificielle générative », à savoir la descente de gradient stochastique, s’identifie à une lentille à travers laquelle observer les pathologies mentales, tandis que le savoir-faire psychanalytique met en évidence les cas limites (boucles, blocages, contraintes) qui nuisent à l’optimisation de l’IA.
Quatrièmement, parce qu’un tel pont favorise l’innovation clinique. S’il devient en effet possible de cartographier les configurations symptomatiques sur des caractéristiques topologiques (profondeur du bassin de préférences, courbure de la selle), les futurs outils numériques, tels que les LLM affinés sur un corpus de retranscriptions de séances de thérapie, pourraient diagnostiquer et guider les dynamiques psychiques en temps réel.
Vu sous cet angle, la psychanalyse s’avère n’être aucunement un conte de fées désuet, mais bien au contraire une théorie qualitative de l’optimisation, d’un statut précurseur, à laquelle les mathématiques modernes fournissent désormais la notation qui lui faisait défaut. L’IA fournit la preuve de concept technique, tandis que les neurosciences confirment que le cerveau, à l’instar de tout autre système génératif adaptatif, est une machine à descente de gradient en perpétuel mouvement.
(à suivre…)
Références :
Freud, S. (1956 [1895]). La naissance de la psychanalyse, Paris : PUF
Friston K. (2010). ‘The free-energy principle: a unified brain theory?’ Nat Rev Neurosci 11: 127–138. https://doi.org/10.1038/nrn2787
Friston K., Kiebel S (2009). ‘Predictive coding under the free-energy principle.’ Phil Trans R Soc B 364: 1211‑1221.
Frontiers (2020). https://www.frontiersin.org/research-topics/6408/free-energy-in-psychoanalysis-and-neuroscience/magazine
Hopkins J. (2016). ‘Free energy in psychoanalysis and neuroscience.’ Frontiers in Psychology 7: 153.
Pezzulo G., et al. (2021). ‘Predictive coding concepts in the working‑through process.’ Neuropsychoanalysis 23: 45‑60.
Laisser un commentaire