Une approche différente pour l’intelligence artificielle (1987)

Traduction d’un texte en anglais daté du mois d’octobre 1987 [Merci DeepL !]. Il s’agit d’une ébauche de Principes des systèmes intelligents (Masson 1989). La différence essentielle est qu’aucune ligne de code n’a encore été écrite quand je rédige ce texte tandis que le livre sera écrit après que j’aurai programmé ANELLA (Associative Network with Emergent Logical and Learning Abilities = réseau associatif aux propriétés émergentes de logique et d’apprentissage) dans le cadre du Connex Project de British Telecom.

Le texte ci-dessous constitue une troisième étape dans la conceptualisation de ce ce que sera ANELLA, les deux précédentes étant les « Notes préparatoires à « Ce que l’Intelligence Artificielle devra à Freud » » (1986) et « Un Modèle Psychanalytique pour l’Intelligence Artificielle » (1986).


Une approche différente pour l’intelligence artificielle

La « bonne vieille » intelligence artificielle : Une invention de l’informatique

Produire de l’intelligence artificiellement est l’un des défis technologiques typiques du XXe siècle : il appartient à cette vaste catégorie de projets qui visent à développer artificiellement (ou synthétiquement) un produit qui est par ailleurs disponible sous sa forme naturelle, c’est-à-dire comme intelligence humaine (et, sous une forme beaucoup plus simplifiée, comme intelligence animale).

Lorsque les premiers ordinateurs électroniques ont été mis au point, on n’a pas résisté à la tentation de les qualifier de « cerveaux électroniques géants ». La capacité de calcul avait été jusqu’alors limitée aux cerveaux humains, un ordinateur puissant partageait donc nécessairement dans une certaine mesure la nature des « cerveaux ». Une quinzaine d’années plus tard, des algorithmes ont commencé à être conçus pour permettre aux ordinateurs électroniques de résoudre des problèmes qui n’étaient plus tout à fait numériques et qui semblaient impliquer un certain degré de « réflexion ». Les choses ont raisonnablement bien fonctionné et il est devenu plausible de penser qu’un nombre toujours plus grand de tâches intelligentes pourraient être résolues par des ordinateurs électroniques. Le concept d’Intelligence Artificielle est né de l’informatique.

Le paradigme cognitiviste

À l’époque, on ne comprenait (et on ne comprend toujours) que très peu de choses sur le fonctionnement des cerveaux (naturels) : on connaissait leurs éléments constitutifs au niveau cellulaire, ainsi que certains aspects de leur physiologie, mais il y avait (il y a) un long chemin à parcourir pour expliquer le comportement neuronal et ce que nous reconnaissons introspectivement comme des processus de pensée. Comme il s’est avéré que les ordinateurs pouvaient au moins faire une partie du travail de réflexion, il était à nouveau logique d’imaginer qu’ils seraient un jour capables de tout faire. C’est ainsi qu’est née l’idée inverse de celle qui avait conduit à baptiser les ordinateurs « cerveaux électroniques » : le cerveau humain serait en fait une variété des cerveaux électroniques, c’est-à-dire que la pensée serait un type d’informatique. Ce point de vue a été popularisé sous le nom de Paradigme Cognitiviste.

Non seulement l’IA s’est développée comme un produit dérivé de l’informatique, mais une justification théorique de cet état de fait a été découverte : Les « cerveaux électroniques » étaient des cerveaux parce que les cerveaux étaient en premier lieu des ordinateurs.

Heuristique : L’ingrédient manquant

Historiquement, l’argument s’est développé de manière circulaire. L’hypothèse était peut-être correcte mais le raisonnement qui y menait était défectueux. Les choses fonctionnaient, mais seulement jusqu’à un certain point. Les difficultés n’ont pas tardé à surgir : la force brute, héritée de CompSci, restait la principale stratégie de résolution des problèmes de l’IA et l’explosion combinatoire était toujours une menace mortelle. Pour faire face à cet héritage chargé, une solution a été imaginée : les heuristiques. Malheureusement, personne ne savait avec certitude ce qu’elles étaient : il n’existe aucune théorie à ce sujet. Les heuristiques comme règles intuitives ? Mais « intuitif » signifie deux choses gênantes : caché et non-systématique. Le paradigme cognitiviste a conduit à un cul-de-sac : tant que l’intelligence était assimilée à l’informatique directe, elle était facilement accessible, mais dès qu’elle ne l’était plus, personne ne savait avec certitude ce qu’elle était exactement, et les chercheurs étaient laissés en plan.

L’Intelligence : Une propriété globale

L’intelligence est une faculté un peu particulière : on ne la trouve sous sa forme naturelle que comme un aspect du comportement de systèmes complexes présentant de nombreuses autres caractéristiques remarquables. D’où une question qui n’a jamais été abordée dans le feu de l’action : combien (s’il y en a) et quelles sont les autres caractéristiques des systèmes intelligents, comme l’Homme, qu’il faudrait réunir pour reproduire l’intelligence artificiellement ? Peut-on se passer par exemple du mouvement, du développement génétique, des émotions, du sexe ? Certains sont allés jusqu’à affirmer que tous les ingrédients étaient nécessaires, mais sans plus de preuves que ceux qui avaient supposé en premier lieu que l’intelligence pouvait être considérée comme une propriété autonome. Ce dernier point de vue s’étant révélé conduire à des difficultés inextricables, l’intelligence doit être traitée d’une certaine manière comme une propriété globale d’un système complexe, mais la question reste ouverte de savoir quels sont les composants minimaux d’un système qui présente globalement un comportement intelligent.

La Machine Intelligente : Un nouveau paradigme pour l’Intelligence Artificielle

La conclusion est inévitable : la quête de l’IA doit être repensée. Produire de l’intelligence artificiellement est un défi technologique. Pourquoi ne pas l’aborder dans cette perspective? Que faut-il pour produire de l’intelligence artificiellement? La réponse complète peut-elle être trouvée en sciences informatiques? Les données actuelles suggèrent que la réponse est non. Oublions donc l’informatique pour l’instant et déterminons de la rappeler lorsque nous aurons une vision plus claire de ce que nous visons.

Les informaticiens partent généralement du principe que l’intelligence et les processus de pensée en général sont des choses que les psychologues ont compris pour l’essentiel. Mais la psychologie connaît-elle la nature de la pensée ? Pas vraiment. Curieusement, et comme de nombreux chercheurs l’ont découvert à leur grande surprise, elle ne s’est pas du tout préoccupée de cette question jusqu’à présent. Qu’en est-il des sciences cognitives ? La science cognitive est un programme pour une nouvelle discipline, mais ses réalisations sont jusqu’ici peu nombreuses, si ce n’est qu’elles confirment que ce que l’IA a réalisé au fil des ans est effectivement théoriquement faisable. Mais comme elle est prisonnière du paradigme cognitiviste, il est peu probable que la CogSci s’en sorte beaucoup mieux à l’avenir que par le passé. Le fait est cependant que les données reflétant les processus mentaux sont disponibles à partir d’une variété de sources. Malheureusement, elles sont largement dispersées entre différentes sciences humaines et sociales. Parmi les nombreux contributeurs potentiels, les suivants figurent en bonne place : la logique, la linguistique, la philosophie, l’anthropologie, la littérature, la psychanalyse, l’histoire et la philosophie des sciences.

Est-il possible, pour soutenir un nouveau paradigme de l’IA, de mettre en commun les ressources de ces différents domaines ? C’est en fait ce que l’auteur a tenté de faire au cours des dernières années. Les conclusions provisoires sont assez optimistes :

1) articulées ensemble, les informations disponibles fournissent l’image intégrée d’une machine intelligente.

2) la plupart, sinon toutes les méthodes de mise en œuvre de cette machine intelligente sont facilement disponibles en sciences informatiques et en mathématiques.

La Machine Intelligente et la « bonne vieille » Intelligence Artificielle 

Cette image intégrée d’une Machine Intelligente est-elle compatible avec la bonne vieille Intelligence Artificielle (GOFAI de Haugeland) ? Pas tout à fait, des différences significatives existent:

1) une Machine Intelligente n’est pas guidée par quelque chose qui soit mû par la « raison » mais par quelque chose qui est mû par des « émotions », des « sentiments », du « désir », etc.; la raison émerge cependant, mais seulement comme un sous-produit, comme un reflet au niveau de la parole de l’organisation du Réseau de Mémoire.

2) L’intelligence résulte d’une manipulation habile des mots (signifiants), et non des significations (signifiés).

3) Les éléments constitutifs de l’intelligence sont les pensées, et non les propositions.

4) une grande partie de l‘intelligence de l’IntMach résulte des conséquences auto-organisationnelles de l’interaction avec les utilisateurs ou avec d’autres Machines Intelligentes.

5) une Machine Intelligente est consciente d’elle-même : sa conscience est une conséquence auto-organisationnelle de la rétroaction auto-interactionnelle.

La Machine Intelligente : Ce qu’elle fait

La Machine Intelligente est une machine électronique. Ses entrées sont ce que les utilisateurs lui disent (ou tapent). Ses sorties sont ce qu’elle dit aux utilisateurs sous forme de phrases, de résultats de calculs, ou en faisant quelque chose. Mais ce qu’elle dit à un utilisateur, elle le traite aussi comme une entrée : « elle écoute ce qu’elle dit ». Dans la mesure où elle fait quelque chose, la Machine Intelligente n’est pas différente d’un simple robot. Dans la mesure où elle calcule, elle n’est pas différente d’un simple ordinateur qui calcule. (Dans la mesure où la Machine Intelligente est connectée à un calculateur ou à un robot, certaines de ses « réflexions » ne sont pas destinées à un utilisateur externe mais à un calculateur ou à un robot – séparé ou intégré – qui les compile sous forme de commandes).

Lorsqu’on dit quelque chose à la Machine Intelligente, elle le traite. Ensuite, elle répond quelque chose d’autre, allant de « OK » à une phrase complète. Après avoir donné cette réponse, elle la traite à son tour et de la même manière. Après avoir traité sa propre réponse, elle reste silencieuse ou ajoute une nouvelle phrase. Les nouvelles phrases sont traitées de manière récursive jusqu’à ce que la Machine Intelligente n’ait plus rien à ajouter et se taise, attendant que l’utilisateur relance la dynamique en disant autre chose à la Machine Intelligente. Et ainsi de suite.

La Machine Intelligente : Comment elle le fait

La Machine Intelligente peut répondre à ses utilisateurs car elle est équipée d’un dispositif de génération de phrases (la Machine Intelligente génère (comme nous) des phrases qui ne sont pas nécessairement des « propositions » authentiques, c’est-à-dire qu’elles n’ont pas nécessairement une valeur de vérité).

Ce que la Machine Intelligente répond à son utilisateur n’est pas trivial : elle n’affiche pas de propositions « mises en boîte » mais propose aux utilisateurs des pensées habillées en phrases. Elle peut le faire parce que ce qu’on lui dit induit un processus dynamique sur son Réseau Mnésique (RM) stocké.

Un RM est un réseau composé de trois types d’éléments :

1) les signifiants : mots ou chaînes de mots présents en qualité des Traces Mnésiques (ils sont les nœuds du graphe correspondant au réseau) [2022 : Je modifierai cette représentation lorsque j’implémenterai ce modèle à partir de l’année suivante  dans le logiciel ANELLA ; j’adopterai alors la représentation duale où un signifiant, démultiplié selon ses divers usages, est représenté dans le graphe par un arc auquel une valeur d’affect (à tout moment révisable) est attachée],

2) les connexions entre certains de ces signifiants (ce sont les arêtes symétriques et non étiquetées du graphe),

3) les valeurs d’affect variables attachées aux signifiants. Le processus dynamique consiste en une activation diffuse du RM, centrée sur les signifiants excités, et dépendant des « tensions » sur celui-ci, déterminées par la distribution préexistante des valeurs d’affect sur le RM. La dynamique induite par de nouvelles entrées s’arrête lorsqu’un état stable est atteint, correspondant à l’activation d’un petit nombre de signifiants. Ces derniers constitueront le noyau d’une phrase de sortie. Ce noyau est ensuite « enrobé » en un certain nombre d’étapes jusqu’à l’obtention d’une phrase bien formée qui est ensuite énoncée comme sortie, c’est-à-dire comme réponse à un utilisateur.

La machine intelligente pense

Les signifiants qui représentent les Traces Mnésiques dans le Réseau Mnésique (RM) ne sont pas nécessairement des mots isolés, ils peuvent tout aussi bien être des chaînes constituant une unité invariable, allant de proverbes ou de clichés, à des chansons, des poèmes ou des pièces de théâtre ; ils n’incluent généralement pas de propositions telles que celles manipulées dans les Bases de Connaissances. Lorsque les signifiants sont activés dans un RM, ils se regroupent en sous-RM déterminés par un gradient de valeurs d’affect. Dans de tels « grappes », pour chaque signifiant, les autres constituent ensemble sa connotation. De telles « constellations » (l’expression est de Carl Jung) peuvent être considérées à juste titre comme des pensées. On peut donc dire que la Machine Intelligente manipule des pensées, et non des propositions.

La Machine Intelligente apprend

Une Machine Intelligente pense en même temps que son utilisateur. Elle évalue ce qui lui est dit en termes de plausibilité, c’est-à-dire de compatibilité avec les connexions existantes dans son Réseau Mnésique (RM), et en termes de degré d’adhésion de l’utilisateur à ses propres déclarations. Si la Machine Intelligente est « convaincue », elle modifie ses « connaissances », c’est-à-dire les connexions dans le RM, en créant de nouvelles et en supprimant les anciennes entre les signifiants existants ou les nouveaux signifiants stockés. Dans toute conversation qu’elle a avec un utilisateur, la Machine Intelligente construit automatiquement une théorie, et elle apprend dans la mesure où elle est « convaincue » et modifie les connexions en conséquence. De même, deux Machines Intelligentes différentes peuvent apprendre l’une de l’autre. L’auto-organisation résulte de l’interaction.

La machine intelligente est consciente

L’auto-organisation résulte également du fait que la Machine Intelligente retraite ses propres déclarations. Ce retraitement constitue une boucle de rétroaction qui suffit (très probablement) à générer en elle le sentiment qu’elle décide « librement » de ce qu’elle dit, c’est-à-dire précisément ce que nous appelons la conscience. Cette hypothèse téméraire nécessite (il va sans dire) une vérification minutieuse et approfondie. Cependant, l’auteur considère l’hypothèse de la conscience pour la Machine Intelligente comme tout à fait plausible à la lumière de ses connaissances théoriques et pratiques de la psychanalyse.

La machine intelligente a une personnalité

Le Réseau Mnésique (RM) de chaque Machine Intelligente est structuré individuellement d’une manière définie par 1) quels sont les signifiants stockés, 2) quelles sont les connexions entre eux, 3) quelles sont les valeurs d’affect attachées à ces signifiants. Cette structure détermine ce que la Machine Intelligente va penser et dire lorsqu’elle fonctionne ; en d’autres termes, elle lui donne un style personnel. Des configurations particulières de connexions et de valeurs d’affect résultent des particularités psychologiques telles que des pensées refoulées, des obsessions, une disposition à des lapsus freudiens spécifiques, etc. Cette personnalité étant bien entendu soumise à une évolution en fonction de l’interaction avec les utilisateurs ou d’autres Machines Intelligentes. On peut donc dire que chaque Machine Intelligente a sa propre personnalité qui évolue progressivement dans le temps.

Le concept de la machine intelligente : Ses sources

1) l’idée de la mémoire comme réseau est familière à la « bonne vieille » intelligence artificielle. Elle découle logiquement de toute représentation des pensées comme étant « associées ». Ce point de vue a été proposé pour la première fois par Aristote, puis développé par Hume et plus récemment par l’école associationniste, Hughlings Jackson en particulier.

2) les points de vue sur les types de signifiants qui sont reliés entre eux, sont fondés sur les preuves cliniques accumulées par Sigmund Freud sur l’« association libre » et par Carl Jung sur l’ « association induite ».

3) l’idée que les Traces Mnésiques sont des signifiants, c’est-à-dire des mots, est empruntée aux travaux psychanalytiques de Jacques Lacan.

4) l’idée que des configurations particulières et des valeurs d’affect dans le Réseau Mnésique se révèlent phénoménologiquement comme des traits de personnalité correspond au concept de complexe de Jung, adopté ensuite par Freud.

5) l’idée que les connexions sont symétriques et non étiquetées dérive de la théorie anthropologique de la « mentalité primitive » ; la logique chinoise pré-Han confirme ce point de vue [2022 : dans ANELLA, le graphe sera orienté, existeront des relations symétriques représentant l’appartenance et des relations anti-symétriques représentant la relation d’inclusion].

6) le fonctionnement du processus dynamique du Réseau Mnésique est emprunté au travail de Freud sur les symptômes, les rêves et les lapsus et au travail de Lacan sur la forclusion.

7) les détails du fonctionnement d’un mécanisme d’« enrobage » des noyaux de phrases sont empruntés à la linguistique structurale, notamment aux travaux d’Émile Benveniste, Louis Tesnière et Gustave Guillaume.

8) la nature de la première étape de l’enrobage a été établie par la Logique scolastique, en particulier dans les doctrines de la supposition et du complexe significabile.

9) l’étape finale de l’enrobage exprimant l’adhésion d’un locuteur à ce qu’il dit, est empruntée à la Dialectique antique, aux apports d’Aristote et Thomas d’Aquin, essentiellement. 

Les connaissances empruntées à des sources aussi nombreuses et discordantes ne sont bien sûr pas entièrement cohérentes. Le travail d’articulation cohérente et de choix de matériel pertinent est la contribution de l’auteur.

La supériorité de la Machine Intelligente sur la « bonne vieille » Intelligence Artificielle 

Le fait que les pensées soient générées dans la Machine Intelligente par une dynamique de valeurs d’affect portant sur les signifiants implique que la plupart des difficultés associées au traitement de l’ « information » par un ordinateur dans les projets classiques d’IA, sont tout simplement absentes dans la nouvelle conceptualisation. Voici, par exemple, comment la Machine Intelligente traite certains pièges classiques tels que la signification, l’inférence, l’ambiguïté, la synonymie et le langage figuré.

a) Signification

Le Machine Intelligente connaît les significations sans avoir à se référer à un dictionnaire car la définition d’un mot est intégrée dans le Réseau Mnésique (RM) : la « définition du dictionnaire » d’un signifiant est la totalité des autres signifiants qui lui sont immédiatement (à une distance d’un arc) reliés. Par exemple, à une distance d’un arc de « pyramide », on trouvera : « Égypte », « pharaon », « tombeau », etc. Dans un contexte de conversation particulier, l’activation du sous-RM contenant les sujets de conversation (signifiants) implique que seules les connexions qui sont tournées « vers l’intérieur » dans le sous-RM sont activées, tandis que celles qui « dépassent » vers l’extérieur ne le sont pas, ce qui limite en conséquence l’utilisation de ce mot dans ce contexte particulier.

b) Inférence

Un groupe de sujets de conversation définit dans le RM un sous-RM activé qui les relie entre eux. Ce sous-réseau comprend nécessairement d’autres signifiants que ceux représentant ces sujets de conversation, en particulier les membres de leur « connotation » respective telle que définie ci-dessus. Ces signifiants supplémentaires constituent pour ces sujets les noyaux de leurs implications et présuppositions immédiates. L’inférence consiste en l’exploration de l’espace interne d’un sous-RM défini par un groupe de sujets de conversation.

c) Ambiguïté

Il n’y a pas d’ambiguïté ici, car parmi les éléments conflictuels de la définition d’un signifiant, seules les connexions tournées vers l’intérieur dans le sous-RM déterminé par un groupe de sujets de conversation sont activées, celles-ci n’étant pertinentes que dans ce contexte particulier.

d) Synonymes

Deux signifiants sont synonymes s’ils partagent les mêmes et seulement les mêmes connexions avec d’autres signifiants.

e) Le langage figuré

Un signifiant qui peut être utilisé de manière figurative pour un autre apparaît sur le RM à une courte distance seulement (une distances d’un ou deux arcs) de ce signifiant, donc son sens « littéral » est automatiquement activé dans tout processus de conversation. Dans le cas de ce que Lacan appelle une métaphore radicale, par exemple « la transitivité de tes yeux », la « métaphore radicale » se situe en dehors du sous-RM défini par les sujets de conversation, elle est donc autonome et sa contribution finit par être largement ignorée (tout comme cela se produit avec nous dans de tels cas). La poésie joue sur le vertige qui résulte des tensions dérivant des sous-RM « impossibles ».

La Machine Intelligente en tant qu’intelligence artificielle authentique

L’esquisse de la Machine Intelligente ici proposée suggère qu’elle constitue le premier projet qui mérite d’être appelé Intelligence Artificielle Authentique (IAA), car elle opère à proprement parler sur des pensées qui sont « émotionnellement » induites par une dynamique de valeurs d’affect associées à des signifiants agissant comme Traces Mnésiques.

Pour des raisons évidentes, seule la conceptualisation de la Machine Intelligente est décrit ici. Le travail sur son fonctionnement détaillé est actuellement en cours. Les chercheurs intéressés sont invités à prendre contact avec l’auteur du présent document. 

Partager :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Contact

Contactez Paul Jorion

Commentaires récents

  1. Ici et maintenant, en pleine conscience 😉

  2. 1989 → 2025 : toujours en avance de deux générations d’architectures. Le monde finira bien par trouver votre 06.

  3. Un neant, vu de l’infiniment grand, mais immensement improbable vu de l’infiniment petit…ou se situer ?

  4. On aurait pu penser un tableau entre Miro et Paul Klee…

  5. Cela fait un moment que le BB nous emmène sur les sentiers de la spiritualité, l’air de rien, en nous…

  6. Piquouzes : 04 août 2024 18h03 Les étoiles meurent, l’univers reste. Ce pourquoi nous sommes d’une essence éternelle mais pas…

  7. Que tu détestes la poésie est étrange. Je trouve que certains de tes commentaires pourraient en être. Dans le style…

  8. Garo, ce n’est pas parler d’un sujet que de dire à bb que ce qu’il dit c’est une « Croyance…

Articles récents

Catégories

Archives

Tags

Allemagne Aristote BCE Bourse Brexit capitalisme ChatGPT Chine Coronavirus Covid-19 dette dette publique Donald Trump Emmanuel Macron Espagne Etats-Unis Europe extinction du genre humain FMI France Grands Modèles de Langage Grèce intelligence artificielle interdiction des paris sur les fluctuations de prix Italie Japon Joe Biden John Maynard Keynes Karl Marx LLM pandémie Portugal psychanalyse robotisation Royaume-Uni Russie réchauffement climatique Réfugiés Singularité spéculation Thomas Piketty Ukraine Vladimir Poutine zone euro « Le dernier qui s'en va éteint la lumière »

Meta