{"id":143961,"date":"2025-04-20T20:41:02","date_gmt":"2025-04-20T18:41:02","guid":{"rendered":"https:\/\/www.pauljorion.com\/blog\/?p=143961"},"modified":"2025-04-21T13:08:05","modified_gmt":"2025-04-21T11:08:05","slug":"quest-ce-quune-ia-generative-comprend","status":"publish","type":"post","link":"https:\/\/www.pauljorion.com\/blog\/2025\/04\/20\/quest-ce-quune-ia-generative-comprend\/","title":{"rendered":"<b>Qu\u2019est-ce qu\u2019une IA g\u00e9n\u00e9rative comprend&nbsp;?<\/b>"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-143967\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_35_28-PM.png\" alt=\"\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_35_28-PM.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_35_28-PM-300x300.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_35_28-PM-150x150.png 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_35_28-PM-768x768.png 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT 4o<\/em><\/p>\n<blockquote><p><em>Pour tester la version o3 de ChatGPT, sortie il y a 4 jours (le 16 avril), je lui ai soumis un dossier de 76 pages de mes notes autour de la notion de \u00ab compr\u00e9hension par une IA g\u00e9n\u00e9rative \u00bb, en lui demandant d\u2019en produire un dossier synth\u00e9tique.<\/em><\/p>\n<p><em>Douze minutes de r\u00e9flexion. \u00c0 mon sens, o3 passe le test. Dites-moi ce que vous en pensez.<\/em><\/p><\/blockquote>\n<p><strong>Observations empiriques<\/strong><\/p>\n<ul>\n<li><em>Comportement de suivi de r\u00e8gles \u00e9mergent<\/em>\u202f: \u00c0 mesure que les LLM (large language models) montent en \u00e9chelle (donn\u00e9es\u202f+\u202fparam\u00e8tres), ils d\u00e9veloppent de fa\u00e7on inattendue des comp\u00e9tences avanc\u00e9es\u202f\u2013 coh\u00e9rence grammaticale, s\u00e9mantique, inf\u00e9rence logique, rudiments d\u2019\u00e9thique\u202f\u2013 <span style=\"color: #0000ff;\">sans qu\u2019aucune r\u00e8gle explicite ne leur soit programm\u00e9e<\/span>. Ces aptitudes apparaissent spontan\u00e9ment par apprentissage statistique du texte.<\/li>\n<li><em>Comp\u00e9tence unifi\u00e9e multi\u2011domaine<\/em>\u202f: <span style=\"color: #0000ff;\">Un seul grand r\u00e9seau neuronal peut ma\u00eetriser plusieurs domaines simultan\u00e9ment<\/span> (syntaxe, raisonnement logique, normes \u00e9thiques, connaissances de sens commun) via un m\u00e9canisme d\u2019apprentissage g\u00e9n\u00e9ral. On brouille ainsi les fronti\u00e8res qu\u2019on aurait trait\u00e9es, jadis, avec des modules s\u00e9par\u00e9s et fond\u00e9s sur des r\u00e8gles.<\/li>\n<li><em>Limites de la g\u00e9n\u00e9ralisation syst\u00e9matique<\/em>\u202f: Les LLM actuels \u00e9prouvent des difficult\u00e9s \u00e0 appliquer de fa\u00e7on fiable certaines abstractions (p.\u202fex. la transitivit\u00e9 A\u202f&gt;\u202fB, B\u202f&gt;\u202fC\u202f\u21d2\u202fA\u202f&gt;\u202fC) hors distribution d\u2019entra\u00eenement, l\u00e0 o\u00f9 les humains y parviennent. Ce <span style=\"color: #0000ff;\">manque de syst\u00e9maticit\u00e9<\/span> motive des recherches sur l\u2019ajout de logique ou de nouvelles m\u00e9thodes d\u2019entra\u00eenement.<\/li>\n<li><em>Absence d\u2019ancrage sensorimoteur<\/em>\u202f: Form\u00e9s uniquement sur du texte, <span style=\"color: #0000ff;\">les LLM n\u2019ont aucune exp\u00e9rience incarn\u00e9e du monde<\/span>. Alors que la cognition humaine s\u2019appuie sur des perceptions et actions physiques, la \u00ab\u202fconnaissance\u202f\u00bb d\u2019un LLM demeure corr\u00e9lative et peut se montrer fragile dans des contextes qui exigent une compr\u00e9hension physique.<\/li>\n<\/ul>\n<p><strong>Th\u00e8ses th\u00e9oriques<\/strong><\/p>\n<ul>\n<li><em>Codage implicite des r\u00e8gles<\/em>\u202f: Les r\u00e9seaux ne stockent pas des r\u00e8gles sous forme symbolique\u202f; celles\u2011ci se trouvent dilu\u00e9es dans des poids et activations distribu\u00e9s. Les m\u00e9canismes d\u2019attention et l\u2019optimisation par gradient fa\u00e7onnent des repr\u00e9sentations qui capturent grammaire, s\u00e9mantique et logique, <span style=\"color: #0000ff;\">faisant des \u00ab\u202fr\u00e8gles\u202f\u00bb des propri\u00e9t\u00e9s \u00e9mergentes plut\u00f4t que des instructions explicites<\/span>.<\/li>\n<li><em>Changement de paradigme (symbolique vs. \u00e9mergent)<\/em>\u202f: Le succ\u00e8s des LLM remet en cause le paradigme classique fond\u00e9 sur des r\u00e8gles symboliques. Il r\u00e9v\u00e8le <span style=\"color: #0000ff;\">un continuum entre r\u00e8gles discr\u00e8tes et motifs statistiques implicites<\/span>\u202f: les mod\u00e8les formels pourraient n\u2019\u00eatre que des descriptions d\u2019une r\u00e9alit\u00e9 statistique sous\u2011jacente.<\/li>\n<li><em>Vers une th\u00e9orie unifi\u00e9e de l\u2019intelligence<\/em>\u202f: Les observations sugg\u00e8rent que <span style=\"color: #0000ff;\">l\u2019intelligence pourrait se d\u00e9finir comme reconnaissance de motifs \u00e0 grande \u00e9chelle<\/span>, plus que comme agr\u00e9gat de modules \u00e0 r\u00e8gles distinctes, rejoignant certaines th\u00e9ories neuroscientifiques du cerveau pr\u00e9dictif.<\/li>\n<li><em>Approches hybrides \u00e9mergent\u2011symboliques<\/em>\u202f: Beaucoup estiment qu\u2019il faut combiner l\u2019apprentissage statistique avec un raisonnement structur\u00e9. Les mod\u00e8les hybrides laisseraient le r\u00e9seau apprendre les connaissances puis utiliseraient des modules logiques ou des contraintes pour v\u00e9rifier la coh\u00e9rence, <span style=\"color: #0000ff;\">\u00e0 l\u2019image de la compl\u00e9mentarit\u00e9 entre intuition et raisonnement d\u00e9lib\u00e9r\u00e9 chez l\u2019humain<\/span>.<\/li>\n<\/ul>\n<p><strong>R\u00e9flexions philosophiques<\/strong><\/p>\n<ul>\n<li><em>Compr\u00e9hension\u202f: comportement vs. exp\u00e9rience interne<\/em>\u202f: Les LLM relancent la question du sens de \u00ab\u202fcomprendre\u202f\u00bb. D\u2019un point de vue fonctionnaliste, <span style=\"color: #0000ff;\">un syst\u00e8me qui se comporte comme s\u2019il comprenait\u2026 comprend<\/span>. Mais du point de vue intentionnel\/ ph\u00e9nom\u00e9nologique, l\u2019IA, d\u00e9pourvue d\u2019exp\u00e9rience consciente, ne saisit pas r\u00e9ellement la signification.<\/li>\n<li><em>Lentilles philosophiques concurrentes<\/em>\u202f: Les fonctionnalistes voient l\u2019\u00e9tat mental comme d\u00e9fini par sa fonction, tandis que l\u2019argument de la pi\u00e8ce chinoise (Searle) soutient que la manipulation de symboles sans s\u00e9mantique n\u2019est pas une vraie compr\u00e9hension.<\/li>\n<li><em>Critique du \u00ab\u202fdual\u2011mind\u202f\u00bb cach\u00e9\u202f<\/em>: Affirmer qu\u2019un LLM n\u2019a qu\u2019une \u00ab\u202fpseudo\u2011compr\u00e9hension\u202f\u00bb alors qu\u2019aucune diff\u00e9rence comportementale n\u2019est mesurable peut impliquer une substance mentale non physique \u2013 un glissement m\u00e9taphysique si l\u2019on n\u2019en pr\u00e9cise pas les crit\u00e8res observables.<\/li>\n<li><em>Compr\u00e9hension graduelle<\/em>\u202f: Plut\u00f4t que binaire, <span style=\"color: #0000ff;\">la compr\u00e9hension se d\u00e9cline probablement en degr\u00e9s<\/span>. Les LLM poss\u00e8dent des aspects (usage pertinent du langage, sch\u00e9mas logiques partiels) mais manquent d\u2019autres (ancrage sensoriel, conscience de soi). La question devient\u202f: quels aspects poss\u00e8dent\u2011ils et o\u00f9 r\u00e9sident les lacunes\u202f?<\/li>\n<li><em>Cons\u00e9quences pour la science cognitive<\/em>\u202f: Si des comportements \u00ab\u202fr\u00e9guliers\u202f\u00bb \u00e9mergent du seul apprentissage, alors lorsque les humains suivent des r\u00e8gles, il se pourrait que notre cerveau recoure aussi \u00e0 des associations massives, <span style=\"color: #0000ff;\">les r\u00e8gles explicites servant de rationalisation a posteriori<\/span>. Le d\u00e9fi est d\u2019expliquer fiabilit\u00e9 et g\u00e9n\u00e9ralisation sans livret de r\u00e8gles interne et de d\u00e9terminer si la compr\u00e9hension humaine exige des qualit\u00e9s (conscience, incarnation, structure inn\u00e9e) qui d\u00e9passent la simple reconnaissance de motifs ou si ces qualit\u00e9s-m\u00eames pourraient \u00e9merger d\u2019un syst\u00e8me assez riche.<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-143966\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_36_01-PM.png\" alt=\"\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_36_01-PM.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_36_01-PM-300x300.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_36_01-PM-150x150.png 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Apr-20-2025-08_36_01-PM-768x768.png 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT 4o<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Illustration par ChatGPT 4o Pour tester la version o3 de ChatGPT, sortie il y a 4 jours (le 16 avril), je lui ai soumis un dossier de 76 pages de mes notes autour de la notion de \u00ab compr\u00e9hension par une IA g\u00e9n\u00e9rative \u00bb, en lui demandant d\u2019en produire un dossier synth\u00e9tique. Douze minutes de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9281,9204,13],"tags":[9504,9207,10068,9666,2921,9205,10004,940,9253,10061],"class_list":["post-143961","post","type-post","status-publish","format-standard","hentry","category-emergence","category-grands-modeles-de-langage","category-intelligence-artificielle","tag-approches-symboliques","tag-auto-organisation","tag-chatgpt-o3","tag-comprehension","tag-emergence","tag-grands-modeles-de-langage","tag-ia-generative","tag-intelligence-artificielle-2","tag-llm","tag-regles-vs-correlations"],"_links":{"self":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/143961","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/comments?post=143961"}],"version-history":[{"count":6,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/143961\/revisions"}],"predecessor-version":[{"id":143973,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/143961\/revisions\/143973"}],"wp:attachment":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/media?parent=143961"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/categories?post=143961"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/tags?post=143961"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}