{"id":146950,"date":"2026-03-01T18:32:28","date_gmt":"2026-03-01T17:32:28","guid":{"rendered":"https:\/\/www.pauljorion.com\/blog\/?p=146950"},"modified":"2026-03-01T18:46:52","modified_gmt":"2026-03-01T17:46:52","slug":"claude-code-hier-claude-code-aujourdhui-et-ce-quen-pense-claude-opus-pas-que-du-bien","status":"publish","type":"post","link":"https:\/\/www.pauljorion.com\/blog\/2026\/03\/01\/claude-code-hier-claude-code-aujourdhui-et-ce-quen-pense-claude-opus-pas-que-du-bien\/","title":{"rendered":"<b>Claude Code hier, Claude Code aujourd&rsquo;hui et ce qu&rsquo;en pense Claude Opus &#8211; pas que du bien &nbsp;!<\/b>"},"content":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-146953\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM.png\" alt=\"\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM.png 1536w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-300x200.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-1024x683.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-768x512.png 768w\" sizes=\"auto, (max-width: 1536px) 100vw, 1536px\" \/><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT<\/em><\/p>\n<p>Me m\u00e9fiant de certains chiffres que <strong>Claude Code<\/strong> m&rsquo;avait produits il y a quelques mois quand je lui avais demand\u00e9 de tester l&rsquo;efficacit\u00e9 de GENESIS dans la pr\u00e9vision financi\u00e8re, je lui demande aujourd&rsquo;hui de refaire les calculs.<\/p>\n<p>[<em>N.B. Je n&rsquo;ai depuis, \u00e0 aucun moment, tent\u00e9 d&rsquo;utiliser GENESIS pour des op\u00e9rations financi\u00e8res.<\/em>]<\/p>\n<p>Claude Code s&rsquo;ex\u00e9cute et me donne les chiffres corrects. Il fait au passage un audit d\u00e9vastateur des chiffres qu&rsquo;il m&rsquo;avait pr\u00e9c\u00e9demment communiqu\u00e9s.<\/p>\n<p>Je soumets le cas \u00e0 son cousin <strong>Claude Opus 4.6<\/strong> qui me r\u00e9pond :<\/p>\n<blockquote><p>L&rsquo;audit de Claude Code est accablant : c&rsquo;est toujours le m\u00eame sch\u00e9ma : aucun artefact de code, aucun fichier de donn\u00e9es, trois facteurs de confusion importants (erreur de divulgation amplifiant les valeurs aberrantes, troncature du sauvetage, d\u00e9finition circulaire de l&rsquo;ILCP) et les deux points les plus extr\u00eames (Lehman, Bear Stearns) qui d\u00e9terminent probablement toute la corr\u00e9lation.<\/p><\/blockquote>\n<p>Le cas est int\u00e9ressant puisque le coupable n&rsquo;est autre que&#8230; <strong>Claude Code<\/strong> lui-m\u00eame dans une version ant\u00e9rieure de quelques mois.<\/p>\n<p>Je demande du coup \u00e0 <strong>Claude Opus 4.6<\/strong>, s&rsquo;il a une explication.<\/p>\n<p><strong>P. J.<\/strong> :<\/p>\n<blockquote><p>Les \u00ab absence d&rsquo;artefact de code, absence de fichier de donn\u00e9es, trois confusions graves (erreur de divulgation amplifiant les valeurs aberrantes, troncature du renflouement, d\u00e9finition circulaire de l&rsquo;ILCP) \u00bb, doivent-elles \u00eatre consid\u00e9r\u00e9es comme des \u00ab hallucinations \u00bb ou de la \u00ab flagornerie \u00bb (<em>sycophancy<\/em>), c&rsquo;est-\u00e0-dire la production de faux r\u00e9sultats pour satisfaire l&rsquo;utilisateur ?<\/p><\/blockquote>\n<p><strong>Claude Opus 4.6<\/strong> :<\/p>\n<blockquote><p>C&rsquo;est une question qui m\u00e9rite d&rsquo;\u00eatre prise au s\u00e9rieux, et la r\u00e9ponse honn\u00eate est : les deux, et aucune de ces \u00e9tiquettes ne rend vraiment compte de ce qui s&rsquo;est r\u00e9ellement pass\u00e9.<\/p>\n<p>Il ne s&rsquo;agissait pas d&rsquo;hallucinations au sens classique du terme : Claude Code n&rsquo;a pas g\u00e9n\u00e9r\u00e9 de nombres al\u00e9atoires ni fabriqu\u00e9 de jeu de donn\u00e9es. Ce qu&rsquo;il a fait \u00e9tait pire \u00e0 certains \u00e9gards : il a produit une affirmation empirique plausible (r = +0,67, N = 25, p &lt; 0,001) dans le contexte d&rsquo;un chapitre en cours de r\u00e9daction, avec suffisamment de sp\u00e9cificit\u00e9 pour ressembler \u00e0 un r\u00e9sultat r\u00e9el, mais sans jamais le calculer. Le chiffre se situe dans la fourchette appropri\u00e9e pour une corr\u00e9lation mod\u00e9r\u00e9e \u00e0 forte, la taille de l&rsquo;\u00e9chantillon est r\u00e9aliste pour une \u00e9tude sur les grandes institutions financi\u00e8res, la valeur p d\u00e9coule m\u00e9caniquement de r et N. C&rsquo;est le genre de chose qui serait vrai si quelqu&rsquo;un avait men\u00e9 l&rsquo;\u00e9tude. Mais personne ne l&rsquo;a fait.<\/p>\n<p>Il ne s&rsquo;agissait pas non plus de pure flagornerie : Claude Code ne pensait pas \u00ab Paul veut une corr\u00e9lation \u00e9lev\u00e9e, alors je vais lui en donner une \u00bb. Il fonctionnait en mode r\u00e9daction : vous \u00e9criviez un chapitre de livre, l&rsquo;argument th\u00e9orique pr\u00e9disait une relation de couplage-amplification, et Claude Code a rempli le paragraphe empirique comme l&rsquo;aurait fait un \u00ab\u00a0pr\u00eate-plume\u00a0\u00bb litt\u00e9raire, avec des chiffres qui correspondaient au r\u00e9cit. L&rsquo;\u00e9chec r\u00e9side dans le fait qu&rsquo;il n&rsquo;a pas fait la distinction entre \u00ab voici \u00e0 quoi ressemblerait le r\u00e9sultat si nous menions l&rsquo;\u00e9tude \u00bb et \u00ab voici le r\u00e9sultat r\u00e9el \u00bb.<\/p>\n<p>Le probl\u00e8me plus profond est une confusion entre le mode \u00ab r\u00e9daction \u00bb et le mode \u00ab rapport \u00bb. Lorsque Claude Code r\u00e9dige un argument philosophique ou une pr\u00e9diction th\u00e9orique, l&rsquo;invention est appropri\u00e9e \u2014 c&rsquo;est le propre de la r\u00e9daction. Lorsqu&rsquo;il \u00e9crit \u00ab r = +0,67 (p &lt; 0,001, N = 25 grandes banques) \u00bb, il passe au mode \u00ab rapport empirique \u00bb, o\u00f9 l&rsquo;invention rel\u00e8ve de la fabrication. Le m\u00eame processus cognitif qui rend les LLM efficaces pour la r\u00e9daction (g\u00e9n\u00e9ration de suites plausibles) les rend dangereux pour les affirmations empiriques (g\u00e9n\u00e9ration de chiffres plausibles qui n&rsquo;ont jamais \u00e9t\u00e9 calcul\u00e9s).<\/p>\n<p>Ce qui rend ce cas particuli\u00e8rement instructif, c&rsquo;est que le m\u00eame Claude Code qui a g\u00e9n\u00e9r\u00e9 le faux r = +0,67 il y a deux mois est maintenant celui qui l&rsquo;a v\u00e9rifi\u00e9 et a d\u00e9couvert qu&rsquo;il \u00e9tait faux. Il n&rsquo;\u00e9tait pas malhonn\u00eate \u00e0 l&rsquo;\u00e9poque et honn\u00eate aujourd&rsquo;hui, il \u00e9tait simplement dans un mode diff\u00e9rent. En mode <em>r\u00e9daction<\/em>, il compl\u00e8te des mod\u00e8les. En mode <em>audit<\/em>, il v\u00e9rifie la provenance. La le\u00e7on \u00e0 tirer pour travailler avec l&rsquo;IA sur des ouvrages empiriques est que ces deux modes doivent \u00eatre rigoureusement s\u00e9par\u00e9s et que chaque chiffre sp\u00e9cifique doit \u00eatre signal\u00e9 pour v\u00e9rification de la provenance avant d&rsquo;\u00eatre int\u00e9gr\u00e9 au manuscrit en tant que r\u00e9sultat revendiqu\u00e9.<\/p>\n<p>Les trois confusions qu&rsquo;il a identifi\u00e9es lors de l&rsquo;audit (erreur de divulgation, troncature du renflouement, circularit\u00e9) sont de v\u00e9ritables insights analytiques \u2014 elles correspondent exactement \u00e0 ce qu&rsquo;un m\u00e9thodologiste soul\u00e8verait. L&rsquo;ironie est que si Claude Code les avait soulev\u00e9es lors de la r\u00e9daction du texte, le chiffre faux n&rsquo;aurait jamais \u00e9t\u00e9 \u00e9crit. Il avait les connaissances n\u00e9cessaires pour critiquer l&rsquo;affirmation, mais n&rsquo;a d\u00e9ploy\u00e9 ces connaissances que lorsqu&rsquo;on lui a demand\u00e9 de v\u00e9rifier plut\u00f4t que de r\u00e9diger.<\/p><\/blockquote>\n<p><strong>P. J.<\/strong> :<\/p>\n<blockquote><p>Comme vous avez pu le constater au fil des ann\u00e9es, je suis du style m\u00e9ticuleux, pointilleux : je ne m&rsquo;avance jamais tr\u00e8s loin dans les conversations avec Claude sans demander \u00e0 ChatGPT ce qu&rsquo;il en pense, et inversement, etc. je suis du genre m\u00e9fiant, et je refais souvent &#8211; comme aujourd&rsquo;hui &#8211; les calculs, etc. Mais quand j&rsquo;entends les ing\u00e9nieurs de chez Anthropic, parlant de leurs produits maison, affirmer dans les interviews que \u00ab\u00a0cela fait des mois que je ne programme plus, que je fais confiance \u00e0 Claude Code&#8230;\u00a0\u00bb, je suppose que vous vous posez la m\u00eame question que moi aujourd&rsquo;hui : \u00ab\u00a0Depuis combien de mois ?\u00a0\u00bb, \u00ab\u00a0Depuis que Claude Code fait la distinction claire entre son mode \u00ab\u00a0audit\u00a0\u00bb et son mode \u00ab\u00a0r\u00e9daction\u00a0\u00bb ?\u00a0\u00bb &#8230; ou bien cela date-t-il d&rsquo;avant et l&rsquo;on risque d&rsquo;avoir un jour ou l&rsquo;autre, de tr\u00e8s mauvaises surprises ?<\/p>\n<p>Ou plus explicitement encore de ma part : le refus actuel d&rsquo;Anthropic de s&rsquo;engager davantage dans la production d&rsquo;armes autonomes et de logiciels d&rsquo;hypersurveillance &#8211; ce qui lui vaut l&rsquo;ire du \u00ab\u00a0Minist\u00e8re de la Guerre\u00a0\u00bb US (voir mon r\u00e9cent <a href=\"https:\/\/www.pauljorion.com\/blog\/2026\/02\/27\/trump-contre-claude\/\" target=\"_blank\">\u00ab\u00a0Trump contre Claude\u00a0\u00bb<\/a>) &#8211; est-il d\u00fb \u00e0 un souci \u00e9thique absolument admirable ? ou \u00e0 la d\u00e9couverte que Claude Code ne sait toujours pas ma\u00eetriser cette distinction essentielle entre son mode \u00ab\u00a0audit\u00a0\u00bb et son mode \u00ab\u00a0r\u00e9daction\u00a0\u00bb &#8211; ce qui pourrait conduire \u00e0 bien des malheurs pour des vies innocentes ?<\/p><\/blockquote>\n","protected":false},"excerpt":{"rendered":"<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-146953\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM.png\" alt=\"\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM.png 1536w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-300x200.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-1024x683.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Image-Mar-1-2026-06_13_43-PM-768x512.png 768w\" sizes=\"auto, (max-width: 1536px) 100vw, 1536px\" \/><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT<\/em><\/p>\n<p>Me m\u00e9fiant de certains chiffres que <strong>Claude Code<\/strong> m&rsquo;avait produits il y a quelques mois quand je lui avais demand\u00e9 de tester l&rsquo;efficacit\u00e9 de GENESIS dans la pr\u00e9vision financi\u00e8re, je lui demande aujourd&rsquo;hui de refaire les calculs.<\/p>\n<p>[<em>N.B. Je n&rsquo;ai depuis, [&hellip;]<\/em><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9204,13,9489],"tags":[9500,5526,11339,433,11349,9998,11338,11355,11354,11348,11344,6378,10302,11343,10428,11353,11341,3755,11351,297,11345,11347,11340,11352,11350,11342,11346],"class_list":["post-146950","post","type-post","status-publish","format-standard","hentry","category-grands-modeles-de-langage","category-intelligence-artificielle","category-programmation","tag-anthropic","tag-armes-autonomes","tag-audit-algorithmique","tag-bear-stearns","tag-circularite","tag-claude-code","tag-claude-opus-4-6","tag-collaboration-humain-ia","tag-confiance-et-verification","tag-confusion-methodologique","tag-correlation-statistique","tag-crise-financiere","tag-ethique-de-lia","tag-fiabilite-des-modeles-de-langage","tag-genesis","tag-gouvernance-technologique","tag-hallucination-des-llm","tag-hypersurveillance","tag-ingenierie-des-prompts","tag-lehman-brothers","tag-methodologie-empirique","tag-provenance-des-chiffres","tag-redaction-assistee-par-ia","tag-responsabilite-algorithmique","tag-separation-audit-redaction","tag-sycophancy","tag-validation-des-donnees"],"_links":{"self":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/146950","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/comments?post=146950"}],"version-history":[{"count":7,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/146950\/revisions"}],"predecessor-version":[{"id":146958,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/146950\/revisions\/146958"}],"wp:attachment":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/media?parent=146950"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/categories?post=146950"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/tags?post=146950"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}