{"id":139147,"date":"2024-03-08T16:48:22","date_gmt":"2024-03-08T15:48:22","guid":{"rendered":"https:\/\/www.pauljorion.com\/blog\/?p=139147"},"modified":"2024-03-08T16:48:22","modified_gmt":"2024-03-08T15:48:22","slug":"grands-modeles-de-langage-pourquoi-les-reseaux-neuronaux-ont-ils-reussi-la-ou-la-linguistique-echouait-par-claude-roux","status":"publish","type":"post","link":"https:\/\/www.pauljorion.com\/blog\/2024\/03\/08\/grands-modeles-de-langage-pourquoi-les-reseaux-neuronaux-ont-ils-reussi-la-ou-la-linguistique-echouait-par-claude-roux\/","title":{"rendered":"<b>Grands Mod\u00e8les de Langage : Pourquoi les r\u00e9seaux neuronaux ont-ils r\u00e9ussi l\u00e0 o\u00f9 la linguistique \u00e9chouait&nbsp;?<\/b>, par Claude Roux"},"content":{"rendered":"<p><a href=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-139150\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp\" alt=\"\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-300x300.webp 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-150x150.webp 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-768x768.webp 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><\/p>\n<p><em>Illustration par DALL\u00b7E (+PJ)<\/em><\/p>\n<p>Je suis tr\u00e8s heureux d&rsquo;entendre enfin un son de cloche positif quant \u00e0 l&rsquo;IA quand le discours ambient vise soit \u00e0 d\u00e9former soit m\u00eame \u00e0 nier les progr\u00e8s faits dans le domaine.<\/p>\n<p>Je suis chercheur en linguistique informatique depuis pr\u00e8s de 30 ans. J&rsquo;ai fait une maitrise d&rsquo;informatique \u00e0 l&rsquo;Institut de Programmation de Paris VI dans les ann\u00e9es 80 avant de faire une th\u00e8se en linguistique \u00e0 l&rsquo;Universit\u00e9 de Montr\u00e9al. J&rsquo;ai fait la majorit\u00e9 de ma carri\u00e8re autour des m\u00e9thodes symboliques au sein de l&rsquo;\u00e9quipe ParSem \u00e0 XRCE (le centre europ\u00e9en de recherche de Xerox \u00e0 Grenoble). J&rsquo;y ai d\u00e9velopp\u00e9 \u00e0 la suite de ma th\u00e8se un moteur d&rsquo;analyse syntaxique\u00a0: XIP qui dans les ann\u00e9es 2000 permettait d&rsquo;extraire des d\u00e9pendances dans un texte \u00e0 la vitesse de 3000 mots\/s. En 2016 nous avons m\u00eame gagn\u00e9 une comp\u00e9tition \u00e0 SemEval pour l&rsquo;extraction des sentiments dans un corpus de critiques de restaurant.<\/p>\n<p>Puis en 2017 est sorti <a href=\"https:\/\/www.pauljorion.com\/blog\/2023\/07\/27\/14-mars-2023-le-jour-ou-le-genre-humain-fut-saisi-par-le-doute-iv-le-transformer-a-autorise-une-intelligence-superieure-a-celle-de-lhumain\/\" target=\"_blank\" rel=\"noopener\"><em>transformer<\/em><\/a> (l&rsquo;article <a href=\"https:\/\/arxiv.org\/abs\/1706.03762\" target=\"_blank\" rel=\"noopener\">\u00ab\u00a0Attention is all you need\u00a0\u00bb<\/a>) et \u00e0 partir de l\u00e0 tout s&rsquo;est emball\u00e9&#8230;<\/p>\n<p>Pour les esprits chagrins qui nient l&rsquo;existence de ces progr\u00e8s, je r\u00e9ponds la chose suivante: JE NE PENSAIS PAS VOIR D\u00c9BARQUER UNE TELLE TECHNOLOGIE DE MON VIVANT.<\/p>\n<p>Suis-je amer\u00a0? Certainement pas, j&rsquo;ai la chance de vivre tout ce dont j&rsquo;ai r\u00eav\u00e9 quand j&rsquo;ai commenc\u00e9 \u00e0 travailler dans le domaine. Traduction Automatique, Analyse de texte, G\u00e9n\u00e9ration de texte et de code, Compr\u00e9hension du texte, j&rsquo;en passe et des meilleurs.<\/p>\n<p>Alors pourquoi ont-ils r\u00e9ussi l\u00e0 o\u00f9 l&rsquo;\u00e9quipe dans laquelle j&rsquo;ai travaill\u00e9 pendant 20 ans a \u00e9chou\u00e9 ?<\/p>\n<p>Il n&rsquo;y a certainement pas de r\u00e9ponse simple, mais je vais tenter d&rsquo;apporter ma pierre personnelle, qui vaut ce qu&rsquo;elle vaut. Que les vrais sp\u00e9cialistes pardonnent \u00e0 quelqu&rsquo;un qui a err\u00e9 sur les chemins du symbolique&#8230;<\/p>\n<p>La linguistique traditionnelle (j&rsquo;y inclus aussi les m\u00e9thodes \u00e0 noyaux) a divis\u00e9 la langue en une multitude de champs diff\u00e9rents : lexicologie, syntaxe, s\u00e9mantique, analyse du discours <em>sans jamais r\u00e9ussir \u00e0 jeter des ponts entre ces domaines<\/em>.<\/p>\n<p>Nous faisions de la syntaxe en m\u00ealant un peu de s\u00e9mantique dans notre groupe, mais nous nous heurtions sans cesse \u00e0 un plafond de verre, car le sens commun nous \u00e9chappait. Nous n&rsquo;arrivions pas \u00e0 injecter suffisamment de connaissances du monde dans nos approches et le moindre ant\u00e9c\u00e9dent qu&rsquo;il soit anaphorique ou pire cataphorique faisait d\u00e9raper nos mod\u00e8les.<\/p>\n<p>Malgr\u00e9 tous nos efforts, notre travail restait laborieux et maladroit&#8230; Nous arrivions \u00e0 quelques r\u00e9sultats, certes, mais au prix d&rsquo;un labeur de b\u00e9n\u00e9dictin.<\/p>\n<p>Les Grands Mod\u00e8les de Langue unifient l&rsquo;ensemble de ces axes. Car lorsque un GML fonctionne, il dispose d&rsquo;une repr\u00e9sentation unifi\u00e9e de la s\u00e9mantique (les plongements ou <em>embeddings<\/em>) que l&rsquo;utilisation de l&rsquo;attention permet de mettre en regard les uns avec les autres.<\/p>\n<p>On entend souvent des critiques affirmer avec une certaine morgue que ces mod\u00e8les ne font que compl\u00e9ter le mot suivant. C&rsquo;est idiot&#8230; Ce que ces mod\u00e8les font c&rsquo;est apprendre sur des contextes de plusieurs milliers de <em>tokens<\/em> \u00e0 deviner un mot masqu\u00e9. D&rsquo;une certaine mani\u00e8re, ils sont entrain\u00e9s \u00e0 r\u00e9soudre des milliards d&rsquo;exercices \u00e0 trous. Et ils apprennent d\u00e8s lors, des milliards de motifs s\u00e9mantiques extr\u00eamement fins, je dis <em>s\u00e9mantique<\/em>, parce que les plongements ne sont pas vraiment li\u00e9s \u00e0 une langue donn\u00e9e, mais bel et bien \u00e0 des concepts s\u00e9mantiques. En ing\u00e9rant toute la connaissance du monde, ils finissent par construire un filet qui lie entre elles toutes les exp\u00e9riences pr\u00e9sentes et pass\u00e9es de notre humanit\u00e9.<\/p>\n<p>En cela, ils sont une parfaite distillation de nos civilisations.<\/p>\n<p>Aujourd&rsquo;hui, je crois qu&rsquo;il faut absolument d\u00e9multiplier nos efforts en recherche dans tous les domaines et dans toutes les langues, pour fournir toujours plus de donn\u00e9es \u00e0 ces mod\u00e8les, parce que nombre de nos probl\u00e8mes actuels, dans le monde de l&rsquo;\u00e9nergie ou de la m\u00e9decine, trouveront peut-\u00eatre leur solution dans le croisement de donn\u00e9es scientifiques disparates que nos cerveaux humains limit\u00e9s sont incapables d&rsquo;\u00e9tablir. Il existe peut-\u00eatre un texte en sanscrit qui d\u00e9crit une m\u00e9thode pour soigner certaines maladies avec certaines plantes. Aujourd&rsquo;hui, il devient possible pour n&rsquo;importe qui d&rsquo;y avoir acc\u00e8s.<\/p>\n<p>Il s&rsquo;est publi\u00e9 pr\u00e8s de 3 millions d&rsquo;articles scientifiques l&rsquo;an dernier, seule la machine peut les dig\u00e9rer tous.<\/p>\n<p><a href=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro.webp\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-139149\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro.webp\" alt=\"\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro.webp 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro-300x300.webp 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro-150x150.webp 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.44.11-Create-a-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-with-all-elements-in-shades-of-red-set-against-a-stark-white-backgro-768x768.webp 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><\/p>\n<p><em>Illustration par DALL\u00b7E (+PJ)<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p><a href=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp\"><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-large wp-image-139150\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp\" alt=\"\" width=\"1024\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast.webp 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-300x300.webp 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-150x150.webp 150w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/DALL\u00b7E-2024-03-08-16.42.47-Create-a-detailed-visualization-of-a-universe-of-words-depicted-as-a-hypercomplex-network-on-a-pale-yellow-background.-The-image-should-feature-a-vast-768x768.webp 768w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><\/p>\n<p><em>Illustration par DALL\u00b7E (+PJ)<\/em><\/p>\n<p>Je suis tr\u00e8s heureux d&rsquo;entendre enfin un son de cloche positif quant \u00e0 l&rsquo;IA quand le discours ambient vise soit \u00e0 d\u00e9former soit m\u00eame \u00e0 nier les progr\u00e8s faits dans le domaine.<\/p>\n<p>Je suis chercheur en linguistique informatique depuis pr\u00e8s de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9204,13,2138],"tags":[9503,9504,9205,1778,9253,9133],"class_list":["post-139147","post","type-post","status-publish","format-standard","hentry","category-grands-modeles-de-langage","category-intelligence-artificielle","category-linguistique-2","tag-attention-is-all-you-need","tag-approches-symboliques","tag-grands-modeles-de-langage","tag-linguistique","tag-llm","tag-transformer"],"_links":{"self":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/139147","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/comments?post=139147"}],"version-history":[{"count":1,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/139147\/revisions"}],"predecessor-version":[{"id":139151,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/139147\/revisions\/139151"}],"wp:attachment":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/media?parent=139147"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/categories?post=139147"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/tags?post=139147"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}