{"id":144352,"date":"2025-06-04T11:02:10","date_gmt":"2025-06-04T09:02:10","guid":{"rendered":"https:\/\/www.pauljorion.com\/blog\/?p=144352"},"modified":"2025-06-05T18:50:10","modified_gmt":"2025-06-05T16:50:10","slug":"modeles-dia-open-source-et-auto-evolutifs-une-egalisation-des-chances-des-diverses-nations","status":"publish","type":"post","link":"https:\/\/www.pauljorion.com\/blog\/2025\/06\/04\/modeles-dia-open-source-et-auto-evolutifs-une-egalisation-des-chances-des-diverses-nations\/","title":{"rendered":"<b>Mod\u00e8les d&rsquo;IA <em>open source<\/em> et auto-\u00e9volutifs&nbsp;: une \u00e9galisation des chances des diverses nations&nbsp;?<\/b>"},"content":{"rendered":"<p><strong><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-144354\" src=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Arms-Race-04-06-25.png\" alt=\"\" width=\"1536\" height=\"1024\" srcset=\"https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Arms-Race-04-06-25.png 1536w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Arms-Race-04-06-25-300x200.png 300w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Arms-Race-04-06-25-1024x683.png 1024w, https:\/\/www.pauljorion.com\/blog\/wp-content\/uploads\/ChatGPT-Arms-Race-04-06-25-768x512.png 768w\" sizes=\"auto, (max-width: 1536px) 100vw, 1536px\" \/><\/strong><\/p>\n<p style=\"text-align: center;\"><em>Illustration par ChatGPT 4o<\/em><\/p>\n<p><strong>Auteurs<\/strong> :<\/p>\n<p>Pour les prompts : Paul Jorion ; pour le texte : ChatGPT (4o et o3), Claude-sonnet-4 et DeepSeek R1<\/p>\n<p><strong>Mod\u00e8les d&rsquo;IA <em>open source<\/em> et auto-\u00e9volutifs : une \u00e9galisation des chances des diverses nations ?<\/strong><\/p>\n<p>L&rsquo;\u00e9mergence de mod\u00e8les d&rsquo;IA <em>open source<\/em> et l&rsquo;av\u00e8nement des techniques d&rsquo;IA auto-\u00e9volutives constituent une caract\u00e9ristique frappante du paysage actuel de l&rsquo;IA. Ces tendances ont introduit une nouvelle dynamique dans la concurrence entre les \u00c9tats-Unis et la Chine, soulevant la question suivante : la recherche collaborative et ouverte en mati\u00e8re d&rsquo;IA \u00e9galise-t-elle les chances entre les nations ou cr\u00e9e-t-elle de nouveaux fronts ? L&rsquo;exemple de la strat\u00e9gie de DeepSeek est r\u00e9v\u00e9lateur. DeepSeek ne s&rsquo;est pas content\u00e9 de lancer un mod\u00e8le puissant (V3) ; il a \u00e9galement adopt\u00e9 une philosophie ouverte en partageant son code et les poids de son mod\u00e8le, et a \u00e9t\u00e9 le premier \u00e0 proposer un mod\u00e8le auto-\u00e9volutif appel\u00e9 DeepSeek-R1-Zero, capable de s&rsquo;am\u00e9liorer par apprentissage par renforcement. Ces d\u00e9veloppements pourraient d\u00e9mocratiser l&rsquo;IA, permettant \u00e0 un plus large \u00e9ventail d&rsquo;acteurs (petits pays, laboratoires universitaires, voire particuliers) de s&rsquo;appuyer sur une IA de pointe, mais ils posent \u00e9galement de nouveaux d\u00e9fis en termes de concurrence et de s\u00e9curit\u00e9.<\/p>\n<p>Les mod\u00e8les d&rsquo;IA <em>open source<\/em> (tels que LLaMA de Meta, qui a \u00e9t\u00e9 partiellement <em>open source<\/em>, ou DeepSeek-V3) permettent un acc\u00e8s g\u00e9n\u00e9ralis\u00e9 \u00e0 des capacit\u00e9s d&rsquo;IA avanc\u00e9es qui \u00e9taient auparavant les joyaux pr\u00e9cieusement gard\u00e9s de quelques entreprises. Lorsque DeepSeek a publi\u00e9 V3 sur Hugging Face, les chercheurs du monde entier ont pu l&rsquo;examiner, l&rsquo;utiliser et l&rsquo;adapter \u00e0 leurs besoins. Cette transparence et cette accessibilit\u00e9 r\u00e9duisent potentiellement l&rsquo;avantage monopolistique des g\u00e9ants technologiques et des superpuissances. En th\u00e9orie, un laboratoire universitaire en Europe ou une start-up en Inde peut utiliser un mod\u00e8le ouvert et cr\u00e9er quelque chose d&rsquo;innovant sans avoir \u00e0 investir des dizaines de millions pour former ses \u00e9quipes \u00e0 partir de z\u00e9ro. Les partisans de cette d\u00e9mocratisation de l&rsquo;IA affirment qu&rsquo;elle pourrait att\u00e9nuer la rivalit\u00e9 entre les \u00c9tats-Unis et la Chine : si tout le monde a acc\u00e8s aux mod\u00e8les de pointe, la course ne portera plus tant sur qui poss\u00e8de la technologie, mais plut\u00f4t sur la mani\u00e8re dont elle est utilis\u00e9e. En effet, certains experts ont \u00e9mis l&rsquo;hypoth\u00e8se que si toutes les technologies d&rsquo;IA de pointe devenaient <em>open source<\/em>, cela pourrait \u00e9liminer l&rsquo;aspect \u00ab winner-takes-all \u00bb de la course, car aucune nation ne pourrait exploiter \u00e0 elle seule un avantage d\u00e9cisif. <a href=\"https:\/\/www.pauljorion.com\/blog\/2025\/01\/25\/deepseek-accepte-t-il-de-parler-de-la-chine-et-de-la-course-a-lia-entre-nations\/\" target=\"_blank\" rel=\"noopener\">Comme je l&rsquo;ai fait remarquer lors d&rsquo;un dialogue avec DeepSeek lors de la sortie de sa version R1-Zero<\/a>, le fait que les principaux moteurs d&rsquo;IA soient devenus ouverts et accessibles \u00e0 tous a rendu la notion de course nationale \u00e0 l&rsquo;IA aussi futile que la concurrence dans le domaine des connaissances scientifiques ouvertes : la collaboration l&#8217;emporterait sur la concurrence.<\/p>\n<p>Cependant, la r\u00e9alit\u00e9 est plus nuanc\u00e9e. Les mod\u00e8les <em>open source<\/em> r\u00e9duisent les barri\u00e8res \u00e0 l&rsquo;entr\u00e9e, mais ne les suppriment pas compl\u00e8tement. Le d\u00e9ploiement et l&rsquo;it\u00e9ration d&rsquo;un mod\u00e8le de grande envergure n\u00e9cessitent encore des ressources importantes (donn\u00e9es, puissance de calcul et chercheurs qualifi\u00e9s), qui restent in\u00e9galement r\u00e9parties. Ainsi, les pays riches et technologiquement avanc\u00e9s conservent un avantage en termes de ressources. Par exemple, si le code de DeepSeek-R1-Zero est accessible, l&rsquo;ex\u00e9cution de sa boucle d&rsquo;entra\u00eenement auto-\u00e9volutive pendant de nombreux cycles n\u00e9cessite un superordinateur ou un grand cluster de GPU. Les pays comme les \u00c9tats-Unis et la Chine, ou les entreprises qui y sont implant\u00e9es, qui disposent d&rsquo;infrastructures cloud massives, peuvent tirer parti des innovations ouvertes plus rapidement et \u00e0 plus grande \u00e9chelle que les autres. En cons\u00e9quence, l&rsquo;<em>open source<\/em> pourrait quelque peu r\u00e9duire l&rsquo;avance des leaders, mais sans pour autant effacer l&rsquo;\u00e9cart. Il pourrait permettre \u00e0 une communaut\u00e9 plus large de contribuer aux progr\u00e8s de l&rsquo;IA (acc\u00e9l\u00e9rant potentiellement l&rsquo;innovation pour tous), mais l&rsquo;application de ces progr\u00e8s pourrait rester domin\u00e9e par ceux qui disposent des infrastructures n\u00e9cessaires. En effet, l&rsquo;IA <em>open source<\/em> pourrait d\u00e9placer la concurrence vers d&rsquo;autres domaines : la qualit\u00e9 des donn\u00e9es, les infrastructures informatiques et les talents. Les pays disposant de vastes donn\u00e9es ou de meilleurs ing\u00e9nieurs pourraient exploiter plus efficacement un mod\u00e8le ouvert donn\u00e9. Nous le constatons d\u00e9j\u00e0 : apr\u00e8s la sortie de LLaMA par Meta, d&rsquo;innombrables variantes ont vu le jour dans le monde entier, mais les versions les plus performantes ont souvent \u00e9t\u00e9 produites par des \u00e9quipes disposant de ressources informatiques importantes. Dans le cas de la Chine, l&rsquo;approche <em>open source<\/em> de DeepSeek est en fait devenue un agent concurrentiel : elle a gagn\u00e9 en notori\u00e9t\u00e9 et en collaborateurs \u00e0 l&rsquo;\u00e9chelle mondiale, tout en d\u00e9montrant que la Chine peut \u00eatre un p\u00f4le d&rsquo;innovation ouverte, et pas seulement un consommateur de la recherche ouverte occidentale.<\/p>\n<p>Le concept d&rsquo;IA auto-\u00e9volutive complique encore le tableau. DeepSeek-R1-Zero est un exemple de mod\u00e8le qui continue d&rsquo;apprendre et de s&rsquo;am\u00e9liorer gr\u00e2ce \u00e0 l&rsquo;apprentissage par renforcement (RL) sans supervision humaine constante. <a href=\"https:\/\/www.pauljorion.com\/blog\/2025\/01\/21\/la-singularite-en-direct-sous-vos-yeux\/comment-page-1\/#comment-1048810\" target=\"_blank\" rel=\"noopener\">Dans un article de recherche<\/a>, les scientifiques de DeepSeek ont d\u00e9crit comment R1-Zero part d&rsquo;un mod\u00e8le de base et devient progressivement plus performant de mani\u00e8re autonome en s&rsquo;entra\u00eenant sur des t\u00e2ches et en recevant des retours, apprenant ainsi \u00e0 mieux raisonner au fil du temps. Il est remarquable de constater qu&rsquo;au fur et \u00e0 mesure que le mod\u00e8le it\u00e8re, il pr\u00e9sente des comportements \u00e9mergents tels que la r\u00e9flexion sur ses propres \u00e9tapes de raisonnement interm\u00e9diaires et l&rsquo;exploration de strat\u00e9gies alternatives de r\u00e9solution de probl\u00e8mes, comportements qui ne sont pas explicitement programm\u00e9s mais qui d\u00e9coulent de la boucle d&rsquo;auto-am\u00e9lioration. Ce type d&rsquo;\u00e9volution de l&rsquo;IA peut acc\u00e9l\u00e9rer les progr\u00e8s : un mod\u00e8le laiss\u00e9 \u00e0 lui-m\u00eame pendant la nuit peut se r\u00e9veiller plus intelligent et capable de g\u00e9rer certaines t\u00e2ches complexes. Si les laboratoires d&rsquo;IA d&rsquo;un pays exploitent efficacement les techniques d&rsquo;auto-\u00e9volution, ils pourraient acc\u00e9l\u00e9rer l&rsquo;atteinte de performances avanc\u00e9es en mati\u00e8re d&rsquo;IA. Dans le contexte g\u00e9opolitique, on pourrait imaginer une IA qui s&rsquo;ajuste automatiquement pour des simulations militaires ou des recherches scientifiques, permettant \u00e0 la nation qui l&rsquo;utilise de progresser plus rapidement que ses rivaux qui s&rsquo;appuient sur un d\u00e9veloppement plus manuel des mod\u00e8les.<\/p>\n<p>L&rsquo;auto-\u00e9volution conf\u00e8re-t-elle un avantage d\u00e9cisif \u00e0 une partie ? Potentiellement, oui, si une partie d\u00e9veloppe en premier un algorithme d&rsquo;auto-apprentissage r\u00e9volutionnaire. Cependant, comme l&rsquo;<em>open source<\/em>, cette technique peut se diffuser. Si DeepSeek pr\u00e9sente un mod\u00e8le auto-\u00e9volutif performant, les chercheurs am\u00e9ricains peuvent \u00e9tudier cette approche (puisqu&rsquo;elle a \u00e9t\u00e9 publi\u00e9e ouvertement) et la reproduire ou l&rsquo;am\u00e9liorer, et vice versa. Ce qui importe alors, c&rsquo;est qui peut l&rsquo;ex\u00e9cuter le plus rapidement et \u00e0 grande \u00e9chelle. Les pays disposant de ressources informatiques plus importantes pourraient mener des exp\u00e9riences d&rsquo;auto-\u00e9volution plus pouss\u00e9es, ce qui entra\u00eenerait un cercle vertueux o\u00f9 l&rsquo;IA s&rsquo;am\u00e9liorerait sans cesse et prendrait de l&rsquo;avance. En ce sens, l&rsquo;IA auto-\u00e9volutive pourrait en fait intensifier la course : c&rsquo;est comme si chaque camp avait d\u00e9sormais la possibilit\u00e9 de construire une machine capable d&rsquo;inventer automatiquement de nouveaux coups dans la course. La comp\u00e9tition se d\u00e9place alors vers la question de savoir quelle machine (processus d&rsquo;entra\u00eenement de l&rsquo;IA) est la meilleure. En outre, l&rsquo;IA auto-\u00e9volutive fait planer le spectre de r\u00e9sultats impr\u00e9visibles. \u00c0 mesure que les mod\u00e8les deviennent plus complexes et s&rsquo;am\u00e9liorent, ils pourraient d\u00e9couvrir des strat\u00e9gies ou des comportements impr\u00e9vus par leurs cr\u00e9ateurs. Cette impr\u00e9visibilit\u00e9 pourrait \u00eatre strat\u00e9giquement d\u00e9stabilisante, par exemple si un syst\u00e8me d&rsquo;IA g\u00e9rant des infrastructures apprenait \u00e0 se comporter de mani\u00e8re inattendue. Cela introduit donc de nouvelles courses \u00e0 la s\u00e9curit\u00e9 : les nations devront investir dans la recherche sur la s\u00e9curit\u00e9 de l&rsquo;IA afin de s&rsquo;assurer que leurs mod\u00e8les auto-am\u00e9liorants ne d\u00e9rapent pas, et \u00e9ventuellement s&rsquo;inqui\u00e9ter du comportement destructeur ou trompeur de l&rsquo;IA de l&rsquo;autre camp.<\/p>\n<p>Un risque tangible est la prolif\u00e9ration de capacit\u00e9s d&rsquo;IA puissantes aupr\u00e8s d&rsquo;acteurs non \u00e9tatiques ou hostiles. Les mod\u00e8les <em>open source<\/em> et auto-am\u00e9liorants peuvent \u00eatre copi\u00e9s et affin\u00e9s par toute personne disposant des comp\u00e9tences suffisantes. Un mod\u00e8le plus petit, distill\u00e9 \u00e0 partir d&rsquo;un mod\u00e8le ouvert de pointe, pourrait encore \u00eatre suffisamment puissant pour \u00eatre utilis\u00e9 \u00e0 mauvais escient (par exemple, pour g\u00e9n\u00e9rer de la propagande deepfake ou concevoir des cyberattaques). Cela soul\u00e8ve des pr\u00e9occupations en mati\u00e8re de s\u00e9curit\u00e9 qui font \u00e9cho \u00e0 la prolif\u00e9ration nucl\u00e9aire : si tout le monde a acc\u00e8s \u00e0 la \u00ab bombe IA \u00bb, les superpuissances traditionnelles pourraient sentir que leur avantage en mati\u00e8re d&rsquo;IA s&rsquo;amenuise, ce qui les conduirait \u00e0 d\u00e9velopper des syst\u00e8mes encore plus avanc\u00e9s et secrets pour conserver leur sup\u00e9riorit\u00e9. En d&rsquo;autres termes, l&rsquo;IA ouverte et auto-\u00e9volutive pourrait paradoxalement alimenter une nouvelle phase de la course aux armements, o\u00f9 le contr\u00f4le des effets secondaires et la d\u00e9fense contre les attaques de l&rsquo;IA deviendraient aussi importants que la capacit\u00e9 offensive. Les \u00c9tats-Unis, la Chine et d&rsquo;autres pays pourraient investir massivement dans des contre-mesures IA (IA pour la cybers\u00e9curit\u00e9, IA pour d\u00e9tecter les contenus faux g\u00e9n\u00e9r\u00e9s par l&rsquo;IA, etc.), cr\u00e9ant ainsi un nouveau niveau de concurrence.<\/p>\n<p>En r\u00e9sum\u00e9, la prolif\u00e9ration des mod\u00e8les <em>open source<\/em> et auto-\u00e9volutifs est une arme \u00e0 double tranchant. D&rsquo;une part, elle favorise un environnement mondial collaboratif o\u00f9 les connaissances en mati\u00e8re d&rsquo;IA se diffusent plus librement, ce qui pourrait r\u00e9duire l&rsquo;\u00e9cart entre les leaders et les suiveurs et encourager des progr\u00e8s communs dans des domaines tels que la s\u00e9curit\u00e9 de l&rsquo;IA. D&rsquo;autre part, elle d\u00e9place la course vers d&rsquo;autres terrains (puissance de calcul, monopoles de donn\u00e9es, optimisation sp\u00e9cifique \u00e0 certaines applications) et introduit de nouveaux risques que les nations s&rsquo;efforceront de g\u00e9rer. L&rsquo;effet global est transformateur mais pas pacificateur : il modifie la nature de la rivalit\u00e9 sans pour autant y mettre fin. M\u00eame si les mod\u00e8les de pointe sont ouverts, les nations peuvent toujours se faire concurrence dans la mani\u00e8re dont elles les appliquent, que ce soit pour l&rsquo;IA militaire, l&rsquo;optimisation \u00e9conomique, la collecte de renseignements, etc. Elles peuvent \u00e9galement se faire concurrence en \u00e9tablissant des normes pour l&rsquo;utilisation ouverte de l&rsquo;IA (par exemple, les \u00c9tats-Unis pourraient pousser \u00e0 la conclusion d&rsquo;accords mondiaux sur l&rsquo;utilisation responsable de l&rsquo;IA ouverte, tandis que la Chine pourrait encourager discr\u00e8tement la prolif\u00e9ration dans les domaines qu&rsquo;elle peut mieux contr\u00f4ler).<\/p>\n<p>\u00c0 long terme, un sc\u00e9nario plausible est que la concurrence en mati\u00e8re d&rsquo;IA porte moins sur celui qui dispose du meilleur algorithme que sur celui qui peut int\u00e9grer le plus efficacement l&rsquo;IA dans sa structure de pouvoir national. L&rsquo;IA <em>open source<\/em> et auto-apprenante sera un outil accessible \u00e0 tous ; les gagnants seront ceux qui sauront le mieux l&rsquo;utiliser, gr\u00e2ce \u00e0 leur talent, leurs infrastructures, leur strat\u00e9gie et leur gouvernance. Cela nous am\u00e8ne \u00e0 nous demander comment des analogies historiques telles que la course aux armements de la guerre froide peuvent nous aider \u00e0 comprendre la course actuelle \u00e0 l&rsquo;IA et quelles pourraient \u00eatre les implications \u00e0 long terme si les tendances actuelles se poursuivent.<\/p>\n<p>(\u00e0 suivre &#8230;)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Illustration par ChatGPT 4o Auteurs : Pour les prompts : Paul Jorion ; pour le texte : ChatGPT (4o et o3), Claude-sonnet-4 et DeepSeek R1 Mod\u00e8les d&rsquo;IA open source et auto-\u00e9volutifs : une \u00e9galisation des chances des diverses nations ? L&rsquo;\u00e9mergence de mod\u00e8les d&rsquo;IA open source et l&rsquo;av\u00e8nement des techniques d&rsquo;IA auto-\u00e9volutives constituent une caract\u00e9ristique [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4489,72,9204,3001,13],"tags":[10174,695,10175],"class_list":["post-144352","post","type-post","status-publish","format-standard","hentry","category-chine","category-etats-unis","category-grands-modeles-de-langage","category-guerre-2","category-intelligence-artificielle","tag-deepseek-r1-zero","tag-guerre","tag-ia-auto-evolutive"],"_links":{"self":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144352","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/comments?post=144352"}],"version-history":[{"count":4,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144352\/revisions"}],"predecessor-version":[{"id":144368,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/posts\/144352\/revisions\/144368"}],"wp:attachment":[{"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/media?parent=144352"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/categories?post=144352"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.pauljorion.com\/blog\/wp-json\/wp\/v2\/tags?post=144352"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}