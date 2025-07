« Le scaling est le moteur de la renaissance de l’IA ; sémantique, syntaxe et proto-soi émergent dès qu’on agrandit le réseau. » Généralisation excessive. Oui, des phénomènes émergent, mais l’acquisition efficace de compétences plafonne bien avant une intelligence « générale ». Il demandera des preuves que votre récit du scaling tient toujours hors distribution ou dans des tâches causales. « We realised that the trick was just to make the network bigger… And the semantics would follow »

« L’IA a déjà “dépassé” l’intelligence humaine en qualité » (référence à Hinton & Hofstadter) Benchmark gonflé. Dans On the Measure of Intelligence, il distingue performance de pic et capacité de généralisation par unité d’expérience. Les LLM actuels excellent sur le premier, mais pas sur le second ; parler de dépassement est prématuré. « An artificial intelligence of a quality apparently higher than the natural one that was meant to be emulated »

« La compréhension est du lest ; la performance peut se passer d’explication. » Il admet que le verbal reasoning interne est post-hoc, mais insiste sur la nécessité de programmes explicites et inspectables (plutôt que d’activations opaques) pour fiabilité et débogage. « Performance is separable from explanation… understanding can be detached »

Thèse « compression = intelligence » Pour Chollet, il manque l’axe des a priori. Deux systèmes aussi compressifs peuvent diverger radicalement par la quantité d’expérience requise. Il réclamerait d’introduire la notion d’efficacité. « Intelligence may be best characterised as prediction and compression across modalities »

Benchmarks : AIBS vs ARC Il saluera l’attaque du biais d’incarnation, mais demandera : 1) AIBS mesure-t-il l’efficacité de données ? 2) Les simulations 3-D riches n’injectent-elles pas trop de priors, rouvrant la porte à la mémorisation ?