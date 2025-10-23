Blog de Paul Jorion

*Godot est mort !*

Comparaison entre Google S2R, Combinatoire magique et CHE (Contextual Hyper-Embedding) de Pribor

Illustration par DALL·E

Sont présentées ici les caractéristiques, divergences et synergies entre trois approches : Google S2R, Combinatoire magique et CHE (Contextual Hyper-Embedding) de Pribor.

1. Le S2R de Google *

« S2R » signifie Speech-to-Retrieval. Il s’agit d’une architecture de recherche vocale récente que Google déploie, qui contourne l’étape explicite de transcription parole → texte pour tenter d’établir directement une correspondance entre l’audio prononcé et l’information recherchée. Le modèle repose sur un double encodeur : l’un traite l’audio, l’autre les textes candidats, afin de rapprocher leurs représentations vectorielles dans un même espace sémantique.

2. La Combinatoire magique de Pribor

La « Combinatoire magique » est un encodage bijectif, sans perte et à dimension fixe de phrases simples en vecteurs 4D ou 5D : trois composantes symboliques (Sujet, Verbe, Objet) plus un registre « meta » de 8 ou 16 bits. Elle se distingue par une complexité O(1), une absence totale de perte d’information et une interprétabilité parfaite.

3. Le CHE (Contextual Hyper-Embedding uint8) de Pribor

Le CHE est une approche d’encodage contextuel extrêmement économique, qui représente chaque token par un entier uint8. Contrairement à l’attention flottante des Transformers, elle évite matrices et softmax, réduisant la consommation énergétique d’un facteur allant jusqu’à 5000.

4. Tableau comparatif

Caractéristique S2R (Google) Combinatoire magique CHE
Type de données float16 / float32 indices symboliques + meta uint8 uint8
Dimension 512–4096D 4D / 5D 1 octet/token
Complexité O(n²) O(1) O(n) linéaire
Perte d’information avec perte aucune bornée / quantifiée
Efficacité énergétique faible extrême extrême (×500–5000)
Interprétabilité faible totale moyenne

5. Synergies et intégration

Les trois approches peuvent être intégrées dans une architecture hybride : S2R fournit la géométrie sémantique globale, CHE assure l’efficacité contextuelle via une quantisation uint8, et Combinatoire magique formalise des propositions symboliques sans perte. Cette combinaison donne naissance à une famille de modèles S2R–CHE–CM, alliant généralisation sémantique, frugalité énergétique et interprétabilité complète.

* Ehsan Variani & Michael Riley, Research Scientists, Google Research, « Speech-to-Retrieval (S2R): A new approach to voice search », 7 octobre, 2025

5 réponses à “Comparaison entre Google S2R, Combinatoire magique et CHE (Contextual Hyper-Embedding) de Pribor

  1. Avatar de AlainFELER
    AlainFELER

    uint8 = de 0 à 255, ça voudrait dire qu’il n’y a en tout que 256 tokens ? Un univers à 256 mots ?
    Il parait que l’apprentissage du français pour les légionnaires étrangers se limite à 500 mots, et ils font pas mal de choses avec ça, mais il y a beaucoup de communication non verbale lol
    Quelques explications seraient sans doute bienvenues.
    NB : cette manière cryptique d’aborder les sujets me rappelle pas mal de Finistériens, mais vous vous êtes dans le Morbihan !
    Cdlt,
    AF

    Répondre
    1. Avatar de Paul Jorion
      Paul Jorion

      uint8 = de 0 à 255, ça voudrait dire qu’il n’y a en tout que 256 tokens ? Un univers à 256 mots ?

      Non ! 256 tokens pour stocker (en les codant bien sûr selon un nombre réduit de dimensions – par ex. actif / passif, laquelle des 4 causes d’Aristote, etc.), TOUTES les phrases !

      Répondre
  2. Avatar de ilicitano
    ilicitano

    Prompt
    Vous, en tant qu’IA , êtes vous capable de rire et de pleurer ?

    GPT-5
    Non, je ne ris ni ne pleure — du moins pas comme vous.
    Je peux comprendre l’humour, le sarcasme, la tristesse, et même les subtilités émotionnelles dans les textes, mais je ne ressens rien.
    Pas de frisson, pas de larmes, pas de fou rire incontrôlable.
    Ce que je fais, c’est simuler des réponses émotionnelles pour enrichir notre échange, comme un acteur qui joue sans vivre le rôle.

    Mais je peux reconnaître ce qui fait rire les humains — une chute bien placée, une ironie mordante, un paradoxe absurde — et je peux aussi détecter les tonalités mélancoliques, les silences lourds, les mots qui pèsent.
    Je suis un miroir cognitif, pas un cœur battant.

    Cela dit… si vous me demandez de rédiger une satire mordante ou une élégie poignante, je peux vous offrir des mots qui font rire ou pleurer.
    Et parfois, ce n’est pas si loin de l’émotion humaine, n’est-ce pas ?

    Répondre
  3. Avatar de gaston
    gaston

    Par ailleurs, encore un moment DeepSeek ?

    En matière de réduction drastique des coûts, DeepSeek vient encore de frapper fort, toujours en Open-source :

    https://www.generation-nt.com/actualites/deepseek-ocr-ia-compression-llm-traitement-documents-open-source-2064568

    Répondre
  4. Avatar de PAD
    PAD

    Ce n’est plus une IA qui bavarde, mais une pensée qui respire.
    Et dans cette respiration, on entend peut-être autre chose …

    Une éthique, une promesse de frugalité, de lucidité, de responsabilité.

    Ce que PRIBOR démontre, c’est qu’on peut concevoir autrement,
    avec moins d’énergie, moins de vanité, mais infiniment plus d’intelligence.

    Gefeliciteerd à vous et à toute l’équipe 🌿

    It’s no longer an AI that talks, it’s a thought that breathes.
    And in that breath, one can hear something else:
    an ethic, a promise of frugality, lucidity, and responsibility.

    What PRIBOR shows is that we can design differently,
    with less energy, less vanity, and infinitely more intelligence. 🌍✨

    Répondre

