PRIBOR : CHE (Contextual Hyper-Embedding uint8)


CHE (Contextual Hyper-Embedding uint8) est plus économique que l’attention classique des LLMs. Des processus similaires sont déjà utilisés mais moins économiques que CHE.

————————————————–

1. Économie de mémoire

  Attention standard : matrices float16/float32 → 700 à 4000 bits par token

  CHE uint8 → 8 bits par token

→ gain × 500 à × 5000 en mémoire

————————————————–

2. Processus similaires déjà utilisés

  INT-FlashAttention (Peking University, 2024) : attention entièrement en INT8, 72 % plus rapide, 82 % moins d’erreur   

  SageAttention (OpenReview, 2024) : attention en INT8 + lissage, plug-and-play   

  LLM.int8() (NeurIPS 2022) : multiplication matricielle entièrement en INT8   

→ uint8 est déjà standard dans l’attention quantifiée.

————————————————–

3. Compatibilité avec CHE

  CHE = uint8 comprimé (SHA-256[0:8]) → 8 bits par token

  Pas de matrice 700×700, pas de softmax, pas de float ;

  Juste un uint8 dans le triplet ℝ⁴ ;

→ Plus économique et déjà utilisé dans l’attention quantifiée.

Contact : pauljorion@pribor.ai

Partager :

Contact

Contactez Paul Jorion

Les livres de Paul Jorion

Commentaires récents

  1. « A quoi bon prendre la vie au sérieux, de toute façon, il n’y aura pas de survivants » Alphonse Allais Joyeux…

  2. « La vie est une maladie sexuellement transmissible et mortelle à 100% » 😂 Bon réveillon à tous en attendant la renaissance…

  3. https://www.theguardian.com/us-news/2025/dec/23/epstein-files-larry-nassar-letter (Le ministère de la Justice affirme que la lettre de Jeffrey Epstein à Larry Nassar faisant référence à Trump…

  4. Venir sur le blog de Paul, pour travailler Paul 🙂 Mmm… En invoquant l’urgence ? Relire simplement les titres des…

  5. « La route est longue, Vincent » … c’est pas sûr du tout. La dangerosité de l’IA ne fait guère de doute.…

  6. Vincent J »en profite pour te dire que tu me fais un peu peur parfois…je reconnais dans ton impatience à nous…

  7. @grand-mère-Michèle Comment prévoit de faire l’écriture inclusive dans le cas de cette métaphore pour n’oublier ni le masculin ni le…

Articles récents

Catégories

Archives

Tags

Allemagne Aristote BCE Bourse Brexit capitalisme ChatGPT Chine Coronavirus Covid-19 dette dette publique Donald Trump Emmanuel Macron Espagne Etats-Unis Europe extinction du genre humain FMI France Grands Modèles de Langage Grèce intelligence artificielle interdiction des paris sur les fluctuations de prix Italie Japon Joe Biden John Maynard Keynes Karl Marx LLM pandémie Portugal psychanalyse robotisation Royaume-Uni Russie réchauffement climatique Réfugiés Singularité spéculation Thomas Piketty Ukraine Vladimir Poutine zone euro « Le dernier qui s'en va éteint la lumière »

Meta