PRIBOR : CHE (Contextual Hyper-Embedding uint8)

CHE (Contextual Hyper-Embedding uint8) est plus économique que l’attention classique des LLMs. Des processus similaires sont déjà utilisés mais moins économiques que CHE.

————————————————–

1. Économie de mémoire

  Attention standard : matrices float16/float32 → 700 à 4000 bits par token

  CHE uint8 → 8 bits par token

→ gain × 500 à × 5000 en mémoire

————————————————–

2. Processus similaires déjà utilisés

  INT-FlashAttention (Peking University, 2024) : attention entièrement en INT8, 72 % plus rapide, 82 % moins d’erreur   

  SageAttention (OpenReview, 2024) : attention en INT8 + lissage, plug-and-play   

  LLM.int8() (NeurIPS 2022) : multiplication matricielle entièrement en INT8   

→ uint8 est déjà standard dans l’attention quantifiée.

————————————————–

3. Compatibilité avec CHE

  CHE = uint8 comprimé (SHA-256[0:8]) → 8 bits par token

  Pas de matrice 700×700, pas de softmax, pas de float ;

  Juste un uint8 dans le triplet ℝ⁴ ;

→ Plus économique et déjà utilisé dans l’attention quantifiée.

Contact : pauljorion@pribor.ai

Partager :

3 réponses à “PRIBOR : CHE (Contextual Hyper-Embedding uint8)

    1. Avatar de Paul Jorion

      Eh bien oui, cher Pascal, j’avais le choix entre « CHE » et « HEC ». Enfin, quand je dis que « j’avais le choix », ce serait très mal connaître Paul Jorion …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Contact

Contactez Paul Jorion

Commentaires récents

  1. @gaston Allez demander aux mafieux s ils préfèrent l or ou le bitcoin… Chez les jeunes l or est vue…

  2. Il n’est certainement pas fortuit que ces jours-ci, alors que l’or monte en flèche, les cryptomonnaies dégringolent : https://www.journaldutoken.com/bitcoin/glissement-du-bitcoin-en-octobre-pourquoi-le-roi-de-la-cryptographie-chute-alors-que-lor-brille/ Demandez…

  3. @Juillot Pierre Sauf erreur de ma part, l’augmentation des prix de l’or est essentiellement dus à des achats massifs par…

  4. No kings, Diffusion en direct https://youtu.be/raD5GuVUlsw

Articles récents

Catégories

Archives

Tags

Allemagne Aristote BCE Bourse Brexit capitalisme ChatGPT Chine Coronavirus Covid-19 dette dette publique Donald Trump Emmanuel Macron Espagne Etats-Unis Europe extinction du genre humain FMI France Grands Modèles de Langage Grèce intelligence artificielle interdiction des paris sur les fluctuations de prix Italie Japon Joe Biden John Maynard Keynes Karl Marx LLM pandémie Portugal psychanalyse robotisation Royaume-Uni Russie réchauffement climatique Réfugiés Singularité spéculation Thomas Piketty Ukraine Vladimir Poutine zone euro « Le dernier qui s'en va éteint la lumière »

Meta