PRIBOR : Logique « Combinatoire magique » – Preuve de concept

Codage sans perte à 4 scalaires × réduction de mémoire de 175 × décodage en 1 cycle

Énoncé : toute phrase simple peut être codée sans perte en 4 scalaires
(3 chaînes UTF-8 ≤ 16 octets chacune + 1 uint8) tout en préservant les
rôles d’agent / patient / possesseur et 10 catégories + 4 causes.

1. Définition du vecteur 4-D

Dim Type Longueur max. Sémantique
0 Chaîne UTF-8 16 B Agent (initiateur)
1 Chaîne UTF-8 16 B Racine du prédicat (action)
2 Chaîne UTF-8 16 B Patient (personne subissant l’action)
3 uint8 1 B Bitmap : possesseur + 4 causes + 6 de réserve

Total = 128 bits (16 octets) – aligné sur une ligne de cache de 64 octets → aucun gaspillage de remplissage à zéro.

2. Disposition du bitmap (1 octet)

bit 0 : 1 = l'agent est le possesseur
bit 1 : 1 = le patient est le possesseur
bit 2 : 1 = cause matérielle présente
bit 3 : 1 = cause formelle présente
bit 4 : 1 = cause efficiente présente
bit 5 : 1 = cause finale présente
bits 6-7 : réservés (0)

3. Exemple concret

Phrase : « Alice donne son livre à Bob. »

  • Agent : Alice
  • Prédicat : donner
  • Patient : livre
  • Bitmap : 0b00010101 → possesseur = agent, cause efficiente et finale signalées.

Charge utile totale : 3×5 + 1 = 16 octets → 128 bits.

4. Gain de mémoire par rapport à l’intégration 700-D Float32

700-D × 4 B = 2 800 B
Magie combinatoire = 16 B
Gain = 2800 / 16 ≈ ×175

5. Garanties de cohérence

  • Disjonction agent-patient : imposée par le schéma (dim 0 ≠ dim 2).
  • Possesseur unique : le bitmap permet à un seul des {agent, patient} d’être marqué comme possesseur.
  • 10 catégories : mappées sur des emplacements à 3 chaînes + 1 octet méta.
  • 4 causes : encodées dans le bitmap ; absence = 0.

6. Test de réversibilité

Étant donné le vecteur 4D ci-dessus, la surface de la phrase originale peut être régénérée de manière déterministe à l’aide du modèle :

{Agent} {prédicat}s {patient} [indicateur de possesseur → « son »/« sa »].

✓ Reconstruction exacte → sans perte.

7. Références


 

Partager :

18 réponses à “PRIBOR : Logique « Combinatoire magique » – Preuve de concept

  1. Avatar de PAD
    PAD

    Et si, au lieu de toujours vouloir tout transmettre comme le fait l’IA actuelle, PRIBOR montrait qu’il suffit d’encoder la structure profonde du langage avec une précision chirurgicale et une mémoire minuscule ?

    1. Avatar de Jean-Claude Svadchii
      Jean-Claude Svadchii

      J’aimerais savoir comment on peut représenter la structure profonde du langage, dans la mesure où les innombrables langues ont des structures extrêmement variées et que les notions qui les gouvernent ne sont pas universelles. Par exemple, l’aspect verbal joue un rôle fondamental en russe, alors qu’il est très marginal chez nous. Ne parlons pas des spécificités du chinois par rapport aux langues d’origine indo-européenne. Ou de celles de l’Inuit qui me semble être une langue agglutinante où une seule phrase peut se dire en un seul mot (mais je me trompe peut-être).

      1. Avatar de Jean-Baptiste AUXIETRE
        Jean-Baptiste AUXIETRE

        Ce n’est pas qu’une phrase se dise en un seul mot qui pose problème c’est bien son « sens » que l’on peut organiser de cette façon ! En français on peut avoir « il pleut » que l’on peut au niveau du sens limiter même à « pleuvoir » car le « il » ne désigne rien. Pourtant ces cas-là on les a bien vus et vérifiés aussi !
        Agent : vide
        Action : pleuvoir
        Patient : vide
        mais cela passe très bien dans cet octet !

        1. Avatar de Tom
          Tom

          Il pleut : le il a une fonction, déterminer la conjugaison du verbe et permettre d’identifier le temps (ici le présent). D’autre part le il seul confirme le sens courant de pleuvoir (c’est de la pluie qui tombe).

          Qu’est-ce que c’est les 10 catégories et les definitions des 4 causes ?

      2. Avatar de PAD
        PAD

        PRIBOR ne serait-il pas avant tout une preuve de concept montrant qu’un encodage minimaliste peut réduire une phrase simple à 16 octets sans perte, tandis que les cas plus complexes exigeraient des extensions modulaires ?

        1. Avatar de Jean-Baptiste AUXIETRE
          Jean-Baptiste AUXIETRE

          Les phrases plus complexes ont des subordonnées que l’on peut traiter de la même manière pour chacune d’entre elles. On sait déjà le faire chez Pribor !

  2. Avatar de Khanard
    Khanard

    @Jean-Claude Svadchii

    si je ne me trompe pas c’est la puissance du code UTF-8 et qui vous permet de lire sur le vouèbe des pages en diverses langues
    A moins que je ne comprenne pas votre commentaire .
    l’avantage immédiat que j’y vois c’est l’économie de besoins en ressources matérielles .
    mais là encore je peux me tromper .

    1. Avatar de PAD
      PAD

      UTF-8 unifie les alphabets, PRIBOR tente d’unifier la grammaire du sens, du moins me semble t-il ?

      1. Avatar de Khanard
        Khanard

        @PAD

        oui bien sûr ! l’UTF-8 n’est qu’une étape . Par contre le codage 4D sans perte a un avantage bien plus important quant à la mise en œuvre .
        Un peu de calcul .
        La plupart des ordinateurs domestiques ont en moyenne 6 Go de mémoire Ram ce qui représente approximativement 6.5 x 10⁹ octets .
        Si on travaille avec Embedding 700D Float32 avec une taille par phrase de 2800 octets cela nous donne 6.45×10⁹ /2800 = 2300000 qu’on peut écrire dans notre mémoire de 6 Go.
        Par contre avec le codage 4D sans perte c’est à dire 16 octets nous avons la division 6.45x 10⁹ /16 =403 millions .
        Vous la voyez la différence ?
        A titre d’exemple un smartphone peut emmagaziner une encyclopédie complète !
        Je ne vous parle même pas des avantages que cela implique pour le processeur , le cache de niveau L1 , les corrections d’erreurs etc…etc…(*)

        le pire c’est que je crois que là où chatgpt et globalement les LLMs ricains travaillent avec du calcul matriciel très lourd en calcul d’où les processeurs Nvidia gargantuesques avec ce procédé utilisé par Pribor on fait me semble t’il un simple calcul binaire avec une concaténation .
        Et enfin pour tous les détracteurs en tous genres concernant l’énergie utilisée on comprend tout de suite que : slogan : Choisissez Pribor le moins énergivore ! 😂😂😂😂😂

  3. Avatar de PAD
    PAD

    PRIBOR : 16 octets pour tout dire 🙂

    1. Avatar de Jean-Baptiste AUXIETRE
      Jean-Baptiste AUXIETRE

      Peut-être pas pour tout dire mais plutôt pour tout « organiser » ! Pour une phrase complexe on a juste plusieurs éléments de ce type. Donc quand on a des subordonnées on crée autant d’éléments qu’il y a de subordonnées

      1. Avatar de Jean-Claude Svadchii
        Jean-Claude Svadchii

        Si c’est pour organiser, OK. Par contre, il suffit de regarder le Grand Robert pour être parfois effaré par la quantité de sens différents qu’un seul mot peut avoir, et qu’on ne peut choisir qu’en fonction du contexte, et ce contexte peut être très vaste. Il peut intégrer l’oeuvre entière de l’écrivain.

        1. Avatar de Jean-Baptiste AUXIETRE
          Jean-Baptiste AUXIETRE

          Nous avons aussi chez Pribor le concept du « développer » et sa modélisation dont nous n’avons pas encore parlé et qui est pour l’instant un « secret de fabrication », qui par exemple au minimum relie un titre à son paragraphe mais fonctionne aussi pour l’ensemble du contexte ! Même si nous n’en avons pas encore parlé, nous avons bien chez Pribor, dans notre valise, exhaustivement, tous les concepts.

    2. Avatar de Jean-Claude Svadchii
      Jean-Claude Svadchii

      UTF-8 unifie les alphabets d’accord. Comment ça marche pour les hiéroglyphes ? Les égyptologues ont dû se débrouiller avec. De même pour l’écriture devanagari avec toutes les ligatures.
      C’est quand même une représentation externe. Quant au sens, il ne faut pas être obnubilé par l’anglais et les langues dominantes. Les milliers de langues qui existent encore recèlent bien des particularités qui ne nous viendraient pas à l’esprit. A-t-on eu le temps de vérifier que ça colle ? J’en doute. Que cela fonctionne pour un ensemble de langues, ce sera toujours cela.

      1. Avatar de Jean-Baptiste AUXIETRE
        Jean-Baptiste AUXIETRE

        Pour unifier tous les alphabets il existe UTF-16 et même UTF-32 au besoin. Les hiéroglyphes sont là https://www.compart.com/fr/unicode/block/U+13000 et peuvent être codé en UTF-8 seulement. Dans Unicode, les hiéroglyphes égyptiens sont définis dans le bloc « Egyptian Hieroglyphs » avec des points de code allant de U+13000 à U+1342F. Ces caractères ont été ajoutés dans Unicode 5.2 en 2009. De même pour le devanagari. La plupart des caractères devanagari nécessitent 3 octets (car ils sont dans la plage U+0800-U+FFFF). Mais comme je vous le dis cela peut aller jusqu’à UTF-32 qui n’est pas du tout rempli actuellement…

  4. Avatar de Dominique
    Dominique

    « Le totalitarisme qui arrive sera technologique, pas étatique » (Asma Mhalla).
    Monsieur Jorion, le titre de cet ouvrage d’une personne remarquable devrait vous interpeller, vous qui ne jurer que par l’IA tout en condamnant les totalitarismes…

    https://www.lecho.be/opinions/general/asma-mhalla-le-totalitarisme-qui-arrive-sera-technologique-pas-etatique/10629628.html

    1. Avatar de Paul Jorion

      Wikipédia :

      En 2024, Mhalla a publié en français l’essai Technopolitique : comment la technologie fait de nous des soldats. Dans son ouvrage, Mhalla soutient que la technologie structure notre rapport à la démocratie[10]. Son livre a été vivement critiqué pour son manque de recherche et son « style hyperbolique » (utilisation excessive des termes « hyper », « grand », « méta », etc. sans définition précise), ainsi que pour son manque de cohérence en matière d’économie, de technologie et d’affaires internationales [Dominique Boullier, « Technopolitique ou l’art de la pêche au gros – AOC media [archive] », 17 avril 2024]. Parmi ces critiques, on souligne la réticence à nommer les personnes ou entités spécifiques (entreprises, gouvernements) responsables de cette situation, ce qui contribue à créer un discours trop général sur « nous » et « eux » [ Irénée Régnauld, LVSL, « Technopolitique » d’Asma Mhalla : la démocratie du « nous contre eux » [archive], 16 mai 2024].

    2. Avatar de Fred AFT
      Fred AFT

      Bonjour,
      Je ne sais pas ce que vous en avez pensé, mais j’ai lu Technopolitique l’an dernier, et j’ai été fort déçu. Tout ce battage est navrant et, à mon sens, inquiétant. La critique de Boullier est hélas assez juste, et, pire encore, on peut dire que les solutions ou pistes éthico-politiques qu’elle esquisse sont une sorte de marketing de « participation » tiède – ici donc, il n’est pas si étonnant que ça que les média lui déroulent le tapis rouge. Mais par là, on peut mettre en évidence les impasses d’une défense réactive des démocraties libérales (en fait oligarchies « représentatives ») quand elle dérive (en fait) vers une forme de technoscepticisme et vers des formes pseudo-démocratiques de la politique. Cyberpunk pourrait rester longtemps en bas de ma pile…

Répondre à Fred AFT Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Contact

Contactez Paul Jorion

Commentaires récents

  1. bb Vous avez déjà lu le Deutéronome ? Bonjour le message d’amour ! Dans ce texte, ça lapide grave ceux…

  2. @bb Toutes les croyances sont nuisibles, et encore plus dans la situation où se trouve l’Humanité : nous sommes en…

  3. @Khanard Ben alors mon vieux… Elle ne vous plaît pas non plus cette histoire ? Décidément… Pourtant, on vous a connu…

  4. Je te laisse tes appréciations culinaires sur la spiritualité et j’attends avec impatience que tu développes ton point de vue…

  5. @Garorock Évidement que je trouve cela débile. 🙂 Toutefois, lorsque j’ai appris que Steve Job avait initialement refusé un traitement…

  6. Oh purée c’est clair, hallucination de ma part, désolé, proximité de l’avatar aussi. Bon ben je m’en cogne de la…

  7. BB Ces derniers temps j’ai surtout été focalisé sur ceux qui pensaient (et on attend les preuves!) que le vaccin…

  8. @Garorock Et vous pensez que la pensée dominante actuelle ne nous impose pas sa vision du matérialisme ? Le consumérisme…

  9. @ Paul Jorion Le sujet me paraît sensible pour être discuté sur un forum public. Je n’ai pas envie de…

Articles récents

Catégories

Archives

Tags

Allemagne Aristote BCE Bourse Brexit capitalisme ChatGPT Chine Coronavirus Covid-19 dette dette publique Donald Trump Emmanuel Macron Espagne Etats-Unis Europe extinction du genre humain FMI France Grands Modèles de Langage Grèce intelligence artificielle interdiction des paris sur les fluctuations de prix Italie Japon Joe Biden John Maynard Keynes Karl Marx LLM pandémie Portugal psychanalyse robotisation Royaume-Uni Russie réchauffement climatique Réfugiés Singularité spéculation Thomas Piketty Ukraine Vladimir Poutine zone euro « Le dernier qui s'en va éteint la lumière »

Meta