algo/v1/chapitre5.md
Nicolas Cantu e93b10a719 Script de compilation, livre consolidé v0, structure v1 et correctifs
**Motivations:**
- Compilation du livre à partir des chapitres v0
- Création de la structure v1 avec chapitres et correctifs

**Evolutions:**
- v0/compile_livre.py : script de compilation
- v0/livre.md : livre consolidé généré
- Modifications des chapitres v0 (1-32), introduction, fermeture, plan_total_ouvrage, references, analyses critiques
- v1 : abstract, chapitres 1-16, correctifs chapitres 17-32, introduction, fermeture, plan_total_ouvrage, references

**Pages affectées:**
- v0/ : compile_livre.py (nouveau), livre.md (nouveau), chapitre1-32.md, introduction.md, fermeture.md, plan_total_ouvrage.md, references.md, analyse_critique_ouvrage*.md
- v1/ : abstract.md, chapitre1-16.md, correctifs/chapitre17-32.md, introduction.md, fermeture.md, plan_total_ouvrage.md, references.md (nouveaux)

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-14 00:44:58 +01:00

22 KiB
Raw Blame History

livre version auteur chapitre type
Théorie des futurs accessibles v1 Nicolas Cantu 5 chapitre

Chapitre 5 — Compression, noninjectivité et classes de formes

Ce chapitre formalise un mécanisme structural déjà latent dans les chapitres précédents : dès quun univers itératif opère sous contraintes de description (finitude globale, finitude locale, ou observabilité agrégée), les transformations effectives deviennent typiquement non injectives. Cette noninjectivité engendre des collisions (plusieurs antécédents pour un même résultat), lesquelles imposent à leur tour des partitions de lespace des configurations en fibres et en classes déquivalence.

La contribution mathématique principale est triple. Dabord, on établit des résultats élémentaires mais structurants : toute application q:X\to A avec |A|<|X| induit une partition par fibres; le degré de collision se borne par des arguments de comptage (principe des tiroirs) et, sous contraintes de codage, par des inégalités de type KraftMcMillan (existence de codes à longueurs données) et par les bornes de Shannon sur la compression sans perte. Ensuite, on formalise la compression comme projection (idempotente) ou comme quotient (factorisation), et on introduit des « attracteurs de second ordre » : attracteurs de la dynamique induite sur un espace des classes (système facteur). Enfin, on relie ces constructions à des quantités de consensus : entropie de Shannon (et entropie conditionnelle) pour mesurer la perte induite par une projection déterministe, et complexité algorithmique de Kolmogorov comme mesure intrinsèque de compressibilité (non calculable en général, mais conceptuellement fondatrice).

La partie « héritage morphologique » reste formelle : elle définit un registre transmissible comme mémoire de collisions (cooccurrences de classes) et montre quelles conditions minimales (flèche dévénements, disponibilité de projections stables) sont requises pour quune accumulation historique devienne possible, sans invoquer finalité ni sémantique.

Fondations formelles : noninjectivité, collisions, partitions, fibres

Soit X un ensemble de configurations (fini ou non), et q:X\to A une application.

Définition (injectivité / noninjectivité).
q est injective si q(x)=q(y)\Rightarrow x=y. Elle est non injective sil existe x\neq y tels que q(x)=q(y).

Définition (collision).
Une collision est un couple (x,y) avec x\neq y et q(x)=q(y). Le modèle ne qualifie pas moralement la collision : cest un fait structurel.

Définition (fibre).
Pour a\in A, la fibre (préimage) est


F_a \;=\; q^{-1}(a)\;=\;\{x\in X:\ q(x)=a\}.

Proposition 1 (partition par fibres).
Lensemble \{F_a\}_{a\in A} forme une partition de X restreinte à limage :
(i) (X=\bigsqcup_{a\in q(X)} F_a) ; (ii) F_a\cap F_b=\varnothing si a\neq b.

Preuve.
Chaque x\in X appartient à F_{q(x)}, donc X=\bigcup_{a\in q(X)}F_a. Si x\in F_a\cap F_b, alors q(x)=a=b, contradiction si a\neq b. □

Collisions imposées par compression de cardinal

Supposons X fini, |X|=N, et |q(X)|=M.

Proposition 2 (principe des tiroirs → collision).
Si M<N, alors q nest pas injective.

Preuve.
Une injection de N éléments dans M<N éléments est impossible (pigeonhole). □

Proposition 3 (borne sur la plus grande fibre).
Il existe a\in q(X) tel que |F_a|\ge \lceil N/M\rceil.

Preuve.
\sum_{a\in q(X)}|F_a|=N. Si toutes les fibres avaient taille <N/M, la somme serait <M\cdot N/M=N, contradiction. □

Ces trois faits suffisent pour une première thèse structurale : toute réduction dun ensemble détats à un alphabet plus petit produit nécessairement des classes (fibres), et donc une perte dindividuation fine.

Cadre mesuré : partitions mesurables et conditionnement

Dans un cadre probabiliste (consensus en théorie de linformation), on suppose une variable aléatoire X à valeurs dans un ensemble fini X, et Y=q(X). Shannon définit lentropie H(X), lentropie jointe H(X,Y) et lentropie conditionnelle via la relation de chaîne


H(X,Y)=H(X)+H_X(Y),

et montre que lincertitude de Y ne croît pas lorsquon connaît X.

Dans le langage plus général des systèmes dynamiques mesurés, Kolmogorov et Sinai définissent lentropie conditionnelle sur des partitions (ou (\sigma)-algèbres) et construisent des quantités invariantes (entropie métrique) à partir de raffinement de partitions ; leur texte introduit explicitement « conditional entropy » et ses propriétés dans ce cadre.

Opérateurs de compression et quotients dynamiques

Compression comme projection idempotente

On formalise une « compression » sans sémantique comme une application de réduction q:X\to A (alphabet des classes) accompagnée dun choix de représentant r:A\to X tel que q\circ r=\mathrm{Id}_A (section).

On définit alors la projection (P:X\to X) :


P \;=\; r\circ q.

Proposition 4 (idempotence).
P\circ P = P.

Preuve.
P(P(x))=r(q(r(q(x))))=r((q\circ r)(q(x)))=r(q(x))=P(x). □

Corollaire (convergence en un pas).
Litération de P converge immédiatement : P^{(n)}=P pour tout n\ge 1. Les points fixes de P sont exactement \mathrm{Im}(P)=r(A).

Cette forme didempotence est le prototype dun « attracteur de second ordre » au sens minimal : le système de compression possède son propre ensemble invariant (les représentants), atteint en un nombre borné ditérations.

Compression comme quotient et systèmes facteurs

Une autre formalisation (plus canonique en dynamique) consiste à partir dune relation déquivalence \sim sur X et à considérer lespace quotient X/{\sim} avec la projection canonique \pi:X\to X/{\sim}.

Soit maintenant une dynamique f:X\to X. On dit que \sim est compatible avec f si


x\sim y\ \Rightarrow\ f(x)\sim f(y),

ce qui équivaut à la bonne définition dune dynamique induite \bar f:X/{\sim}\to X/{\sim} telle que


\pi\circ f = \bar f \circ \pi.

Ceci formalise lidée que « la dynamique ne dépend que de la classe ».

Définition (attracteur de second ordre).
Un attracteur A^\*\subseteq X/{\sim} de \bar f est appelé attracteur de second ordre relatif à (X,f,\sim). Il décrit un régime stable non plus sur les états, mais sur leurs classes.

Ce concept généralise un fait déjà rencontré : dans un graphe fonctionnel fini, les cycles sont des invariants sur X; un quotient peut fusionner plusieurs cycles ou plusieurs transitoires, créant une « topologie dattracteurs » plus grossière. La pertinence technique (et non interprétative) est que des régimes invariants deviennent calculables et transmissibles à une résolution plus faible.

Mortveit et Reidys, dans un cadre de dynamiques discrètes sur graphes (Sequential Dynamical Systems), mettent explicitement en avant létude de la réversibilité, des orbites périodiques, ainsi que des notions d« equivalence, morphisms and reduction », i.e. précisément des mécanismes de quotient et de réduction de dynamique, considérés comme outils structurants de la théorie.

Exemple directeur : opérateur de Kaprekar comme compression + dynamique

On considère des mots de longueur D en base B (ou des entiers à D chiffres en base B avec zéros initiaux). Lopération « trier les chiffres » est une compression : elle quotient par laction du groupe des permutations des positions (linformation « ordre des chiffres » est supprimée). Thakur formalise le processus \kappa en base B et D chiffres : \kappa(n)=\overrightarrow{n}-\overleftarrow{n}, où \overrightarrow{n} et \overleftarrow{n} sont les chiffres triés décroissant/croissant.

Young rappelle la propriété classique : en base 10 et D=4, toute itération issue dun nombre dont les chiffres ne sont pas tous égaux atteint 6174 en au plus sept étapes, et 6174 est invariant sous lopérateur.

Dans notre lecture, le point structurel est le suivant : létape de tri est un projecteur vers un représentant canonique de lorbite sous permutation (compression), puis lopérateur complet itère sur un espace fini, donc admet des cycles (chapitres 23), mais sur un espace déjà compressé.

Diagramme abstrait (Kaprekar comme quotient puis dynamique) :

flowchart LR
  X["États (D chiffres, base B)"] -->|q : quotient par permutations| A["Classes (multisets de chiffres)"]
  A -->|r : représentant canonique (tri)| Xc["Représentants triés"]
  Xc -->|d : transformation (différence)| X2["États suivants"]
  X2 -->|itération| X

Mesures de compression : entropies, complexités, distances

Entropie de Shannon et perte induite par une projection déterministe

Soit une variable aléatoire X à valeurs dans un ensemble fini, et Y=q(X) une projection déterministe.

Shannon établit les relations fondamentales (entropie jointe, conditionnelle) et la relation de chaîne


H(X,Y)=H(X)+H_X(Y),

ainsi que des inégalités de sousadditivité et le fait que lincertitude ne croît pas lorsquon conditionne.

Comme Y est une fonction de X, on a H(Y|X)=0 et donc


H(X) = H(Y) + H(X|Y).

Interprétation strictement formelle :

  • H(Y) mesure lincertitude au niveau des classes (partitions) ;
  • H(X|Y) mesure lincertitude résiduelle à lintérieur dune fibre (information perdue par la projection).

Proposition 5 (borne par la plus grande fibre).


H(X|Y)\ \le\ \log |F_{\max}|
\quad\text{où}\quad
|F_{\max}|=\max_{a}|F_a|.

Preuve.
Conditionnellement à Y=a, la variable X prend ses valeurs dans F_a, donc son entropie conditionnelle est \le \log|F_a|; en moyennant, \le \log|F_{\max}|. □

Compression sans perte et contraintes de codage

Un « codage sans perte » impose que le décodage soit injectif sur les messages possibles. Shannon démontre que lentropie borne par le bas le taux de compression atteignable en moyenne (noiseless coding theorem) et relie directement compression, redondance, et codages efficaces.

Sur le plan combinatoire, lexistence de codes instantanés/préfixes est contrainte par linégalité de Kraft, et lextension aux codes uniquement déchiffrables par McMillan. Un cours MIT OCW rappelle cette contrainte classique et sa construction par arbres (D)-aires. Huffman fournit ensuite une procédure constructive doptimalité (minimum de redondance moyenne) pour ensembles finis de messages, explicitement dans la continuité de Shannon et en citant Kraft.

Ces résultats sont utilisés ici de façon non sémantique : ils montrent que vouloir raccourcir systématiquement les descriptions (compression) impose soit des collisions (noninjectivité du codage), soit des redondances explicites (longueurs suffisantes), soit une probabilité derreur.

Entropie combinatoire et « entropie structurelle des classes »

Kolmogorov rappelle quavant toute probabilité, on peut définir une entropie combinatoire H(x)=\log_2 N lorsque x prend ses valeurs dans un ensemble fini de taille N, et introduit aussi une entropie conditionnelle combinatoire via les ensembles possibles Y_a compatibles avec x=a.

Dans notre cadre, si q:X\to A induit des classes, une mesure structurelle minimale, indépendante de la dynamique, est


H_{\text{classes}}
\;=\;-\sum_{a\in A} p_a \log p_a,
\quad
p_a=\frac{|F_a|}{|X|}

en supposant une distribution uniforme sur X. Cest lentropie de Shannon de la variable « classe » quand on pick un état uniformément (un cas particulier du cadre mesuré).

Complexité de Kolmogorov : compressibilité intrinsèque (consensus, non constructive)

Kolmogorov introduit un troisième point de vue : mesurer linformation dun objet par la longueur de la plus courte description algorithmique produisant cet objet (approche algorithmique), après avoir exposé les approches combinatoire et probabiliste.

On en retient ici une conséquence structurale (de consensus dans la théorie) : il existe des objets (chaînes) incompressibles au sens algorithmique, pour lesquels aucune description significativement plus courte nexiste, tandis que dautres objets sont compressibles parce quils possèdent des régularités exploitables. Dans ce livre, cela nest pas interprété comme « sens » ou « utilité », mais comme propriété intrinsèque de description.

Calcul effectif en contexte discret : algorithmes et complexité

Ce chapitre requiert des outils effectifs : calculer classes, fibres, et parfois bassins, dans des univers finis.

Calcul des fibres dune projection

Entrée : représentation explicite de X (liste des états) et de q.
Sortie : dictionnaire a \mapsto F_a.

Algorithme : un seul parcours, insertion dans une table de hachage.

  • Temps : O(|X|) évaluations de q + coût de hachage (amorti).
  • Mémoire : O(|X|) au pire si on stocke tous les éléments.

Calcul des cycles et bassins dune fonction f:X\to X

Dans un cadre fini déterministe, le graphe est fonctionnel (degré sortant 1). Les cycles et bassins se calculent en temps linéaire O(N) via élimination des arbres (méthode par degrés entrants) ou via détection de cycles.

Pseudocode (élimination des noncycliques) :

Input: f[1..N]  // successeur de chaque nœud
indeg[1..N] = 0
for v in 1..N: indeg[f[v]]++

queue = all v with indeg[v]==0
mark_noncycle[v]=false

while queue not empty:
  v = pop(queue)
  mark_noncycle[v]=true
  u = f[v]
  indeg[u]--
  if indeg[u]==0: push(u)

cycles = all v with mark_noncycle[v]==false
// cycles contiennent les sommets sur cycles; les bassins se déduisent par parcours inverse

Cette structure « phase space » est précisément lobjet central des dynamiques discrètes finies (points fixes, orbites périodiques, réversibilité, réductions), comme le souligne la littérature SDS citée plus haut.

Détection locale dun cycle sur une trajectoire : accès constant

Lorsquon na pas accès à tout X mais seulement à un oracle f et un état initial, on peut détecter une périodicité par la méthode de la « tortue et du lièvre » (rhoFloyd), présentée en français dans des notes dagrégation. Dans léconomie de notre livre, ce point illustre une propriété simple : la cyclicité nest pas seulement un fait théorique, elle est détectable par des algorithmes légers.

Transmission structurale : mémoire des collisions et sousstructures transmissibles

Cette section nest pas une « application ». Elle construit un prolongement formel minimal, compatible avec les chapitres 14 : si la noninjectivité impose des classes, alors il devient possible (et parfois nécessaire) de transporter non pas des états, mais des classes et des statistiques de collisions.

Registre de collisions comme objet transmissible

Fixons une projection q:X\to A, permettant de remplacer les états par leurs classes a\in A. Considérons une trajectoire (x_t) et la trajectoire projetée (a_t) avec a_t=q(x_t).

On définit un registre de cooccurrences (mémoire purement combinatoire) :


M(a,b)\;=\;\#\{t:\ a_t=a,\ a_{t+1}=b\},

ou, plus généralement, une version multidistance M_\Delta(a,b)=\#\{t:\ a_t=a,\ a_{t+\Delta}=b\}.

Ce registre encode lhistoire au niveau des classes, non des identités fines : il est invariant à lintérieur des fibres, donc compatible avec le principe même de compression.

Génotype minimal comme quadruplet formel

On définit un objet transmissible \Gamma (sans interprétation biologique requise) :


\Gamma=(S, M, \mathcal{I}, \mathcal{R})

où :

  • S\in A^{n} est une séquence de classes (trace compressée) ;
  • M est un registre de cooccurrences comme cidessus ;
  • \mathcal{I} est un ensemble dinvariants dérivés (par exemple, attracteur(s) dans lespace des classes, période, temps de convergence dans lespace quotient) ;
  • \mathcal{R} est un ensemble de règles admissibles de transformation (mutations de S, mises à jour de M, contraintes de compatibilité).

Point de méthode. Ce quadruplet nest pas présenté comme « vrai dans la nature ». Il est présenté comme construction minimale pour transporter lhistoire quand lidentité fine nest pas conservable.

Gamète comme sousstructure (fragment) et recombinaison

On définit un opérateur de fragmentation


\mathrm{Frag}(\Gamma) = \gamma = (S_\gamma, M_\gamma, \mathcal{I}_\gamma),

S_\gamma est une sousséquence (ou un ensemble de segments), M_\gamma est la restriction correspondante (sousmatrice), et \mathcal{I}_\gamma les invariants associés.

Une recombinaison minimale est une opération de somme/concaténation sous contraintes :


\Gamma'=\mathrm{Recombine}(\gamma_1,\gamma_2;\Theta),

\Theta fixe les règles dassemblage et de conflit.

Condition formelle pour accumulation historique

Les objets précédents restent stériles si lon autorise des boucles « généalogiques » illimitées : laccumulation exige une flèche structurelle (chapitre 4). Dans la logique interne, une condition minimale est lacyclicité du graphe dévénements (DAG) ou lexistence dune ressource consommée monotone interdisant les retours exacts.

À ce point, Landauer fournit un ancrage de consensus : toute opération logiquement irréversible (noninjective) est associée à une dissipation minimale, i.e. un coût physique de leffacement des distinctions, ce qui rend plausible (au niveau des implémentations) la nongratuité des compressions destructives.

Diagramme minimal (état → fibre → classe → registre → fragments transmissibles) :

flowchart TD
  x["État x ∈ X"] -->|q| a["Classe a ∈ A"]
  a --> Fa["Fibre F_a = q^{-1}(a)"]
  a --> S["Trace S ∈ A^n"]
  S --> M["Cooccurrences M(a,b)"]
  subgraph Gamma["Registre Γ=(S,M,,)"]
    S
    M
  end
  Gamma -->|Frag| g1["Fragment γ₁"]
  Gamma -->|Frag| g2["Fragment γ₂"]
  g1 -->|Recombine| Gp["Nouveau registre Γ'"]
  g2 -->|Recombine| Gp

Lectures conditionnelles (S1) dérivées strictement

Cette section se limite à des implications nécessaires des mathématiques cidessus.

Disponibilité de classes de formes.
Dès quune description effective est bornée (alphabet de classes A, code plus court, quotient par symétries), la noninjectivité est inévitable (Proposition 2), donc des classes apparaissent nécessairement. Ces classes sont des « formes » au sens minimal : des ensembles détats indiscernables sous la projection considérée.

Renforcement de stabilité par projection.
Une projection idempotente P=r\circ q crée un sousensemble invariant \mathrm{Im}(P) atteint en temps borné (Proposition 4). Donc, indépendamment de toute physique, la compression peut produire des régimes stables au niveau des représentants, et plus généralement au niveau du quotient (attracteurs de second ordre).

Condition de possibilité de canaux dhéritage.
Un canal dhéritage au sens strictement formel exige (i) une représentation stable et transmissible (classe/registre), et (ii) une flèche empêchant le recyclage parfait des événements. Le premier point est fourni par la partition et par des invariants de quotient; le second relève des mécanismes dirréversibilité (noninjectivité, monotones) établis au chapitre 4.

Analyse philosophique finale : ontologie de la compression, limites et interdits

Nécessité ontologique minimale.
Dans un univers défini par transformations admissibles, lidentité fine nest pas une primitive garantie : elle est un luxe qui exige injectivité ou traçabilité complète. Or, toute contrainte de description ou de symétrie impose des quotients. Ainsi, « persister » à niveau donné signifie, le plus souvent, persister comme classe (fibre) plutôt que comme individu.

Compression nimplique ni finalité ni sémantique.
Le vocabulaire de « compression » peut suggérer un acte, un but, une optimisation. Ici, il ne désigne quune relation structurale : une factorisation X\to A entraînant des collisions. Les entropies et complexités ne qualifient pas un sens, mais une quantité de distinction possible (Shannon) ou une longueur minimale de description (Kolmogorov).

Ce que le formalisme interdit à ce stade.

  • Il interdit dinférer une « meilleure » compression : sans fonction objectif, « mieux » na pas de sens mathématique.
  • Il interdit didentifier une classe à une essence : une classe est relative à une projection q. Changer q change lontologie des formes.
  • Il interdit toute téléologie cachée : un quotient peut être imposé par une symétrie, par une limitation de code, ou par une observation; aucune de ces raisons nest une intention.

Limite structurale : pluralité des niveaux.
La coexistence de plusieurs projections q_1,q_2,\dots implique une pluralité de mondes de classes. La philosophie rigoureuse qui suit de ce fait est une philosophie stratifiée : il nexiste pas « la » classe absolue sans spécification du niveau de description. Ce résultat nest pas un relativisme : cest la conséquence logique que léquivalence est toujours définie par une relation (ou un observateur formel) et non par lobjet nu.

Transition logique vers les chapitres suivants.
Ce chapitre a montré que la noninjectivité contraint lunivers à se décrire par classes, et que la dynamique peut se factoriser sur ces classes. Le chapitre suivant (classes déquivalence et invariants) pourra donc : (i) stabiliser les constructions de quotient, (ii) étudier la persistance relative des invariants sous transformation, et (iii) préparer la grammaire compositionnelle des formes (chapitres 68).