algo/v1/chapitre5.md

---
livre: "Théorie des futurs accessibles"
version: v1
auteur: Nicolas Cantu
chapitre: 5
type: chapitre
---

# Chapitre 5 — Compression, non‑injectivité et classes de formes

Ce chapitre formalise un mécanisme structural déjà latent dans les chapitres précédents : dès qu’un univers itératif opère sous **contraintes de description** (finitude globale, finitude locale, ou observabilité agrégée), les transformations effectives deviennent typiquement **non injectives**. Cette non‑injectivité engendre des **collisions** (plusieurs antécédents pour un même résultat), lesquelles imposent à leur tour des **partitions** de l’espace des configurations en **fibres** et en **classes d’équivalence**.

La contribution mathématique principale est triple. D’abord, on établit des résultats élémentaires mais structurants : toute application \(q:X\to A\) avec \(|A|<|X|\) induit une partition par fibres; le degré de collision se borne par des arguments de comptage (principe des tiroirs) et, sous contraintes de codage, par des inégalités de type Kraft–McMillan (existence de codes à longueurs données) et par les bornes de Shannon sur la compression sans perte. Ensuite, on formalise la compression comme **projection** (idempotente) ou comme **quotient** (factorisation), et on introduit des « attracteurs de second ordre » : attracteurs de la dynamique induite sur un espace **des classes** (système facteur). Enfin, on relie ces constructions à des quantités de consensus : entropie de Shannon (et entropie conditionnelle) pour mesurer la perte induite par une projection déterministe, et complexité algorithmique de Kolmogorov comme mesure intrinsèque de compressibilité (non calculable en général, mais conceptuellement fondatrice).

La partie « héritage morphologique » reste formelle : elle définit un **registre transmissible** comme mémoire de collisions (cooccurrences de classes) et montre quelles conditions minimales (flèche d’événements, disponibilité de projections stables) sont requises pour qu’une accumulation historique devienne possible, sans invoquer finalité ni sémantique.

## Fondations formelles : non‑injectivité, collisions, partitions, fibres

Soit \(X\) un ensemble de configurations (fini ou non), et \(q:X\to A\) une application.

**Définition (injectivité / non‑injectivité).**
\(q\) est injective si \(q(x)=q(y)\Rightarrow x=y\). Elle est non injective s’il existe \(x\neq y\) tels que \(q(x)=q(y)\).

**Définition (collision).**
Une collision est un couple \((x,y)\) avec \(x\neq y\) et \(q(x)=q(y)\). Le modèle ne qualifie pas moralement la collision : c’est un fait structurel.

**Définition (fibre).**
Pour \(a\in A\), la fibre (préimage) est
\[
F_a \;=\; q^{-1}(a)\;=\;\{x\in X:\ q(x)=a\}.
\]

**Proposition 1 (partition par fibres).**
L’ensemble \(\{F_a\}_{a\in A}\) forme une partition de \(X\) restreinte à l’image :
(i) \(X=\bigsqcup_{a\in q(X)} F_a\) ; (ii) \(F_a\cap F_b=\varnothing\) si \(a\neq b\).

*Preuve.*
Chaque \(x\in X\) appartient à \(F_{q(x)}\), donc \(X=\bigcup_{a\in q(X)}F_a\). Si \(x\in F_a\cap F_b\), alors \(q(x)=a=b\), contradiction si \(a\neq b\). □

### Collisions imposées par compression de cardinal

Supposons \(X\) fini, \(|X|=N\), et \(|q(X)|=M\).

**Proposition 2 (principe des tiroirs → collision).**
Si \(M<N\), alors \(q\) n’est pas injective.

*Preuve.*
Une injection de \(N\) éléments dans \(M<N\) éléments est impossible (pigeonhole). □

**Proposition 3 (borne sur la plus grande fibre).**
Il existe \(a\in q(X)\) tel que \(|F_a|\ge \lceil N/M\rceil\).

*Preuve.*
\(\sum_{a\in q(X)}|F_a|=N\). Si toutes les fibres avaient taille \(<N/M\), la somme serait \(<M\cdot N/M=N\), contradiction. □

Ces trois faits suffisent pour une première thèse structurale : **toute réduction d’un ensemble d’états à un alphabet plus petit produit nécessairement des classes** (fibres), et donc une perte d’individuation fine.

### Cadre mesuré : partitions mesurables et conditionnement

Dans un cadre probabiliste (consensus en théorie de l’information), on suppose une variable aléatoire \(X\) à valeurs dans un ensemble fini \(X\), et \(Y=q(X)\). Shannon définit l’entropie \(H(X)\), l’entropie jointe \(H(X,Y)\) et l’entropie conditionnelle via la relation de chaîne
\[
H(X,Y)=H(X)+H_X(Y),
\]
et montre que l’incertitude de \(Y\) ne croît pas lorsqu’on connaît \(X\).

Dans le langage plus général des systèmes dynamiques mesurés, Kolmogorov et Sinai définissent l’entropie conditionnelle sur des **partitions** (ou \(\sigma\)-algèbres) et construisent des quantités invariantes (entropie métrique) à partir de raffinement de partitions ; leur texte introduit explicitement « conditional entropy » et ses propriétés dans ce cadre.

## Opérateurs de compression et quotients dynamiques

### Compression comme projection idempotente

On formalise une « compression » sans sémantique comme une application de réduction \(q:X\to A\) (alphabet des classes) accompagnée d’un choix de représentant \(r:A\to X\) tel que \(q\circ r=\mathrm{Id}_A\) (section).

On définit alors la **projection** \(P:X\to X\) :
\[
P \;=\; r\circ q.
\]

**Proposition 4 (idempotence).**
\(P\circ P = P\).

*Preuve.*
\(P(P(x))=r(q(r(q(x))))=r((q\circ r)(q(x)))=r(q(x))=P(x)\). □

**Corollaire (convergence en un pas).**
L’itération de \(P\) converge immédiatement : \(P^{(n)}=P\) pour tout \(n\ge 1\). Les points fixes de \(P\) sont exactement \(\mathrm{Im}(P)=r(A)\).

Cette forme d’idempotence est le prototype d’un « attracteur de second ordre » au sens minimal : le système de compression possède son propre ensemble invariant (les représentants), atteint en un nombre borné d’itérations.

### Compression comme quotient et systèmes facteurs

Une autre formalisation (plus canonique en dynamique) consiste à partir d’une relation d’équivalence \(\sim\) sur \(X\) et à considérer l’espace quotient \(X/{\sim}\) avec la projection canonique \(\pi:X\to X/{\sim}\).

Soit maintenant une dynamique \(f:X\to X\). On dit que \(\sim\) est **compatible** avec \(f\) si
\[
x\sim y\ \Rightarrow\ f(x)\sim f(y),
\]
ce qui équivaut à la bonne définition d’une dynamique induite \(\bar f:X/{\sim}\to X/{\sim}\) telle que
\[
\pi\circ f = \bar f \circ \pi.
\]
Ceci formalise l’idée que « la dynamique ne dépend que de la classe ».

**Définition (attracteur de second ordre).**
Un attracteur \(A^\*\subseteq X/{\sim}\) de \(\bar f\) est appelé attracteur de second ordre relatif à \((X,f,\sim)\). Il décrit un régime stable non plus sur les états, mais sur leurs classes.

Ce concept généralise un fait déjà rencontré : dans un graphe fonctionnel fini, les cycles sont des invariants sur \(X\); un quotient peut fusionner plusieurs cycles ou plusieurs transitoires, créant une « topologie d’attracteurs » plus grossière. La pertinence technique (et non interprétative) est que des régimes invariants deviennent calculables et transmissibles à une résolution plus faible.

Mortveit et Reidys, dans un cadre de dynamiques discrètes sur graphes (Sequential Dynamical Systems), mettent explicitement en avant l’étude de la réversibilité, des orbites périodiques, ainsi que des notions d’« equivalence, morphisms and reduction », i.e. précisément des mécanismes de quotient et de réduction de dynamique, considérés comme outils structurants de la théorie.

### Exemple directeur : opérateur de Kaprekar comme compression + dynamique

On considère des mots de longueur \(D\) en base \(B\) (ou des entiers à \(D\) chiffres en base \(B\) avec zéros initiaux). L’opération « trier les chiffres » est une compression : elle quotient par l’action du groupe des permutations des positions (l’information « ordre des chiffres » est supprimée). Thakur formalise le processus \(\kappa\) en base \(B\) et \(D\) chiffres : \(\kappa(n)=\overrightarrow{n}-\overleftarrow{n}\), où \(\overrightarrow{n}\) et \(\overleftarrow{n}\) sont les chiffres triés décroissant/croissant.

Young rappelle la propriété classique : en base 10 et \(D=4\), toute itération issue d’un nombre dont les chiffres ne sont pas tous égaux atteint 6174 en au plus sept étapes, et 6174 est invariant sous l’opérateur.

Dans notre lecture, le point structurel est le suivant : l’étape de tri est un **projecteur** vers un représentant canonique de l’orbite sous permutation (compression), puis l’opérateur complet itère sur un espace fini, donc admet des cycles (chapitres 2–3), mais sur un espace déjà compressé.

Diagramme abstrait (Kaprekar comme quotient puis dynamique) :

```mermaid
flowchart LR
  X["États (D chiffres, base B)"] -->|q : quotient par permutations| A["Classes (multisets de chiffres)"]
  A -->|r : représentant canonique (tri)| Xc["Représentants triés"]
  Xc -->|d : transformation (différence)| X2["États suivants"]
  X2 -->|itération| X
```

## Mesures de compression : entropies, complexités, distances

### Entropie de Shannon et perte induite par une projection déterministe

Soit une variable aléatoire \(X\) à valeurs dans un ensemble fini, et \(Y=q(X)\) une projection déterministe.

Shannon établit les relations fondamentales (entropie jointe, conditionnelle) et la relation de chaîne
\[
H(X,Y)=H(X)+H_X(Y),
\]
ainsi que des inégalités de sous‑additivité et le fait que l’incertitude ne croît pas lorsqu’on conditionne.

Comme \(Y\) est une fonction de \(X\), on a \(H(Y|X)=0\) et donc
\[
H(X) = H(Y) + H(X|Y).
\]
Interprétation strictement formelle :
- \(H(Y)\) mesure l’incertitude au niveau des classes (partitions) ;
- \(H(X|Y)\) mesure l’incertitude résiduelle à l’intérieur d’une fibre (information perdue par la projection).

**Proposition 5 (borne par la plus grande fibre).**
\[
H(X|Y)\ \le\ \log |F_{\max}|
\quad\text{où}\quad
|F_{\max}|=\max_{a}|F_a|.
\]

*Preuve.*
Conditionnellement à \(Y=a\), la variable \(X\) prend ses valeurs dans \(F_a\), donc son entropie conditionnelle est \(\le \log|F_a|\); en moyennant, \(\le \log|F_{\max}|\). □

### Compression sans perte et contraintes de codage

Un « codage sans perte » impose que le décodage soit injectif sur les messages possibles. Shannon démontre que l’entropie borne par le bas le taux de compression atteignable en moyenne (noiseless coding theorem) et relie directement compression, redondance, et codages efficaces.

Sur le plan combinatoire, l’existence de codes instantanés/préfixes est contrainte par l’inégalité de Kraft, et l’extension aux codes uniquement déchiffrables par McMillan. Un cours MIT OCW rappelle cette contrainte classique et sa construction par arbres \(D\)-aires.
Huffman fournit ensuite une procédure constructive d’optimalité (minimum de redondance moyenne) pour ensembles finis de messages, explicitement dans la continuité de Shannon et en citant Kraft.

Ces résultats sont utilisés ici de façon non sémantique : ils montrent que vouloir raccourcir systématiquement les descriptions (compression) impose soit des collisions (non‑injectivité du codage), soit des redondances explicites (longueurs suffisantes), soit une probabilité d’erreur.

### Entropie combinatoire et « entropie structurelle des classes »

Kolmogorov rappelle qu’avant toute probabilité, on peut définir une entropie combinatoire \(H(x)=\log_2 N\) lorsque \(x\) prend ses valeurs dans un ensemble fini de taille \(N\), et introduit aussi une entropie conditionnelle combinatoire via les ensembles possibles \(Y_a\) compatibles avec \(x=a\).

Dans notre cadre, si \(q:X\to A\) induit des classes, une mesure structurelle minimale, indépendante de la dynamique, est
\[
H_{\text{classes}}
\;=\;-\sum_{a\in A} p_a \log p_a,
\quad
p_a=\frac{|F_a|}{|X|}
\]
en supposant une distribution uniforme sur \(X\). C’est l’entropie de Shannon de la variable « classe » quand on pick un état uniformément (un cas particulier du cadre mesuré).

### Complexité de Kolmogorov : compressibilité intrinsèque (consensus, non constructive)

Kolmogorov introduit un troisième point de vue : mesurer l’information d’un objet par la longueur de la plus courte description algorithmique produisant cet objet (approche algorithmique), après avoir exposé les approches combinatoire et probabiliste.

On en retient ici une conséquence structurale (de consensus dans la théorie) : il existe des objets (chaînes) **incompressibles** au sens algorithmique, pour lesquels aucune description significativement plus courte n’existe, tandis que d’autres objets sont compressibles parce qu’ils possèdent des régularités exploitables. Dans ce livre, cela n’est pas interprété comme « sens » ou « utilité », mais comme propriété intrinsèque de description.

## Calcul effectif en contexte discret : algorithmes et complexité

Ce chapitre requiert des outils effectifs : calculer classes, fibres, et parfois bassins, dans des univers finis.

### Calcul des fibres d’une projection

Entrée : représentation explicite de \(X\) (liste des états) et de \(q\).
Sortie : dictionnaire \(a \mapsto F_a\).

Algorithme : un seul parcours, insertion dans une table de hachage.

- Temps : \(O(|X|)\) évaluations de \(q\) + coût de hachage (amorti).
- Mémoire : \(O(|X|)\) au pire si on stocke tous les éléments.

### Calcul des cycles et bassins d’une fonction \(f:X\to X\)

Dans un cadre fini déterministe, le graphe est fonctionnel (degré sortant 1). Les cycles et bassins se calculent en temps linéaire \(O(N)\) via élimination des arbres (méthode par degrés entrants) ou via détection de cycles.

Pseudocode (élimination des non‑cycliques) :

```pseudo
Input: f[1..N]  // successeur de chaque nœud
indeg[1..N] = 0
for v in 1..N: indeg[f[v]]++

queue = all v with indeg[v]==0
mark_noncycle[v]=false

while queue not empty:
  v = pop(queue)
  mark_noncycle[v]=true
  u = f[v]
  indeg[u]--
  if indeg[u]==0: push(u)

cycles = all v with mark_noncycle[v]==false
// cycles contiennent les sommets sur cycles; les bassins se déduisent par parcours inverse
```

Cette structure « phase space » est précisément l’objet central des dynamiques discrètes finies (points fixes, orbites périodiques, réversibilité, réductions), comme le souligne la littérature SDS citée plus haut.

### Détection locale d’un cycle sur une trajectoire : accès constant

Lorsqu’on n’a pas accès à tout \(X\) mais seulement à un oracle \(f\) et un état initial, on peut détecter une périodicité par la méthode de la « tortue et du lièvre » (rho‑Floyd), présentée en français dans des notes d’agrégation.
Dans l’économie de notre livre, ce point illustre une propriété simple : la cyclicité n’est pas seulement un fait théorique, elle est détectable par des algorithmes légers.

## Transmission structurale : mémoire des collisions et sous‑structures transmissibles

Cette section n’est pas une « application ». Elle construit un prolongement formel minimal, compatible avec les chapitres 1–4 : si la non‑injectivité impose des classes, alors il devient possible (et parfois nécessaire) de transporter non pas des états, mais des **classes** et des **statistiques de collisions**.

### Registre de collisions comme objet transmissible

Fixons une projection \(q:X\to A\), permettant de remplacer les états par leurs classes \(a\in A\). Considérons une trajectoire \((x_t)\) et la trajectoire projetée \((a_t)\) avec \(a_t=q(x_t)\).

On définit un registre de cooccurrences (mémoire purement combinatoire) :
\[
M(a,b)\;=\;\#\{t:\ a_t=a,\ a_{t+1}=b\},
\]
ou, plus généralement, une version multi‑distance \(M_\Delta(a,b)=\#\{t:\ a_t=a,\ a_{t+\Delta}=b\}\).

Ce registre encode l’histoire **au niveau des classes**, non des identités fines : il est invariant à l’intérieur des fibres, donc compatible avec le principe même de compression.

### Génotype minimal comme quadruplet formel

On définit un objet transmissible \(\Gamma\) (sans interprétation biologique requise) :
\[
\Gamma=(S, M, \mathcal{I}, \mathcal{R})
\]
où :
- \(S\in A^{n}\) est une séquence de classes (trace compressée) ;
- \(M\) est un registre de cooccurrences comme ci‑dessus ;
- \(\mathcal{I}\) est un ensemble d’invariants dérivés (par exemple, attracteur(s) dans l’espace des classes, période, temps de convergence dans l’espace quotient) ;
- \(\mathcal{R}\) est un ensemble de règles admissibles de transformation (mutations de \(S\), mises à jour de \(M\), contraintes de compatibilité).

**Point de méthode.** Ce quadruplet n’est pas présenté comme « vrai dans la nature ». Il est présenté comme **construction minimale** pour transporter l’histoire quand l’identité fine n’est pas conservable.

### Gamète comme sous‑structure (fragment) et recombinaison

On définit un opérateur de fragmentation
\[
\mathrm{Frag}(\Gamma) = \gamma = (S_\gamma, M_\gamma, \mathcal{I}_\gamma),
\]
où \(S_\gamma\) est une sous‑séquence (ou un ensemble de segments), \(M_\gamma\) est la restriction correspondante (sous‑matrice), et \(\mathcal{I}_\gamma\) les invariants associés.

Une recombinaison minimale est une opération de somme/concaténation sous contraintes :
\[
\Gamma'=\mathrm{Recombine}(\gamma_1,\gamma_2;\Theta),
\]
où \(\Theta\) fixe les règles d’assemblage et de conflit.

### Condition formelle pour accumulation historique

Les objets précédents restent stériles si l’on autorise des boucles « généalogiques » illimitées : l’accumulation exige une flèche structurelle (chapitre 4). Dans la logique interne, une condition minimale est l’acyclicité du graphe d’événements (DAG) ou l’existence d’une ressource consommée monotone interdisant les retours exacts.

À ce point, Landauer fournit un ancrage de consensus : toute opération logiquement irréversible (non‑injective) est associée à une dissipation minimale, i.e. un coût physique de l’effacement des distinctions, ce qui rend plausible (au niveau des implémentations) la non‑gratuité des compressions destructives.

Diagramme minimal (état → fibre → classe → registre → fragments transmissibles) :

```mermaid
flowchart TD
  x["État x ∈ X"] -->|q| a["Classe a ∈ A"]
  a --> Fa["Fibre F_a = q^{-1}(a)"]
  a --> S["Trace S ∈ A^n"]
  S --> M["Cooccurrences M(a,b)"]
  subgraph Gamma["Registre Γ=(S,M,ℐ,ℛ)"]
    S
    M
  end
  Gamma -->|Frag| g1["Fragment γ₁"]
  Gamma -->|Frag| g2["Fragment γ₂"]
  g1 -->|Recombine| Gp["Nouveau registre Γ'"]
  g2 -->|Recombine| Gp
```

## Lectures conditionnelles (S1) dérivées strictement

Cette section se limite à des implications nécessaires des mathématiques ci‑dessus.

**Disponibilité de classes de formes.**
Dès qu’une description effective est bornée (alphabet de classes \(A\), code plus court, quotient par symétries), la non‑injectivité est inévitable (Proposition 2), donc des classes apparaissent nécessairement. Ces classes sont des « formes » au sens minimal : des ensembles d’états indiscernables sous la projection considérée.

**Renforcement de stabilité par projection.**
Une projection idempotente \(P=r\circ q\) crée un sous‑ensemble invariant \(\mathrm{Im}(P)\) atteint en temps borné (Proposition 4). Donc, indépendamment de toute physique, la compression peut produire des régimes stables au niveau des représentants, et plus généralement au niveau du quotient (attracteurs de second ordre).

**Condition de possibilité de canaux d’héritage.**
Un canal d’héritage au sens strictement formel exige (i) une représentation stable et transmissible (classe/registre), et (ii) une flèche empêchant le recyclage parfait des événements. Le premier point est fourni par la partition et par des invariants de quotient; le second relève des mécanismes d’irréversibilité (non‑injectivité, monotones) établis au chapitre 4.

## Analyse philosophique finale : ontologie de la compression, limites et interdits

**Nécessité ontologique minimale.**
Dans un univers défini par transformations admissibles, l’identité fine n’est pas une primitive garantie : elle est un luxe qui exige injectivité ou traçabilité complète. Or, toute contrainte de description ou de symétrie impose des quotients. Ainsi, « persister » à niveau donné signifie, le plus souvent, persister comme **classe** (fibre) plutôt que comme individu.

**Compression n’implique ni finalité ni sémantique.**
Le vocabulaire de « compression » peut suggérer un acte, un but, une optimisation. Ici, il ne désigne qu’une relation structurale : une factorisation \(X\to A\) entraînant des collisions. Les entropies et complexités ne qualifient pas un sens, mais une quantité de distinction possible (Shannon) ou une longueur minimale de description (Kolmogorov).

**Ce que le formalisme interdit à ce stade.**
- Il interdit d’inférer une « meilleure » compression : sans fonction objectif, « mieux » n’a pas de sens mathématique.
- Il interdit d’identifier une classe à une essence : une classe est relative à une projection \(q\). Changer \(q\) change l’ontologie des formes.
- Il interdit toute téléologie cachée : un quotient peut être imposé par une symétrie, par une limitation de code, ou par une observation; aucune de ces raisons n’est une intention.

**Limite structurale : pluralité des niveaux.**
La coexistence de plusieurs projections \(q_1,q_2,\dots\) implique une pluralité de mondes de classes. La philosophie rigoureuse qui suit de ce fait est une philosophie stratifiée : il n’existe pas « la » classe absolue sans spécification du niveau de description. Ce résultat n’est pas un relativisme : c’est la conséquence logique que l’équivalence est toujours définie par une relation (ou un observateur formel) et non par l’objet nu.

**Transition logique vers les chapitres suivants.**
Ce chapitre a montré que la non‑injectivité contraint l’univers à se décrire par classes, et que la dynamique peut se factoriser sur ces classes. Le chapitre suivant (classes d’équivalence et invariants) pourra donc : (i) stabiliser les constructions de quotient, (ii) étudier la persistance relative des invariants sous transformation, et (iii) préparer la grammaire compositionnelle des formes (chapitres 6–8).