algo/v1/chapitre5.md
Nicolas Cantu e93b10a719 Script de compilation, livre consolidé v0, structure v1 et correctifs
**Motivations:**
- Compilation du livre à partir des chapitres v0
- Création de la structure v1 avec chapitres et correctifs

**Evolutions:**
- v0/compile_livre.py : script de compilation
- v0/livre.md : livre consolidé généré
- Modifications des chapitres v0 (1-32), introduction, fermeture, plan_total_ouvrage, references, analyses critiques
- v1 : abstract, chapitres 1-16, correctifs chapitres 17-32, introduction, fermeture, plan_total_ouvrage, references

**Pages affectées:**
- v0/ : compile_livre.py (nouveau), livre.md (nouveau), chapitre1-32.md, introduction.md, fermeture.md, plan_total_ouvrage.md, references.md, analyse_critique_ouvrage*.md
- v1/ : abstract.md, chapitre1-16.md, correctifs/chapitre17-32.md, introduction.md, fermeture.md, plan_total_ouvrage.md, references.md (nouveaux)

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-02-14 00:44:58 +01:00

333 lines
22 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
livre: "Théorie des futurs accessibles"
version: v1
auteur: Nicolas Cantu
chapitre: 5
type: chapitre
---
# Chapitre 5 — Compression, noninjectivité et classes de formes
Ce chapitre formalise un mécanisme structural déjà latent dans les chapitres précédents : dès quun univers itératif opère sous **contraintes de description** (finitude globale, finitude locale, ou observabilité agrégée), les transformations effectives deviennent typiquement **non injectives**. Cette noninjectivité engendre des **collisions** (plusieurs antécédents pour un même résultat), lesquelles imposent à leur tour des **partitions** de lespace des configurations en **fibres** et en **classes déquivalence**.
La contribution mathématique principale est triple. Dabord, on établit des résultats élémentaires mais structurants : toute application \(q:X\to A\) avec \(|A|<|X|\) induit une partition par fibres; le degré de collision se borne par des arguments de comptage (principe des tiroirs) et, sous contraintes de codage, par des inégalités de type KraftMcMillan (existence de codes à longueurs données) et par les bornes de Shannon sur la compression sans perte. Ensuite, on formalise la compression comme **projection** (idempotente) ou comme **quotient** (factorisation), et on introduit des « attracteurs de second ordre » : attracteurs de la dynamique induite sur un espace **des classes** (système facteur). Enfin, on relie ces constructions à des quantités de consensus : entropie de Shannon (et entropie conditionnelle) pour mesurer la perte induite par une projection déterministe, et complexité algorithmique de Kolmogorov comme mesure intrinsèque de compressibilité (non calculable en général, mais conceptuellement fondatrice).
La partie « héritage morphologique » reste formelle : elle définit un **registre transmissible** comme mémoire de collisions (cooccurrences de classes) et montre quelles conditions minimales (flèche dévénements, disponibilité de projections stables) sont requises pour quune accumulation historique devienne possible, sans invoquer finalité ni sémantique.
## Fondations formelles : noninjectivité, collisions, partitions, fibres
Soit \(X\) un ensemble de configurations (fini ou non), et \(q:X\to A\) une application.
**Définition (injectivité / noninjectivité).**
\(q\) est injective si \(q(x)=q(y)\Rightarrow x=y\). Elle est non injective sil existe \(x\neq y\) tels que \(q(x)=q(y)\).
**Définition (collision).**
Une collision est un couple \((x,y)\) avec \(x\neq y\) et \(q(x)=q(y)\). Le modèle ne qualifie pas moralement la collision : cest un fait structurel.
**Définition (fibre).**
Pour \(a\in A\), la fibre (préimage) est
\[
F_a \;=\; q^{-1}(a)\;=\;\{x\in X:\ q(x)=a\}.
\]
**Proposition 1 (partition par fibres).**
Lensemble \(\{F_a\}_{a\in A}\) forme une partition de \(X\) restreinte à limage :
(i) \(X=\bigsqcup_{a\in q(X)} F_a\) ; (ii) \(F_a\cap F_b=\varnothing\) si \(a\neq b\).
*Preuve.*
Chaque \(x\in X\) appartient à \(F_{q(x)}\), donc \(X=\bigcup_{a\in q(X)}F_a\). Si \(x\in F_a\cap F_b\), alors \(q(x)=a=b\), contradiction si \(a\neq b\). □
### Collisions imposées par compression de cardinal
Supposons \(X\) fini, \(|X|=N\), et \(|q(X)|=M\).
**Proposition 2 (principe des tiroirs → collision).**
Si \(M<N\), alors \(q\) nest pas injective.
*Preuve.*
Une injection de \(N\) éléments dans \(M<N\) éléments est impossible (pigeonhole).
**Proposition 3 (borne sur la plus grande fibre).**
Il existe \(a\in q(X)\) tel que \(|F_a|\ge \lceil N/M\rceil\).
*Preuve.*
\(\sum_{a\in q(X)}|F_a|=N\). Si toutes les fibres avaient taille \(<N/M\), la somme serait \(<M\cdot N/M=N\), contradiction.
Ces trois faits suffisent pour une première thèse structurale : **toute réduction dun ensemble détats à un alphabet plus petit produit nécessairement des classes** (fibres), et donc une perte dindividuation fine.
### Cadre mesuré : partitions mesurables et conditionnement
Dans un cadre probabiliste (consensus en théorie de linformation), on suppose une variable aléatoire \(X\) à valeurs dans un ensemble fini \(X\), et \(Y=q(X)\). Shannon définit lentropie \(H(X)\), lentropie jointe \(H(X,Y)\) et lentropie conditionnelle via la relation de chaîne
\[
H(X,Y)=H(X)+H_X(Y),
\]
et montre que lincertitude de \(Y\) ne croît pas lorsquon connaît \(X\).
Dans le langage plus général des systèmes dynamiques mesurés, Kolmogorov et Sinai définissent lentropie conditionnelle sur des **partitions** (ou \(\sigma\)-algèbres) et construisent des quantités invariantes (entropie métrique) à partir de raffinement de partitions ; leur texte introduit explicitement « conditional entropy » et ses propriétés dans ce cadre.
## Opérateurs de compression et quotients dynamiques
### Compression comme projection idempotente
On formalise une « compression » sans sémantique comme une application de réduction \(q:X\to A\) (alphabet des classes) accompagnée dun choix de représentant \(r:A\to X\) tel que \(q\circ r=\mathrm{Id}_A\) (section).
On définit alors la **projection** \(P:X\to X\) :
\[
P \;=\; r\circ q.
\]
**Proposition 4 (idempotence).**
\(P\circ P = P\).
*Preuve.*
\(P(P(x))=r(q(r(q(x))))=r((q\circ r)(q(x)))=r(q(x))=P(x)\).
**Corollaire (convergence en un pas).**
Litération de \(P\) converge immédiatement : \(P^{(n)}=P\) pour tout \(n\ge 1\). Les points fixes de \(P\) sont exactement \(\mathrm{Im}(P)=r(A)\).
Cette forme didempotence est le prototype dun « attracteur de second ordre » au sens minimal : le système de compression possède son propre ensemble invariant (les représentants), atteint en un nombre borné ditérations.
### Compression comme quotient et systèmes facteurs
Une autre formalisation (plus canonique en dynamique) consiste à partir dune relation déquivalence \(\sim\) sur \(X\) et à considérer lespace quotient \(X/{\sim}\) avec la projection canonique \(\pi:X\to X/{\sim}\).
Soit maintenant une dynamique \(f:X\to X\). On dit que \(\sim\) est **compatible** avec \(f\) si
\[
x\sim y\ \Rightarrow\ f(x)\sim f(y),
\]
ce qui équivaut à la bonne définition dune dynamique induite \(\bar f:X/{\sim}\to X/{\sim}\) telle que
\[
\pi\circ f = \bar f \circ \pi.
\]
Ceci formalise lidée que « la dynamique ne dépend que de la classe ».
**Définition (attracteur de second ordre).**
Un attracteur \(A^\*\subseteq X/{\sim}\) de \(\bar f\) est appelé attracteur de second ordre relatif à \((X,f,\sim)\). Il décrit un régime stable non plus sur les états, mais sur leurs classes.
Ce concept généralise un fait déjà rencontré : dans un graphe fonctionnel fini, les cycles sont des invariants sur \(X\); un quotient peut fusionner plusieurs cycles ou plusieurs transitoires, créant une « topologie dattracteurs » plus grossière. La pertinence technique (et non interprétative) est que des régimes invariants deviennent calculables et transmissibles à une résolution plus faible.
Mortveit et Reidys, dans un cadre de dynamiques discrètes sur graphes (Sequential Dynamical Systems), mettent explicitement en avant létude de la réversibilité, des orbites périodiques, ainsi que des notions d’« equivalence, morphisms and reduction », i.e. précisément des mécanismes de quotient et de réduction de dynamique, considérés comme outils structurants de la théorie.
### Exemple directeur : opérateur de Kaprekar comme compression + dynamique
On considère des mots de longueur \(D\) en base \(B\) (ou des entiers à \(D\) chiffres en base \(B\) avec zéros initiaux). Lopération « trier les chiffres » est une compression : elle quotient par laction du groupe des permutations des positions (linformation « ordre des chiffres » est supprimée). Thakur formalise le processus \(\kappa\) en base \(B\) et \(D\) chiffres : \(\kappa(n)=\overrightarrow{n}-\overleftarrow{n}\), \(\overrightarrow{n}\) et \(\overleftarrow{n}\) sont les chiffres triés décroissant/croissant.
Young rappelle la propriété classique : en base 10 et \(D=4\), toute itération issue dun nombre dont les chiffres ne sont pas tous égaux atteint 6174 en au plus sept étapes, et 6174 est invariant sous lopérateur.
Dans notre lecture, le point structurel est le suivant : létape de tri est un **projecteur** vers un représentant canonique de lorbite sous permutation (compression), puis lopérateur complet itère sur un espace fini, donc admet des cycles (chapitres 23), mais sur un espace déjà compressé.
Diagramme abstrait (Kaprekar comme quotient puis dynamique) :
```mermaid
flowchart LR
X["États (D chiffres, base B)"] -->|q : quotient par permutations| A["Classes (multisets de chiffres)"]
A -->|r : représentant canonique (tri)| Xc["Représentants triés"]
Xc -->|d : transformation (différence)| X2["États suivants"]
X2 -->|itération| X
```
## Mesures de compression : entropies, complexités, distances
### Entropie de Shannon et perte induite par une projection déterministe
Soit une variable aléatoire \(X\) à valeurs dans un ensemble fini, et \(Y=q(X)\) une projection déterministe.
Shannon établit les relations fondamentales (entropie jointe, conditionnelle) et la relation de chaîne
\[
H(X,Y)=H(X)+H_X(Y),
\]
ainsi que des inégalités de sousadditivité et le fait que lincertitude ne croît pas lorsquon conditionne.
Comme \(Y\) est une fonction de \(X\), on a \(H(Y|X)=0\) et donc
\[
H(X) = H(Y) + H(X|Y).
\]
Interprétation strictement formelle :
- \(H(Y)\) mesure lincertitude au niveau des classes (partitions) ;
- \(H(X|Y)\) mesure lincertitude résiduelle à lintérieur dune fibre (information perdue par la projection).
**Proposition 5 (borne par la plus grande fibre).**
\[
H(X|Y)\ \le\ \log |F_{\max}|
\quad\text{}\quad
|F_{\max}|=\max_{a}|F_a|.
\]
*Preuve.*
Conditionnellement à \(Y=a\), la variable \(X\) prend ses valeurs dans \(F_a\), donc son entropie conditionnelle est \(\le \log|F_a|\); en moyennant, \(\le \log|F_{\max}|\).
### Compression sans perte et contraintes de codage
Un « codage sans perte » impose que le décodage soit injectif sur les messages possibles. Shannon démontre que lentropie borne par le bas le taux de compression atteignable en moyenne (noiseless coding theorem) et relie directement compression, redondance, et codages efficaces.
Sur le plan combinatoire, lexistence de codes instantanés/préfixes est contrainte par linégalité de Kraft, et lextension aux codes uniquement déchiffrables par McMillan. Un cours MIT OCW rappelle cette contrainte classique et sa construction par arbres \(D\)-aires.
Huffman fournit ensuite une procédure constructive doptimalité (minimum de redondance moyenne) pour ensembles finis de messages, explicitement dans la continuité de Shannon et en citant Kraft.
Ces résultats sont utilisés ici de façon non sémantique : ils montrent que vouloir raccourcir systématiquement les descriptions (compression) impose soit des collisions (noninjectivité du codage), soit des redondances explicites (longueurs suffisantes), soit une probabilité derreur.
### Entropie combinatoire et « entropie structurelle des classes »
Kolmogorov rappelle quavant toute probabilité, on peut définir une entropie combinatoire \(H(x)=\log_2 N\) lorsque \(x\) prend ses valeurs dans un ensemble fini de taille \(N\), et introduit aussi une entropie conditionnelle combinatoire via les ensembles possibles \(Y_a\) compatibles avec \(x=a\).
Dans notre cadre, si \(q:X\to A\) induit des classes, une mesure structurelle minimale, indépendante de la dynamique, est
\[
H_{\text{classes}}
\;=\;-\sum_{a\in A} p_a \log p_a,
\quad
p_a=\frac{|F_a|}{|X|}
\]
en supposant une distribution uniforme sur \(X\). Cest lentropie de Shannon de la variable « classe » quand on pick un état uniformément (un cas particulier du cadre mesuré).
### Complexité de Kolmogorov : compressibilité intrinsèque (consensus, non constructive)
Kolmogorov introduit un troisième point de vue : mesurer linformation dun objet par la longueur de la plus courte description algorithmique produisant cet objet (approche algorithmique), après avoir exposé les approches combinatoire et probabiliste.
On en retient ici une conséquence structurale (de consensus dans la théorie) : il existe des objets (chaînes) **incompressibles** au sens algorithmique, pour lesquels aucune description significativement plus courte nexiste, tandis que dautres objets sont compressibles parce quils possèdent des régularités exploitables. Dans ce livre, cela nest pas interprété comme « sens » ou « utilité », mais comme propriété intrinsèque de description.
## Calcul effectif en contexte discret : algorithmes et complexité
Ce chapitre requiert des outils effectifs : calculer classes, fibres, et parfois bassins, dans des univers finis.
### Calcul des fibres dune projection
Entrée : représentation explicite de \(X\) (liste des états) et de \(q\).
Sortie : dictionnaire \(a \mapsto F_a\).
Algorithme : un seul parcours, insertion dans une table de hachage.
- Temps : \(O(|X|)\) évaluations de \(q\) + coût de hachage (amorti).
- Mémoire : \(O(|X|)\) au pire si on stocke tous les éléments.
### Calcul des cycles et bassins dune fonction \(f:X\to X\)
Dans un cadre fini déterministe, le graphe est fonctionnel (degré sortant 1). Les cycles et bassins se calculent en temps linéaire \(O(N)\) via élimination des arbres (méthode par degrés entrants) ou via détection de cycles.
Pseudocode (élimination des noncycliques) :
```pseudo
Input: f[1..N] // successeur de chaque nœud
indeg[1..N] = 0
for v in 1..N: indeg[f[v]]++
queue = all v with indeg[v]==0
mark_noncycle[v]=false
while queue not empty:
v = pop(queue)
mark_noncycle[v]=true
u = f[v]
indeg[u]--
if indeg[u]==0: push(u)
cycles = all v with mark_noncycle[v]==false
// cycles contiennent les sommets sur cycles; les bassins se déduisent par parcours inverse
```
Cette structure « phase space » est précisément lobjet central des dynamiques discrètes finies (points fixes, orbites périodiques, réversibilité, réductions), comme le souligne la littérature SDS citée plus haut.
### Détection locale dun cycle sur une trajectoire : accès constant
Lorsquon na pas accès à tout \(X\) mais seulement à un oracle \(f\) et un état initial, on peut détecter une périodicité par la méthode de la « tortue et du lièvre » (rhoFloyd), présentée en français dans des notes dagrégation.
Dans léconomie de notre livre, ce point illustre une propriété simple : la cyclicité nest pas seulement un fait théorique, elle est détectable par des algorithmes légers.
## Transmission structurale : mémoire des collisions et sousstructures transmissibles
Cette section nest pas une « application ». Elle construit un prolongement formel minimal, compatible avec les chapitres 14 : si la noninjectivité impose des classes, alors il devient possible (et parfois nécessaire) de transporter non pas des états, mais des **classes** et des **statistiques de collisions**.
### Registre de collisions comme objet transmissible
Fixons une projection \(q:X\to A\), permettant de remplacer les états par leurs classes \(a\in A\). Considérons une trajectoire \((x_t)\) et la trajectoire projetée \((a_t)\) avec \(a_t=q(x_t)\).
On définit un registre de cooccurrences (mémoire purement combinatoire) :
\[
M(a,b)\;=\;\#\{t:\ a_t=a,\ a_{t+1}=b\},
\]
ou, plus généralement, une version multidistance \(M_\Delta(a,b)=\#\{t:\ a_t=a,\ a_{t+\Delta}=b\}\).
Ce registre encode lhistoire **au niveau des classes**, non des identités fines : il est invariant à lintérieur des fibres, donc compatible avec le principe même de compression.
### Génotype minimal comme quadruplet formel
On définit un objet transmissible \(\Gamma\) (sans interprétation biologique requise) :
\[
\Gamma=(S, M, \mathcal{I}, \mathcal{R})
\]
 :
- \(S\in A^{n}\) est une séquence de classes (trace compressée) ;
- \(M\) est un registre de cooccurrences comme cidessus ;
- \(\mathcal{I}\) est un ensemble dinvariants dérivés (par exemple, attracteur(s) dans lespace des classes, période, temps de convergence dans lespace quotient) ;
- \(\mathcal{R}\) est un ensemble de règles admissibles de transformation (mutations de \(S\), mises à jour de \(M\), contraintes de compatibilité).
**Point de méthode.** Ce quadruplet nest pas présenté comme « vrai dans la nature ». Il est présenté comme **construction minimale** pour transporter lhistoire quand lidentité fine nest pas conservable.
### Gamète comme sousstructure (fragment) et recombinaison
On définit un opérateur de fragmentation
\[
\mathrm{Frag}(\Gamma) = \gamma = (S_\gamma, M_\gamma, \mathcal{I}_\gamma),
\]
\(S_\gamma\) est une sousséquence (ou un ensemble de segments), \(M_\gamma\) est la restriction correspondante (sousmatrice), et \(\mathcal{I}_\gamma\) les invariants associés.
Une recombinaison minimale est une opération de somme/concaténation sous contraintes :
\[
\Gamma'=\mathrm{Recombine}(\gamma_1,\gamma_2;\Theta),
\]
\(\Theta\) fixe les règles dassemblage et de conflit.
### Condition formelle pour accumulation historique
Les objets précédents restent stériles si lon autorise des boucles « généalogiques » illimitées : laccumulation exige une flèche structurelle (chapitre 4). Dans la logique interne, une condition minimale est lacyclicité du graphe dévénements (DAG) ou lexistence dune ressource consommée monotone interdisant les retours exacts.
À ce point, Landauer fournit un ancrage de consensus : toute opération logiquement irréversible (noninjective) est associée à une dissipation minimale, i.e. un coût physique de leffacement des distinctions, ce qui rend plausible (au niveau des implémentations) la nongratuité des compressions destructives.
Diagramme minimal (état fibre classe registre fragments transmissibles) :
```mermaid
flowchart TD
x["État x ∈ X"] -->|q| a["Classe a ∈ A"]
a --> Fa["Fibre F_a = q^{-1}(a)"]
a --> S["Trace S ∈ A^n"]
S --> M["Cooccurrences M(a,b)"]
subgraph Gamma["Registre Γ=(S,M,,)"]
S
M
end
Gamma -->|Frag| g1["Fragment γ₁"]
Gamma -->|Frag| g2["Fragment γ₂"]
g1 -->|Recombine| Gp["Nouveau registre Γ'"]
g2 -->|Recombine| Gp
```
## Lectures conditionnelles (S1) dérivées strictement
Cette section se limite à des implications nécessaires des mathématiques cidessus.
**Disponibilité de classes de formes.**
Dès quune description effective est bornée (alphabet de classes \(A\), code plus court, quotient par symétries), la noninjectivité est inévitable (Proposition 2), donc des classes apparaissent nécessairement. Ces classes sont des « formes » au sens minimal : des ensembles détats indiscernables sous la projection considérée.
**Renforcement de stabilité par projection.**
Une projection idempotente \(P=r\circ q\) crée un sousensemble invariant \(\mathrm{Im}(P)\) atteint en temps borné (Proposition 4). Donc, indépendamment de toute physique, la compression peut produire des régimes stables au niveau des représentants, et plus généralement au niveau du quotient (attracteurs de second ordre).
**Condition de possibilité de canaux dhéritage.**
Un canal dhéritage au sens strictement formel exige (i) une représentation stable et transmissible (classe/registre), et (ii) une flèche empêchant le recyclage parfait des événements. Le premier point est fourni par la partition et par des invariants de quotient; le second relève des mécanismes dirréversibilité (noninjectivité, monotones) établis au chapitre 4.
## Analyse philosophique finale : ontologie de la compression, limites et interdits
**Nécessité ontologique minimale.**
Dans un univers défini par transformations admissibles, lidentité fine nest pas une primitive garantie : elle est un luxe qui exige injectivité ou traçabilité complète. Or, toute contrainte de description ou de symétrie impose des quotients. Ainsi, « persister » à niveau donné signifie, le plus souvent, persister comme **classe** (fibre) plutôt que comme individu.
**Compression nimplique ni finalité ni sémantique.**
Le vocabulaire de « compression » peut suggérer un acte, un but, une optimisation. Ici, il ne désigne quune relation structurale : une factorisation \(X\to A\) entraînant des collisions. Les entropies et complexités ne qualifient pas un sens, mais une quantité de distinction possible (Shannon) ou une longueur minimale de description (Kolmogorov).
**Ce que le formalisme interdit à ce stade.**
- Il interdit dinférer une « meilleure » compression : sans fonction objectif, « mieux » na pas de sens mathématique.
- Il interdit didentifier une classe à une essence : une classe est relative à une projection \(q\). Changer \(q\) change lontologie des formes.
- Il interdit toute téléologie cachée : un quotient peut être imposé par une symétrie, par une limitation de code, ou par une observation; aucune de ces raisons nest une intention.
**Limite structurale : pluralité des niveaux.**
La coexistence de plusieurs projections \(q_1,q_2,\dots\) implique une pluralité de mondes de classes. La philosophie rigoureuse qui suit de ce fait est une philosophie stratifiée : il nexiste pas « la » classe absolue sans spécification du niveau de description. Ce résultat nest pas un relativisme : cest la conséquence logique que léquivalence est toujours définie par une relation (ou un observateur formel) et non par lobjet nu.
**Transition logique vers les chapitres suivants.**
Ce chapitre a montré que la noninjectivité contraint lunivers à se décrire par classes, et que la dynamique peut se factoriser sur ces classes. Le chapitre suivant (classes déquivalence et invariants) pourra donc : (i) stabiliser les constructions de quotient, (ii) étudier la persistance relative des invariants sous transformation, et (iii) préparer la grammaire compositionnelle des formes (chapitres 68).