**Motivations:** - Initial push of project to Gitea **Evolutions:** - Add v0 content (plan, chapters, analysis, references) **Pages affectées:** - v0/*.md, scripts, .gitignore
27 KiB
Chapitre 6 — Reproduction partielle, recombinaison et héritage morphologique
Résumé exécutif
Ce chapitre introduit une famille d’opérations formelles — fragmentation, recombinaison, épissage et réparation — qui permettent de définir, sans hypothèse sémantique ni agentive, une transmission partielle de structures discrètes à travers une succession d’événements. La construction s’appuie exclusivement sur des primitives non sémantiques déjà admises dans l’ouvrage (configurations, transformations, itération et ordre induit), et prolonge la non‑injectivité et les classes (chapitres précédents) par une notion de registre transmissible.
Le noyau mathématique est la définition d’un génotype abstrait \Gamma=(S,M,A,R) : (i) une séquence S sur un alphabet fini, (ii) une mémoire M de cooccurrences (registre de collisions passées au niveau des classes), (iii) un ensemble A d’invariants calculés, (iv) un ensemble R de règles admissibles (mutations, épissage, réparation). Un gamète \gamma est une sous‑structure obtenue par fragmentation de \Gamma; la reproduction se formalise comme la composition d’un opérateur de fragmentation avec un opérateur de recombinaison produisant un nouvel objet \Gamma'. On établit des propositions élémentaires : conditions suffisantes de transmission fidèle d’une sous‑structure (segments invariants), bornes sur la perte d’information induite par la recombinaison (en termes de cardinalités de préimages ou d’entropie conditionnelle), et conditions de stabilité de certains invariants A sous recombinaison (homomorphismes de monoïdes).
La flèche du temps généalogique est obtenue sans postuler un temps externe : elle résulte de (i) la structure d’ordre induite (chapitre 4) et (ii) la consommation de ressources non réutilisables associées aux événements reproductifs (gamètes‑jetons), rendant la généalogie un DAG (graphe orienté acyclique). La conclusion cosmogonique reste strictement déduite : un univers discret capable de (a) compression en classes, (b) fragmentation et recombinaison, et (c) orientation par consommation, possède nécessairement les conditions minimales d’accumulation historique de formes transmissibles, sans présupposer finalité. Du point de vue philosophique, le chapitre fonde une ontologie de l’héritage comme persistance de contraintes (classes et cooccurrences) et explicite ce que le formalisme interdit : toute lecture intentionnelle, tout « but » de reproduction, et toute identité forte des individus.
Fondations formelles et axiomes minimaux
On travaille dans un cadre discret, compatible avec les chapitres antérieurs : un alphabet fini \mathcal{L} (classes de formes au sens du quotient/partition) et des séquences finies sur \mathcal{L}. Les définitions ci‑dessous ne supposent ni biologie empirique ni sémantique : elles ne font qu’axiomatiser des opérations de découpe et de recomposition sur des objets discrets.
A0 (alphabet et séquences). \mathcal{L} est un ensemble fini. Pour n\in\mathbb{N}, \mathcal{L}^n est l’ensemble des mots de longueur n, et \mathcal{L}^\* l’ensemble des mots finis.
A1 (génotype abstrait). Un individu est muni d’un quadruplet
\Gamma \;=\; (S,M,A,R)
où :
S \in \mathcal{L}^\*est une séquence (trace) de classes.Mest une mémoire de collisions passées au niveau des classes, représentée minimalement comme un comptage de cooccurrences :
(Les variantes multi‑échellesM:\mathcal{L}\times \mathcal{L}\to \mathbb{N},\qquad M(a,b)=\#\{t:\ S_t=a,\ S_{t+1}=b\}.M_\Deltasont possibles, mais non nécessaires ici.)Aest un ensemble d’invariants calculés sur(S,M)(p. ex. statistiques, attracteurs dans un quotient dynamique, longueurs de cycles), dont le statut est purement mathématique.Rest un ensemble de règles admissibles (opérateurs) sur(S,M,A): mutations permises, épissage, réparation, normalisation.
A2 (gamète). Un gamète est une sous‑structure
\gamma \;=\; (S_\gamma, M_\gamma, A_\gamma)
où S_\gamma est un sous‑mot (ou un multi‑segment) extrait de S, M_\gamma est une restriction correspondante de la mémoire M, et A_\gamma regroupe les invariants calculables localement à partir de (S_\gamma,M_\gamma).
A3 (reproduction partielle). Un événement reproductif est une application
\mathrm{Reproduce}:\gamma_1\times \gamma_2 \longrightarrow \Gamma'
où \Gamma'=(S',M',A',R') est construit à partir de \gamma_1,\gamma_2 et de règles R (éventuellement avec hasard).
A4 (épissage). Un épissage est une application de sélection‑concaténation
\pi:\mathcal{L}^\*\to (\mathcal{L}^\*)^k
\quad \text{puis}\quad
\mathrm{Concat}:(\mathcal{L}^\*)^k\to \mathcal{L}^\*,
où \pi choisit des segments selon des marqueurs (positions, motifs), et \mathrm{Concat} les recolle suivant un ordre imposé.
A5 (réparation). Une réparation est une application
\rho:\mathcal{L}^\*\to \mathcal{L}^\*
(ou sur \Gamma) qui projette un objet potentiellement non admissible dans une sous‑classe admissible définie par des contraintes R. Elle n’a pas à être injective.
Ces axiomes prolongent une idée centrale des automates auto‑reproducteurs : la reproduction formelle exige une séparation entre (i) une description transmissible et (ii) des opérations de construction/assemblage agissant sur cette description, séparation explicitée historiquement dans les travaux de von Neumann sur les automates auto‑reproducteurs. citeturn0search0turn0search4
Opérateurs de fragmentation, recombinaison et réparation
On explicite maintenant trois opérateurs fondamentaux, puis on étudie leurs propriétés algébriques élémentaires.
Fragmentation
Un opérateur de fragmentation est une application
\mathrm{Frag}:\Gamma\to \mathcal{P}(\Gamma)\ \text{ou}\ \Gamma\to \gamma,
selon qu’on produit un ensemble de fragments ou un fragment unique.
Version segment unique. Pour un couple (i,j) avec 1\le i\le j\le |S|,
S_\gamma = S[i:j].
La mémoire restreinte peut être définie par le comptage interne aux transitions contenues dans [i:j] :
M_\gamma(a,b)=\#\{t\in[i,j-1]: S_t=a,\ S_{t+1}=b\}.
Version multi‑segments (épissage). On choisit une famille d’intervalles disjoints \{[i_p,j_p]\}_{p=1}^k. On pose
S_\gamma = S[i_1:j_1]\ \Vert\ S[i_2:j_2]\ \Vert\ \cdots\ \Vert\ S[i_k:j_k],
où \Vert est la concaténation, et M_\gamma est la somme des comptages internes à chaque segment, éventuellement augmentée de transitions « de jonction » si on les considère comme admissibles.
Recombinaison
On formalise la recombinaison comme un opérateur
\mathrm{Recombine}:\gamma_1\times \gamma_2 \to \Gamma'.
Le cas minimal est la recombinaison par concaténation :
S' = S_{\gamma_1}\ \Vert\ S_{\gamma_2}.
Une recombinaison plus proche des modèles classiques de « crossover » est définie par un masque m\in\{1,2\}^n indiquant, pour chaque position, le parent source (crossover uniforme), ou par une coupure k (crossover à un point). Ces opérateurs sont standards en modélisation algorithmique de recombinaison ; ils capturent mathématiquement le fait discuté en génétique évolutive que la reproduction sexuée implique réassortiment et recombinaison de segments héréditaires. citeturn2search31turn0search9turn0search2
Pour la mémoire M', trois constructions minimales (toutes admissibles) existent :
- Héritage additif restreint.
(somme point‑par‑point), puis éventuelle mise à jour des transitions sur les jonctions.M' = M_{\gamma_1} + M_{\gamma_2} - Héritage par projection.
M'est recomputée à partir deS'par définition :M'(a,b)=\#\{t:\ S'_t=a,\ S'_{t+1}=b\}. - Héritage mixte.
M'combine (1) et (2), en conservant certains compteurs « historiques » tout en recalculant les transitions nouvellement créées.
Réparation
La réparation est un opérateur de projection (souvent non injectif) visant à satisfaire des contraintes R (par exemple interdictions de motifs, bornes sur longueur, compatibilité de marqueurs). La réparation est l’analogue formel d’une étape de « purification/normalisation » : elle peut être idempotente si elle est une projection sur un sous‑ensemble admissible.
Proposition 1 (idempotence de la réparation sous projection).
Si \rho vérifie \rho(x)=x pour tout x admissible (fixé) et \rho(x) admissible pour tout x, alors \rho\circ \rho = \rho.
Preuve. \rho(x) est admissible, donc \rho(\rho(x))=\rho(x). □
Cette structure est la même que celle d’un projecteur de compression (chapitre 5), mais appliquée ici au niveau des règles R.
Propriétés algébriques élémentaires
On note \oplus une recombinaison sur les séquences (p. ex. concaténation).
- Associativité (concaténation).
(u\Vert v)\Vert w = u\Vert (v\Vert w).
Donc l’opérateur « recombiner par concaténation » est associatif surS. - Non‑commutativité.
u\Vert v \neq v\Vert uen général : la recombinaison ordonnée n’est pas commutative. - Commutativité éventuelle. Si l’on définit la recombinaison comme multiensemble de segments (ordre oublié), alors elle devient commutative mais perd de l’information (projection supplémentaire).
Sur la recombinaison à masque, l’associativité échoue en général : deux recombinaisons successives ne se réduisent pas à une recombinaison unique sans enrichir l’opérateur (composition de masques). Cette non‑associativité est un fait structural : elle reflète l’existence de paramètres internes (points de coupure/masques) qui font partie du processus mais peuvent ne pas être conservés.
Transmission fidèle, métriques d’héritabilité et bornes
Condition suffisante de transmission fidèle d’une sous‑structure
On formalise une « sous‑structure » comme un sous‑objet \sigma (typiquement un segment) et on demande une condition de conservation.
Définition (inclusion de segment).
Un segment \sigma\in\mathcal{L}^\* est transmis fidèlement de S à S' si \sigma apparaît comme sous‑mot contigu de S' et correspond à un segment extrait sans modification.
Proposition 2 (transmission fidèle sous épissage conservatif).
Supposons :
\mathrm{Frag}extrait un segment\sigma=S[i:j]sans altération,\mathrm{Recombine}insère\sigmacomme bloc contigu dansS',\rhon’altère pas\sigma(i.e.\rhoagit en dehors de ses positions).
Alors\sigmaest transmis fidèlement.
Preuve. Par (1) \sigma est présent dans S_{\gamma}. Par (2) \sigma apparaît bloc contigu dans S'. Par (3) la réparation ne le modifie pas. □
Cette proposition est volontairement « mécanique » : elle isole les conditions strictes de conservation d’un fragment.
Métriques d’héritabilité
On introduit deux métriques compatibles avec les objets (S,M), sans emprunter au vocabulaire biologique (où « héritabilité » a un sens statistique spécifique, historiquement ancré dans la génétique quantitative de Fisher). citeturn1search4turn0search2
Métrique sur séquences.
On prend une distance d’édition (Levenshtein) d_S(S,S') ou une distance de Hamming si les longueurs sont fixées.
Métrique sur mémoires.
On définit une distance L^1 sur matrices de cooccurrence :
d_M(M,M')=\sum_{a,b\in\mathcal{L}} |M(a,b)-M'(a,b)|.
Définition (indice d’héritabilité abstrait).
Pour des poids \lambda\ge 0 et une normalisation Z>0 :
h(\Gamma,\Gamma') \;=\; 1 - \frac{d_M(M,M') + \lambda\, d_S(S,S')}{Z}.
On choisit Z comme borne supérieure théorique (ou empirique) pour garantir h\in[0,1].
Bornes minimales sur la perte d’information en recombinaison
Ici, « information » est prise au sens formel (Shannon ou combinatoire), sans sémantique. Lorsque la recombinaison est un calcul déterministe ou stochastique, elle induit une application (ou noyau) (\gamma_1,\gamma_2)\mapsto \Gamma', généralement non injective.
Approche combinatoire (préimages).
Pour une recombinaison déterministe g, définissons la multiplicité :
\mu(\Gamma') = \#\{(\gamma_1,\gamma_2): g(\gamma_1,\gamma_2)=\Gamma'\}.
Alors \log \mu(\Gamma') est une mesure de « perte d’identifiabilité » : plus \mu est grand, moins on peut reconstruire l’origine à partir du résultat.
Proposition 3 (borne inférieure triviale).
Si g n’est pas injective, il existe \Gamma' tel que \mu(\Gamma')\ge 2, donc \log\mu(\Gamma')\ge 1 bit (en base 2).
Preuve. Non‑injectivité \Rightarrow existence de deux antécédents distincts menant au même résultat. □
Approche Shannon (entropie conditionnelle).
Soient des variables aléatoires (\Gamma_1,\Gamma_2) (parents) et \Gamma' (descendant) liées par un mécanisme de recombinaison. Shannon a montré que toute fonction déterministe Y=q(X) ne peut pas augmenter l’information au sens entropique : l’entropie ne croît pas sous application déterministe et les décompositions par entropie conditionnelle quantifient la perte. citeturn2search1turn2search5
En particulier, si \Gamma' est une fonction (déterministe) de (\Gamma_1,\Gamma_2), alors
H(\Gamma') \le H(\Gamma_1,\Gamma_2),
\qquad
H(\Gamma_1,\Gamma_2\,|\,\Gamma') = H(\Gamma_1,\Gamma_2)-I(\Gamma_1,\Gamma_2;\Gamma').
La quantité H(\Gamma_1,\Gamma_2\,|\,\Gamma') mesure l’ambiguïté résiduelle (origine non reconstructible).
Lorsque la recombinaison implique un paramètre interne K (point de coupure, masque), le mécanisme se formalise comme \Gamma'=g(\Gamma_1,\Gamma_2,K). Ignorer K revient à projeter (compression supplémentaire), augmentant en général l’ambiguïté sur les origines.
Stabilité d’invariants A sous recombinaison
On formalise une classe d’invariants « composables ».
Définition (invariant homomorphe de concaténation).
Soit (\mathcal{M},\oplus) un monoïde commutatif. Une application I:\mathcal{L}^\*\to \mathcal{M} est un homomorphisme si
I(u\Vert v)=I(u)\oplus I(v).
Exemples : vecteur de comptages de lettres (addition), comptage de digrammes internes (avec correction de jonction).
Proposition 4 (stabilité composable).
Si I est un homomorphisme et si S'=S_{\gamma_1}\Vert S_{\gamma_2}, alors I(S')=I(S_{\gamma_1})\oplus I(S_{\gamma_2}). Donc I est stable sous recombinaison par concaténation (au sens « se compose sans perte »).
Preuve. Par définition d’homomorphisme. □
Cette proposition donne une condition claire sur le type d’invariants qu’on a le droit d’attendre « stables » sous recombinaison : ceux qui dépendent additivement des fragments (ou qui se corrigent localement aux jonctions).
Modèles discrets, algorithmes et complexité
Aucune hypothèse « adaptative » n’est requise. On décrit uniquement des mécanismes de sélection de segments, d’assemblage et de réparation.
Modèles de sélection de fragments et épissage
On fixe une longueur |S|=n. Trois familles standard (abstraites) :
- épissage à marqueurs : sélectionner des segments entre marqueurs (positions
i,jsatisfaisant une contrainte). - épissage aléatoire : choisir
kintervalles disjoints au hasard (distribution sur tuples d’intervalles). - épissage pondéré : choisir des segments avec probabilité proportionnelle à un score local (fonction
wsur positions), sans interprétation.
Recombinaison stochastique
Deux modèles classiques :
- crossover à un point : choisir
k\in\{1,\dots,n-1\}, produireS' = S_1[1:k]\Vert S_2[k+1:n]. - crossover uniforme : choisir un masque
m\in\{1,2\}^net définirS'_t = S_{m_t,t}.
Ces schémas abstraits reflètent le fait empirique qu’en reproduction sexuée, la recombinaison réassortit des segments génétiques, thème central chez Maynard Smith. citeturn0search9turn2search31
Sur le plan théorique, la littérature de génétique des populations discute leur effet sur les associations entre loci (déséquilibre de liaison) et la vitesse de production de combinaisons, avec des résultats classiques suivant les hypothèses (population finie vs infinie), notamment chez Felsenstein. citeturn1search3turn1search7
Réparation et compatibilité
La réparation \rho peut être :
- locale (modifier un motif interdit en un motif autorisé),
- globale (réécrire pour satisfaire une grammaire),
- projective (projection sur un ensemble admissible minimal).
La logique rejoint une idée générale en théorie des automates et de la computation : rendre un processus « réversible » exige de conserver l’historique; effacer l’historique est une opération logiquement irréversible (non‑injective), point discuté par Landauer et Bennett. citeturn2search0turn2search6
Ici, on n’en tire pas une thèse physique additionnelle : on retient le fait structural que réparation/projection est typiquement non injective.
Algorithmes et complexité
On donne des coûts asymptotiques usuels (où n=|S|, |\mathcal{L}|=B) :
Extraction d’un segment S[i:j] : O(j-i+1).
Multi‑segments : O(\sum_p (j_p-i_p+1)).
Recombinaison à un point : O(n).
Recombinaison uniforme : O(n) (parcours + masque).
Recalcul de M depuis (S) : O(n).
Distance (d_M) (matrices denses) : O(B^2); (sparse) : O(\#\text{transitions distinctes}).
Distance d’édition d_S : O(n^2) en général (DP), O(n) en Hamming si longueurs fixes.
Pseudocode minimal (crossover à un point + mise à jour de M) :
Input: S1, S2 (length n), cut k
S' = S1[1:k] concat S2[k+1:n]
Initialize M' = 0
for t in 1..n-1:
M'[ S'[t], S'[t+1] ] += 1
Output: (S', M')
Gamètes non réutilisables, ressource consommée et flèche généalogique
Le chapitre 4 a établi que la flèche du temps peut être reconstruite comme non‑extensibilité en groupe (semi‑groupe effectif), notamment par non‑injectivité ou monotone. On applique ici cette idée à l’ordre généalogique.
Jetons de gamètes comme ressource non réutilisable
On associe à chaque individu i un multiensemble G_i de gamètes‑jetons (ressource finie). Un événement reproductif prend deux jetons \gamma^{(1)}\in G_p et \gamma^{(2)}\in G_q, les consomme (irréversiblement), et produit un nouvel individu c avec génotype \Gamma_c.
Formellement, l’événement est une transition :
(p,q,\gamma^{(1)},\gamma^{(2)})\;\longmapsto\; c
avec mise à jour G_p\leftarrow G_p\setminus\{\gamma^{(1)}\}, G_q\leftarrow G_q\setminus\{\gamma^{(2)}\}.
Proposition 5 (monotone de consommation).
La quantité totale T=\sum_i |G_i| est un monotone décroissant strict à chaque reproduction (si aucun jeton n’est créé ex nihilo au même niveau).
Preuve. Chaque événement retire au moins 2 jetons; donc T diminue strictement. □
Comme au chapitre 4, l’existence d’un monotone strict interdit les cycles au niveau des événements.
Lignée comme DAG
On définit un graphe orienté \mathcal{T} dont les nœuds sont les individus (génotypes \Gamma) et où l’on met des arêtes p\to c et q\to c à chaque reproduction.
Proposition 6 (acyclicité).
Sous la règle « gamètes non réutilisables » et une création de jetons strictement orientée (aucune ré‑utilisation), le graphe des événements reproductifs est acyclique.
Preuve. Une boucle impliquerait qu’un individu soit ancêtre de lui‑même, donc qu’une chaîne d’événements consomme des jetons tout en revenant à une configuration antérieure. Mais le monotone T diminue strictement à chaque événement (Proposition 5), donc une boucle est impossible. □
Diagramme :
flowchart TD
P1["Parent p : Γ_p"] -->|γ_p = Frag(Γ_p)| G1["Gamète γ_p"]
P2["Parent q : Γ_q"] -->|γ_q = Frag(Γ_q)| G2["Gamète γ_q"]
G1 -->|Recombine| C["Enfant c : Γ_c"]
G2 -->|Recombine| C
C -->|Frag| Gc["Gamètes de c (nouveaux jetons)"]
subgraph Lineage["Lignée (DAG)"]
P1 --> C
P2 --> C
end
Cette structure donne une flèche généalogique sans agentivité : ce n’est pas « quelqu’un » qui choisit, c’est la présence d’une règle de consommation et de transformation admissible qui impose l’orientation.
Conditions minimales d’héritage des collisions passées
Le chapitre 5 a introduit le rôle des collisions (non‑injectivité) et des classes. Ici, la mémoire M capture l’historique au niveau des classes.
Deux conditions minimales ressortent :
- Transmissibilité partielle de
M. Il faut que la fragmentation transmette des sous‑matrices/cooccurrences (ou des segments permettant de les recalculer). - Accumulation sans boucles. La lignée doit être un DAG (Proposition 6) ou, plus généralement, un ordre partiel d’événements (chapitre 4), afin que la mémoire agrégée ne soit pas recyclable à l’identique.
On peut formaliser une mémoire de lignée par agrégation pondérée :
M_{\mathcal{T}}=\sum_{i\in \mathcal{T}} \omega_i M_i,
où \omega_i pondère la contribution (descendance, profondeur, etc.). Cette somme n’introduit pas de sémantique : elle est une opération sur compteurs.
Implications cosmogoniques déduites strictement
On ne déduit ici que ce qui suit nécessairement des sections mathématiques.
-
Diversification sans finalité.
Dès qu’il existe (i) une partition en classes (chapitre 5), (ii) une fragmentation non triviale, et (iii) une recombinaison, l’espace des objets accessibles par itération des événements s’élargit combinatoirement : le nombre de séquences composées de fragments croît au moins multiplicativement avec le nombre de fragments disponibles. Cette diversification est une conséquence de la combinatoire des concaténations et masques, pas d’un objectif. -
Accumulation historique.
L’existence d’un monotone de consommation (gamètes‑jetons) impose une orientation des événements, donc rend possible l’accumulation d’un registreM_{\mathcal{T}}qui ne peut pas être « déroulé » en sens inverse sans réintroduire des objets consommés. Ceci prolonge directement l’idée que la non‑injectivité et la perte d’antécédents rendent le passé non reconstructible à partir du présent (chapitre 4), idée également cohérente avec la notion d’irréversibilité logique discutée par Landauer et Bennett (non‑inversibilité à valeur unique). citeturn2search0turn2search6 -
Condition de possibilité de mécanismes auto‑constructifs.
Von Neumann a montré qu’un cadre formel (automates cellulaires) peut contenir des dispositifs de construction universelle et d’auto‑reproduction, en s’appuyant sur des descriptions transmissibles et des opérations de construction. citeturn0search0turn0search4
Le présent chapitre n’affirme pas que de tels dispositifs apparaissent nécessairement, mais établit que nos opérateurs (fragmentation/recombinaison/réparation) constituent une grammaire minimale compatible avec ce type de phénomènes.
Analyse philosophique finale : ontologie de l’héritage, limites et interdits
Ontologie minimale.
L’héritage n’est pas ici l’héritage d’identités, mais l’héritage de structures compressées : segments S_\gamma et cooccurrences M_\gamma. L’individu n’est pas une substance ; c’est un nœud dans un graphe d’événements portant un quadruplet transmissible. Cette lecture découle du fait que la non‑injectivité (collisions) rend l’identité fine non conservative, donc inapte à fonder une généalogie robuste au niveau des classes.
Ce que le formalisme interdit.
Il interdit toute attribution de but (la reproduction ne « vise » rien), toute lecture intentionnelle (il n’y a pas de « choix » intrinsèque), et toute assimilation de ces objets à des contenus sémantiques. Le mot « génotype » est une étiquette de convenance pour \Gamma, non une importation biologique : l’objet est défini par ses composantes (S,M,A,R), pas par un référent.
Limites.
Deux limites sont structurelles :
- La stabilité sous recombinaison n’est pas universelle : seuls certains invariants (homomorphes, locaux, ou conçus pour être composables) résistent à la recombinaison (Proposition 4).
- Les métriques
d_S,d_Msont des choix : elles définissent une géométrie sur l’espace des génotypes, et différentes géométries conduisent à des notions différentes de proximité héréditaire. Il ne peut donc pas y avoir « une » héritabilité métrique sans convention explicite.
Pont discipliné vers la génétique des populations (sans réduction).
La littérature classique en génétique évolutive met au centre le rôle de la recombinaison et discute ses avantages selon les hypothèses (modèles finis/infinis, déséquilibre de liaison, interférences entre loci). Maynard Smith a structuré le problème et Felsenstein a fourni des analyses influentes sur l’avantage de recombinaison dans des cadres où la dérive crée des associations entre loci. citeturn0search9turn1search3turn1search7
Nous n’en tirons aucune finalité : nous retenons uniquement que ces cadres établissent la pertinence mathématique d’opérations de recombinaison (mélange de segments) et d’effets de non‑injectivité (multiples origines possibles).
Tableaux comparatifs
| Objet / opération | Définition minimale | Propriété clé | Injectif ? | Coût calcul (typique) |
|---|---|---|---|---|
Fragmentation \mathrm{Frag} |
extraction de segments | réduction / sous‑structure | non (perte) | O(n) |
Épissage \pi |
sélection + concaténation | composition de fragments | non en général | O(n) |
| Recombinaison (concat) | S'=S_1\Vert S_2 |
associative, non commutative | non (origines ambiguës) | O(n) |
| Recombinaison (masque) | mélange positionnel | paramètre interne | non | O(n) |
Réparation \rho |
projection admissible | idempotence si projecteur | non | dépend contraintes |
Mémoire M |
cooccurrences | héritage de collisions | — | recalcul O(n) |
| Métrique | Définition | Interprétation formelle | Complexité |
|---|---|---|---|
d_S |
distance d’édition | coût minimal de transformation de chaînes | O(n^2) |
d_M |
(\sum | M-M' | ) |
h |
normalisation de d_S,d_M |
indice de ressemblance transmissible | coût des distances |