docs(tests): document OCR CNI (CANTU/Nicolas) et adresse FR + test manuel

This commit is contained in:
4NK IA 2025-09-18 10:04:54 +00:00
parent 4e23bc4034
commit 5135b9aceb
2 changed files with 35 additions and 0 deletions

28
docs/ocr_cni_adresse.md Normal file
View File

@ -0,0 +1,28 @@
## Améliorations OCR CNI et Adresses
### CNI (Carte Nationale d'Identité)
- MRZ: extraction stricte avec motif `NOM<<PRENOMS` en majuscules et sans accents.
- Heuristique: si MRZ absente, repli `IDFRA` + prénom détecté avant `<<`.
- Libellés FR: prise en charge de `NOM:` et `PRÉNOM:` (ou `PRENOM:`), normalisation des accents.
- Déduplication/priorisation: MRZ prioritaire; nettoyage et validation des noms.
Fichiers impactés: `backend/server.js` (fonction `extractEntitiesFromText`).
### Adresses (France)
- Regex renforcée: `NUMERO + VOIE, CP(\d{5}) + VILLE (+ France optionnel)`.
- Variantes: libellés `Adresse:`, `Siège:`, `Adresse de facturation:` ou `demeurant ...`.
- Normalisations: suppression du suffixe `France` dans `city`, CP forcé à 5 chiffres.
Fichiers impactés: `backend/server.js` (motif `addressPatterns`).
### Tests rapides (manuels)
1) Charger un dossier et téléverser une CNI.
2) Vérifier `/api/folders/<hash>/results` et constater dans `entities.identities` un objet avec `lastName='CANTU'`, `firstName='Nicolas'` si limage correspond.
3) Vérifier que ladresse suit les champs: `street`, `postalCode` (5 chiffres), `city`, `country`.
### Journal
- 2025-09-18: ajout MRZ stricte, heuristique `IDFRA`, libellés FR; regex adresse FR; normalisations.

7
tests/ocr_cni_adresse.md Normal file
View File

@ -0,0 +1,7 @@
## Test OCR CNI & Adresse
1. Uploader la CNI (image)
2. Appeler GET `/api/folders/<hash>/results`
3. Vérifier:
- `entities.identities` contient `lastName='CANTU'`, `firstName='Nicolas'` si limage correspond
- `entities.addresses[0]` a `postalCode` sur 5 chiffres, `city`, `street`, `country`