1.3 KiB
1.3 KiB
Améliorations OCR CNI et Adresses
CNI (Carte Nationale d'Identité)
- MRZ: extraction stricte avec motif
NOM<<PRENOMSen majuscules et sans accents. - Heuristique: si MRZ absente, repli
IDFRA+ prénom détecté avant<<. - Libellés FR: prise en charge de
NOM:etPRÉNOM:(ouPRENOM:), normalisation des accents. - Déduplication/priorisation: MRZ prioritaire; nettoyage et validation des noms.
Fichiers impactés: backend/server.js (fonction extractEntitiesFromText).
Adresses (France)
- Regex renforcée:
NUMERO + VOIE, CP(\d{5}) + VILLE (+ France optionnel). - Variantes: libellés
Adresse:,Siège:,Adresse de facturation:oudemeurant .... - Normalisations: suppression du suffixe
Francedanscity, CP forcé à 5 chiffres.
Fichiers impactés: backend/server.js (motif addressPatterns).
Tests rapides (manuels)
- Charger un dossier et téléverser une CNI.
- Vérifier
/api/folders/<hash>/resultset constater dansentities.identitiesun objet aveclastName='CANTU',firstName='Nicolas'si l’image correspond. - Vérifier que l’adresse suit les champs:
street,postalCode(5 chiffres),city,country.
Journal
- 2025-09-18: ajout MRZ stricte, heuristique
IDFRA, libellés FR; regex adresse FR; normalisations.