4NK_IA_front/docs/annuaire_noms.md

15 lines
764 B
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## Annuaire de noms (FR et autres)
- Emplacement: `backend/data/names/`
- Fichiers CSV/TSV/texte séparés par `,` `;` ou `\t`.
- Noms de fichiers:
- `firstnames_fr.csv`, `firstnames_en.csv`, `prenoms_fr.csv`, etc.
- `lastnames_fr.csv`, `surnames_en.csv`, `noms_fr.csv`, etc.
- Chargement: automatique au démarrage; normalisation sans accents; ensembles en mémoire.
- Usage: léger boost de confiance si prénom/nom détectés appartiennent à lannuaire.
- Extension multi-langues: ajouter des fichiers `firstnames_<lang>.csv` et `lastnames_<lang>.csv`.
Impact:
- Le score `globalConfidence` est augmenté de +5% pour prénom connu, +5% pour nom connu (max +10%).
- Améliore la décision de re-upload (moins de faux négatifs si noms valides).