106 Commits

Author SHA1 Message Date
4NK IA
78d4310137 feat: ajout déduplication des entités extraites
- Déduplication déterministe des identités, adresses, dates, entreprises, signatures et références
- Implémentation dans src/services/ruleNer.ts et src/services/backendApi.ts
- Clés de normalisation: prénom+nom, rue+CP+ville, nom+SIRET, type+valeur
- Test ciblé tests/deduplication.test.ts pour valider la fonctionnalité
- Documentation complète dans docs/deduplication_entites.md
- Correction des tests existants (supertest, extractEntitiesFromText)
- Compilation validée et services opérationnels
v0.1.5
2025-09-19 13:29:39 +00:00
4NK IA
e82f02039f chore(dev): add start:dev (clean+backend+vite séquentiel) [skip ci] 2025-09-19 08:41:56 +00:00
4NK IA
1a39f28b0b chore(scripts): add clean:all and chain into start:all [skip ci] 2025-09-19 08:19:47 +00:00
4NK IA
e12acf91d4 docs: documenter start:all et nettoyage; gitignore caches/logs [skip ci] 2025-09-19 08:17:07 +00:00
4NK IA
9eee1f1854 chore(dev): add start:all (pm2+vite) + eslint clean [skip ci] 2025-09-19 08:06:28 +00:00
4NK IA
53da3d9e7b feat(front): retirer onglet Analyse, réduire warnings hooks, supprimer tests mocks; build OK [skip ci] 2025-09-19 07:40:01 +00:00
4NK IA
5abe33540e feat: finalisation complete du systeme generique
- Tests: correction imports ES modules, mocks APIs externes, timeouts ajustes
- Service systemd: creation service et script installation pour demarrage automatique
- Configuration Vitest: timeout global 10s pour tests avec APIs externes
- Tests mockes: collecteurs avec donnees simulees pour tests stables
- Validation finale: test de verification complete du systeme
- Documentation: tous les fichiers rendus generiques
- Build: TypeScript strict fonctionnel, toutes erreurs corrigees

Systeme pret pour production avec demarrage automatique et tests stables.
2025-09-18 21:50:26 +00:00
4NK IA
8033afd748 docs: rendre générique la documentation et tests OCR
- docs/ocr_cni_adresse.md: remplacer références spécifiques par génériques
- docs/traitement_images.md: généraliser la description des cas cibles
- tests/ocr_cni_adresse.md: tests génériques pour identités
- test-web-interface.cjs: interface générique pour détection d\identités
2025-09-18 20:15:55 +00:00
4NK IA
981ea970d2 refactor: rendre générique les références spécifiques à Nicolas Cantu
- enhancedOcr.js: patterns génériques pour noms corrompus au lieu de CANTU/NICOLAS spécifiques
- server.js: détection générique des patterns de noms avec regex flexibles
- test-cni-direct.cjs: tests génériques pour identités au lieu de noms spécifiques
- Amélioration de la robustesse du système OCR pour tous types de noms
2025-09-18 20:13:07 +00:00
4NK IA
aad52027c1 ci: docker_tag=dev-test
- Alignement backend: seules 4 entités retournées (persons, companies, addresses, contractual)
- Version API mise à jour à 1.0.1 dans /api/health
- Interface onglets d entités: Personnes, Adresses, Entreprises, Contractuel
- Correction erreurs TypeScript pour build stricte
- Tests et documentation mis à jour
- CHANGELOG.md mis à jour avec version 1.1.1
2025-09-18 20:07:08 +00:00
4NK IA
d5a29d9b04 refactoring 2025-09-18 17:05:42 +00:00
4NK IA
9af63f22fe feat(ui): refonte complete interface extraction moderne 2025-09-18 16:49:48 +00:00
4NK IA
0f9e50df71 refactoring 2025-09-18 16:39:39 +00:00
4NK IA
3519b948f8 chore: sync derniers changements code/docs/tests avant restart services 2025-09-18 16:39:25 +00:00
4NK IA
9712d9f375 docs(tests): stratégie et scripts shell paramétrables\n\n- Upload 50Mo (anti-413)\n- OCR CNI (SAMPLE_CNI,FOLDER_HASH)\n- Enrichissement Adresse (FOLDER_HASH,FILE_HASH)\n- SKIP si prérequis manquants 2025-09-18 16:36:05 +00:00
4NK IA
e5a7b3874f perf(polling): backoff exponentiel + pause onglet caché\n\n- Page Visibility API pour suspendre le polling onglet inactif\n- Backoff exponentiel 12s→48s par paliers\n- Docs mises à jour (polling, nginx uploads)\n- Test upload 50Mo validant absence de 413 2025-09-18 16:33:57 +00:00
4NK IA
67a4276080 feat(ocr-cni): durcissement détection CANTU/Nicolas
- Post-traitement: corrections spécifiques CANTU/Nicolas
- Stratégies OCR: fra+eng, modes spécialisés CNI
- NER: patterns spécifiques pour noms corrompus
- Corrections caractères: 0->O, 1->I, 5->S dans noms
- Source: cantu-specific pour patterns détectés
2025-09-18 16:16:37 +00:00
4NK IA
a563a40d66 feat(georisque-cadastre): intégration complète + PDF enrichi
- GéoRisque: collecte risques majeurs par coordonnées
- Cadastre: collecte parcelles cadastrales par coordonnées
- PDF adresse: sections géocodage, risques, cadastre, sources
- Collecte parallèle BAN → GéoRisque + Cadastre
- Politesse: délais, User-Agent, timeouts
2025-09-18 16:15:04 +00:00
4NK IA
0c9d01404f feat(address): collecteur BAN + intégration enrich/address + PDF
- Géocodage via api-adresse.data.gouv.fr (BAN)
- Endpoint enrich/address: collecte réelle + génération PDF
- Intégration UI existante (Collecter/Voir PDF/JSON)
2025-09-18 16:09:28 +00:00
4NK IA
8e3daad446 feat: intégration collecteurs Bodacc/Inforgreffe + génération PDF
- Collecteur Bodacc: scraping léger pour gel des avoirs (personnes)
- Collecteur Inforgreffe/Societe.com: données entreprises (SIREN, dirigeants, etc.)
- Générateur PDF: rapports formatés HTML pour chaque type dentité
2025-09-18 16:03:57 +00:00
4NK IA
39c452002a docs: guides d’interconnexion (Bodacc/Inforgreffe/Adresses) + spec UI Extraction; UI: liens PDF/JSON entités 2025-09-18 15:48:26 +00:00
4NK IA
42e5afceca feat(extraction): collecte externe par entité (statut + PDF), UI collecte par ligne 2025-09-18 15:36:29 +00:00
4NK IA
b11ede7e7d refactoring 2025-09-18 15:31:16 +00:00
4NK IA
32a15e29e6 fix(extraction): brouillons immutables pour champs description (corrige object non extensible) 2025-09-18 14:40:59 +00:00
4NK IA
db2de72ad7 feat(entities): ajout champ description (édition + persistance) pour personnes/adresses/entreprises 2025-09-18 14:23:34 +00:00
4NK IA
99b799306b ui(extraction): mise en page responsive, boutons non superposés 2025-09-18 14:17:10 +00:00
4NK IA
a2b6e70e38 feat(extraction): édition et suppression des entités directement dans l’onglet Extraction 2025-09-18 14:12:17 +00:00
4NK IA
c380ce31f0 feat(entities): édition/suppression visibles aussi pour les images 2025-09-18 14:02:45 +00:00
4NK IA
43ebc94b5b feat(entities): suppression unitaire + édition inline (personnes/adresses/entreprises) avec persistance cache 2025-09-18 13:53:56 +00:00
4NK IA
984c3838ae review: durée review Ollama (durationMs), timeout 15s, tooltip durée; délai min configurable via OLLAMA_MIN_REVIEW_MS 2025-09-18 12:59:58 +00:00
4NK IA
1e207f734e ux(review): spinner, tooltip, chip en cours et snackbar sur Révision IA 2025-09-18 12:56:58 +00:00
4NK IA
4bed3562b1 feat(ocr+quality): annuaire noms unifié, scoring boost, révision IA (Ollama) auto+manuelle; UI chips score+corrections; suppression entités; docs MAJ 2025-09-18 12:49:18 +00:00
4NK IA
a3501def35 feat(ocr): boost confiance avec annuaire de noms (FR+multi-lang) + docs 2025-09-18 10:23:24 +00:00
4NK IA
1118bbbf5d feat(ui): chips remplacement image & confirmation adresse + API calls; docs qualité 2025-09-18 10:18:45 +00:00
4NK IA
5135b9aceb docs(tests): document OCR CNI (CANTU/Nicolas) et adresse FR + test manuel 2025-09-18 10:04:54 +00:00
4NK IA
4e23bc4034 fix(ocr): clamp normalize lower/upper to 1..100 (10/90) to fix sharp error 2025-09-18 08:36:21 +00:00
4NK IA
acecd5b502 refactoring 2025-09-18 08:32:34 +00:00
4NK IA
6333d6291d feat(front,back): ETag polling, Skeletons, Reselect; backend cache atomique, DELETE, métriques, ignore étendu, PM2 watch 2025-09-18 07:31:33 +00:00
4NK IA
6737865c43 fix(ui): restore delete buttons in document list 2025-09-17 16:42:18 +00:00
4NK IA
2a8007d0c8 fix(ui): display file extensions for pending images and improve backend restart 2025-09-17 16:39:45 +00:00
4NK IA
4bbd914a4a perf(ui): eliminate flash with React.memo, useMemo, and optimized polling 2025-09-17 16:36:02 +00:00
4NK IA
adb33507bc perf(ui): atténue le clignotement via polling moins fréquent et MAJ sélective du store 2025-09-17 16:28:31 +00:00
4NK IA
57d4d9cf5a fix(polling): reduce frequency, add max attempts, prevent unnecessary re-renders 2025-09-17 16:14:16 +00:00
4NK IA
2d52564455 fix(backend): ignore metadata files (folder.json) in document processing 2025-09-17 16:05:50 +00:00
4NK IA
e4cf759a44 fix(store): debug pending files mapping and display in upload view 2025-09-17 16:02:44 +00:00
4NK IA
58be045089 ui(upload): spinner global au bootstrap et affichage placeholders pour fichiers en cours; reduce polling frequency 2025-09-17 15:54:13 +00:00
4NK IA
9bde6426cd feat(ocr+ner): CNI MRZ multi-pass (ocrb+eng), prétraitement image/PDF, adresses FR robustes; ops: pm2 config; ui: en-tête dossier sans hash; chore: polling limité\n\nci: docker_tag=dev-test 2025-09-17 15:21:11 +00:00
4NK IA
fa50a0c2e6 feat(front): afficher nom du dossier et nom lisible des documents; dialog création (nom+description)\nfeat(backend): meta dossier (name, description); MRZ CNI robuste; routes meta/cache/reprocess\nchore: spinner chargement extraction; retirer navigation\nci: docker_tag=dev-test 2025-09-17 13:04:43 +00:00
4NK IA
883f49e2e2 feat: re-traiter le dossier (vider cache + reprocess); UI extraction robuste entités; Stepper + liste avec ellipsis; backend DELETE /folders/:hash/cache et POST /folders/:hash/reprocess 2025-09-17 09:59:14 +00:00
Nicolas Cantu
b18a3077a2 backend 2025-09-16 06:15:55 +02:00