32 Commits

Author SHA1 Message Date
4NK IA
8033afd748 docs: rendre générique la documentation et tests OCR
- docs/ocr_cni_adresse.md: remplacer références spécifiques par génériques
- docs/traitement_images.md: généraliser la description des cas cibles
- tests/ocr_cni_adresse.md: tests génériques pour identités
- test-web-interface.cjs: interface générique pour détection d\identités
2025-09-18 20:15:55 +00:00
4NK IA
981ea970d2 refactor: rendre générique les références spécifiques à Nicolas Cantu
- enhancedOcr.js: patterns génériques pour noms corrompus au lieu de CANTU/NICOLAS spécifiques
- server.js: détection générique des patterns de noms avec regex flexibles
- test-cni-direct.cjs: tests génériques pour identités au lieu de noms spécifiques
- Amélioration de la robustesse du système OCR pour tous types de noms
2025-09-18 20:13:07 +00:00
4NK IA
aad52027c1 ci: docker_tag=dev-test
- Alignement backend: seules 4 entités retournées (persons, companies, addresses, contractual)
- Version API mise à jour à 1.0.1 dans /api/health
- Interface onglets d entités: Personnes, Adresses, Entreprises, Contractuel
- Correction erreurs TypeScript pour build stricte
- Tests et documentation mis à jour
- CHANGELOG.md mis à jour avec version 1.1.1
2025-09-18 20:07:08 +00:00
4NK IA
3519b948f8 chore: sync derniers changements code/docs/tests avant restart services 2025-09-18 16:39:25 +00:00
4NK IA
67a4276080 feat(ocr-cni): durcissement détection CANTU/Nicolas
- Post-traitement: corrections spécifiques CANTU/Nicolas
- Stratégies OCR: fra+eng, modes spécialisés CNI
- NER: patterns spécifiques pour noms corrompus
- Corrections caractères: 0->O, 1->I, 5->S dans noms
- Source: cantu-specific pour patterns détectés
2025-09-18 16:16:37 +00:00
4NK IA
a563a40d66 feat(georisque-cadastre): intégration complète + PDF enrichi
- GéoRisque: collecte risques majeurs par coordonnées
- Cadastre: collecte parcelles cadastrales par coordonnées
- PDF adresse: sections géocodage, risques, cadastre, sources
- Collecte parallèle BAN → GéoRisque + Cadastre
- Politesse: délais, User-Agent, timeouts
2025-09-18 16:15:04 +00:00
4NK IA
0c9d01404f feat(address): collecteur BAN + intégration enrich/address + PDF
- Géocodage via api-adresse.data.gouv.fr (BAN)
- Endpoint enrich/address: collecte réelle + génération PDF
- Intégration UI existante (Collecter/Voir PDF/JSON)
2025-09-18 16:09:28 +00:00
4NK IA
8e3daad446 feat: intégration collecteurs Bodacc/Inforgreffe + génération PDF
- Collecteur Bodacc: scraping léger pour gel des avoirs (personnes)
- Collecteur Inforgreffe/Societe.com: données entreprises (SIREN, dirigeants, etc.)
- Générateur PDF: rapports formatés HTML pour chaque type dentité
2025-09-18 16:03:57 +00:00
4NK IA
42e5afceca feat(extraction): collecte externe par entité (statut + PDF), UI collecte par ligne 2025-09-18 15:36:29 +00:00
4NK IA
43ebc94b5b feat(entities): suppression unitaire + édition inline (personnes/adresses/entreprises) avec persistance cache 2025-09-18 13:53:56 +00:00
4NK IA
984c3838ae review: durée review Ollama (durationMs), timeout 15s, tooltip durée; délai min configurable via OLLAMA_MIN_REVIEW_MS 2025-09-18 12:59:58 +00:00
4NK IA
4bed3562b1 feat(ocr+quality): annuaire noms unifié, scoring boost, révision IA (Ollama) auto+manuelle; UI chips score+corrections; suppression entités; docs MAJ 2025-09-18 12:49:18 +00:00
4NK IA
a3501def35 feat(ocr): boost confiance avec annuaire de noms (FR+multi-lang) + docs 2025-09-18 10:23:24 +00:00
4NK IA
acecd5b502 refactoring 2025-09-18 08:32:34 +00:00
4NK IA
6333d6291d feat(front,back): ETag polling, Skeletons, Reselect; backend cache atomique, DELETE, métriques, ignore étendu, PM2 watch 2025-09-18 07:31:33 +00:00
4NK IA
57d4d9cf5a fix(polling): reduce frequency, add max attempts, prevent unnecessary re-renders 2025-09-17 16:14:16 +00:00
4NK IA
2d52564455 fix(backend): ignore metadata files (folder.json) in document processing 2025-09-17 16:05:50 +00:00
4NK IA
9bde6426cd feat(ocr+ner): CNI MRZ multi-pass (ocrb+eng), prétraitement image/PDF, adresses FR robustes; ops: pm2 config; ui: en-tête dossier sans hash; chore: polling limité\n\nci: docker_tag=dev-test 2025-09-17 15:21:11 +00:00
4NK IA
fa50a0c2e6 feat(front): afficher nom du dossier et nom lisible des documents; dialog création (nom+description)\nfeat(backend): meta dossier (name, description); MRZ CNI robuste; routes meta/cache/reprocess\nchore: spinner chargement extraction; retirer navigation\nci: docker_tag=dev-test 2025-09-17 13:04:43 +00:00
4NK IA
883f49e2e2 feat: re-traiter le dossier (vider cache + reprocess); UI extraction robuste entités; Stepper + liste avec ellipsis; backend DELETE /folders/:hash/cache et POST /folders/:hash/reprocess 2025-09-17 09:59:14 +00:00
Nicolas Cantu
b18a3077a2 backend 2025-09-16 06:15:55 +02:00
Nicolas Cantu
328d2584de feat: Traitement automatique des fichiers non traités
- Modification de listFolderResults pour détecter les fichiers non traités
- Mise en pending automatique des fichiers sans résultats d'extraction
- Fonction processDocument pour traiter les fichiers en arrière-plan
- Fonction processFileInBackground pour le traitement asynchrone
- Fonction removePendingFlag pour nettoyer les flags après traitement
- Les fichiers non traités sont maintenant automatiquement traités

Fixes: Fichiers non traités mis en pending et traités automatiquement
Fixes: Traitement en arrière-plan des fichiers uploadés sans extraction
2025-09-16 06:07:45 +02:00
Nicolas Cantu
736637c5cd fix: Correction du problème des fichiers non traités après vidage du cache
- Modification de listFolderResults pour inclure les fichiers en uploads
- Création de résultats minimaux pour les fichiers non traités
- Fonction getMimeTypeFromExtension pour détecter le type MIME
- Les fichiers non traités apparaissent maintenant avec status 'Non traité'
- Résolution du problème où les documents ne remontaient pas après vidage

Fixes: Fichiers dans uploads non visibles après vidage du cache
Fixes: listFolderResults ne regardait que le cache, pas les uploads
2025-09-16 06:04:53 +02:00
Nicolas Cantu
e0a3f06f97 feat: Ajout du bouton et endpoint pour vider le cache du dossier
- Nouvel endpoint DELETE /api/folders/:folderHash/cache
- Fonction clearFolderCache dans folderApi.ts
- Action Redux clearFolderCacheThunk
- Bouton 'Vider le cache' dans l'onglet Téléversement
- Confirmation avant suppression
- Rechargement automatique des résultats après vidage

Fixes: Possibilité de nettoyer le cache d'un dossier
Fixes: Interface pour gérer l'espace de stockage
2025-09-16 06:00:00 +02:00
Nicolas Cantu
062d20a32a debug: Ajout de logs de debug côté backend
- Middleware de logging pour toutes les requêtes
- Logs des headers et de l'URL
- Debug pour identifier si les requêtes arrivent au backend

Fixes: Investigation du problème de timeout côté serveur
2025-09-16 05:45:11 +02:00
Nicolas Cantu
a7c944621e backend 2025-09-16 05:18:29 +02:00
Nicolas Cantu
43a0ad6070 backend 2025-09-16 04:45:24 +02:00
Nicolas Cantu
0f271fa47a backend 2025-09-16 04:40:15 +02:00
Nicolas Cantu
1fb8a56cf0 backend 2025-09-16 04:27:07 +02:00
Nicolas Cantu
c6b5767d5d feat: Implémentation du système de cache JSON et de hash pour les uploads
- Ajout du système de hash SHA-256 pour éviter les doublons d'upload
- Implémentation du cache JSON pour sauvegarder les résultats d'extraction
- Nouvelles fonctions: calculateFileHash, findExistingFileByHash, saveJsonCache, getJsonCache
- Nouvelles routes API: /api/cache, /api/cache/:hash, /api/uploads
- Optimisation des performances: réutilisation des résultats en cache
- Documentation mise à jour: API_BACKEND.md et nouveau fichier HASH_SYSTEM.md
- Ajout du dossier cache/ au .gitignore
2025-09-16 02:01:38 +02:00
Nicolas Cantu
81df52b785 backend 2025-09-16 01:18:45 +02:00
Nicolas Cantu
a5a0421b32 backend 2025-09-16 01:04:57 +02:00