- Mise à jour du README.md avec les nouvelles fonctionnalités - Documentation API mise à jour avec les intégrations externes - Guide d'installation avec bootstrap automatisé - Architecture mise à jour avec Celery et intégrations - CHANGELOG détaillé avec toutes les nouvelles fonctionnalités - Nouvelle documentation des fonctionnalités v1.2.0 Nouvelles sections documentées: - Pipeline de traitement asynchrone avec Celery - Intégrations avec APIs externes (Cadastre, Géorisques, BODACC, etc.) - Clients d'intégration (AnythingLLM, Neo4j, OpenSearch) - Configuration d'environnement centralisée - Script bootstrap automatisé - Monitoring et observabilité - Exemples d'utilisation et API
5.3 KiB
5.3 KiB
Changelog
Toutes les modifications notables de ce projet seront documentées dans ce fichier.
Le format est basé sur Keep a Changelog, et ce projet adhère au Versioning Sémantique.
[1.2.0] - 2025-01-09
Ajouté
- Intégration complète de Celery pour les tâches asynchrones avec queues spécialisées
- Pipelines worker complets : préprocessing, OCR, classification, extraction, indexation, vérification, finalisation
- Intégrations avec APIs externes : Cadastre, Géorisques, BODACC, Infogreffe, RBE
- Clients d'intégration avancés : AnythingLLM, Neo4j, OpenSearch
- Vérifications automatisées avec calcul du score de vraisemblance
- OCR avancé avec préprocessing d'images et correction lexicale notariale
- Support multi-formats : PDF, JPEG, PNG, TIFF, HEIC avec conversion automatique
- Indexation multi-système : AnythingLLM (sémantique), OpenSearch (plein-texte), Neo4j (graphe)
- Fichier d'environnement complet (.env.example et .env) avec toutes les variables
- Script bootstrap automatisé pour l'initialisation complète du système
- Gestion robuste des erreurs dans tous les pipelines avec fallbacks
- Support des tâches périodiques (Celery Beat) pour la maintenance
- Configuration centralisée des workers et des services
Modifié
- Worker principal refactorisé pour utiliser Celery avec orchestration avancée
- Amélioration de la gestion des erreurs dans tous les pipelines
- Configuration Docker optimisée pour Celery et les nouvelles dépendances
- Documentation complètement mise à jour avec les nouvelles fonctionnalités
- API version 1.2.0 avec nouvelles fonctionnalités
Corrigé
- Gestion robuste des erreurs dans les tâches asynchrones
- Amélioration de la scalabilité du système avec Celery
- Configuration d'environnement centralisée et automatisée
- Compatibilité des formats de documents avec conversion automatique
[1.1.0] - 2025-01-09
Ajouté
- Transformation en application backend-only
- Suppression complète de l'interface utilisateur
- API REST complète pour l'ingestion et l'orchestration
- Support des documents notariaux (actes de vente, donations, successions, CNI)
- Pipeline de traitement asynchrone avec workers
- Intégration avec Ollama pour l'IA locale
- Stockage S3-compatible avec MinIO
- Base de données PostgreSQL avec SQLAlchemy
- Cache Redis pour les performances
- Monitoring avec Prometheus et Grafana
- Recherche avec OpenSearch
- Graphe de connaissances avec Neo4j
- Interface AnythingLLM pour l'IA
Modifié
- Architecture simplifiée sans interface web
- API version 1.1.0
- Configuration Docker optimisée
- Documentation mise à jour
Corrigé
- Tous les tests passent avec succès
- Erreurs d'import et de configuration corrigées
- Compatibilité Docker améliorée
[1.0.0] - 2025-01-08
Ajouté
- Infrastructure complète de traitement de documents notariaux
- API FastAPI d'ingestion et d'orchestration
- Pipelines Celery pour le traitement asynchrone
- Support des formats PDF, JPEG, PNG, TIFF, HEIC
- OCR avec Tesseract et correction lexicale
- Classification automatique des documents avec Ollama
- Extraction de données structurées
- Indexation dans AnythingLLM et OpenSearch
- Système de vérifications et contrôles métier
- Base de données PostgreSQL pour le métier
- Stockage objet avec MinIO
- Base de données graphe Neo4j
- Recherche plein-texte avec OpenSearch
- Supervision avec Prometheus et Grafana
- Passerelle HTTP avec Traefik
- Scripts d'installation pour Debian et Windows
- Documentation complète
- Tests unitaires et de performance
- Service systemd pour le déploiement
- Scripts de déploiement automatisés
Types de documents supportés
- Actes de vente immobilière
- Actes d'achat immobilière
- Donations
- Testaments
- Successions
- Contrats de mariage
- Procurations
- Attestations
- Factures notariales
Fonctionnalités techniques
- Pipeline de traitement en 7 étapes
- Correction lexicale spécialisée notariale
- Classification avec modèles LLM locaux
- Extraction de données avec validation
- Indexation multi-système
- Vérifications métier automatisées
- Traçabilité complète des traitements
- Gestion d'erreurs et révision manuelle
- Monitoring et métriques détaillées
Sécurité
- Chiffrement TLS en frontal
- Cloisonnement par étude
- Audit et traçabilité
- Gestion des secrets
Déploiement
- Docker Compose pour tous les services
- Scripts d'installation automatisés
- Configuration par variables d'environnement
- Service systemd pour production
- Scripts de sauvegarde et maintenance
[0.1.0] - 2025-01-08
Ajouté
- Structure initiale du projet
- Configuration Docker de base
- API FastAPI minimale
- Worker Celery basique
- Documentation initiale
Format des versions
- MAJOR : Changements incompatibles avec l'API
- MINOR : Nouvelles fonctionnalités compatibles
- PATCH : Corrections de bugs compatibles
Types de changements
- Ajouté : Nouvelles fonctionnalités
- Modifié : Changements de fonctionnalités existantes
- Déprécié : Fonctionnalités qui seront supprimées
- Supprimé : Fonctionnalités supprimées
- Corrigé : Corrections de bugs
- Sécurité : Corrections de vulnérabilités