- Ajout de l'intégration Celery pour les tâches asynchrones
- Création des tâches spécialisées (OCR, classification, extraction, indexation, vérification)
- Configuration des queues Celery avec Redis
- Création du fichier d'environnement complet (.env.example et .env)
- Script bootstrap automatisé pour l'initialisation
- Amélioration du worker avec orchestration des pipelines
- Ajout des dépendances Celery et Kombu
Fonctionnalités ajoutées:
- Pipeline de traitement asynchrone avec Celery
- Tâches de traitement en lot
- Monitoring et health checks
- Configuration d'environnement centralisée
- Script d'initialisation automatisé
- Infrastructure complète de traitement de documents notariaux
- API FastAPI d'ingestion et d'orchestration
- Pipelines Celery pour le traitement asynchrone
- Support des formats PDF, JPEG, PNG, TIFF, HEIC
- OCR avec Tesseract et correction lexicale
- Classification automatique des documents avec Ollama
- Extraction de données structurées
- Indexation dans AnythingLLM et OpenSearch
- Système de vérifications et contrôles métier
- Base de données PostgreSQL pour le métier
- Stockage objet avec MinIO
- Base de données graphe Neo4j
- Recherche plein-texte avec OpenSearch
- Supervision avec Prometheus et Grafana
- Scripts d'installation pour Debian
- Documentation complète
- Tests unitaires et de performance
- Service systemd pour le déploiement
- Scripts de déploiement automatisés