4NK_IA_back/docker/worker/requirements.txt
Nicolas Cantu f485efdb87 feat: Implémentation complète des pipelines et intégrations
- Pipelines worker complets (preprocess, ocr, classify, extract, index, checks, finalize)
- Intégration avec les APIs externes (Cadastre, Géorisques, BODACC, Infogreffe, RBE)
- Client AnythingLLM pour l'indexation et la recherche sémantique
- Client Neo4j pour la gestion du graphe de connaissances
- Client OpenSearch pour la recherche plein-texte
- Vérifications automatisées avec calcul du score de vraisemblance
- Amélioration des pipelines OCR avec préprocessing avancé
- Support des formats PDF, images avec conversion automatique
- Correction lexicale spécialisée notariale
- Indexation multi-système (AnythingLLM, OpenSearch, Neo4j)

Fonctionnalités ajoutées:
- Vérification d'adresses via API Cadastre
- Contrôle des risques géologiques via Géorisques
- Vérification d'entreprises via BODACC
- Recherche de personnes via RBE et Infogreffe
- Indexation sémantique dans AnythingLLM
- Recherche plein-texte avec OpenSearch
- Graphe de connaissances avec Neo4j
- Score de vraisemblance automatisé
2025-09-10 18:37:04 +02:00

21 lines
364 B
Plaintext

celery[redis]==5.4.0
kombu==5.4.0
opencv-python-headless==4.10.0.84
pytesseract==0.3.13
numpy==2.0.1
pillow==10.4.0
pdfminer.six==20240706
rapidfuzz==3.9.6
requests==2.32.3
minio==7.2.7
psycopg[binary]==3.2.1
sqlalchemy==2.0.35
opensearch-py==2.6.0
neo4j==5.23.1
jsonschema==4.23.0
ocrmypdf==15.4.0
pydantic==2.8.2
PyMuPDF==1.23.26
pdf2image==1.17.0
PyPDF2==3.0.1