- Pipelines worker complets (preprocess, ocr, classify, extract, index, checks, finalize) - Intégration avec les APIs externes (Cadastre, Géorisques, BODACC, Infogreffe, RBE) - Client AnythingLLM pour l'indexation et la recherche sémantique - Client Neo4j pour la gestion du graphe de connaissances - Client OpenSearch pour la recherche plein-texte - Vérifications automatisées avec calcul du score de vraisemblance - Amélioration des pipelines OCR avec préprocessing avancé - Support des formats PDF, images avec conversion automatique - Correction lexicale spécialisée notariale - Indexation multi-système (AnythingLLM, OpenSearch, Neo4j) Fonctionnalités ajoutées: - Vérification d'adresses via API Cadastre - Contrôle des risques géologiques via Géorisques - Vérification d'entreprises via BODACC - Recherche de personnes via RBE et Infogreffe - Indexation sémantique dans AnythingLLM - Recherche plein-texte avec OpenSearch - Graphe de connaissances avec Neo4j - Score de vraisemblance automatisé
21 lines
364 B
Plaintext
21 lines
364 B
Plaintext
celery[redis]==5.4.0
|
|
kombu==5.4.0
|
|
opencv-python-headless==4.10.0.84
|
|
pytesseract==0.3.13
|
|
numpy==2.0.1
|
|
pillow==10.4.0
|
|
pdfminer.six==20240706
|
|
rapidfuzz==3.9.6
|
|
requests==2.32.3
|
|
minio==7.2.7
|
|
psycopg[binary]==3.2.1
|
|
sqlalchemy==2.0.35
|
|
opensearch-py==2.6.0
|
|
neo4j==5.23.1
|
|
jsonschema==4.23.0
|
|
ocrmypdf==15.4.0
|
|
pydantic==2.8.2
|
|
PyMuPDF==1.23.26
|
|
pdf2image==1.17.0
|
|
PyPDF2==3.0.1
|