
- Infrastructure complète de traitement de documents notariaux - API FastAPI d'ingestion et d'orchestration - Pipelines Celery pour le traitement asynchrone - Support des formats PDF, JPEG, PNG, TIFF, HEIC - OCR avec Tesseract et correction lexicale - Classification automatique des documents avec Ollama - Extraction de données structurées - Indexation dans AnythingLLM et OpenSearch - Système de vérifications et contrôles métier - Base de données PostgreSQL pour le métier - Stockage objet avec MinIO - Base de données graphe Neo4j - Recherche plein-texte avec OpenSearch - Supervision avec Prometheus et Grafana - Scripts d'installation pour Debian - Documentation complète - Tests unitaires et de performance - Service systemd pour le déploiement - Scripts de déploiement automatisés
18 lines
321 B
Plaintext
18 lines
321 B
Plaintext
celery[redis]==5.4.0
|
|
opencv-python-headless==4.10.0.84
|
|
pytesseract==0.3.13
|
|
numpy==2.0.1
|
|
pillow==10.4.0
|
|
pdfminer.six==20240706
|
|
python-alto==0.5.0
|
|
rapidfuzz==3.9.6
|
|
requests==2.32.3
|
|
minio==7.2.7
|
|
psycopg[binary]==3.2.1
|
|
sqlalchemy==2.0.35
|
|
opensearch-py==2.6.0
|
|
neo4j==5.23.1
|
|
jsonschema==4.23.0
|
|
ocrmypdf==15.4.0
|
|
pydantic==2.8.2
|