- Submodule services/chandra/upstream (shallow), run-chandra.sh, .env.example - Docs: service-chandra, chandra-ocr-documents; link from PageIndex feature - Index updates in docs/README, repo/README, services, system-architecture
1.3 KiB
1.3 KiB
Service Chandra OCR (services/chandra/)
OCR et extraction structurée (PDF / images → Markdown, HTML, JSON avec mise en page) via le projet amont datalab-to/chandra.
Rôle dans smart_ide
- Numérisation de documents complexes (tableaux, formulaires, manuscrits, math).
- Pas de listener HTTP dans ce dépôt : CLI
chandra, lancée parservices/chandra/run-chandra.shaprès installation dansupstream/(uv syncou équivalent).
Licences
- Code : Apache-2.0 (fichier
LICENSEdansupstream/). - Poids du modèle : voir
MODEL_LICENSEdans le sous-module amont et les conditions d’usage commercial décrites dans le README Chandra.
Exploitation
Voir services/chandra/README.md et features/chandra-ocr-documents.md.
Configuration : variables d’environnement ou upstream/local.env — gabarit services/chandra/.env.example.
Voir aussi
- service-pageindex.md — index sémantique sur Markdown / PDF
- anythingllm-workspaces.md — RAG par workspace