smart_ide/docs/repo/service-chandra.md
4NK a1ac5ae66b Add Chandra OCR service (datalab-to upstream submodule, CLI wrapper)
- Submodule services/chandra/upstream (shallow), run-chandra.sh, .env.example
- Docs: service-chandra, chandra-ocr-documents; link from PageIndex feature
- Index updates in docs/README, repo/README, services, system-architecture
2026-04-03 22:27:18 +02:00

25 lines
1.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Service Chandra OCR (`services/chandra/`)
OCR et extraction **structurée** (PDF / images → Markdown, HTML, JSON avec mise en page) via le projet amont **[datalab-to/chandra](https://github.com/datalab-to/chandra)**.
## Rôle dans smart_ide
- **Numérisation** de documents complexes (tableaux, formulaires, manuscrits, math).
- **Pas de listener HTTP** dans ce dépôt : CLI **`chandra`**, lancée par **`services/chandra/run-chandra.sh`** après installation dans **`upstream/`** (`uv sync` ou équivalent).
## Licences
- **Code** : Apache-2.0 (fichier `LICENSE` dans `upstream/`).
- **Poids du modèle** : voir **`MODEL_LICENSE`** dans le sous-module amont et les conditions dusage commercial décrites dans le [README Chandra](https://github.com/datalab-to/chandra/blob/master/README.md).
## Exploitation
Voir **[`services/chandra/README.md`](../../services/chandra/README.md)** et **[features/chandra-ocr-documents.md](../features/chandra-ocr-documents.md)**.
Configuration : variables denvironnement ou **`upstream/local.env`** — gabarit **`services/chandra/.env.example`**.
## Voir aussi
- [service-pageindex.md](./service-pageindex.md) — index sémantique sur Markdown / PDF
- [anythingllm-workspaces.md](../anythingllm-workspaces.md) — RAG par workspace