- New service: tools bridge (port 37147) registry + Carbonyl/PageIndex/Chandra POST jobs - config/services.local.env.example and gitignore for services.local.env - .env.example for repos-devtools, regex-search, ia-dev-gateway, orchestrator, claw proxy, langextract - Orchestrator intents: tools.registry, tools.carbonyl.plan, tools.pageindex.run, tools.chandra.ocr - Docs: API + repo service fiche, architecture index; do not commit dist/
21 lines
1.3 KiB
Markdown
21 lines
1.3 KiB
Markdown
# Service PageIndex (`services/pageindex/`)
|
||
|
||
Indexation **sémantique structurée** de documents longs (PDF, Markdown) via le projet amont **[VectifyAI/PageIndex](https://github.com/VectifyAI/PageIndex)** : arbre hiérarchique (sections, résumés) et RAG **sans vecteurs** fondé sur le raisonnement LLM sur cet index.
|
||
|
||
## Rôle dans smart_ide
|
||
|
||
- **Pilotage de la définition sémantique** des documents : produire ou exploiter un **index arborescent** traçable (titres, pages, nœuds), distinct du RAG par embeddings **AnythingLLM**.
|
||
- **CLI** : **`services/pageindex/run-pageindex.sh`** (Python sous **`upstream/`**).
|
||
- **API pour l’IDE** : **`services/smart-ide-tools-bridge/`** — `POST /v1/pageindex/run` — [API/smart-ide-tools-bridge-api.md](../API/smart-ide-tools-bridge-api.md).
|
||
|
||
## Exploitation
|
||
|
||
Voir **[`services/pageindex/README.md`](../../services/pageindex/README.md)** et **[features/pageindex-semantic-documents.md](../features/pageindex-semantic-documents.md)**.
|
||
|
||
Secrets : fichier **`upstream/.env`** (non versionné) ou variables d’environnement, selon l’amont — gabarit **`services/pageindex/.env.example`**.
|
||
|
||
## Voir aussi
|
||
|
||
- [service-anythingllm-devtools.md](./service-anythingllm-devtools.md) — workspaces et upload documentaire vectoriel
|
||
- [anythingllm-workspaces.md](../anythingllm-workspaces.md) — un workspace AnythingLLM par projet
|