- Submodule services/pageindex/upstream (shallow), run-pageindex.sh, .env.example - Docs: service-pageindex, pageindex-semantic-documents, index updates
20 lines
1.3 KiB
Markdown
20 lines
1.3 KiB
Markdown
# Service PageIndex (`services/pageindex/`)
|
||
|
||
Indexation **sémantique structurée** de documents longs (PDF, Markdown) via le projet amont **[VectifyAI/PageIndex](https://github.com/VectifyAI/PageIndex)** : arbre hiérarchique (sections, résumés) et RAG **sans vecteurs** fondé sur le raisonnement LLM sur cet index.
|
||
|
||
## Rôle dans smart_ide
|
||
|
||
- **Pilotage de la définition sémantique** des documents : produire ou exploiter un **index arborescent** traçable (titres, pages, nœuds), distinct du RAG par embeddings **AnythingLLM**.
|
||
- **Pas de service HTTP** dans ce dépôt : exécution **CLI** Python sous **`services/pageindex/upstream/`**, lancée via **`services/pageindex/run-pageindex.sh`**.
|
||
|
||
## Exploitation
|
||
|
||
Voir **[`services/pageindex/README.md`](../../services/pageindex/README.md)** et **[features/pageindex-semantic-documents.md](../features/pageindex-semantic-documents.md)**.
|
||
|
||
Secrets : fichier **`upstream/.env`** (non versionné) ou variables d’environnement, selon l’amont — gabarit **`services/pageindex/.env.example`**.
|
||
|
||
## Voir aussi
|
||
|
||
- [service-anythingllm-devtools.md](./service-anythingllm-devtools.md) — workspaces et upload documentaire vectoriel
|
||
- [anythingllm-workspaces.md](../anythingllm-workspaces.md) — un workspace AnythingLLM par projet
|