FélixGPT

docs – chunks –

idle

Chunks 10

Historique 6 MSG

Budget tokens 5000

Temp 0.3

Max tokens 2048

Modèle

Coût: – (0 tokens)

Prompt système

Défaut

Identifiant (optionnel)

Posez une question sur vos documents indexés.

Déposer un fichier ou cliquer

.txt .md .rst .pdf — max 50 Mo

💡 Chunking — Découpe tes documents en petits blocs. Plus petits = plus précis mais plus de coûts. Plus gros = moins de coûts mais moins de précision. Les chunks se chevauchent (overlap) pour garder du contexte.

Chunking: Size: Overlap:

Fichier	Chunks	Ctx	Date

Quizz

Déposer des photos ou cliquer

JPG, PNG, GIF, WebP — max 50 Mo chacune

Aucune photo. Uploadez-en une.

Exercices

Aucun exercice. Créez-en un.

Sélectionnez ou créez un exercice

Quiz Playground

Testez un exercice en mode interactif — le chatbot pose des questions, demande des précisions, donne des indices.

Exercice

Modèle LLM

Identifiant testeur

Prompts

Aucun prompt.

Sélectionnez ou créez un prompt

1 Indexation

Fichier→ Chunking→ Contextualisation→ Embeddings TEI→ Qdrant

Chunking

Découpage en blocs de 512 tokens avec overlap de 64. Séparateurs : paragraphes → lignes → phrases.

Contextualisation (Anthropic CR)

Pour chaque chunk, Claude Haiku génère 2-3 phrases de contexte à partir du document complet. Coût : ~0.001 $/chunk. Désactivable.

Embeddings + Sparse

Le chunk contextualisé est encodé via multilingual-e5-large (1024D, local) + vecteur sparse BM25-like. 100% local.

Qdrant

Chaque chunk est stocké avec ses vecteurs dense + sparse, texte original, texte contextualisé, métadonnées (fichier, date, ID).

2 Requête

Question→ Embed query→ Hybride dense+sparse→ Fusion RRF→ Claude Haiku

Recherche hybride

Qdrant exécute en parallèle une recherche dense (cosinus) et sparse (lexicale), fusionne via RRF.

Génération

Les top-K chunks sont injectés dans un prompt structuré. Claude Haiku génère la réponse. Seul appel externe.

3 Gestion des données

Ajouter

Upload via l'interface ou POST /api/index/upload.

Mettre à jour

Re-uploadez le même fichier : les anciens chunks sont automatiquement supprimés et remplacés.

Supprimer

Par document : DELETE /api/documents/{id}. Reset total : DELETE /api/collection.

Backup Qdrant

curl -X POST "http://localhost:6333/collections/rag_documents/snapshots"

4 API

POST /api/ask                → Question RAG complète
POST /api/search             → Recherche hybride seule
POST /api/index/upload       → Upload + indexation
POST /api/index/reindex/{id} → Ré-indexer un doc
GET  /api/documents          → Lister les documents
DEL  /api/documents/{id}     → Supprimer un doc
GET  /api/stats              → Stats vector store
DEL  /api/collection         → Reset complet
GET  /api/health             → Santé

Utilisateurs

Chargement...

Sessions

Sélectionnez un utilisateur

Messages

Sélectionnez une session

Config publique

Paramètres de tous les étudiants.

Chunks 10

Historique 6 MSG

Budget tokens 5000

Temp 0.3

Max tokens 2000

Modèle

Prompt système

Défaut

👥 Gestion des utilisateurs

📊 Request Logs & Metrics

Période

→

Utilisateur

Type

Granularité

Total Cost

$0.00

Total Requests

0

Input Tokens

0

Output Tokens

0

Cache Hits

0

Queue Size

0

Sessions de chat