Skip to content

🧠 Amélioration du pipeline RAG — Précision et qualité d'extraction #21

@cutiips

Description

@cutiips

Contexte

L'évaluation actuelle du pipeline RAG montre un score de 84.6% (22/26) sur le formulaire AVS avec des documents synthétiques. Les 4 échecs restants révèlent des problèmes structurels :

Champ Attendu Obtenu Cause racine
2.2 Nom Dubois MĂĽller Hans Contamination par bruit (documents d'autres patients)
2.8 Téléphone patient 079 123 45 67 032 567 89 00 Confusion d'entités (patient ↔ médecin)
2.13 Téléphone spécialiste 021 345 67 89 032 567 89 00 Confusion d'entités (spécialiste ↔ généraliste)
4.2 Symptômes Douleurs lombaires... Inconnu Retrieval miss (chunk non trouvé)

Objectifs

  • Atteindre ≥95% de prĂ©cision sur l'Ă©valuation AVS
  • Étendre l'Ă©valuation aux templates Cardio et LAA
  • RĂ©duire les erreurs de confusion d'entitĂ©s Ă  zĂ©ro

Sub-issues

Ce ticket parent regroupe les améliorations suivantes :

🔧 Données & Templates

🎯 Pipeline RAG

📊 Évaluation

Métriques de suivi

Métrique Avant Cible
Précision AVS 84.6% ≥95%
Précision Cardio Non testé ≥90%
Précision LAA Non testé ≥90%
Confusion d'entités 2 cas 0
Temps de traitement (100 docs) ~90s <5 min

🤖 Generated with Claude Code

Metadata

Metadata

Assignees

No one assigned

    Labels

    priority:highFix before productionragRAG pipeline improvements

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions