Génération à enrichissement contextuel
La génération à enrichissement contextuel (anglais : Retrieval-augmented generation, RAG) est une technique d'optimisation de réponses de modèle de langage en intelligence artificielle générative. Cette méthode permet notamment d'améliorer la qualité de réponses aux requêtes en permettant aux grands modèles de langage (LLM) d'exploiter des ressources de données supplémentaires sans ré-entraînement[1].
Les cas d'utilisation incluent l'accès via un chatbot aux données internes de l'entreprise ou la diffusion d'informations vérifiées provenant exclusivement de sources fiables et reconnues[2].
Références
- ↑ Guillaume Serries, « RAG : comment cette technique optimise l'IA générative », sur ZDNET, (consulté le )
- ↑ « Qu'est-ce que la génération à enrichissement contextuel (RAG) ? – Explication de l'IA de génération à enrichissement contextuel – AWS », sur Amazon Web Services, Inc. (consulté le )
- Portail de l’intelligence artificielle
- Portail de l’informatique