Cet article a été écrit par Tom Travel. Cliquez ici pour lire l'article d'origine
Si vous êtes l'auteur de cet article, cliquez ici pour découvrir comment la republication de votre article améliore votre SEO et votre visibilité !
Avec la montée en puissance des grands modèles de langage (LLM), le concept de RAG (retrieval-augmented generation) s’impose comme une avancée pour répondre aux limites de ces technologies. Maxime Vermeir, Senior Director of AI Strategy chez ABBYY, nous éclaire sur cette approche, son fonctionnement et ses applications concrètes dans les entreprises.
Le principe de la RAG a été introduit dès 2020 dans un article publié par des chercheurs de Meta, alors appelé Facebook AI Research (FAIR). L’idée a regagné en popularité lorsque les gens ont réalisé que les grands modèles de langage (LLM) comme Llama, ChatGPT d’OpenAI ou Claude d’Anthropic, bien qu’impressionnants, sont de nature probabiliste. Ils tentent de fournir la réponse la plus probable, mais cela ne garantit pas qu’elle soit correcte. Avec la RAG, on peut enrichir ces modèles en leur fournissant des données précises et actualisées issues d’une base de connaissances, afin d’améliorer la qualité et la précision des réponses.
Le processus commence par la collecte d’informations écrites dans des documents. Ces informations doivent être transformées en données structurées, car les documents bruts ne sont pas naturellement compréhensibles par les ordinateurs. Une fois cette étape réalisée, les données sont converties en vecteurs lors d’un processus appelé embedding. Ces vecteurs, stockés dans une base de données vectorielle, permettent de rechercher des relations entre les éléments de façon plus sophistiquée qu’avec une simple recherche de mots-clés.
Lorsqu’un utilisateur pose une question, les vecteurs correspondants sont extraits et combinés avec la requête. Ces données enrichies sont alors envoyées au LLM pour générer une réponse précise. On peut également demander au modèle d’ignorer ses connaissances générales pour se concentrer uniquement sur les données fournies.
Oui, les APIs peuvent être utilisées pour accéder à des bases de données externes ou temps réel. Cependant, sans embedding, les données retournées par une API restent du texte brut, sans les relations contextuelles qu’un système RAG peut établir. Cela réduit la pertinence des réponses comparées à un système complet basé sur la RAG.
De nombreuses entreprises utilisent la RAG pour transformer leurs connaissances internes en ressources accessibles et exploitables. Par exemple, nous avons aidé des organisations à structurer leurs procédures internes et à les intégrer dans un système RAG. Cela permet aux employés de poser des questions complexes et d’obtenir des réponses précises basées sur des faits issus de leur propre base de connaissances. Cela s’applique également aux équipes en interne chez ABBYY : nous partageons nos savoirs pour accélérer la résolution de problèmes et gagner en efficacité.
Le voyage est un secteur idéal pour exploiter la RAG. Imaginez un assistant personnel capable de planifier un voyage en fonction des préférences exactes du client et d’actualiser les informations en temps réel, comme les retards de vol ou les restrictions sanitaires. Les entreprises devront cependant investir dans la qualification de leurs données, car la qualité des réponses dépendra directement de la précision et de la richesse des informations qu’elles fournissent.
Je dirais que la RAG est une application du NLP, pas une évolution ou une rupture. Elle utilise les mêmes bases technologiques, mais les applique d’une manière spécifique pour répondre à des besoins précis. En définitive, c’est l’association entre le NLP et les systèmes RAG qui permet d’obtenir des résultats si pertinents.
Les assistants personnels basés sur l’IA vont devenir courants et transformer nos façons de travailler et de vivre. Avec la RAG, ces assistants pourront non seulement fournir des informations précises mais aussi effectuer des actions concrètes. Cela nous libérera du temps pour nous concentrer sur ce qui nous rend uniques : la créativité.
Photo d’ouverture : yurich84
Input your search keywords and press Enter.