Cet article a été écrit par Tom Travel. Cliquez ici pour lire l'article d'origine
Si vous êtes l'auteur de cet article, cliquez ici pour découvrir comment la republication de votre article améliore votre SEO et votre visibilité !
Hugging Face montre les capacités de son Open Computer Agent, qui permet à un modèle d’IA d’interagir de façon autonome avec un ordinateur virtuel. Cette solution ouvre la voie à de nouveaux usages automatisés et transparents, notamment pour la recherche et la réservation de billets.
L’entreprise franco-américaine Hugging Face vient de dévoiler Open Computer Agent, un agent IA capable de naviguer sur le web, d’utiliser des applications et de remplir des formulaires, sans aucune intervention manuelle. Cette démonstration d’un agent IA cloud illustre le potentiel croissant de l’IA agentique pour transformer notre rapport aux interfaces numériques et aux tâches répétitives sur la base d’instructions en langage naturel.
L’Open Computer Agent de Hugging Face fonctionne sur un ordinateur virtuel Linux hébergé dans le cloud et peut effectuer des actions variées, telles que cliquer sur des boutons, remplir des champs ou parcourir des sites web; tout cela de façon autonome et transparente pour l’utilisateur. L’outil ambitionne ainsi de libérer l’utilisateur de l’usage traditionnel du clavier et de la souris pour proposer des interfaces entièrement pilotées par l’IA.
We’re launching Computer Use in smolagents! 🥳
-> As vision models become more capable, they become able to power complex agentic workflows. Especially Qwen-VL models, that support built-in grounding, i.e. ability to locate any element in an image by its coordinates, thus to… pic.twitter.com/mI8MuWZkIS
— m_ric (@AymericRoucher) May 6, 2025
Hugging Face continue à explorer une piste déjà envisagée par d’autres acteurs de l’IA. En janvier 2025, OpenAI lançait Operator, son agent capable, lui aussi, d’analyser un contenu à l’écran et de faire le meilleur choix sur la base des consignes qu’on lui a préalablement données. Mais la start-up franco-américaine mise sur l’Open Source pour garantir davantage de transparence sur le fonctionnement des modèles et, peut-être, rassurer sur les capacités d’un agent IA capable de naviguer sur Internet à notre place.
Ces promesses de dire adieu aux formulaires semblent toutes s’accorder sur ce qu’est le cas d’usage parfait pour ces technologies : le travel, et la perspective d’épargner à l’utilisateur les longues démarches pour déterminer un itinéraire, acheter des billets d’avion, de train, réserver un hébergement ou un restaurant. L’outil peut être testé sur le site de Hugging Face (tant qu’il n’est pas victime de son succès) et permettra de mesurer sa capacité à déjouer les Captcha lui demandant de prouver qu’il n’est pas un robot.
Photo d’ouverture : Mohamed Nohassi
À lire aussi :
Input your search keywords and press Enter.