Ils sont peu nombreux à être au centre de l’actualité sur le net et pourtant, plusieurs agents IA spécifiques à chaque besoin sont disponibles pour les développeurs et les utilisateurs. Une étude récente du MIT a permis d’explorer cet environnement, afin d’en recenser les meilleurs agents IA.
Le laboratoire universitaire consacré à la recherche sur l’IA au MIT a décidé d’identifier et documenter les performances de l’agent IA. Quelles sont les véritables fonctions d’un agent IA ? Quels sont les meilleurs agents IA autonomes et semi-autonomes les plus demandés par les entreprises ? L’étude a permis de détailler les interfaces les plus populaires, mais également les risques communs aux agents IA.
Les agents recensés dans l'index du MIT
L’étude a regroupé les meilleures solutions du moment :
- OpenAI ChatGPT / ChatGPT Agent / Codex / AgentKit
- Anthropic Claude / Claude Code
- Google Gemini / Gemini CLI
- Manus AI
- Perplexity
- Alibaba MobileAgent
- ByteDance Agent TARS
- Perplexity Comet
- IBM watsonx Orchestrate
- Microsoft 365 Copilot
- SAP Joule Studio
- Salesforce Agentforce
- ServiceNow AI Agents
Les catégories d’agents les plus importantes
Les scientifiques du laboratoire du MIT ont choisi trois segments différents en fonction de l’usage métier : Agents de workflow d’entreprise, Applications de chat avec outils agents, Agents basés sur un navigateur.
- Agents de workflow d’entreprise
Ils intègrent des fonctions d’agent pour l’automatisation des tâches commerciales fastidieuses. Les plateformes telles que Microsoft 365 Copilot et ServiceNow sont des exemples qui illustrent cette partie.
- Applications de chat avec outils agents
Cette partie propose des interfaces de chat, en plus d’un accès étendu à des outils tiers. Comme exemple, l’on peut citer les agents de codage à l’instar de Claude, ou encore Manus AI et ChatGPT dans une certaine mesure.
- Agents basés sur un navigateur
L’interface la plus importante de ces 5 systèmes est un navigateur ou un ordinateur. Ils possèdent des outils d’interaction très étendus. Perplexity Comet, ChatGPT Atlas et ByteDance Agent TARS en font partie.
Les principaux usages des agents IA
Les cas d’utilisation concernent les besoins de productivité immédiats :
- La recherche : il s’agit de 12 agents sur 30, en plus des assistants grand public et pro.
- L’automatisation des processus : ici 11 agents sont spécialisés dans les RH, la vente, l’assistance et l’informatique.
- L’interface graphique : 7 modèles gèrent le remplissage de formulaires et les réservations.
Une autonomie instable ?
Les niveaux d’autonomie sont fonction de l’architecture logicielle. Ici, les assistants conversationnels présentent le niveau le moins élevé et évoluent par des interactions successives.
Les modèles à l’instar de OpenAI et ChatGPT, Anthropic et Claude, et enfin Google Gemini restent à chaque fois dans l’attente d’une instruction venant de l’utilisateur.
Contrairement aux agents de navigateur comme Perplexity Comet, qui sont capables d’exécuter ses tâches de façon autonome une fois l’instruction donnée. Dans ce cas, l’utilisateur ne peut plus intervenir tant que l’agent IA n’a pas terminé.
Les plateformes d’entreprise ont une approche dite « hybride ». Avec des déclencheurs et les garde-fous configurés manuellement pendant la conception. Dès que les agents sont déployés, ils sont autonomes. Ils s’activent par exemple en cas de nouveau e-mail ou d’une modification de la base de données.
Des modèles comme Microsoft 365 Copilot, Google Gemini Enterprise, Glean, ou encore IBM watsonx fonctionnent de cette manière.
L’intervention humaine reste obligatoire
La majorité des offres pour développeurs recommande une confirmation explicite pour les opérations. Par exemple en cas de modification de fichiers ou lors de l’exécution d’une commande système. Des agents IA comme ChatGPT Atlas ou Opera Neon possèdent un mode surveillance, dont le rôle est de contrôler en temps réel des actions critiques.