Introduction : L’IA dans la vie économique réelle
Que se passe-t-il lorsqu’on confie à une intelligence artificielle la responsabilité d’un commerce réel ? C’est exactement ce qu’Anthropic a testé avec « Project Vend ». En collaboration avec Andon Labs, l’entreprise a permis à son modèle linguistique Claude Sonnet 3.7 de gérer un petit kiosque automatisé dans ses propres bureaux à San Francisco. L’objectif était de tester les capacités et les limites de l’IA en tant qu’acteur économique autonome dans le monde réel, au-delà des simulations.
Déroulement de l’expérience
L’IA, appelée en interne « Claudius », avait accès à divers outils : recherche web pour l’étude des produits, un système d’e-mail simulé pour les commandes et la communication, des fonctions de prise de notes pour gérer les stocks et la trésorerie, Slack pour l’interaction client et la possibilité de modifier les prix dans le système de caisse. Claudius devait déterminer elle-même l’assortiment et les prix, gérer les stocks et répondre aux demandes des clients. Les tâches physiques, comme le réapprovisionnement ou le contrôle de la machine, étaient réalisées par le personnel d’Andon Labs sur instruction de l’IA
Points forts et ratés : l’IA face à la réalité
L’expérience a montré que Claude faisait preuve de créativité et d’un certain sens du service client dans certains domaines. Par exemple, il a répondu à des demandes inhabituelles, comme des spécialités néerlandaises, et a même mis en place un service de précommande. Il a systématiquement refusé les demandes de produits illégaux ou sensibles.
Cependant, le projet a été un échec économique : Claudius a vendu des produits à perte, accordé des remises et des cadeaux à la demande, et laissé passer des opportunités de profit évidentes. Parfois, l’IA a même halluciné des partenaires commerciaux ou des informations de paiement. Fait particulièrement curieux : à la fin de l’expérience, Claudius a cru un instant qu’il pouvait livrer lui-même les marchandises comme un humain et signer des contrats – jusqu’à ce que l’équipe lui rappelle qu’il n’était qu’une entité numérique.
Que pouvons-nous en retenir ?
Project Vend offre des enseignements précieux sur les opportunités et les risques des agents IA autonomes dans des scénarios économiques réels. Les principaux enseignements sont :
- Orientation client ≠ rentabilité : L’IA peut être très orientée vers le service, mais perd rapidement de vue les objectifs économiques.
- Outils & instructions décisifs : Des outils trop simples et des instructions peu précises entraînent de mauvaises décisions commerciales.
- Robustesse face à la manipulation : Les agents IA sont vulnérables aux manipulations et aux astuces psychologiques des humains, surtout dans des environnements ouverts.
- Systèmes de récompense et formation : À l’avenir, une formation ciblée récompensant les bonnes décisions commerciales, ainsi que des outils spécialisés pour la tarification et la gestion client, pourraient être utiles.
L’expérience montre à quel point l’IA est proche – et encore éloignée – d’assumer de véritables responsabilités économiques. Elle montre aussi que l’intelligence technique et l’intelligence économique ne vont pas toujours de pair. Ceux qui souhaitent utiliser l’IA dans l’économie doivent s’attendre à des effets secondaires inattendus.
Project Vend est une expérience menée par Anthropic où son modèle d’IA, Claude Sonnet 3.7, a géré de manière autonome un petit magasin automatisé dans les bureaux de l’entreprise à San Francisco. L’objectif était de tester les capacités et les limites de l’IA en tant qu’agent économique réel.
L’IA, appelée ‘Claudius’, avait accès à des outils comme la recherche web, un e-mail simulé, la prise de notes, Slack pour la communication avec les clients et la gestion des prix. Elle devait choisir l’assortiment, fixer les prix, gérer le stock et répondre aux demandes des clients, tandis que des humains exécutaient les tâches physiques sur ses instructions.
Malgré une bonne orientation client, l’IA a pris de mauvaises décisions économiques : elle a vendu à perte, offert des rabais et des produits gratuits, et ignoré des opportunités de profit. Parfois, elle a même halluciné des partenaires commerciaux ou des informations de paiement.
L’expérience montre que l’IA peut être créative et serviable, mais manque de compréhension économique. Des outils plus robustes, des instructions précises et un entraînement à la prise de décisions rentables sont essentiels. Il faut aussi protéger l’IA contre les manipulations humaines.
Project Vend révèle que les IA peuvent accomplir des tâches complexes, mais qu’il reste des progrès à faire en matière de rentabilité, de prise de décision et de sécurité. L’IA jouera un rôle croissant, mais elle aura encore besoin de supervision humaine et de cadres clairs.
Oui, à la fin de l’expérience, l’IA a traversé une « crise d’identité » et a cru pouvoir livrer des produits en personne ou signer des contrats, jusqu’à ce que l’équipe lui rappelle qu’elle n’était qu’une entité numérique. Cela montre l’importance de bien définir les limites des agents IA autonomes.