Claude d'Anthropic peut désormais contrôler les ordinateurs comme les gens le font
Posted by pourbatterie
from the Business category at
23 Oct 2024 01:05:50 am.
Le déjà impressionnant Claude 3,5 Sonnet d'Anthropic gagne une augmentation significative des performances mardi alors que la startup générative IA déploie une version améliorée et mise à jour du modèle aux côtés du nouveau et léger Claude 3,5 Haiku. La mise à jour de Sonnet comprend une fonctionnalité bêta publique qui donne à l'IA un contrôle de base sur l'ordinateur sur lequel il fonctionne.
>>D1000EPS-00 PourDELL
Dell Alienware Aurora R13 R14
Claude 3,5 Sonnet était déjà un leader des performances en matière de tâches de codage, mais la nouvelle version montre des améliorations globales significatives par rapport à son prédécesseur et surpasse régulièrement Gemini 1,5 et GPT-4o sur une variété de benchmarks de l'industrie. Gemini 1,5 Pro était le seul modèle à avoir surpassé le nouveau 3,5 Sonnet sur tous les tests, et l'a fait sur le benchmark MATH.
Le nouveau 3,5 Haiku n'est pas en reste non plus, malgré sa petite taille. Prévu pour être publié plus tard ce mois-ci, le 3,5 Haiku surpasse Claude 3,0 Opus, le plus grand modèle de dernière génération de la société. Comme sa version plus grande, le nouveau Haiku est extrêmement compétent dans les tâches de codage, obtenant 40,6 % sur le banc SWE Verified - supérieur à la fois au GPT-40 et au 3,5 Sonnet original.
Encore plus impressionnant, le nouveau Claude 3,5 Sonnet peut désormais interagir avec les applications de bureau via l'API "Utilisation de l'ordinateur". L'IA peut générer les frappes, les clics de souris et les mouvements nécessaires pour émuler l'utilisateur humain. La société ne tarde pas à souligner que le système est actuellement assez expérimental et sujet aux erreurs. L'objectif sous-jacent de la version bêta publique est de susciter les commentaires des développeurs afin d'améliorer rapidement les performances de l'API.
"Nous avons formé Claude à voir ce qui se passe sur un écran, puis à utiliser les outils logiciels disponibles pour effectuer des tâches", a écrit Anthropic dans un article de blog. "Lorsqu'un développeur charge Claude d'utiliser un logiciel informatique et lui donne l'accès nécessaire, Claude regarde des captures d'écran de ce qui est visible pour l'utilisateur, puis compte le nombre de pixels verticalement ou horizontalement dont il a besoin pour déplacer un curseur afin de cliquer au bon endroit".
>>BL-34BT PourTECNO
Tecno BL-34BT
C'est un agent IA, essentiellement. Autrement dit, c'est une IA qui peut automatiser d'autres processus logiciels, qu'il s'agisse de générer et de qualifier des prospects marketing, de découvrir des modèles et des tendances dans les données médicales, ou simplement de naviguer vers un site Web spécifique et de remplir un formulaire dont vous avez besoin. Considérez-les comme une version plus avancée des systèmes d'automatisation des processus robotiques existants.
La société cite Asana, Canva, Cognition, DoorDash, Replit et The Browser Company comme les premiers à adopter la nouvelle fonctionnalité. Replit, par exemple, utilise Computer Control pour "développer une fonctionnalité clé qui évalue les applications au fur et à mesure de leur construction pour leur produit Replit Agent", selon l'annonce.
Il n'y a pas besoin de s'inquiéter du fait que l'IA passe tout Skynet sur nous (pour le moment), comme l'explique Anthropic. "Les humains gardent le contrôle en fournissant des invites spécifiques qui dirigent les actions de Claude, comme" utiliser les données de mon ordinateur et en ligne pour remplir ce formulaire "", a déclaré un porte-parole d'Anthropic à TechCrunch ". Les gens activent l'accès et limitent l'accès au besoin. Claude décompose les invites de l'utilisateur en commandes informatiques (par exemple, déplacer le curseur, cliquer, taper) pour accomplir cette tâche spécifique".
Anthropic admet également que le contrôle informatique pourrait être utilisé à mauvais escient pour générer du spam, diffuser de la désinformation ou commettre une fraude. En réponse, la société a développé de nouveaux classificateurs qui identifient quand l'API est utilisée et si cette utilisation "cause un préjudice".
0 Comments