Uh oh, Claude AI can now control your PC

Uh oh, Claude Ai ahora puede controlar tu PC

Soneto 3.5 de Claude. A partir de hoy, 23 de octubre de 2024, este modelo de lenguaje grande (LLM) puede asumir muchas funciones en su computadora. Sí, Claude AI puede imitar las interacciones humanas con su PC, desde mover el cursor hasta escribir, hacer clic y navegar.

Esta última actualización, denominada función “Uso de la computadora”, permite a Claude controlar el sistema mediante comandos simples. Al analizar lo que sucede en la pantalla, Claude puede automatizar tareas que antes requerían de la intervención directa del usuario. Por ejemplo, puede extraer información de una aplicación (como una hoja de cálculo) e ingresarla en otra, como un formulario en línea o un editor de documentos. En la demostración que mostró Anthropic, la IA fue capaz de completar formularios complejos de forma autónoma extrayendo y procesando datos en tiempo real.

Entonces, ¿cómo funciona? Claude se basa en capturas de pantalla de tu escritorio y utiliza esas imágenes para saber qué acciones realizar. La IA calcula cuánto mover el cursor o qué teclas presionar en función de lo que "ve" en la pantalla. Actualmente no es perfecto. Puede tener dificultades con acciones básicas como desplazarse y hacer zoom, pero es un avance impresionante.

Puedes acceder a esta función en versión beta a través de la API de Anthropic en plataformas como Vertex AI de Google Cloud y Bedrock de Amazon. Los desarrolladores ya están experimentando con sus capacidades para crear herramientas que automaticen todo, desde tareas administrativas simples hasta procesos de verificación de aplicaciones.

Los usuarios seguirán necesitando conceder permisos específicos, manteniendo un nivel de control sobre lo que la IA puede hacer. Pero, a medida que Claude continúa evolucionando, surgen preguntas sobre cuánta autonomía estamos dispuestos a ceder a los sistemas de IA y qué salvaguardas son necesarias para evitar un uso indebido. En resumen, esto marca un momento emocionante, un poco desconcertante, en el desarrollo de la IA. La pregunta no es solo "¿qué puede hacer Claude ahora?", sino "¿cuánto tiempo tardará en hacer aún más?". Esté atento a este espacio porque, con capacidades como esta, Claude está pasando rápidamente de ser un asistente a un operador autónomo.

Volver al blog

País/región

Idioma