Google DeepMind ha presentado Gemini 2.5 Computer Use, un modelo que permite a los desarrolladores crear agentes capaces de interactuar con interfaces gráficas como si fueran humanos. El modelo se opera mediante la herramienta computer_use y puede navegar por webs, completar formularios y hacer clic en botones. Las pruebas internas y externas muestran que Gemini 2.5 Computer Use supera a sus competidores en benchmarks como Online-Mind2Web y WebVoyager, obteniendo puntuaciones de hasta 79.9%. El modelo está disponible en vista previa pública a través de la API de Gemini y su uso está restringido al nivel de pago. El precio es de 1,25 dólares por millón de tokens de entrada y hasta 15 dólares por millón de tokens de salida. Gemini 2.5 Computer Use representa un paso fundamental hacia agentes de IA verdaderamente autónomos.