En 2025 se esperaba que los agentes de IA fueran capaces de asumir proyectos completos y trabajar sin supervisión humana. Sin embargo, un estudio de Scale AI encontró que los modelos de IA más avanzados solo pueden realizar un 2,5% de tareas humanas de manera aceptable. El modelo Manus fue el que mejor rendimiento logró, con un 2,5% de entregas aceptables, seguido de Grok con un 2,1%, Claude con un 2,1%, GPT-5 con un 1,7% y Gemini 2.5 Pro con un 0,8%. Los expertos como Andrej Karpathy, cofundador de OpenAI, afirman que los agentes de IA no están listos para sustituir a las personas. Aunque la IA ha avanzado mucho, todavía no puede priorizar, contextualizar bien y entender matices o expectativas. El estudio evaluó proyectos freelance reales y los juzgó con un panel de 40 jueces como si fueran clientes humanos. Los proyectos abarcaban desde diseño de producto y desarrollo de videojuegos hasta análisis de datos y redacción de textos científicos. Microsoft había hablado de trabajadores de IA, pero la realidad es que la IA todavía no está lista para sustituir a las personas.