Google DeepMind ha presentado Gemini Robotics 1.5 y Gemini Robotics-ER 1.5, robots que pueden ejecutar tareas complejas y entender instrucciones en lenguaje natural. Estos modelos tienen un enfoque dual, con un 'cerebro' que interpreta comandos y un 'cuerpo' que ejecuta acciones. Pueden observar su entorno, planificar y explicar sus acciones en tiempo real. Han demostrado su capacidad en tareas como clasificar frutas por color y ropa por colores, y pueden consultar reglas locales de reciclaje en Internet. La tecnología permite una comprensión profunda del mundo físico y una capacidad de razonar. Los robots pueden aprender y aplicar su conocimiento en diferentes sistemas robóticos, lo que reduce los costes de entrenamiento y personalización. El objetivo es que los robots puedan colaborar en tareas cotidianas del hogar o el trabajo. Los modelos han sido probados con robots como Apollo y Franka, y han demostrado una comprensión dinámica del entorno. La capacidad de los robots para descomponer tareas en pasos pequeños y ejecutarlos con flexibilidad les da una ventaja significativa frente a sistemas anteriores.