
La inteligencia artificial se pone a prueba jugando a Pokémon, específicamente Claude 3.7 y Gemini Pro 2.5 Experimental, en la versión de Pokémon para la Game Boy Advance. Claude se quedó atascado en una fase del juego, mientras que Gemini Pro 2.5 Experimental parece avanzar sin problemas. La versión de Pokémon para la Game Boy Advance es ideal para evaluar las capacidades de los modelos de IA debido a su simplicidad gráfica y jugabilidad por turnos. La ARC Prize Foundation también experimentó con el juego Snake, donde los modelos de razonamiento fueron los ganadores con un 78% de victorias.