Dreamer 4, desarrollado por Google DeepMind, es un agente de inteligencia artificial que aprende sin practicar en el mundo real. Utiliza un modelo de mundo para aprender, anticipando consecuencias antes de actuar. Ha sido capaz de obtener diamantes en Minecraft sin haber jugado nunca en tiempo real, solo con videos pregrabados de humanos jugando. El modelo utiliza un transformador eficiente para predecir observaciones futuras y acciones, y ha sido entrenado con un conjunto de datos fijo de grabaciones de partidas humanas en Minecraft. Dreamer 4 puede aprender con apenas cientos de horas de datos de acción, lo que abre la puerta a un futuro donde los robots podrán entrenarse a partir de videos disponibles en internet. Los investigadores planean dotar al agente de una memoria de largo plazo y comprensión del lenguaje natural. Danijar Hafner, autor principal del proyecto, destaca que los robots no pueden permitirse cometer errores durante el aprendizaje, por lo que el modelo es ideal para entrenar robots físicos. El modelo es lo suficientemente ligero como para funcionar en una sola GPU, permitiendo interacciones en tiempo real.