La inteligencia artificial ha avanzado significativamente con el desarrollo de DeepSeek-R1, un modelo que aprende a razonar sin intervención humana directa. El equipo de DeepSeek AI utilizó aprendizaje por refuerzo, premiando al modelo cuando obtenía respuestas correctas. Durante su entrenamiento, DeepSeek-R1 enfrentó problemas complejos de matemáticas, programación y ciencias, y comenzó a mostrar conductas propias del razonamiento humano. El modelo obtuvo un 86,7% de aciertos en el American Invitational Mathematics Examination 2024, superando a modelos anteriores entrenados con guía humana. Aunque todavía presenta fallos, el modelo tiene un gran potencial para transformar la forma en que desarrollamos IA, haciendo el proceso más eficiente y menos dependiente de intervenciones humanas continuas. El estudio se centra en un caso específico, pero sus implicaciones son amplias, desde asistentes virtuales más inteligentes hasta sistemas capaces de descubrir soluciones novedosas a problemas científicos o técnicos.