
DeepSeek ha presentado el modelo R1 0528, una actualización que se ha situado como líder indiscutible entre los modelos de IA de código abierto, alcanzando el segundo puesto mundial en el Artificial Analysis Intelligence Index. Ha superado a modelos como Grok 3 mini, Llama 4 Maverick y Anthropic con Claude 4, con 68 puntos en el índice, mejorando en áreas como AIME 2024, LiveCodeBench y Humanity's Last Exam. La clave del éxito ha sido el poder post-entrenamiento, demostrando la importancia de las técnicas de post-entrenamiento y el aprendizaje por refuerzo (RL).