
El modelo open source de DeepSeek le habla 'de tú a tú' a los grandes de la IA: están 'haciendo magia' a la hora de mejorarlo
DeepSeek ha presentado el modelo R1 0528, una actualización que se ha situado como líder indiscutible entre los modelos de IA de código abierto, alcanzando el segundo puesto mundial en el Artificial Analysis Intelligence Index. Ha superado a modelos como Grok 3 mini, Llama 4 Maverick y Anthropic con Claude 4, con 68 puntos en el índice, mejorando en áreas como AIME 2024, LiveCodeBench y Humanity's Last Exam. La clave del éxito ha sido el poder post-entrenamiento, demostrando la importancia de las técnicas de post-entrenamiento y el aprendizaje por refuerzo (RL).
...promete una 'magia' en la inteligencia artificial, pero en realidad, es solo una demostración de cómo el post-entrenamiento y el aprendizaje por refuerzo pueden hacer que un modelo de IA sea más potente. No es exactamente 'magia', pero es una noticia interesante que muestra cómo la tecnología está avanzando. Sin embargo, el título podría ser más preciso y menos sensacionalista.