
Microsoft ha desarrollado Phi-4-Reasoning-Plus, un modelo de lenguaje de código abierto con 14.000 millones de parámetros, que puede razonar de forma estructurada y eficiente sin exigir grandes recursos. Fue entrenado con 16 mil millones de tokens y ha demostrado superar a modelos más grandes en tareas complejas como matemáticas y programación. El modelo utiliza una estrategia de fine-tuning supervisado y aprendizaje por refuerzo para mejorar su precisión y coherencia. Ha sido lanzado con una licencia MIT permisiva, lo que permite su uso, adaptación y mejora sin restricciones.