
Los nuevos modelos de OpenAI, como o3 y o4-mini, han demostrado capacidades avanzadas en razonamiento y resolución de problemas complejos, pero también presentan una tasa de alucinaciones significativamente más alta que sus predecesores. Por ejemplo, o3 falló el 33% de las veces en una prueba de conocimientos personales (PersonQA), lo que supone el doble que modelos anteriores como o1 o o3-mini. A pesar de esto, estos modelos pueden realizar tareas increíbles, como crear un negocio para la venta de quesos por correspondencia en menos de dos minutos, incluyendo la invención de eslóganes, desarrollo de un plan financiero, análisis de la competencia, generación de un logotipo y construcción de un sitio web.