
Los nuevos modelos de OpenAI, o3 y o4-mini, son más avanzados en tareas como la programación y las matemáticas, pero cometen más errores al inventarse información, un fenómeno conocido como alucinaciones en IA. En un benchmark llamado PersonQA, el modelo o3 alucinó en el 33% de los casos, mientras que el modelo o4-mini alcanzó un 48% de alucinaciones. La causa de esto no está clara, pero se cree que el tipo de aprendizaje por refuerzo utilizado en estos modelos podría estar amplificando ciertos errores. La industria está trabajando en soluciones, como integrar los modelos con capacidades de búsqueda web, para mejorar la precisión y reducir las alucinaciones.