OpenAI o3: ¿Qué significa que su IA no cumpliera con los resultados prometidos?

La versión pública del modelo o3 no es la misma que se usó para los tests internos

La versión pública del modelo o3 no es la misma que se usó para los tests internos

OpenAI presentó su modelo de lenguaje o3, asegurando que había superado el test FrontierMath con un 25% de aciertos. Sin embargo, la versión pública del modelo mostró un rendimiento inferior, con solo un 10% de aciertos. La discrepancia se debe a que la versión pública no es la misma que se usó para los tests internos, que tenía una mayor potencia de procesamiento. El equipo de ARC Prize explicó que el modelo o3 que se lanzó al público no es exactamente el mismo que se usó para los tests internos, lo que generó confusión y debate en redes sociales.

Crítica:El artículo nos muestra cómo las empresas de tecnología pueden crear expectativas infladas y luego decepcionar a sus usuarios. La historia de OpenAI y su modelo o3 es un ejemplo perfecto de cómo la transparencia es fundamental en el desarrollo de la inteligencia artificial. ¿Quién necesita un modelo que puede superar un test matemático si no se puede replicar en la vida real? La moraleja de la historia es que debemos ser escépticos con los anuncios grandiosos y exigir más transparencia en la industria tecnológica.
fuente wwwhatsnew.com
22-04-2025 00:00

Tecnología
Resumir link
Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link
Los modelos o3 y o4-mini de OpenAI alucinan en un 33% y 48% de los casos, respectivamente

Los nuevos modelos de OpenAI son más inteligentes… pero también se inventan más cosas

Los nuevos modelos de OpenAI, o3 y o4-mini, son más avanzados en tareas como la programación y las matemáticas, pero cometen más errores al inventarse información, un fenómeno conocido como alucinaciones en IA. En un benchmark llamado PersonQA, el modelo o3 alucinó en el 33% de los casos, mientras que el modelo o4-mini alcanzó un 48% de alucinaciones. La causa de esto no está clara, pero se cree que el tipo de aprendizaje por refuerzo utilizado en estos modelos podría estar amplificando ciertos errores. La industria está trabajando en soluciones, como integrar los modelos con capacidades de búsqueda web, para mejorar la precisión y reducir las alucinaciones.
...es como un adolescente brillante que aún tiene mucho que aprender: promete mucho, pero a veces se inventa cosas. Aunque es interesante ver cómo los nuevos modelos de OpenAI están avanzando en tareas complejas, es preocupante ver cómo también están aumentando las alucinaciones. Esperemos que la industria pueda encontrar soluciones para mejorar la precisión y reducir las alucinaciones, porque de lo contrario, podríamos tener un problema en nuestras manos... o en nuestras máquinas.
wwwhatsnew.com Tecnología
15 minutos es suficiente para no perder el vuelo si se ha realizado el check-in online y solo se lleva equipaje de mano

Llevamos años esperando horas en los aeropuertos. La "teoría del aeropuerto" de TikTok cree que ha sido un error

La 'teoría del aeropuerto' en TikTok sostiene que si se ha realizado el check-in online y solo se lleva equipaje de mano, se puede llegar al aeropuerto 15 minutos antes de embarcar. Influencers como Michael DiCostanzo y Betsy Grunch han demostrado esta teoría en sus propios viajes, con más de 400 millones de visitas en TikTok. Sin embargo, profesionales de los aeropuertos advierten sobre los riesgos de presentarse con poca antelación, ya que los tiempos de espera en los controles de seguridad pueden variar. La teoría ha generado un debate en redes sociales, con algunos usuarios compartiendo sus experiencias y otros criticando la idea de llegar tan tarde al aeropuerto.
La 'teoría del aeropuerto' es un ejemplo perfecto de cómo las redes sociales pueden convertir una idea loca en una tendencia viral. ¿Quién necesita llegar al aeropuerto con antelación cuando se puede llegar 15 minutos antes y aún así tomar el vuelo? Es como si los influencers estuvieran compitiendo en un juego de 'quién puede llegar más tarde al aeropuerto sin perder el vuelo'. Mientras tanto, los profesionales de los aeropuertos se están tirando de los pelos, advirtiendo sobre los riesgos de esta teoría. En resumen, la 'teoría del aeropuerto' es un ejemplo de cómo las redes sociales pueden ser tanto divertidas como peligrosas.
www.xataka.com Tecnología
Edits es una aplicación gratuita para editar vídeos y crear Reels de manera profesional

Instagram Edits: qué es, para qué sirve y qué funciones ofrece el nuevo editor de vídeos de Meta

Edits es una aplicación de edición de vídeo creada por Meta para Instagram, que permite realizar composiciones y crear Reels de manera profesional. La aplicación es gratuita y está disponible en Google Play y la App Store. Ofrece funciones como edición de vídeos, añadir audio, texto o voz, crear subtítulos, superposiciones y efectos de sonido. También incluye una sección de estadísticas para ver el alcance y los datos de los Reels de la cuenta de Instagram.
...es una presentación detallada de la aplicación Edits, pero no aporta nada nuevo o sorprendente. Es como si Meta hubiera decidido crear su propia versión de CapCut y luego hubiera escrito un artículo para explicar por qué es tan genial. En fin, si eres un creador de contenido, probablemente te gustaría saber que hay una nueva herramienta para editar tus vídeos, pero si no, puedes seguir durmiendo tranquilamente.
www.xataka.com Tecnología
La Comisión Europea ha multado a Apple con 500 millones de euros por no cumplir con la DMA

La Comisión Europea multa a Apple con 500 millones de euros. Y Apple ya tiene una respuesta

La Comisión Europea ha multado a Apple con 500 millones de euros por infringir la Ley de Mercados Digitales (DMA) al no permitir que los desarrolladores de aplicaciones informen a sus clientes sobre opciones alternativas fuera de la App Store. Apple ya ha anunciado que apelará la decisión. La multa supone alrededor del 0,15% de la facturación anual de Apple. La Comisión Europea también ha sancionado a Meta con 200 millones de euros por no cumplir con la DMA en su modelo de negocio publicitario.
La noticia es un golpe para Apple, pero la multa de 500 millones de euros es solo un pequeño pinchazo en su gran bolsillo. Lo que realmente duele es la pérdida de control sobre su ecosistema cerrado. La Comisión Europea está decidida a abrir las puertas a la competencia y a dar más opciones a los usuarios. ¡Viva la libertad de elección! (O al menos, viva la libertad de elegir entre varias opciones de aplicaciones)
www.applesfera.com Tecnología
Pronto podrás comunicarte con tus contactos desde cualquier navegador compatible

WhatsApp Web incorporará llamadas de voz y video: una mejora esperada

WhatsApp Web incorporará llamadas de voz y video, permitiendo a los usuarios comunicarse directamente desde el navegador sin necesidad de instalar aplicaciones adicionales. Esta función está en desarrollo y se espera que se lance en los próximos meses. La implementación de llamadas en WhatsApp Web podría transformar la forma en que las personas gestionan su comunicación, especialmente en entornos laborales.
...promete una revolución en la comunicación, pero en realidad solo nos dice que WhatsApp Web va a dejar de ser un pobre primo de la aplicación móvil. Aun así, es un paso adelante y nos ahorrará tener que cambiar de dispositivo para hacer una videollamada. ¡Eso es progreso!
wwwhatsnew.com Tecnología
La aplicación Meta AI utiliza el modelo de lenguaje Llama 4 para ofrecer interacciones más humanas y fluidas

Meta lanza su nueva aplicación Meta AI: una experiencia personalizada y conversacional

Meta ha lanzado la aplicación Meta AI, que ofrece un asistente virtual personalizado y conversacional.
La aplicación Meta AI parece ser un paso adelante en la tecnología de asistentes virtuales, pero ¿será capaz de mantener la conversación sin que nos quede la sensación de que estamos hablando con un robot? Solo el tiempo lo dirá. Mientras tanto, podemos disfrutar de la novedad de tener un asistente que nos entiende... o al menos, eso es lo que promete.
wwwhatsnew.com Tecnología
Decenas de millones de dólares

La amabilidad con ChatGPT le está saliendo cara a OpenAI: los "por favor" y "gracias" tienen un coste absurdo cada mes

El CEO de OpenAI, Sam Altman, reveló que la amabilidad de los usuarios con ChatGPT, como decir 'por favor' y 'gracias', cuesta decenas de millones de dólares al mes. Esto se debe al consumo de recursos y electricidad necesarios para ejecutar los modelos de lenguaje. Un estudio encontró que la cortesía en las indicaciones puede mejorar el rendimiento de los chatbots, pero el exceso de cortesía no garantiza mejores resultados.
El costo de ser amable con las máquinas es un tema interesante, pero el artículo podría profundizar más en los detalles técnicos y económicos detrás de este fenómeno. Sin embargo, es divertido imaginar a un robot sonriendo y diciendo 'gracias' después de cada interacción, ¡quizás sea el comienzo de una revolución en la educación de las máquinas!
www.xataka.com Tecnología
Los humanos ganaron con un tiempo de 1 hora y 2 minutos

China enfrenta a robots humanoides contra humanos en una media maratón. Ganaron los humanos

En la Media Maratón Internacional de Pekín, 21 robots humanoides compitieron contra 10.000 atletas humanos. Solo 6 robots completaron el recorrido de 21,1 kilómetros, con el Tiangong Ultra siendo el más rápido en 2 horas y 40 minutos. El ganador humano cruzó la meta en 1 hora y 2 minutos. La carrera fue un test para evaluar la resistencia y funcionalidad de los robots en entornos reales.
La noticia es un ejemplo perfecto de cómo la tecnología puede ser emocionante, pero también un poco decepcionante. Los robots humanoides pueden correr, pero no exactamente como los humanos. Aun así, es un paso hacia adelante en la investigación y el desarrollo de la robótica. ¿Quién sabe? Tal vez en un futuro no muy lejano, los robots serán los que nos estén dando vueltas en la pista.
www.esdiario.com Tecnología
Meta copia funciones de otras aplicaciones para atraer a los creadores de contenido

Meta ha hecho fortuna copiando y reciclando las ideas de sus competidores: con Edits, TikTok lo ha vuelto a comprobar

Meta ha lanzado Instagram Edits, una aplicación de edición de vídeo corto que copia funcionalidades de CapCut, una aplicación de Bytedance. Esto se produce después de que el gobierno de Donald Trump prohibiera TikTok y CapCut en enero. Edits se lanza en un momento de incertidumbre para las aplicaciones de Bytedance. Los creadores de contenido son clave para Meta, y la empresa busca atraerlos con herramientas como Edits. La aplicación tiene 27 millones de usuarios y es la séptima aplicación más descargada a nivel mundial. Meta ha copiado funciones de otras aplicaciones en el pasado, como Instagram Stories, que se inspiró en Snapchat.
...es un ejemplo perfecto de cómo Meta sigue la estrategia de 'copiar para matar', pero lo que realmente mata es la creatividad. Es como si Meta estuviera diciendo: 'No necesitamos innovar, solo copiar y mejorar un poco'. Pero, en serio, ¿quién necesita originalidad cuando puedes copiar y pegar?
www.xataka.com Tecnología
La versión 14.2 de Android Auto incluye un nuevo icono de micrófono y compatibilidad con gafas inteligentes

Android Auto 14.2 oficial: novedades y cómo descargar la última versión estable

Android Auto 14.2 es la nueva versión del sistema operativo para coches, que incluye un nuevo icono de micrófono en blanco, compatibilidad con gafas inteligentes y mejoras en la estabilidad y compatibilidad con nuevos modelos de vehículo. La actualización está disponible a través de Google Play o mediante la descarga manual del APK desde APKMirror. La versión es 14.2 y se puede instalar en móviles con arquitectura ARM o ARM64.
...es un resumen decente de las novedades de Android Auto 14.2, pero no es exactamente un artículo explosivo. La noticia es más bien un susurro en el viento, pero al menos nos informa de que hay una nueva versión. ¡Y eso es algo, supongo! La compatibilidad con gafas inteligentes es un paso interesante, pero no es como si fuera a revolucionar la forma en que conducimos... todavía.
www.xataka.com Tecnología
El Smart #3 Brabus tiene 428 CV de potencia

Smart #3, análisis: este coche eléctrico es tan irracional e ilógico como sus 428 CV y por eso te enamora

El Smart #3 Brabus es un coche eléctrico con 315 kW (428 CV) de potencia, 415 km de autonomía homologada y un precio de 54.399 euros. Tiene un diseño coupé y una tecnología de carga de 150 kW. El coche es divertido de conducir, especialmente en carreteras secundarias, pero tiene algunos problemas con la tecnología de infoentretenimiento y la ausencia de mandos físicos. La autonomía real es de unos 250 km si se conduce de manera agresiva, pero puede alcanzar los 300 km a velocidades sostenidas de autopista.
...es un análisis detallado del Smart #3 Brabus, pero el título es un poco engañoso. En lugar de ser un análisis serio, el artículo se centra en la emoción y la diversión de conducir este coche eléctrico. La crítica constructiva es que el artículo podría profundizar más en los aspectos técnicos y prácticos del coche, en lugar de centrarse solo en la experiencia de conducción. Sin embargo, el artículo es bien escrito y ofrece una visión interesante del Smart #3 Brabus.
www.xataka.com Tecnología
La Cosori Turbo Tower Pro Smart Chef Edition es una freidora de aire con dos cestas independientes que ahorra espacio en casa

El problema fundamental de las freidoras de aire es que son armatostes enormes. Cosori tiene una solución: una "litera"

Cosori ha lanzado la Turbo Tower Pro Smart Chef Edition, una freidora de aire con dos cestas independientes y capacidad para cocinar hasta tres platos al mismo tiempo, con un ancho de 30 centímetros y un alto de 40,5 centímetros, ocupando el mismo espacio en la encimera que un modelo básico. La freidora tiene una capacidad total de 10,8 litros, con una cesta superior de 4,3 litros y una inferior de 6,5 litros. El precio es de 279,99 euros y se puede comprar en la web del fabricante y en plataformas como Amazon o El Corte Inglés.
...promete una solución innovadora al problema del tamaño de las freidoras de aire, y Cosori no defrauda. La Turbo Tower Pro Smart Chef Edition es un diseño inteligente que ahorra espacio en casa sin sacrificar capacidad. Sin embargo, el precio de 279,99 euros puede ser un obstáculo para algunos compradores. En resumen, una excelente opción para aquellos que buscan una freidora de aire potente y compacta, pero no para los que buscan una ganga.
www.xataka.com Tecnología
Share on Whatsapp Share on X Share on LinkedIn Share by Mail Copiar enlace