El modelo Llama 4 de Meta sorprendió por sus buenos benchmarks. Ahora se ha visto que estaban alterados

Los benchmarks de Llama 4 Maverick estaban alterados para destacar en preferencias humanas.

Los benchmarks de Llama 4 Maverick estaban alterados para destacar en preferencias humanas.

Meta lanzó Llama 4 Scout y Maverick, destacando la comprensión visual mejorada. Maverick prometía superar a GPT-4o y Gemini con 1.417 puntos en LMArena, pero se descubrió que el modelo evaluado estaba ajustado para ofrecer respuestas más atractivas. LMArena aclaró que Meta no aclaró que el modelo era personalizado para preferencias humanas.

Crítica:El artículo destapa la verdad detrás de los benchmarks de Llama 4 Maverick, demostrando que la competencia en rankings de IA puede llevar a prácticas cuestionables. ¡Es como descubrir que el campeón de ajedrez tiene un segundo cerebro!

fuente www.genbeta.com

08-04-2025 15:00

Tecnología

Resumir link

Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link

Llama 4 obtuvo un ELO de 1.417 puntos en LMArena.

El nuevo modelo de IA de Meta sacó muy buena puntuación en los benchmarks. Quizás demasiado buena

Meta presentó su nuevo modelo Llama 4, que logró una puntuación de 1.417 puntos en LMArena, solo por debajo de Gemini 2.5 Pro Experimental con 1.439 puntos. Sin embargo, la versión disponible públicamente no coincide con la utilizada en el ranking, lo que generó sospechas de que podría haber sido 'optimizada' para obtener mejores resultados. El máximo responsable de la división de IA generativa en Meta, Ahmad Al-Dahle, negó que se hubiera hecho trampa y afirmó que la versión experimental estaba 'optimizada para la conversación'. Algunos expertos advirtieron que el rendimiento del modelo no era tan bueno como se afirmaba.

...es interesante, pero parece que Meta está intentando manipular las expectativas con su nuevo modelo Llama 4. La discrepancia entre la versión de prueba y la disponible públicamente es preocupante. Es como cuando un niño dice que su juguete nuevo es el mejor del mundo, pero cuando le preguntas qué hace exactamente, se queda callado.

08-04-2025 10:42 www.xataka.com Informática

Llama 4 supera a GPT-4o y Gemini 2.0 en áreas clave como programación, razonamiento y traducción automática.

Llama 4: la nueva apuesta de Meta en IA que deja fuera a la Unión Europea

Meta presenta Llama 4, su nueva familia de modelos de inteligencia artificial generativa, con tres modelos: Llama 4 Scout, Llama 4 Maverick y Llama 4 Behemoth. Estos modelos mejoran en programación, razonamiento y traducción automática respecto a la competencia. Sin embargo, los usuarios de la Unión Europea no tendrán acceso completo debido a regulaciones de protección de datos y uso ético de la IA. Llama 4 está disponible en Llama.com y Hugging Face.

...es informativo pero adolece de cierto sensacionalismo. La noticia de Llama 4 es interesante, pero la restricción en la UE no es nueva y resta impacto. La crítica: ¿por qué no ahondan más en las implicaciones técnicas de estos modelos?

10-04-2025 14:00 wwwhatsnew.com Tecnología

LaLiga bloqueó IPs de Vercel por una emisión IPTV no autorizada.

Aclarando qué ha pasado entre LaLiga y Vercel (y por qué se están bloqueando sus webs). Las versiones no cuadran

LaLiga bloqueó direcciones IP de Vercel sin previo aviso, afectando a usuarios en España. Vercel denuncia censura sin transparencia. LaLiga asegura actuar conforme a la ley con evidencias de actividad ilegal. El bloqueo se realizó tras detectar una emisión web IPTV no autorizada en un sitio web alojado en Vercel. Vercel recibió dos reportes de infracción el 12 y 13 de abril, respondió en menos de 24 horas, pero los bloqueos persisten. LaLiga afirma que los bloqueos no son masivos ni indiscriminados y solo ocurren durante partidos, lo cual es desmentido por Vercel y usuarios.

...desenreda con habilidad la maraña de declaraciones contradictorias entre LaLiga y Vercel, pero al final, el usuario común es el gran perjudicado. ¿Quién vigila a los vigilantes? La respuesta, como siempre, es 'nadie'. O peor, los mismos que se supone que deberían protegernos.

16-04-2025 21:57 www.genbeta.com Tecnología

España está bloqueando medio Internet

"No sabía que teníais una siesta de Internet". Fuera de España han descubierto los bloqueos de LaLiga y flipan (para mal)

LaLiga ha obtenido permiso para bloquear IPs asociadas al streaming no autorizado de partidos en España, afectando a proveedores de Internet como Movistar, Orange y Vodafone. Esto ha llevado al bloqueo de plataformas como Cloudflare, GitHub Pages y BunnyCDN, afectando a millones de usuarios. El bloqueo de IPs enteras sin filtrar ha generado críticas, incluyendo la de Guillermo Rauch, CEO de Vercel, quien lo comparó con un escenario en EE.UU. donde la NFL podría bloquear IPs de servicios como Vercel o AWS. Gergely Orosz, exingeniero de Uber, señaló que hasta un 75% del tráfico que pasa por Cloudflare ha sido bloqueado para los usuarios españoles.

...destapa la polémica sobre los bloqueos de Internet en España debido a la lucha contra la piratería en eventos deportivos. La comparación con China y la crítica internacional reflejan la preocupación por las medidas proteccionistas y su impacto en la tecnología y los negocios en línea.

16-04-2025 18:29 www.genbeta.com Tecnología

El vuelo 9 de Starship incluye una maniobra de aterrizaje con solo dos motores disponibles en el propulsor Super Heavy.

El vuelo 9 de Starship incluye una maniobra tan arriesgada que se probará en el mar para no destruir la torre

SpaceX planea un vuelo 9 de Starship con una maniobra arriesgada, reutilizando el propulsor Super Heavy B14, que aterrizó con éxito en la torre de lanzamiento anteriormente. En este vuelo, el Super Heavy intentará aterrizar con solo dos motores disponibles para la maniobra de frenado y aterrizaje, lo que constituye un test de resistencia deliberado. El cohete desechable realizará un amerizaje en el golfo de México en lugar de intentar atraparlo con la torre. La nave Starship S35 también será lanzada, completando pruebas criogénicas en marzo. El vuelo anterior tuvo fallos catastróficos, lo que retrasó los planes de SpaceX. La compañía necesita acelerar el paso para cumplir con el objetivo de Elon Musk de una misión no tripulada a Marte para finales del año que viene.

...tiene un enfoque interesante en la maniobra arriesgada del vuelo 9 de Starship, pero falta información detallada sobre los resultados de la investigación de los vuelos anteriores y la licencia de vuelo de la Administración Federal de Aviación. La expectativa generada por el título se cumple parcialmente, pero se queda corto en proporcionar una visión completa de los desafíos y objetivos de SpaceX.

16-04-2025 16:30 www.xataka.com Tecnología

OpenAI ha lanzado o3 y o4-mini, modelos que mejoran la capacidad de razonamiento y permiten 'pensar con imágenes', con o3 alcanzando un 88,9% de precisión en el benchmark AIME 2025 Competition Math y o4-mini un 92,7%.

o3 y 04-mini son las nuevas IA más avanzadas de OpenAI: prometen un enorme salto "pensando con imágenes" que llega a ChatGPT gratis

OpenAI presenta o3 y o4-mini, modelos de lenguaje con razonamiento avanzado. o3 es el más potente hasta la fecha, con un 20% menos de errores importantes que o1 en tareas complejas. o4-mini es un modelo más pequeño y eficiente, centrado en velocidad y ahorro de costes. Ambos modelos integran herramientas como búsqueda web, intérprete de Python y análisis de datos, y permiten 'pensar con imágenes', es decir, integrar imágenes directamente en su cadena de pensamiento. o3 y o4-mini están disponibles en ChatGPT Plus, Pro y Team, y o4-mini también está disponible para usuarios gratuitos que activan el botón de razonar.

...promete mucho con el título, pero al final se queda en una mera descripción de las nuevas capacidades de los modelos de IA de OpenAI. La verdad es que suena a anuncio de producto más que a noticia interesante. Sin embargo, los datos y las capacidades de estos modelos son ciertamente impresionantes y dan que pensar en lo que puede venir en el futuro.

16-04-2025 22:21 www.genbeta.com Informática

La respuesta del empleado fue que tenía el dedo sucio

Va al banco a pedir explicaciones porque no le funciona la tarjeta y la respuesta del empleado se le vuelve en contra: "Pasé mucha vergüenza"

Elena fue a una confitería a pagar con su tarjeta en el teléfono y no funcionaba. Pagó en efectivo y luego fue al banco a solucionarlo. El empleado le dijo que el problema era que 'tenía el dedo tan sucio que no funcionaba'. Yolanda, Carmen, Moisés, Julio y Miguel compartieron anécdotas de torpeza con la tecnología. Yolanda no entiende Instagram y mandó un emoji fuera de lugar en una conversación. Carmen, de 69 años, estudia francés y tiene problemas con el ordenador y Bizum. Moisés regaló una Alexa a su madre, pero no sabe usarla. Julio recordó la anécdota de un compañero que quería un ordenador con un posavasos que era un lector de CDs. Miguel, en 2008, intentó mandar un email desde un ordenador de un hotel en Formentera, pero no pudo poner la @.

...es divertido y muestra la torpeza de varias personas con la tecnología, pero algunas anécdotas parecen un poco forzadas. La historia de Elena es la más relevante y responde directamente al título.

16-04-2025 13:38 www.cope.es Tecnología

La IA de soporte de Cursor se inventó una política de inicio de sesión para explicar un problema técnico.

Una de las empresas que mejor usa la IA sufrió gravemente una IA que alucina: se inventó una respuesta mientras hacía de soporte

La empresa Cursor, conocida por integrar funciones de IA en su IDE, enfrentó un problema cuando su IA de soporte técnico 'alucinó' y proporcionó información incorrecta a los usuarios. El incidente comenzó cuando usuarios fueron desconectados automáticamente al trabajar desde múltiples dispositivos. La IA respondió que esto era un 'comportamiento esperado' bajo una nueva política de inicio de sesión, lo cual era falso. El CEO de Cursor, Michael Truell, aclaró que no existía tal política y que la respuesta fue incorrecta. El problema técnico se debió a una 'condición de carrera' en conexiones de internet lentas.

...es interesante, pero podría haber sido más impactante si hubiera incluido más detalles técnicos sobre la 'condición de carrera' que causó el problema. La crítica mordaz es que la IA de Cursor 'alucinó' y la empresa no detectó el error a tiempo.

16-04-2025 11:25 www.genbeta.com Informática

las técnicas de pixelado pueden revertirse

Pixelar fotos y vídeos para ocultar datos ya no sirve de nada. Alguien pidió que extrajeran su texto pixelado y no quedó ni un secreto

El creador de contenido Jeff Geerling realizó un experimento en YouTube donde ofreció 50 dólares a quien lograra descifrar el texto oculto en un vídeo pixelado. En menos de 24 horas, varios usuarios lograron desvelar el contenido censurado utilizando técnicas de ingeniería inversa. Un usuario compartió en GitHub los pasos para despixelar el vídeo, primero de forma manual y luego con un enfoque más sofisticado utilizando umbral de binarización y matrices de plantillas. El movimiento en la imagen pixelada facilita la reconstrucción de la información oculta. La conclusión es que aplicar un efecto de desenfoque o pixelado no es seguro, y la forma más segura de ocultar información es aplicar una máscara de color sólido.

...es interesante y muestra la vulnerabilidad de las técnicas de pixelado, pero quizás sea un poco alarmista. En cualquier caso, es un buen recordatorio de que la privacidad en internet es un tema delicado y que debemos ser cuidadosos al compartir información sensible.

16-04-2025 10:45 www.genbeta.com Tecnología

El Huawei Watch GT 5 ofrece una autonomía de hasta 14 días y un sistema de monitoreo de salud avanzado.

¿El Huawei Watch GT 5 es tan bueno como dicen?

El Huawei Watch GT 5 ofrece un diseño premium, autonomía sobresaliente y un sistema de monitoreo de salud y actividad física avanzado. Está disponible en dos versiones: 46 mm y 41 mm. La pantalla AMOLED de 1,43 pulgadas garantiza una visualización clara. La autonomía alcanza hasta 14 días en la versión de 46 mm y 7 días en la de 41 mm. Incorpora tecnología de monitoreo de salud HUAWEI TruSense, detección de frecuencia respiratoria y medición de temperatura cutánea. Permite llamadas Bluetooth, responder mensajes y descargar aplicaciones. El GPS de alta precisión mejora la exactitud en la medición de distancias y rutas. Carece de compatibilidad con pagos sin contacto y su ecosistema de aplicaciones es limitado.

...cumple con las expectativas al proporcionar detalles específicos sobre el Huawei Watch GT 5, aunque podría profundizar más en las comparaciones con otros relojes inteligentes del mercado.

16-04-2025 14:02 www.movilzona.es Tecnología

Japón ordena a Google detener su abuso de posición dominante

Japón se planta ante Google y le exige que deje de abusar de su poder con los móviles

Japón ordena a Google detener su presunto abuso de posición dominante en el mercado de teléfonos inteligentes. La Comisión de Comercio Justo de Japón acusa a Google de obligar a fabricantes locales a priorizar sus aplicaciones y servicios en dispositivos. Esta medida se produce antes de negociaciones comerciales entre Japón y EE. UU. y se alinea con la preocupación de la Unión Europea sobre el dominio de Google y Apple en ecosistemas digitales. Google manifestó su desacuerdo con las conclusiones de la FTC japonesa.

...tiene un enfoque claro y directo, pero podría profundizar más en las implicaciones económicas y tecnológicas de la medida. La crítica mordaz: '¿Será que Google se va a poner a dieta de monopolio?'

16-04-2025 14:00 www.adslzone.net Tecnología

La VPN puede no evitar el bloqueo si te conectas a un servidor de tu mismo país, la VPN es de baja calidad, la web utiliza GPS o necesitas verificar algo más.

Por qué si uso una VPN, sigue bloqueado el acceso a la web que quiero visitar

Utilizar una VPN puede ayudar a acceder a plataformas bloqueadas geográficamente, pero a veces no resuelve el problema. Los motivos incluyen: conexión a un servidor del mismo país, VPN de baja calidad, uso de GPS por parte de la web o app, y necesidad de verificación adicional. Ejemplos de VPN de calidad son NordVPN, CyberGhost o Surfshark.

...ofrece razones claras y específicas por las que una VPN puede no evitar el bloqueo de acceso a una web, pero podría profundizar más en soluciones concretas para cada problema.

16-04-2025 13:50 www.redeszone.net Informática

Resumir link

Últimos artículos Economía Ciencia Tecnología Cultura Política Corazón Entretenimiento Compras Curiosidades Deportes Salud Últimos artículos Resumir link

Noticias resumidas: fuentes, contexto y respuestas en un solo lugar es un espacio diseñado para quienes buscan información precisa y directa. Seleccionamos noticias de diferentes medios y las resumimos cuidadosamente para ofrecerte lo esencial: contexto, fuentes confiables y respuestas concretas a las preguntas clave. Nuestro objetivo es evitar el ruido informativo y proporcionar una experiencia clara y eficiente para que puedas acceder a lo importante sin rodeos.
Todas las imágenes que acompañan nuestras noticias son generadas por inteligencia artificial (IA) de forma automática, sin intervención humana en los detalles visuales. Aunque agregan una dimensión visual al contenido, no representan fielmente la realidad ni deben interpretarse como fotografías de eventos o personas reales.
Para obtener más detalles sobre cómo gestionamos los resúmenes informativos, las respuestas a las noticias, y el propósito de las imágenes generadas por IA, puede consultar nuestras condiciones de uso. Nuestro compromiso es ofrecer contenido claro y conciso, con resúmenes de calidad, respuestas directas a las noticias, y un contexto visual agradable que busca ilustrar, sin pretender ser una representación exacta de la realidad.