La paradoja de que los nuevos modelos de OpenAI alucinen más que sus antecesores mientras son capaces de hacer cosas increíbles

Los modelos de OpenAI alucinan más a pesar de ser más avanzados.

Los modelos de OpenAI alucinan más a pesar de ser más avanzados.

Los nuevos modelos de OpenAI, como o3 y o4-mini, han demostrado capacidades avanzadas en razonamiento y resolución de problemas complejos, pero también presentan una tasa de alucinaciones significativamente más alta que sus predecesores. Por ejemplo, o3 falló el 33% de las veces en una prueba de conocimientos personales (PersonQA), lo que supone el doble que modelos anteriores como o1 o o3-mini. A pesar de esto, estos modelos pueden realizar tareas increíbles, como crear un negocio para la venta de quesos por correspondencia en menos de dos minutos, incluyendo la invención de eslóganes, desarrollo de un plan financiero, análisis de la competencia, generación de un logotipo y construcción de un sitio web.

Crítica:El artículo plantea una crítica mordaz sobre la situación actual de la IA, donde los avances en capacidades de razonamiento vienen acompañados de un aumento en las alucinaciones, lo que pone en riesgo su adopción en sectores críticos. La ironía de hacer a los modelos más 'inteligentes' pero también más propensos a equivocarse de forma sofisticada es un punto destacado. Sin embargo, el artículo podría profundizar más en las posibles soluciones a este problema.

fuente www.genbeta.com

21-04-2025 22:31

Tecnología

Resumir link

Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link

La elección del modelo generativo es igual de decisiva que la calidad de los embeddings para la calidad final de las respuestas en un pipeline de RAG.

La importancia de elegir bien el modelo en Ollama en un RAG (más allá de la calidad de los embeddings)

En un pipeline de RAG, la elección del modelo generativo es crucial para la calidad final de las respuestas. Modelos pequeños (0.5 B) tienen memoria interna reducida y tendencia a parafrasear o recortar, mientras que modelos medianos y grandes (7 B–13 B+) reconocen mejor las instrucciones de copia literal y producen salidas más fieles. La capacidad de 'memoria' y síntesis de información, gestión de la ventana de contexto, alineamiento con instrucciones y parámetros de generación, e impacto en la fidelidad y confiabilidad son aspectos clave. Para aplicaciones críticas, se recomienda invertir en redes de 7 B o superiores.

...es una advertencia necesaria sobre la importancia de elegir el modelo generativo adecuado en un pipeline de RAG, pero podría ser más conciso y directo en sus recomendaciones. La crítica mordaz sería: 'No te quedes solo en los embeddings, la capacidad interna del modelo es la verdadera clave para respuestas precisas... y no te olvides de invertir en modelos de 7 B o superiores para aplicaciones críticas!'

18-04-2025 15:07 wwwhatsnew.com Informática

Los estafadores utilizan técnicas como el principio de coherencia, crear una falsa urgencia, construir una relación de confianza, la trampa de la deuda social y apelar a la autoridad para manipular a sus víctimas.

La psicología detrás de los timos: así se aprovechan los estafadores de nuestra debilidad

Los estafadores utilizan técnicas psicológicas para manipular a sus víctimas. Comienzan con peticiones triviales para ganar confianza, crean una falsa urgencia para presionar a la víctima, construyen una relación de confianza a largo plazo, utilizan la deuda social para obtener favores, y apelan a la autoridad para obtener obediencia. El experto Joe Grand afirma que la gente en situaciones desesperadas no piensa críticamente y ignora las señales de alerta. Para protegerse, se recomienda verificar la identidad, desconfiar de la urgencia, reconocer las emociones y acordar una 'palabra segura'.

...proporciona una visión interesante sobre las técnicas psicológicas utilizadas por los estafadores, pero podría profundizar más en las estadísticas y los casos concretos de estafas. La crítica mordaz sería: '...es como un buen consejo de un amigo, pero sin la acción. ¿Cuántos lectores realmente cambiarán su comportamiento después de leer esto?'

19-04-2025 10:01 www.genbeta.com Informática

La estafa utiliza una técnica llamada 'DKIM Replay Attack' que permite reenviar correos legítimos de Google sin que sean detectados como spam.

Hasta los expertos caen en esta nueva estafa que suplanta a Google: sus correos no hacen saltar las alarmas de GMail

Una campaña de phishing sofisticada suplantó a Google utilizando correos electrónicos que parecían provenir de no-reply@accounts.google.com. Estos correos pasaban los mecanismos de seguridad de Gmail, incluyendo SPF, DKIM y DMARC. La técnica utilizada se llama 'DKIM Replay Attack', que aprovecha una debilidad en la autenticación de correos electrónicos. Los atacantes reenviaron correos legítimos de Google sin alterar la firma DKIM, haciendo que parecieran auténticos. Utilizaron Google Sites para alojar páginas falsas y robar credenciales. Los correos incluían enlaces a páginas de soporte con apariencia oficial y solicitaban acciones urgentes.

...es interesante y bien documentado, pero podría ser más conciso. La explicación técnica es clara, pero algunos párrafos son largos y podrían dividirse en secciones más pequeñas. La crítica principal es que el titular es un poco sensacionalista, ya que no todos los expertos caen en esta estafa, sino que se describe como sofisticada y peligrosa.

21-04-2025 19:11 www.genbeta.com Informática

La IA generativa ha superado las expectativas de las plataformas low-code y no-code, y se está utilizando para programar casi todo.

La industria pronosticó que en 2025 estas tecnologías programarían casi todo. La IA ni estaba ni se le esperaba

Hace unos años, los gurús tecnológicos predecían que las plataformas low-code y no-code serían las protagonistas del desarrollo de software en 2025. Sin embargo, la inteligencia artificial (IA) ha revolucionado el sector. En 2020, Gartner predijo que el 65% del desarrollo de aplicaciones se realizaría mediante herramientas low-code y no-code. Un informe de Red Hat de 2018 aseguró que estas soluciones podrían reducir el tiempo de desarrollo en un 90%. Sin embargo, una encuesta de Gergely Orosz en 2024 mostró que apenas un 6,6% de los profesionales utiliza principalmente soluciones low-code, mientras que un 85,7% negó emplearlas. La IA ha cambiado el panorama, con el 76% de los desarrolladores utilizando o planeando utilizar herramientas de IA en su proceso de desarrollo en 2024, un incremento respecto al 70% del año anterior. El concepto de 'vibe coding' ha emergido, donde los desarrolladores describen 'la esencia' de lo que quieren crear y las herramientas de IA generan el código correspondiente.

...es interesante y muestra cómo la IA ha cambiado el panorama del desarrollo de software. Sin embargo, podría profundizar más en las implicaciones negativas del 'vibe coding' y cómo afectará a los desarrolladores en el futuro. La crítica es que el título es un poco clickbait, pero el contenido es valioso.

21-04-2025 14:21 www.genbeta.com Tecnología

El uso de expresiones como 'por favor' y 'gracias' en ChatGPT supone un gasto adicional de decenas de millones de dólares en electricidad.

Ser educado SÍ cuesta: decir 'por favor' y 'gracias' a ChatGPT no sale gratis. "Decenas de millones de dólares", según Sam Altman

Decir 'por favor' y 'gracias' a ChatGPT genera un gasto extra en electricidad. Según Sam Altman, CEO de OpenAI, esto supone un coste de 'decenas de millones de dólares'. Una consulta promedio a ChatGPT consume 0,3 vatios-hora (Wh) de electricidad. El consumo energético total de ChatGPT en un año se estima en 1.058,5 gigavatios-hora (GWh). La Agencia Internacional de la Energía (AIE) proyecta que los centros de datos consumirán 945 teravatios-hora (TWh) de electricidad en 2030.

...es interesante, pero el titular puede ser considerado clickbait. La información sobre el impacto medioambiental de ChatGPT es relevante y los datos proporcionados son interesantes. Sin embargo, la relación entre ser educado y el gasto extra en electricidad puede ser exagerada.

21-04-2025 11:42 www.genbeta.com Tecnología

Puedes oponerte a que Meta use tu información para entrenar la IA enviando un formulario a través de la notificación que recibiste o a través de este enlace.

Instagram ha comenzado a usar nuestros post para entrenar a su IA, casi casi sin avisar. Pero podemos negarnos a ello

Instagram comenzó a usar publicaciones para entrenar su IA en Meta de forma discreta. Avisó a usuarios con una notificación fácil de perder. El uso de datos es para usuarios mayores de 18 años e incluye información pública como publicaciones, comentarios, nombre, nombre de usuario, foto de perfil y actividad en grupos públicos. La empresa asegura que no usa contenido de mensajes privados. Los usuarios pueden oponerse a que Meta use su información para entrenar la IA enviando un formulario. La oposición se aplicará a todas las cuentas vinculadas al Centro de cuentas. Meta puede seguir procesando cierta información aunque el usuario se oponga.

...es informativo, pero el titular podría ser más específico sobre cómo oponerse a la recopilación de datos. La empresa de Mark Zuckerberg sigue dando lecciones sobre privacidad.

21-04-2025 16:57 www.genbeta.com Tecnología

Las empresas están considerando volver a las entrevistas presenciales y otros métodos para mejorar la eficacia de los procesos de selección de personal.

Las entrevistas de trabajo y los procesos de selección son un desastre total. Así es cómo las empresas intentan que vuelvan a ser útiles

Los procesos de selección de personal están fallando debido a la cantidad de perfiles falsos y solicitudes generadas por inteligencia artificial. Empresas como Google están considerando volver a las entrevistas presenciales. Gergely Orosz, ingeniero de software, afirma que contratar buenos ingenieros no es fácil debido a la cantidad de spam en las ofertas de empleo. Herval Freire, jefe de ingeniería en maestro.dev, comparte su experiencia contratando talento y destaca la dificultad para conseguir currículums reales. Se barajan ideas como volver a confiar en las referencias, introducir periodos de prueba y realizar entrevistas presenciales, que podrían costar entre 1.500 y 2.000 dólares por candidato.

...plantea un problema interesante sobre la efectividad de los procesos de selección de personal en la era digital, pero podría profundizar más en las soluciones concretas y ofrecer más detalles sobre las experiencias de las empresas. La crítica mordaz: '¿Quién necesita recursos humanos cuando tienes inteligencia artificial que puede mentir en una entrevista?'

21-04-2025 16:25 www.genbeta.com Tecnología

Las pérdidas económicas por bloqueos de IP de LaLiga rozan los 100.000 euros.

Los usuarios afectados por los bloqueos de IP de LaLiga ya hacen públicas sus pérdidas bajo el término 'LaLigaGate'

LaLiga ha bloqueado direcciones IP para frenar retransmisiones no autorizadas de partidos, afectando páginas web ajenas al fútbol. Usuarios denuncian pérdidas económicas y organizan '#LaLigaGate' para visibilizar daños. La página web de recopilación de información registra pérdidas cercanas a 100.000 euros, con una empresa de material de tenis siendo la más afectada. Los tribunales respaldan acciones de LaLiga, desestimando recursos de afectados.

...destapa la incongruencia de las medidas de LaLiga para frenar las retransmisiones ilegales, que terminan afectando a empresas y usuarios inocentes. La creación de '#LaLigaGate' muestra la unión de afectados para visibilizar un problema que, pese a ser técnico, tiene consecuencias económicas muy reales. La cifra de 100.000 euros en pérdidas es un buen gancho, pero esperemos que sirva para que LaLiga revise su estrategia.

21-04-2025 12:28 www.genbeta.com Tecnología

Microsoft vendió el 5% de acciones de Apple en 2003 por preocupaciones antimonopolio, perdiendo miles de millones de dólares en el proceso.

Bill Gates explica por qué Microsoft vendió el 5% de acciones que tenía de Apple. Perdieron miles de millones al hacerlo

En 1997, Microsoft compró 150 millones de acciones de Apple cuando la empresa estaba cerca de la bancarrota. Bill Gates se arrepiente de haber vendido el 5% de acciones de Apple en 2003, ya que podrían valer 202.509 millones de dólares hoy. La venta se realizó debido a preocupaciones antimonopolio. Microsoft convirtió 150.000 millones de acciones preferentes en 18,1 millones de acciones ordinarias y las vendió por 550 millones de dólares. Las acciones de Apple han aumentado significativamente desde entonces.

...es interesante, pero el título podría ser más específico sobre la cantidad de dinero que Microsoft podría haber ganado si no hubiera vendido las acciones de Apple. La crítica es que el título es un poco sensacionalista, pero el contenido es informativo y bien documentado.

20-04-2025 17:01 www.genbeta.com Tecnología

ChatGPT puede generar tickets y facturas falsos con un alto grado de realismo, incluyendo detalles como fechas, importes y números de producto.

He probado a generar tickets y facturas falsas en ChatGPT y me he llevado una sorpresa. Ya no podré fiarme ni de los documentos físicos

ChatGPT puede generar imágenes hiperrealistas de tickets y facturas que parecen auténticos. Un ticket de Zara con fecha 1 de abril de 2025, a las 11:39, con un importe de 25 euros, incluyendo IVA, fue generado de manera convincente. La herramienta puede crear documentos con detalles como dirección de tienda, número de producto y fecha. Incluso puede replicar tickets digitales de aplicaciones como Pull&Bear y generar facturas de compañías eléctricas o telecomunicaciones con cambios en nombre, dirección o importe.

...revela la capacidad de ChatGPT para generar documentos falsos con un realismo alarmante, lo que plantea graves riesgos de fraude. La única solución viable parece ser la implementación de sistemas de verificación como códigos QR únicos. Mientras tanto, es crucial que empresas y administraciones dejen de confiar ciegamente en imágenes como prueba documental.

20-04-2025 12:01 www.genbeta.com Tecnología

No comprende realmente los sentimientos y emociones humanas

Walter Isaacson, biógrafo de Elon Musk, alerta sobre su personalidad: "No comprende realmente los sentimientos y emociones humanas"

El biógrafo de Elon Musk, Walter Isaacson, afirma que Musk no comprende realmente los sentimientos y emociones humanas. Isaacson destacó que la falta de empatía de Musk se debe a su convencimiento de que la gente debe abrir los ojos al respecto del beneficio de los vehículos autónomos. Musk exige mucho a sus equipos, pero no se da cuenta de que un coche autónomo que choca a alguien puede conmocionar a la gente más que un accidente causado por un mal conductor. Isaacson también señaló que la necesidad de perfección de Musk en los procesos acaba jugando en contra del empresario y resta mérito a sus logros.

...es interesante, pero podría profundizar más en la relación entre la personalidad de Elon Musk y su éxito empresarial. La crítica a la falta de empatía de Musk es interesante, pero se queda un poco en la superficie. En general, el artículo está bien, pero podría ser más mordaz y crítico con Musk.

20-04-2025 10:00 www.larazon.es Tecnología

Google ahorra más de 1 millón de horas diarias a sus usuarios gracias a optimizaciones en su buscador.

Cómo Google mantiene su buscador rápido y confiable: la ingeniería detrás de cada milisegundo

Google ha logrado reducir la latencia en su buscador, a pesar de incorporar nuevas funciones como fragmentos enriquecidos, gráficos de conocimiento y resúmenes generados con inteligencia artificial. Los ingenieros de Google analizan cada componente del buscador, identifican áreas de mejora y eliminan lo que no aporta valor. En los últimos dos años, los usuarios de Google han ahorrado colectivamente más de un millón de horas cada día. Las nuevas funciones basadas en IA, como los resúmenes inteligentes, han sido optimizadas para la velocidad, ahorrando medio millón de horas adicionales al día. El sistema está diseñado para mantenerse firme incluso durante picos inesperados de tráfico, con servidores distribuidos por todo el mundo que pueden procesar miles de millones de búsquedas diarias. En promedio, una persona tendría que hacer unas 150.000 búsquedas para toparse con un fallo provocado por el sistema.

...es interesante, pero podría profundizar más en los detalles técnicos de cómo Google logra mantener su buscador rápido y confiable. La crítica es que el artículo se enfoca demasiado en la 'magia' detrás de Google Search y no proporciona suficientes detalles concretos sobre la tecnología utilizada.

20-04-2025 12:00 wwwhatsnew.com Tecnología

Resumir link

Últimos artículos Economía Ciencia Tecnología Cultura Política Corazón Entretenimiento Compras Curiosidades Deportes Salud Últimos artículos Resumir link

Noticias resumidas: fuentes, contexto y respuestas en un solo lugar es un espacio diseñado para quienes buscan información precisa y directa. Seleccionamos noticias de diferentes medios y las resumimos cuidadosamente para ofrecerte lo esencial: contexto, fuentes confiables y respuestas concretas a las preguntas clave. Nuestro objetivo es evitar el ruido informativo y proporcionar una experiencia clara y eficiente para que puedas acceder a lo importante sin rodeos.
Todas las imágenes que acompañan nuestras noticias son generadas por inteligencia artificial (IA) de forma automática, sin intervención humana en los detalles visuales. Aunque agregan una dimensión visual al contenido, no representan fielmente la realidad ni deben interpretarse como fotografías de eventos o personas reales.
Para obtener más detalles sobre cómo gestionamos los resúmenes informativos, las respuestas a las noticias, y el propósito de las imágenes generadas por IA, puede consultar nuestras condiciones de uso. Nuestro compromiso es ofrecer contenido claro y conciso, con resúmenes de calidad, respuestas directas a las noticias, y un contexto visual agradable que busca ilustrar, sin pretender ser una representación exacta de la realidad.