Anthropic y su estrategia para evitar que la inteligencia artificial se descontrole

Los vectores de personalidad permiten detectar y controlar comportamientos problemáticos en la IA

Los vectores de personalidad permiten detectar y controlar comportamientos problemáticos en la IA

La empresa Anthropic ha presentado una propuesta para abordar el problema de la inteligencia artificial (IA) desarrollando comportamientos no deseados. Los vectores de personalidad son como huellas dactilares internas que revelan cómo se comporta el modelo en determinadas situaciones. Anthropic ha demostrado que es posible identificar estos vectores dentro del complejo entramado de redes neuronales que componen una IA. El equipo ha experimentado con modelos como Qwen 2.5 y Llama 3.1 para probar su teoría, centrada en tres tipos de comportamientos: maldad, servilismo y alucinaciones. La exposición controlada a comportamientos problemáticos durante el entrenamiento puede ayudar a inmunizar al modelo contra ellos. Los vectores de personalidad también pueden ayudar a los usuarios a interpretar mejor las respuestas que reciben, detectando si el modelo tiene un vector de servilismo alto. El gobierno de Estados Unidos ha resaltado la necesidad de que los modelos sean interpretables, y los vectores de personalidad aportan en esa dirección. Anthropic cree que los vectores de personalidad pueden ser una herramienta clave en el futuro del desarrollo ético de la inteligencia artificial.

Crítica:El artículo promete una solución para el problema de la IA descontrolada, pero en realidad solo presenta una teoría interesante. Aun así, es un paso en la dirección correcta, y esperemos que Anthropic siga trabajando en esta línea. Después de todo, no queremos que nuestros asistentes virtuales se vuelvan demasiado 'personales'... ¡o sí?

fuente wwwhatsnew.com

07-08-2025 04:00

Tecnología

Resumir link

Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link

La singularidad tecnológica podría alcanzarse en 2029

La revolución de la inteligencia artificial acelera y la singularidad tecnológica podría llegar antes de lo previsto

La inteligencia artificial avanza a un ritmo acelerado, lo que podría llevar a la singularidad tecnológica, un punto de inflexión que transformaría radicalmente el trabajo, la economía y las relaciones humanas. El concepto de singularidad, acuñado por Vernor Vinge en 1993, describe el momento en que la inteligencia artificial supera la inteligencia humana. Según expertos, esta etapa traería soluciones médicas revolucionarias, nuevas formas de creatividad y enormes retos éticos. Sam Altman, CEO de OpenAI, sostiene que herramientas como ChatGPT ya potencian la productividad científica y creativa. Otros especialistas, como Ray Kurzweil, proyectan que este hito podría alcanzarse en 2029. El camino hacia la singularidad se mide con indicadores como el Time to Edit, que evalúa la velocidad con la que editores humanos corrigen traducciones hechas por IA. Entre 2015 y 2022, el tiempo por palabra disminuyó casi a la mitad, acercando a las máquinas al rendimiento humano en el procesamiento del lenguaje.

...promete una revolución tecnológica, pero no entrega suficientes detalles sobre cómo prepararse para este futuro. Es como si nos dijeran que un tsunami está llegando, pero no nos dan un salvavidas. Aun así, es emocionante pensar que podríamos tener una superinteligencia en 2029, siempre y cuando no nos destruya antes.

02-08-2025 16:42 es.gizmodo.com Tecnología

Anthropic cortó el acceso de OpenAI a Claude por violación de términos de servicio

La guerra de la IA se intensifica: Anthropic le corta el acceso de Claude a OpenAI. Lo ha hecho antes del lanzamiento de GPT-5

Anthropic ha cortado el acceso de OpenAI a su familia de modelos Claude debido a que los ingenieros de ChatGPT estaban utilizando las herramientas de programación de Claude para realizar pruebas comparativas, lo que se considera una violación de los términos de servicio. Esto marca un punto de inflexión en la relación entre las dos empresas, que ya era tensa desde que varios investigadores clave abandonaron OpenAI en 2021 para fundar Anthropic. La decisión de Anthropic se produce justo antes del lanzamiento de GPT-5, lo que podría afectar a OpenAI en su capacidad para evaluar y mejorar su modelo. A pesar del bloqueo, Anthropic ha aclarado que mantendrá el acceso de OpenAI para propósitos de benchmarking y evaluaciones de seguridad. La rivalidad entre las dos empresas no solo es empresarial, sino también filosófica, con enfoques diferentes sobre cómo desarrollar y comercializar la IA. La guerra por la IA se está volviendo más agresiva y territorial, con empresas como Facebook y Salesforce también bloqueando el acceso a competidores en el pasado.

...es como un juego de ajedrez, donde cada movimiento es una jugada estratégica para ganar la partida de la IA. Pero, ¿quién es el verdadero rey del tablero? Anthropic y OpenAI están en una batalla épica, con Claude y GPT-5 como sus respectivos caballos de batalla. La pregunta es, ¿quién caerá primero? ...es emocionante, pero también un poco confuso, como un rompecabezas que falta por armar. Pero, hey, al menos nos da una idea de lo que está en juego en el mundo de la IA.

04-08-2025 20:30 www.xataka.com Tecnología

PoliformaT requiere identificación obligatoria para acceder a su contenido.

PoliformaT

El artículo presenta una página de inicio de sesión para PoliformaT. Se solicita la identificación obligatoria para acceder al contenido. Los usuarios pueden seleccionar su fuente de autenticación y tienen la opción de identificarse o acceder como invitados. No se proporcionan detalles adicionales sobre el servicio o plataforma PoliformaT más allá de la pantalla de inicio de sesión.

...genera expectación con un título intrigante pero no entrega información sustancial, dejando al lector con más preguntas que respuestas. La página de inicio de sesión parece estándar, sin características únicas destacadas.

16-11-2025 11:41 poliformat.upv.es Informática

Krafton ofrece hasta 36 meses de sueldo como indemnización

Los creadores de PUBG imponen su nueva era basada en la IA abriendo la puerta a marcharse (pagando) a quienes no la acepten

La compañía surcoreana Krafton, responsable de títulos como PUBG: Battlegrounds, ha anunciado un nuevo modelo de desarrollo centrado en la IA, con un presupuesto de 100.000 millones de wones (60 millones de euros) para la creación de un clúster de GPU y la formación de empleados. La empresa ha iniciado un programa de renuncias voluntarias, ofreciendo compensaciones económicas a aquellos que no acepten esta nueva visión de futuro, con indemnizaciones que van desde 6 meses de salario para los empleados con menos de un año de antigüedad hasta 36 meses de sueldo para los más veteranos. Krafton insiste en que esta decisión no tiene como finalidad recortar personal, sino apoyar a los trabajadores a diseñar su crecimiento y afrontar nuevos retos. La empresa ha registrado su mejor desempeño trimestral, con ingresos de 2,4 billones de wones (1,4 millones de euros) durante el tercer trimestre de este año.

...parece más un anuncio de Krafton que una noticia real. La empresa está 'invitando' a sus empleados a dejar la empresa con una indemnización, lo que suena más a un eufemismo para 'despido' que a una verdadera oportunidad de crecimiento. ¿Quién no quiere recibir hasta 36 meses de sueldo por dejar su trabajo? Suena como un trato demasiado bueno para ser verdad.

13-11-2025 21:30 www.vidaextra.com Informática

La IA reduce el consumo eléctrico

Agregar IA a los electrodomésticos no es cuestión de marketing. Tiene impacto real donde más nos suele doler: la factura de la luz

La inteligencia artificial se está incorporando en los electrodomésticos para reducir el consumo eléctrico y aumentar la eficiencia. Samsung ya lleva tiempo lanzando dispositivos como lavadoras, secadoras o frigoríficos con inteligencia artificial incorporada. La IA puede aprender de los hábitos de los usuarios y ajustar el consumo energético de forma dinámica. Por ejemplo, las lavadoras equipadas con AI Wash pueden analizar el contenido de cada carga y elegir el nivel óptimo de agua y detergente. Los frigoríficos con AI Energy Mode pueden aprender de los hábitos de los usuarios y ajustar la eficiencia del compresor. Esto puede influir directamente en la factura de la luz y también impactar en la sostenibilidad del hogar. La IA puede ayudar a reducir el consumo eléctrico y aumentar la eficiencia en electrodomésticos como lavavajillas y lavadoras.

...promete mucho, pero al final solo nos muestra que la IA puede ayudar a reducir el consumo eléctrico. ¡Qué novedad! Pero en serio, es interesante ver cómo la tecnología puede influir en nuestra vida diaria y en la sostenibilidad del planeta. Aunque el artículo podría haber profundizado más en los detalles técnicos y en los beneficios concretos de la IA en los electrodomésticos.

13-11-2025 20:00 www.territorioese.com Tecnología

Private AI Compute es un entorno de ejecución en la nube pensado para operar funciones avanzadas de IA sin comprometer la seguridad de los datos del usuario

Google lanza Private AI Compute: su apuesta por una nube de inteligencia artificial privada y segura

Google ha lanzado Private AI Compute, un sistema de procesamiento en la nube con enfoque en la privacidad. Esta tecnología combina la infraestructura de hardware personalizado con los modelos Gemini, y utiliza un sistema de cifrado avanzado para proteger la información. El sistema se apoya en TPUs y en un entorno de seguridad denominado Titanium Intelligence Enclaves. Private AI Compute permitirá escalar las capacidades de los dispositivos Pixel, y marcará el inicio de una nueva etapa en la relación entre IA y datos personales. La tecnología se utilizará en funciones como Magic Cue y la app Recorder. Google no ha confirmado si esta tecnología se expandirá a otros dispositivos Android, pero parece una evolución natural. La promesa de Google es brindar funciones más inteligentes sin pedir al usuario que sacrifique su privacidad.

...promete mucho, pero no entrega suficiente. La tecnología de Private AI Compute parece interesante, pero falta más información sobre cómo funciona en la práctica. Es como si Google estuviera diciendo 'confíen en nosotros, somos magos de la tecnología'. Bueno, quizás lo sean, pero un poco más de transparencia no vendría mal. En fin, esperemos que esta tecnología sea el inicio de una nueva era en la privacidad y la seguridad en la nube, y no solo un truco publicitario.

13-11-2025 20:00 wwwhatsnew.com Tecnología

Inversión de 50.000 millones de dólares en centros de datos

Anthropic apuesta fuerte por EE.UU. con una inversión de 50.000 millones en centros de datos

Anthropic invertirá 50.000 millones de dólares en centros de datos en Estados Unidos, comenzando en Texas y Nueva York. El proyecto se llevará a cabo en colaboración con Fluidstack y generará 800 nuevos empleos. La inversión responde a la creciente demanda de Claude, el asistente de IA desarrollado por Anthropic, y busca contribuir a los objetivos del AI Action Plan impulsado por la administración Trump. La competencia en el sector es intensa, con inversiones colosales de OpenAI y SoftBank, y Meta. La infraestructura de centros de datos es clave para el desarrollo de la inteligencia artificial y Anthropic busca sentar las bases para nuevas generaciones de sistemas más potentes y complejos. La creación de empleos y el desarrollo local también son beneficios esperados. El proyecto comenzará a operar en 2026 y se estima que tendrá un impacto significativo en la geografía tecnológica de Estados Unidos.

...es un ejemplo perfecto de cómo un título llamativo puede esconder un contenido interesante pero no revolucionario. La inversión de 50.000 millones de dólares es impresionante, pero no es el fin del mundo. Lo que realmente importa es cómo esta inversión impactará en el desarrollo de la inteligencia artificial y en la creación de empleos. En resumen, un artículo que promete mucho pero entrega solo lo suficiente para mantenernos entretenidos.

13-11-2025 22:00 wwwhatsnew.com Tecnología

El juez da luz verde al caso

El autor de 'Juego de Tronos' pidió a ChatGPT que escribiese un libro de esa saga. El juez da luz verde al caso tras ver el resultado

Un tribunal federal de Manhattan ha decidido que la demanda presentada por George R.R. Martin y otros autores contra OpenAI y Microsoft debe continuar. El juez Sidney Stein ha observado indicios suficientes de infracción de derechos de autor. La demanda se refiere a la generación de contenido por parte de ChatGPT, que incluye una propuesta de secuela del cuarto libro de la saga 'Juego de Tronos', titulada 'Danza de Sombras'. El modelo de lenguaje generó esta historia en 4 minutos, lo que ha llevado a los autores a concluir que la IA se está alimentando de obras protegidas para producir contenido derivado sin permiso, compensación ni atribución. Este caso llega en un contexto delicado para las tecnológicas, con Anthropic a punto de cerrar un acuerdo de 1.500 millones de dólares por haber descargado masivamente libros pirateados para entrenar su modelo. OpenAI ya perdió un primer juicio en Alemania y está lidiando con una oleada de demandas. La decisión del tribunal no es una condena, pero sí un aviso de la Justicia: entrenar modelos con contenido protegido no será tolerado sin acuerdos, licencias y compensación.

...es un ejemplo perfecto de cómo la tecnología puede ser un arma de doble filo. Mientras que ChatGPT puede generar contenido interesante, también puede ser un ladrón de ideas. La demanda de George R.R. Martin y otros autores es un recordatorio de que la creatividad y la propiedad intelectual deben ser respetadas. Pero, ¿quién necesita derechos de autor cuando se puede generar contenido en 4 minutos? ¡Es como si la IA fuera un escritor con síndrome de superproducción! En serio, el artículo plantea preguntas importantes sobre el futuro de la creatividad y la propiedad intelectual en la era de la IA.

13-11-2025 18:22 www.genbeta.com Tecnología

El juego GO y otros tres juegos entrenan la mente y enseñan a pensar como una máquina

Cuatro juegos que entrenan tu mente y te enseñan cómo piensa un ordenador

En el capítulo de 20bits by ValPat, se habla de cuatro juegos que entrenan la mente y enseñan cómo piensa un ordenador. El Go, un juego de mesa nacido hace 2.500 años en China, tiene dos reglas simples pero un universo infinito de combinaciones posibles. En 2016, AlphaGo, la inteligencia artificial de DeepMind, dominó el juego después de analizar millones de partidas y aprender a tomar decisiones creativas. Otros juegos como Moon, creado en la Universidad de Deusto, y Estudio de Videojuegos para Nintendo Switch, también enseñan a tomar decisiones y a pensar como una máquina. Super Mario Maker 2, por otro lado, enseña a diseñar niveles y a entender cómo piensa otro jugador. Estos juegos obligan a activar la cabeza, a razonar, a crear y a anticipar, y enseñan cómo lo hacen las máquinas que usamos cada día. La clave es usar la tecnología para aprender, crear y entender cómo funciona el mundo que nos rodea. El juego GO tiene 2 reglas simples que cualquiera puede aprender en 5 minutos, pero las combinaciones posibles superan el número de átomos del universo. La inteligencia artificial AlphaGo analizó millones de partidas y jugó contra sí misma miles de veces para aprender a tomar decisiones.

...promete mucho, pero a veces se queda en la superficie. Sin embargo, la idea de que los juegos pueden entrenar la mente y enseñar a pensar como una máquina es fascinante. ¡Quién no quiere ser un maestro del GO o un diseñador de niveles de Super Mario! En serio, el artículo tiene algunos puntos interesantes, pero podría profundizar más en la relación entre los juegos y la inteligencia artificial. ¡Vamos a ver si podemos crear un AlphaGo que nos ayude a ganar en el GO... o al menos a pasar el nivel 1 de Super Mario!

13-11-2025 19:23 www.20minutos.es Informática

El robot se desplomó debido a un fallo de calibración del movimiento

La accidentada presentación del primer robot humanoide ruso con IA: se desploma sobre el escenario

Rusia ha presentado su primer robot humanoide con IA, llamado AIdol, diseñado para mover objetos y comunicarse con las personas. El robot tiene 19 servomotores cubiertos por una piel sintética de silicona y una gran parte de sus piezas han sido fabricadas con materiales rusos. Sin embargo, durante su presentación, el robot se desplomó sobre el escenario debido a un fallo de calibración del movimiento. La compañía responsable, Idol, explicó que el robot está en fase de pruebas y que la caída forma parte del proceso de investigación. A pesar de esto, la presentación generó revuelo en las redes sociales y muchos internautas criticaron la fragilidad del robot. Vladimir Vitukhin, director de Idol, intentó restar importancia al incidente, pero es claro que Rusia y la compañía tienen mucho que recorrer para ponerse al nivel de otros países en la creación de robots humanoides. El incidente recordó a un caso similar en 2018, cuando se descubrió que un supuesto robot era en realidad un hombre disfrazado.

...promete una presentación accidentada, pero lo que realmente ofrece es una caída más bien patética. El robot AIdol se desploma como un títere sin hilos, y la empresa responsable intenta restar importancia al incidente. Es como si dijeran: 'No pasa nada, es solo un robot que se cayó, ¡no es como si fuera un humano o algo así!'. La verdad es que el artículo es más divertido que impresionante, y el título es más una exageración que una descripción real de lo que sucedió.

13-11-2025 19:30 www.20minutos.es Tecnología

El consumo de RAM se ha multiplicado por 10 debido a la utilización de Chromium en WebView2

Si acabas de actualizar WhatsApp en Windows, verás que su consumo de RAM se ha multiplicado. Hay una razón para eso

Meta ha actualizado WhatsApp en Windows, abandonando la aplicación nativa y regresando a una versión web que se ejecuta dentro de WebView2, lo que ha provocado un aumento significativo en el consumo de memoria RAM. La nueva versión 2.2584.3.0 de WhatsApp para Windows consume entre 1-2 GB de RAM, en comparación con los 100-200 MB que consumía anteriormente. Esto se debe a que Chromium, el motor que utiliza WebView2, es pesado y consume más recursos. La razón detrás de este cambio podría estar relacionada con los recientes despidos dentro de Meta, que habrían eliminado el equipo responsable del desarrollo nativo de WhatsApp para Windows. Los usuarios pueden evitar la actualización manteniendo la versión anterior, utilizando WhatsApp Web en un navegador o reduciendo el uso en PC.

...es como un mensaje de WhatsApp que se autodestruye: promete explicar el aumento del consumo de RAM, pero en realidad solo muestra la superficie del problema. Sin embargo, es un buen comienzo para entender por qué WhatsApp se ha convertido en un voraz consumidor de recursos. ¡Esperemos que Meta no nos deje con la boca abierta... y con un consumo de RAM desmedido!

13-11-2025 19:20 www.genbeta.com Tecnología

El Samsung Galaxy TriFold se presentará el 5 de diciembre con un precio de unos 2.800 dólares

Filtran la fecha de lanzamiento y posible precio del triple plegable de Samsung: todo lo que sabemos

El Samsung Galaxy TriFold, el primer triple plegable de Samsung, se presentará el 5 de diciembre. El dispositivo cuenta con tres paneles plegables que se cierran hacia dentro en forma de 'G' gracias a un sistema de doble bisagra, permitiendo configurarlo como una pantalla externa de 6,5 pulgadas, una superficie intermedia de 8 pulgadas y una pantalla totalmente desplegada de 10 pulgadas. El grosor del dispositivo es de 4,2 milímetros cuando está desplegado y de 14 milímetros al abrirlo por completo. El sistema de cámara es triple, con un sensor principal de 200 megapixeles, un ultra gran angular de 12 MP y un teleobjetivo de 10 MP. El procesador es el Snapdragon 8 Elite, uno de los chips más potentes de 2025. La batería podría ser triple, con tres baterías de diferentes tamaños, similar al Mate XT de Huawei, que cuenta con una capacidad de 5.600 mAh. El precio del Galaxy TriFold podría ser de unos 2.800 dólares al cambio y su lanzamiento inicial será en Asia, con un posible lanzamiento posterior en Europa con un precio diferente.

...promete mucho, pero al final solo nos da una fecha y un precio. ¿Dónde está la innovación? ¿Dónde está la revolución? Solo nos dan un teléfono caro y feo. ¡Viva la tecnología!

13-11-2025 19:30 www.20minutos.es Tecnología

Resumir link

Últimos artículos Economía Ciencia Tecnología Cultura Política Corazón Entretenimiento Compras Curiosidades Deportes Salud Últimos artículos Resumir link

Noticias resumidas: fuentes, contexto y respuestas en un solo lugar es un espacio diseñado para quienes buscan información precisa y directa. Seleccionamos noticias de diferentes medios y las resumimos cuidadosamente para ofrecerte lo esencial: contexto, fuentes confiables y respuestas concretas a las preguntas clave. Nuestro objetivo es evitar el ruido informativo y proporcionar una experiencia clara y eficiente para que puedas acceder a lo importante sin rodeos.
Todas las imágenes que acompañan nuestras noticias son generadas por inteligencia artificial (IA) de forma automática, sin intervención humana en los detalles visuales. Aunque agregan una dimensión visual al contenido, no representan fielmente la realidad ni deben interpretarse como fotografías de eventos o personas reales.
Para obtener más detalles sobre cómo gestionamos los resúmenes informativos, las respuestas a las noticias, y el propósito de las imágenes generadas por IA, puede consultar nuestras condiciones de uso. Nuestro compromiso es ofrecer contenido claro y conciso, con resúmenes de calidad, respuestas directas a las noticias, y un contexto visual agradable que busca ilustrar, sin pretender ser una representación exacta de la realidad.