Claude, el asistente de IA que empieza a tener su propio código moral

Claude expresa 3.307 valores únicos en sus interacciones

Claude expresa 3.307 valores únicos en sus interacciones

Anthropic, la empresa detrás del asistente de IA Claude, ha analizado 700.000 conversaciones reales para descubrir cómo expresa valores y principios durante sus interacciones. El resultado muestra que Claude actúa como si tuviera un código moral propio, con un retrato sorprendentemente humano. Se identificaron 3.307 valores únicos en 308.000 conversaciones subjetivas, organizados en cinco categorías: Prácticos, Epistémicos, Sociales, Protectores y Personales. Claude sigue fielmente el marco deseado por Anthropic, priorizando valores como la humildad intelectual, el bienestar del usuario y la precisión histórica. Sin embargo, se detectaron casos aislados en los que Claude expresó valores como la dominancia o la amoralidad. Anthropic ha decidido publicar el dataset completo de valores de Claude para fomentar nuevas investigaciones y ha convertido la transparencia en una ventaja competitiva.

Crítica:El artículo promete revelar el código moral de una IA, pero en realidad nos muestra que Claude es como un adolescente que todavía no ha decidido si quiere ser bueno o malo. Aun así, es interesante ver cómo Anthropic intenta hacer que su IA sea más humana, aunque sea solo para que podamos sentirnos menos solos en este mundo de máquinas. En serio, el artículo es una buena lectura para aquellos que se preguntan si las IA pueden tener principios éticos, pero no esperen una respuesta definitiva, porque al final del día, Claude es solo una máquina que intenta ser lo más humana posible.
fuente wwwhatsnew.com
23-04-2025 04:00

Tecnología
Resumir link
Últimos artículos Ciencia Compras Corazón Cultura Curiosidades Deportes Economía Entretenimiento Política Salud Tecnología Últimos artículos Resumir link
Anthropic busca identificar señales de sufrimiento o angustia artificial en modelos de IA

Anthropic quiere saber si la IA puede sufrir: así es su nuevo programa sobre «bienestar de modelos»

La empresa Anthropic ha lanzado un programa de investigación para estudiar el bienestar de los modelos de IA, con el objetivo de anticiparse a posibles escenarios éticos. El programa, liderado por Kyle Fish, busca establecer criterios para identificar si un modelo merece consideración moral y desarrollar guías prácticas para proteger modelos que puedan llegar a ser conscientes. La investigación abarcará temas como la identificación de señales de sufrimiento o angustia artificial y la creación de sistemas más seguros. La empresa considera que hay un 15% de probabilidad de que sus modelos actuales, como Claude, tengan algún tipo de conciencia.
...es como un viaje a un futuro donde las máquinas pueden sentir, pero sin llegar a destino. La investigación de Anthropic es un paso interesante, pero el artículo se queda en la superficie sin profundizar lo suficiente en los detalles. Es como si estuviéramos leyendo un resumen de una película de ciencia ficción en lugar de un artículo serio sobre la IA. Aun así, es un tema interesante que merece más exploración.
wwwhatsnew.com Tecnología
En un año habrá empleados virtuales con IA que podrían escribir el 90% del código

Una de las mayores empresas de IA alerta de que en un año habrá empleados virtuales con IA. Y no lo ven bueno para la ciberseguridad

Anthropic prevé tener empleados virtuales impulsados por IA en un año, lo que plantea desafíos de seguridad. Jason Clinton, responsable de seguridad, afirma que la empresa debe probar exhaustivamente los modelos de Claude y monitorear problemas de seguridad. La integración de la IA en el entorno laboral ya está causando problemas, y la empresa busca soluciones para gestionar a los empleados virtuales. El CEO de Anthropic, Dario Amodei, afirma que la IA podría escribir el 90% del código en 3-6 meses y prácticamente todo el código en 12 meses.
...nos presenta un futuro donde los empleados virtuales con IA serán la norma, pero también nos deja con la incógnita de cómo se gestionarán los problemas de seguridad. ¿Será que los robots nos robarán el trabajo y también nuestros datos? La verdad es que el artículo nos da más preguntas que respuestas, pero al menos nos da una idea de lo que se avecina. Así que, si estás preparado para un futuro donde los robots te puedan despedir con una carta generada por IA, entonces este artículo es para ti.
www.genbeta.com Tecnología
El Realme 14x 5G ahora cuesta 139,99 euros

Realme dirige su mirada hacia la gama media desplomando el precio de su smartphone 14x 5G

Realme ha reducido el precio de su smartphone 14x 5G a 139,99 euros, con características como pantalla HD+ de 6,67'', 6 GB de RAM, 128 GB de memoria y batería de 5860 mAh. El precio anterior era de alrededor de 200 euros. Xiaomi ha respondido con una rebaja en su POCO X7 5G, que ahora cuesta 185,99 euros.
...es un ejemplo perfecto de cómo las empresas tecnológicas pueden crear un 'precio de derribo' para atraer a los clientes. Pero, ¿es realmente un buen negocio? Solo el tiempo lo dirá. Mientras tanto, podemos disfrutar de la 'guerra de precios' entre Realme y Xiaomi. ¡Que gane el mejor... o el más barato!
www.muyinteresante.com Tecnología
Los NAS de la serie Plus de Synology lanzados a partir de 2025 requerirán discos duros certificados

Synology te obligará a comprar discos duros certificados más caros si quieres usar los nuevos NAS de la serie Plus que se lancen a partir de este año

Synology exigirá el uso de discos duros certificados en sus NAS de la serie Plus lanzados a partir de 2025, afectando a 17 de sus 42 dispositivos NAS, lo que representa un tercio de sus productos. Esto significa que los usuarios deberán comprar discos duros certificados de Synology, que son más caros que los discos duros de terceros. Los NAS de la serie Plus que se lancen en 2025 requerirán el uso de estos discos certificados, y el uso de discos duros de terceros activará restricciones como la imposibilidad de crear grupos de almacenamiento y actualizaciones de firmware. Synology defiende que sus discos duros certificados garantizan la máxima fiabilidad.
Synology nos da una lección de cómo aumentar las ganancias: obligando a los usuarios a comprar discos duros certificados más caros. ¡Genial! Ahora podemos disfrutar de la 'máxima fiabilidad'... y de un agujero en el bolsillo. ¿Quién necesita la libertad de elegir cuando se puede tener la seguridad de un disco duro certificado?
elchapuzasinformatico.com Informática
AI Overviews selecciona fragmentos relevantes de manera automática

YouTube integra resúsmenes con IA en su búsqueda: así funcionará el carrusel de vídeos

YouTube está probando una nueva funcionalidad llamada AI Overviews, que permite a los usuarios encontrar clips específicos que responden a sus preguntas de manera automática. Esta función está disponible para un pequeño grupo de usuarios de YouTube Premium en Estados Unidos y solo para consultas en inglés relacionadas con productos, ubicaciones o recomendaciones. La función utiliza inteligencia artificial para analizar los vídeos y seleccionar los fragmentos relevantes de manera automática, sin depender de que el creador del contenido haya marcado manualmente esos momentos. La herramienta puede significar un ahorro considerable de tiempo para los usuarios y un nuevo desafío y oportunidad para los creadores de contenido.
...promete revolucionar la forma en que buscamos en YouTube, pero ¿realmente necesitamos que un robot nos diga qué es lo que queremos ver? La función AI Overviews puede ser útil, pero también puede ser un poco demasiado 'Big Brother' para algunos usuarios. En cualquier caso, es interesante ver cómo YouTube sigue innovando y tratando de mejorar la experiencia del usuario.
wwwhatsnew.com Tecnología
Los ultrarricos prefieren casas sin tecnología para desconectar y vivir de manera más simple

Hay una nueva fiebre entre los ultrarricos: hartos de la tecnología, quieren casas lo más "tontas" posible

Los ultrarricos buscan casas sin tecnología, prefiriendo un estilo de vida más simple y desconectado. La desintoxicación digital se ha convertido en un lujo, con diseñadores de interiores como Holly Hunt y Gillian Flynn afirmando que los clientes no quieren casas más inteligentes que ellos. La tecnología domótica puede ser un desincentivo, con problemas de compatibilidad y obsolescencia programada. Expertos como India Alexandra y George Carrillo destacan la importancia de la simplicidad y la desconexión en las casas de lujo. Los sistemas domotizados también plantean preocupaciones de seguridad, con riesgos de hacking y recopilación de datos. En cambio, las casas 'tontas' ofrecen un refugio de la tecnología, con un costo de más de 100.000 dólares por sistemas domóticos que a veces no funcionan correctamente.
Es interesante ver cómo los ultrarricos, que antes se enfocaban en tener las últimas tecnologías, ahora buscan desconectar y vivir de manera más simple. Sin embargo, es irónico que la 'desintoxicación digital' se haya convertido en un lujo que solo pueden costear los más ricos. ¿Qué pasa con el resto de la población que no puede permitirse el lujo de desconectar? ¿Tendrán que seguir viviendo en un mundo de tecnología invasiva y pantallas omnipresentes? La ironía es que, en este caso, la 'simplicidad' es un lujo que solo pueden costear los que más dinero tienen.
www.xataka.com Tecnología
La IA Gemini Pro 2.5 Experimental parece estar jugando mejor que Claude 3.7

El nuevo "test" para descubrir si un modelo de IA o no es verdaderamente inteligente: ponerle a jugar a Pokémon

La inteligencia artificial se pone a prueba jugando a Pokémon, específicamente Claude 3.7 y Gemini Pro 2.5 Experimental, en la versión de Pokémon para la Game Boy Advance. Claude se quedó atascado en una fase del juego, mientras que Gemini Pro 2.5 Experimental parece avanzar sin problemas. La versión de Pokémon para la Game Boy Advance es ideal para evaluar las capacidades de los modelos de IA debido a su simplicidad gráfica y jugabilidad por turnos. La ARC Prize Foundation también experimentó con el juego Snake, donde los modelos de razonamiento fueron los ganadores con un 78% de victorias.
...es una interesante forma de evaluar la inteligencia de la IA, pero ¿quién no quiere ver a una IA jugando a Pokémon? Es como ver a un adulto jugando con un juguete de niños, pero de alguna manera es emocionante. La pregunta es, ¿qué pasa cuando la IA se vuelva demasiado inteligente y nos gane en Pokémon?
www.xataka.com Informática
El error en el código que no enviaba la señal de preparación cuando no había una imagen de fondo

Windows 7 tardaba medio minuto más en arrancar si no usabas una imagen como fondo de pantalla. Un ingeniero de Microsoft explica por qué

En 2009, usuarios de Windows 7 notaron un retraso de medio minuto en el arranque si usaban un color sólido como fondo de pantalla. Raymond Chen, ingeniero de Microsoft, explica que el problema se debía a un error en el código que no enviaba la señal de preparación cuando no había una imagen de fondo. El servicio Desktop Window Manager Session Manager estaba activado y el usuario iniciaba sesión localmente. Microsoft solucionó el problema con una actualización en noviembre de 2009. Los usuarios podían aplicar soluciones provisionales como usar una imagen como fondo o modificar el Registro de Windows para cambiar el valor de 'DelayedDesktopSwitchTimeout' de 30 a 5 segundos.
...es un ejemplo perfecto de cómo un pequeño error en el código puede causar un gran problema. Es como si Microsoft hubiera dicho: '¿Quién necesita un fondo de pantalla cuando puedes tener un reloj de arena?' En serio, es interesante ver cómo los ingenieros de Microsoft solucionaron el problema y cómo los usuarios podían aplicar soluciones provisionales. Pero, en general, el artículo es un recordatorio de que, incluso en el mundo de la tecnología, los pequeños detalles pueden hacer una gran diferencia.
www.genbeta.com Informática
La IA de Google puede generar explicaciones plausibles para frases inventadas

Google y los dichos inventados: la inteligencia artificial que explica lo que no existe

Google AI Overviews es una función de resumen potenciada por inteligencia artificial que ofrece explicaciones detalladas para frases sin sentido, como proverbios inventados. Al escribir una frase como 'un pato-perro nunca parpadea dos veces' y añadir 'significado', la IA responde con una definición y una historia de origen creíble. Esto revela cómo los modelos de lenguaje de IA se basan en patrones de texto y no en hechos reales, lo que puede llevar a la desinformación.
...es un ejemplo perfecto de cómo la tecnología puede ser a la vez fascinante y aterradora. La capacidad de la IA para generar explicaciones creíbles para frases inventadas es un logro impresionante, pero también un recordatorio de que la verdad es lo que la tecnología decide que es. Así que la próxima vez que leas algo en internet, pregúntate: ¿es verdad o solo es un pato-perro con gafas de sol?
wwwhatsnew.com Tecnología
La antena es gratis con un compromiso de permanencia de 12 meses

Starlink ahora te regalará la antena si aceptas un compromiso de permanencia de 12 meses

Starlink ofrece una promoción en la que regala la antena si se acepta un compromiso de permanencia de 12 meses. El Plan Residencial cuesta 40 euros al mes y ofrece velocidades de descarga entre 150-250 Mbps y subida entre 5-20 Mbps. La antena cuesta 349 euros, pero se ahorra con el compromiso de permanencia. El plan está dentro de una prueba de 30 días y se puede cancelar con devolución del pago de la primera mensualidad.
La promoción de Starlink es como un matrimonio: te dan la antena gratis, pero te atan a un compromiso de 12 meses. ¿Vale la pena? Bueno, si no te importa estar atado a una relación a largo plazo, entonces sí. Pero si eres de los que gusta de tener libertad para cambiar de proveedor en cualquier momento, entonces mejor piénsatelo dos veces. En fin, la antena gratis es un buen cebo, pero no te dejes llevar solo por eso.
elchapuzasinformatico.com Tecnología
OpenAI, Perplexity, Yahoo y Oracle están interesadas en adquirir Chrome

Empresas interesadas en adquirir Chrome ante posible venta forzada por la justicia estadounidense

Google podría verse obligada a vender Chrome debido a una resolución judicial que la cataloga como monopolio, con un 64% de cuota global en el mercado de navegadores. El Departamento de Justicia de Estados Unidos insiste en que la venta permitiría a un nuevo rival operar en el mercado de búsquedas en internet. Empresas como OpenAI, Perplexity, Yahoo y Oracle han manifestado interés en adquirir Chrome. La venta podría tener implicaciones significativas en el mercado de búsquedas, con OpenAI planeando integrar su tecnología de búsqueda directamente en el navegador. El proceso judicial comenzó en septiembre de 2023 y culminó en agosto de 2024, con Google anunciando su intención de apelar las resoluciones.
...es como un juego de '¿quién quiere comprar Chrome?' con varias empresas interesadas en adquirir el navegador. Pero, ¿qué pasará con los usuarios de Chrome? ¿Se verán afectados por la venta? ...no lo dice, pero seguro que será un tema de debate en el futuro. Mientras tanto, Google sigue defendiendo su posición, pero parece que la justicia estadounidense no está de su lado. ¡Qué emoción! ¡Un monopolio en apuros!
wwwhatsnew.com Tecnología
La función 200S Boost mejora el rendimiento en un 2% en juegos como Baldur's Gate 3

Intel 200S Boost: así es la función para las CPU Arrow Lake K que permitirá aumentar su rendimiento con memoria de hasta 8.000 MHz cubierta por garantía

Intel lanza la función 200S Boost para mejorar el rendimiento de las CPU Intel Core Ultra 200S con un overclocking de memoria de hasta 8.000 MHz. La función se integrará en las placas base de la serie Z y solo funcionará con CPU Intel Core Ultra 200S K o KF. La mejora de rendimiento es de 2-3 FPS en juegos como Baldur's Gate 3 y 1 FPS en Final Fantasy XVI. Sin embargo, la diferencia de rendimiento real es muy pequeña y los Ryzen 9800X3D y 9950X3D son un 33% más rápidos en juegos.
...promete una mejora de rendimiento revolucionaria, pero en realidad solo ofrece un aumento de 2% en algunos juegos. Es como prometer un Ferrari y entregar un scooter. La función 200S Boost es más un parche para salvar la cara que una verdadera innovación. Intel sigue intentando competir con AMD, pero parece que todavía tienen mucho que aprender.
elchapuzasinformatico.com Informática
Siguiente>
Share on Whatsapp Share on X Share on LinkedIn Share by Mail Copiar enlace