Anthropic, una startup de inteligencia artificial con sede en San Francisco, está preparando el lanzamiento de su modelo Claude 4.5 Opus. Este modelo ha sido enviado a un grupo de expertos en seguridad conocidos como red-teamers para poner a prueba su capacidad para resistir manipulaciones externas. El objetivo es identificar jailbreaks universales verificados y reforzar la seguridad del modelo antes de su despliegue público. Los expertos tienen 10 días para intentar romper las barreras de seguridad del modelo y recibirán bonificaciones económicas si consiguen identificar vulnerabilidades. Anthropic ha lanzado anteriormente dos variantes de Claude 4.5, Sonnet y Haiku, pero Opus es el más avanzado y tiene un enfoque intensivo en la seguridad. El modelo Claude ha sido reconocido como uno de los más robustos frente a ataques externos y este nuevo movimiento confirma su compromiso con la seguridad. La startup ha integrado Claude en plataformas como Microsoft Excel, Teams y Outlook, demostrando que los modelos de lenguaje no están pensados solo para chatbots o asistentes, sino que están empezando a jugar un papel clave en el trabajo diario de millones de personas.