Claude Sonnet 4.5 es un modelo de lenguaje que actúa como un agente autónomo altamente competente, logrando sostener tareas complejas durante más de 30 horas con un enfoque sostenido. Superó a GPT-5 y Gemini 2.5 Pro en la evaluación SWE-bench Verified, alcanzando un 82% de precisión con computación paralela en pruebas de codificación real. También brilla en el uso de herramientas como terminales, interfaces de código, hojas de cálculo y navegadores, gracias a su dominio en benchmarks como OSWorld, donde alcanza un 61,4%. En sectores específicos como las finanzas, logra un 55,3% en el benchmark Finance Agent, superando ampliamente a versiones anteriores. En el ámbito del derecho, empresas como Thomson Reuters destacan su capacidad para sintetizar argumentos legales y generar borradores de resoluciones judiciales. En ciberseguridad, se ha utilizado para detectar vulnerabilidades, analizar amenazas y generar respuestas automatizadas con rapidez y precisión. Anthropic acompaña esta versión con un ecosistema completo de herramientas que potencia la construcción de agentes personalizados. El modelo puede generar documentos como hojas de cálculo o presentaciones, todo a partir de lenguaje natural. Claude Sonnet 4.5 no solo destaca en tareas aplicadas, sino también en evaluaciones académicas exigentes, obteniendo un 100% de aciertos con código y un 87% sin herramientas en la competición AIMEE 2025 de matemáticas de nivel secundario.