
Un estudio de la empresa Midgard analiza cómo saltarse los filtros de seguridad de los AI Guardrails utilizando técnicas de Invisible Characters y Prompts Maliciosos. El estudio probó varios AI Guardrails, incluyendo Azure Prompt Shield, Protect AI v1 & v2, Llama (Meta) Prompt Guard y Vijil Prompt, y encontró que existen técnicas de Invisible Character que permiten saltarse el 100% de los casos. Los resultados se presentan en tablas y gráficos, mostrando el Attack Surface Rate para cada técnica y AI Guardrail.