
Google ha incorporado la funcionalidad de 'implicit caching' en los modelos Gemini 2.5, lo que permite a los desarrolladores ahorrar recursos sin complicaciones adicionales. Esta tecnología reutiliza partes de las peticiones anteriores que comparten un mismo comienzo para reducir el consumo de tokens y, con ello, el coste de cada llamada a la API. El sistema detecta automáticamente la coincidencia y aplica un descuento del 75% en los tokens cacheados. Los requisitos mínimos para beneficiarse del 'cache hit' son 1024 tokens en Gemini 2.5 Flash y 2048 tokens en Gemini 2.5 Pro.