Google DeepMind ha presentado File Search, una función integrada en la API de Gemini que ofrece un sistema RAG completamente gestionado. Esto significa que los desarrolladores ya no necesitan construir y mantener por separado una infraestructura de recuperación de información. La promesa de simplicidad y bajo costo se refleja en el modelo de facturación, que ofrece almacenamiento gratuito y generación de 'embeddings' durante la consulta, cobrando solo por la generación inicial de embeddings al momento de indexar los archivos, a un precio fijo de 0,15 dólares por cada millón de tokens. File Search se basa en integrar automáticamente todo el flujo de trabajo de RAG dentro del API, almacenando archivos, dividiéndolos en fragmentos óptimos y generando los embeddings correspondientes. La búsqueda semántica es posible gracias al modelo gemini-embedding-001, que entiende el significado de las consultas incluso cuando no coinciden literalmente con el contenido de los documentos. La transparencia se logra mediante citas automáticas que indican qué partes de los documentos fueron utilizadas para construir la respuesta. File Search soporta una variedad extensa de formatos y ha sido utilizada por empresas como Phaser Studio, que ha visto una mejora significativa en la eficiencia y creatividad gracias a esta herramienta.