
Google ha desarrollado Gemma 3n, un modelo pequeño de lenguaje con capacidad multimodal que puede comprender texto, imágenes, video y audio en dispositivos locales como móviles y tabletas. La plataforma LiteRT alberga más de una docena de modelos ligeros listos para ejecutar localmente, incluyendo Gemma 3 1B con 529 MB de tamaño y una velocidad de hasta 2.585 tokens por segundo en GPU móvil. La compatibilidad con RAG y Function Calling permite a los modelos pequeños acceder a información específica de una aplicación y ejecutar acciones sin necesidad de conexiones externas. Los casos de uso incluyen técnicos de campo, trabajadores de cocina y aplicaciones educativas.