Meta ha lanzado Omnilingual ASR, un sistema de reconocimiento automático del habla que soporta más de 1.600 idiomas de forma nativa y puede adaptarse a miles más sin necesidad de reentrenamiento. Esta tecnología utiliza aprendizaje sin disparo y aprendizaje contextual, permitiendo transcribir nuevos idiomas con solo unos pocos ejemplos de audio y texto. El sistema está diseñado para ser accesible y adaptable, y se distribuye bajo licencia Apache 2.0. El conjunto incluye modelos de transcripción, un modelo de representación de audio de 7 mil millones de parámetros y un corpus de voz masivo con más de 350 idiomas previamente poco representados. El sistema ha sido entrenado con más de 4,3 millones de horas de audio en 1.600 lenguas, incluyendo más de 500 que nunca habían sido cubiertas por modelos ASR. La tasa de error de caracteres es inferior al 10% en el 78% de los idiomas admitidos. El modelo más avanzado requiere 17 GB de memoria GPU para funcionar, pero existen versiones más ligeras que permiten transcripción en tiempo real incluso en dispositivos modestos. Meta ha trabajado con universidades y organizaciones comunitarias en regiones como África y Asia para construir el sistema. El lanzamiento de Omnilingual ASR representa un cambio en la estrategia de Meta en el ámbito de la IA, centrándose en la comunidad, la transparencia y la extensibilidad.