
MoCha es una tecnología de inteligencia artificial desarrollada por Meta en colaboración con la Universidad de Waterloo, que permite generar personajes parlantes a partir de un texto y una muestra de voz. Utiliza técnicas de aprendizaje automático y redes neuronales profundas, entrenadas con más de 500.000 clips de vídeo con audio sincronizado, equivalentes a 300 horas de contenido en alta calidad. MoCha puede generar vídeos con personajes que hablan de forma realista, con gestos, movimientos faciales y expresiones que coinciden con el tono emocional del audio. Puede trabajar con varios personajes a la vez y mantener la coherencia en las escenas. Aunque todavía hay ciertos detalles que delatan que se trata de un vídeo generado por IA, los resultados son impresionantes. MoCha se compara con otras herramientas como Runway Gen-4, Microsoft VASA-1, ByteDance y OmniHuman-1, destacando por su equilibrio entre sincronización de voz, expresión emocional y capacidad para manejar múltiples personajes en una sola escena.