DeepSeek ha lanzado el modelo V3.1, que incluye una inferencia híbrida y está optimizado para funcionar con chips chinos de próxima generación. El modelo utiliza un formato de datos FP8, que es más ligero que el FP16/BF16 y permite un mayor rendimiento por ciclo. La empresa ha entrenado el modelo utilizando este formato y ha logrado reducir el tiempo de respuesta. El lanzamiento de V3.1 puede tener un impacto en NVIDIA, ya que China representa el 13% de los ingresos de la empresa y la demanda de soluciones occidentales podría erosionarse si los chips chinos dan buenos resultados. El modelo V3.1 está disponible a través de la API y los pesos y el código se encuentran en Hugging Face. La plataforma MathArena ha evaluado el modelo y lo sitúa entre los mejores del momento, con un 90% en pruebas de respuesta final. El lanzamiento de V3.1 es una iteración en la estrategia de DeepSeek para migrar sus procesos a chips chinos, después de que la empresa intentara entrenar su modelo R2 con chips Huawei Ascend y se encontrara con problemas técnicos persistentes.