
DeepSeek ha lanzado su modelo R1-0528, que ha generado controversia sobre el origen de los datos utilizados para entrenarlo. Se sospecha que el modelo podría haber sido entrenado con salidas generadas por Gemini, el modelo de lenguaje desarrollado por Google. Un análisis comparativo realizado por Sam Paeach sugiere que R1-0528 utiliza expresiones y palabras similares a las de Gemini 2.5 Pro. Además, el creador de SpeechMap encontró similitudes en las huellas internas o 'traces' generadas por el modelo de DeepSeek y las de Gemini. DeepSeek enfrenta acusaciones de haber utilizado una técnica conocida como destilación, que consiste en generar un nuevo modelo a partir de las respuestas de modelos más grandes y avanzados. OpenAI confirmó haber encontrado indicios de que DeepSeek podría estar utilizando esta técnica, lo que generó controversia sobre el uso de salidas de modelos de terceros protegidos por términos de servicio.