por Hipertextual
3 de junio de 2025
A unos días del lanzamiento del nuevo modelo de DeepSeek, ha surgido el rumor de que la IA se entrenó usando a Gemini. Un investigador llevó a cabo pruebas de escritura y descubrió que la IA china produce resultados similares a su contraparte de Google. Aunque no existe evidencia de que DeepSeek se haya aprovechado de Gemini, esta no es la primera vez que la empresa de origen chino está en el ojo del huracán.
De acuerdo con TechCrunch, un investigador descubrió similitudes preocupantes entre DeepSeek-R1-0528 y Gemini 2.5 Pro. Sam Paech, un desarrollador que creó un benchmark de inteligencia emocional para modelos de IA, encontró que la IA china produce resultados similares en la escritura creativa. DeepSeek R1-0528 tiende a repetir las mismas palabras o frases que Gemini 2.5 Pro, el modelo más poderoso de Google.
"Si te preguntas por qué el nuevo deepseek r1 suena un poco diferente, creo que probablemente cambiaron del entrenamiento en openai sintético a salidas gemini sintéticas", mencionó Paech en una publicación de X. Según el investigador, las pruebas de escritura creativa generan un perfil que sirve para analizar patrones léxicos sobrerrepresentados.
Aunque DeepSeek-R1-0528 obtiene un resultado notable en el benchmark, su desempeño se ha visto opacado por su similitud con Gemini 2.5 Pro. La gravedad de las acusaciones no sorprende a nadie, si consideramos que ocurrió lo mismo con OpenAI.
DeepSeek deja atrás a ChatGPT y ahora se entrena con Gemini
Hace unos meses, OpenAI acusó a DeepSeek de entrenar a su modelo con los registros de ChatGPT. La empresa dirigida por Sam Altman descubrió que DeepSeek utilizó una técnica que permite transferir el conocimiento de un modelo a otro para reducir costes. Si bien la destilación se utiliza en la industria para entrenar a los modelos pequeños, los desarrolladores chinos habrían encontrado un mejor uso.
Según reportó Financial Times, OpenAI y Microsoft analizaron cuentas de desarrolladores ligadas a DeepSeek y encontraron rastros de destilación. Debido a que esta práctica violaba los términos de uso, la empresa cerró las cuentas y bloqueó el acceso a su API. Lamenteablemente para OpenAI, el daño estaba hecho y DeepSeek ya había obtenido lo que buscaba.
Tras ese incidente, ahora la balanza se inclina del lado de Gemini. La IA de Google ha demostrado un avance considerable en muchas áreas, incluyendo el razonamiento y la programación, por lo que no suena descabellado que DeepSeek la haya tomado como base para su entrenamiento.
Eso piensa Nathan Lambert, investigador del instituto AI1, quien cree que los chinos entrenaron a su IA usando datos sintéticos de Google. "Si yo fuera DeepSeek, definitivamente crearía una tonelada de datos sintéticos a partir del mejor modelo de API que existe", dijo en una publicación de X.
DeepSeek no ha respondido a los señalamientos y probablemente no lo hará. La IA china no está sujeta a ninguna ley que le obligue a seguir las reglas de las empresas occidentales, aunque estas acciones podrían acelerar un posible veto en Estados Unidos. Basta recordar que OpenAI pidió bloquear a DeepSeek y otras IA de origen chino por supuestos nexos con el Partido Comunista Chino.