MIE, 29 / ENE / 2025

OpenAI se queja de robo de datos por parte de DeepSeek

El modelo de origen chino habría sido entrenado con una técnica de destilación. ChatGPT, Claude y otros habrían actuado como maestros de DeepSeek.

DeepSeek ha causado una gran impresión en la prensa, los especialistas de IA, los políticos, el público en general e incluso en los ejecutivos de empresas rivales. Uno de los más entusiastas fue el jefe de ciencia en Meta, Yann LeCun. El investigador señaló que DeepSeek se había beneficiado de las investigaciones abiertas y el modelo de código abierto. Esquema que utiliza el modelo de Meta, Llama. “Vinieron con nuevas ideas y construyeron sobre el trabajo de otras personas. Como su tranbajo se publica y es de código abierto todos pueden sacarle provecho. Ese es el poder de la investigación abierta y el código abierto”.

Todo lo dicho es cierto, DeepSeek es verdaderamente un proyecto de código abierto. No sucede lo mismo con, por ejemplo, OpenAI.

Tomando del trabajo de otros

El aprovechamiento del trabajo de otros es algo que se ha manifestado en varios incidentes curiosos. Algunos usuarios ha notado que al pregutarle a la IA por sus reglas de comportamiento, esta señaló que las había establecido OpenAI. En otro caso, cuando se le preguntó cuál era su nombre señaló que oficialmente se la conocía como Claude. Esto parece indicar una herencia del modelo creado por Anthropic.

Lo señalado implica que la versión V3 de la IA china fue entrenada con respuestas generadas por los modelos mencionados. La técnica es conocida como destilación. Supone que un modelo actúa como profesor y transmite sus conocimientos a un modelo estudiante. Esta práctica es en realidad bastante común, pero en general ocurre dentro de los confines de una misma empresa.

OpenAI denuncia el destilado

OpenAI también ha observado la situación y ha señalado que DeepSeek utilizó ChatGPT para entrenar a su modelo. La compañía apunta que el uso de esta técnica va en contra de los términos de uso de su tecnología. Además, afirma que vulnera su propiedad intelectual. Uno de los asesores de Donald Trump, David Sacks, ha advertido también sobre la posibilidad de que se haya producido un robo.

Pero OpenAI ha sostenido que el uso de contenido bajo derecho de copia para entrenara a sus IA es legítimo. Y nunca se ha preocupado por los términos de uso de los autores. Ahora es víctima de las reglas de juego y prácticas que ha impulsado durante años.

Comentarios