OpenAI ha respondido a las acusaciones del New York Times sobre el uso de los artículos producidos por dicho medio para el entrenamiento de su modelo de inteligencia artificial ChatGPT. La compañía afirma que no tienen mérito y que aún espera llegar a una solución concertada.
Cabe recordar que el diario había señalado que una enorme cantidad de artículos bajo derecho de copia habían sido tomados sin permiso para el entrenamiento. Además, en ocasiones la IA había reproducido fragmentos completos de los artículos.
La defensa
Según OpenAI el NYT ha utilizado consignas con fragmentos de sus artículos con la intención de conseguir el efecto señalado en la acusación. Sin embargo, aún en estos casos los modelos de lenguaje de la empresa no responden del modo en que el diario ha señalado. Por dicha razón o bien el NYT le pidió al modelo explícitamente que reprodujera los artículos o seleccionó los ejemplos presentados de un gran número de intentos.
OpenAI también afirma que ha intentado reducir este efecto en sus modelos y que el New York Times se ha negado a compartir ejemplos antes de la demanda.
Finalmente, sostiene que los ejemplos ofrecidos son de artículos que han sido reproducidos en varios sitios web de terceros.
Derecho de copia, uso justo y grandes modelos
OpenaAI mantiene la postura de que para poder desarrollar las IA es necesario una gran cantidad de información. Entrenar a los modelos con los datos que se encuentran en Internet, afirma, puede clasificarse como un uso justo de material bajo derechos de copia.
La compañía había señalado que las empresas que no quieran que se use su material pueden bloquear los sistemas utilizados para recabar información. Pero esta opción es algo similar a informarle a un amigo que puede etiquetar las cosas que no quiere que te lleves prestadas de su casa, un buen tiempo después de haberte llevado de su casa varias cosas prestadas.