Es posible que el talón de Aquiles de la gran mayoría de los proyectos de inteligencia artificial sea el pobre manejo que se ha hecho de la parte legal vinculada a las bases de datos. Las empresas se han apurado en buscar grandes cantidades de información para el entrenamiento de sus modelos, y la fuente elegida ha sido a menudo un ernorme conjunto de sitios web.
Pero al parecer, en algunos casos otras fuentes igualmente o más problemáticas han sido empleadas.
Los desarrolladores no parecen haber considerado lo que implicaba tomar el material sin establecer un acuerdo con las personas que lo habían creado.
Las IA no consumen el material, aprenden de él y se olvidan de que existió. Lo que en realidad hacen es conformar sus respuestas en base a dicho material, por lo que todo lo que generan puede considerarse un derivado.
El uso del material
Esta problemática es la que ha llevado a la comediante estadounidense Sarah Silverman a demandar a OpenAI y Meta por violación de derechos de copia. No es la única autora involucrada en la acción de clase, pero tal vez la más conocida hasta el momento. Tanto ChatGPT como LlaMa habrían utilizado material de los autores sin su consentimiento. Los autores señalan que sus libros aparecen en las bases de datos que los desarrolladores utilizaron.
Este no es el primer caso contra OpenAI. Otros autores han realizado demandas similares.
Muy probablemente los desarrolladores argumenten que el uso de los libros y obras similares puede considerarse un uso justo. El problema es, que como algunas investigaciones han demostrado, las IA pueden generar material muy similar al que se encuentra en su base de datos. Por lo que queda por pensar si debe considerarse cada caso particular o su uso en general.