El auge de la IA provoca una prueba de la ley de derechos de autor

El auge de las herramientas de inteligencia artificial que aprovechan una gran cantidad de contenidos de Internet ha comenzado a poner a prueba los límites de la ley de derechos de autor.

Autores y una importante agencia de fotografía presentaron una demanda durante el año pasado, alegando que su propiedad intelectual se utilizó ilegalmente para entrenar sistemas de inteligencia artificial, que pueden producir procesos similares a los humanos y potenciar aplicaciones como chatbots.

Ahora se les ha sumado la industria de las noticias. El New York Times presentó una demanda el miércoles acusando a OpenAI y Microsoft de infracción de derechos de autor, la primera impugnación de este tipo por parte de una importante organización de noticias estadounidense sobre el uso de inteligencia artificial.

La demanda sostiene que ChatGPT de OpenAI y Bing Chat de Microsoft pueden producir contenido casi idéntico a los artículos del Times, lo que permite a las empresas «aprovechar la enorme inversión del Times en su periodismo usándolo para crear productos sustitutos sin permiso ni pago».

OpenAI y Microsoft no han tenido oportunidad de responder ante los tribunales. Pero después de que se presentó la demanda, esas empresas señalaron que estaban en conversaciones con varias organizaciones de noticias sobre el uso de su contenido y, en el caso de OpenAI, habían comenzado a firmar acuerdos.

Sin tales acuerdos, los límites pueden resolverse en los tribunales, con importantes repercusiones. Los datos son cruciales para el desarrollo de tecnologías generativas de IA (que pueden generar texto, imágenes y otros medios por sí solas) y para los modelos de negocio de las empresas que realizan ese trabajo.

«Los derechos de autor serán uno de los puntos clave que darán forma a la industria de la IA generativa», dijo Fred Havemeyer, analista de la firma de investigación financiera Macquarie.

Una consideración central es la doctrina del “uso justo” en la ley de propiedad intelectual, que permite a los creadores aprovechar el trabajo protegido por derechos de autor. Entre otros factores, los demandados en casos de derechos de autor deben demostrar que transformaron sustancialmente el contenido y no están compitiendo en el mismo mercado como sustituto del trabajo del creador original.

Una reseña que cite pasajes de un libro, por ejemplo, podría considerarse uso legítimo porque se basa en ese contenido para crear un trabajo nuevo y único. Por otro lado, vender extractos extensos del libro puede violar la doctrina.

Los tribunales no han intervenido sobre cómo se aplican esos estándares a las herramientas de inteligencia artificial.

«No hay una respuesta clara sobre si en Estados Unidos eso es una infracción de derechos de autor o un uso legítimo», dijo Ryan Abbott, abogado de Brown Neri Smith & Khan que se ocupa de casos de propiedad intelectual. «Mientras tanto, tenemos muchas demandas en curso con potencialmente miles de millones de dólares en juego».

Podría pasar algún tiempo antes de que la industria obtenga respuestas definitivas.

Las demandas que plantean estas cuestiones se encuentran en las primeras etapas de litigio. Si no llegan a acuerdos (como ocurre con la mayoría de los litigios), podrían pasar años hasta que un Tribunal de Distrito Federal se pronuncie sobre el asunto. Esos fallos probablemente serían apelados, y las decisiones de apelación podrían variar según el circuito, lo que potencialmente podría elevar la cuestión a la Corte Suprema de Estados Unidos.

Llegar allí podría llevar alrededor de una década, dijo Abbott. “Una década es una eternidad en el mercado que vivimos actualmente”, afirmó.

El Times dijo en su demanda que había estado en conversaciones con Microsoft y OpenAI sobre los términos para resolver la disputa, posiblemente incluyendo una licencia. Associated Press y Axel Springer, el propietario alemán de medios como Politico y Business Insider, llegaron recientemente acuerdos de licencia de datos con OpenAI.

Llevar los casos a juicio podría responder preguntas vitales sobre qué datos protegidos por derechos de autor pueden utilizar los desarrolladores de IA y cómo. Pero también podría servir simplemente como palanca para que un demandante consiga un acuerdo de licencia más favorable mediante un acuerdo.

«En última instancia, si esta demanda termina o no dando forma a la ley de derechos de autor dependerá de si la demanda realmente trata sobre el futuro del uso legítimo y los derechos de autor, o si es seguro en una negociación», dijo Jane Ginsburg, profesora de la Facultad de Derecho de Columbia. dijo sobre la demanda por The Times.

La forma en que se desarrolle el panorama legal podría dar forma a la naciente pero muy capitalizada industria de la IA.

Algunas empresas de inteligencia artificial se vieron inundadas de capital de riesgo el año pasado después de que el lanzamiento público de ChatGPT se volviera viral. Un plan de acciones bajo consideración podría valorar OpenAI en más de 80 mil millones de dólares; Microsoft ha invertido 13.000 millones de dólares en la empresa y ha incorporado su tecnología a sus propios productos. Pero las preguntas sobre el uso de la propiedad intelectual para entrenar modelos han sido una de las principales preocupaciones de los inversores, dijo Havemeyer.

La competencia en el campo de la IA puede reducirse a los que tienen y los que no tienen datos.

Las empresas con derechos sobre grandes cantidades de datos, como Adobe y Bloomberg, o que han acumulado sus propios datos, como Meta y Google, han comenzado a desarrollar sus propias herramientas de inteligencia artificial. Havemeyer señaló que una empresa establecida como Microsoft estaba bien equipada para asegurar acuerdos de licencia de datos y abordar desafíos legales. Pero las empresas emergentes con menos capital pueden tener más dificultades para obtener los datos que necesitan para competir.

“La IA generativa comienza y termina con los datos”, afirmó Havemeyer.

Benjamín Mullin contribuyó con informes.