OpenAI contraataca a la demanda del New York Times contra ChatGPT: "Sus contenidos no son significativos para el aprendizaje del chatbot"

Publicado en "El Mundo" (España)

Una avalancha de demandas en un tribunal federal de Nueva York pondrá a prueba el futuro de ChatGPT y otros productos de inteligencia artificial que se han nutrido de grandes cantidades de obras humanas protegidas por derechos de autor para conseguir la elocuencia que caracteriza a sus chatbots.

El avance, sin embargo, abre una falla entre la tecnología y los profesionales y medios de comunicación. La pregunta que habrán de dirimir las leyes que regulen el uso de la inteligencia artificial es: ¿incumplen estos productos ampliamente comercializados fabricados por OpenAI y su socio comercial Microsoft las leyes sobre derechos de autor y competencia leal?

"Me gustaría ser optimista en nombre de los autores, pero no lo soy. Creo que tienen una ardua batalla por delante", afirma la abogada especializada en derechos de autor Ashima Aggarwal, que trabajó para el gigante editorial John Wiley & Sons.

Una de las demandas procede de The New York Times. Otra, de un grupo de reconocidos novelistas como John Grisham, Jodi Picoult y George R.R. Martin. Una tercera, de escritores de no ficción de gran éxito, incluido el autor de la biografía ganadora del Premio Pulitzer en la que se basó la galardonada película Oppenheimer.

Cada una de las demandas presenta argumentos diferentes, pero todas se centran en que la empresa OpenAI, con sede en San Francisco, "ha creado este producto a partir de la propiedad intelectual de otras personas", explica el abogado Justin Nelson, que representa a los escritores de no ficción y cuyo despacho también representa a The New York Times. "Lo que dice OpenAI es que tiene vía libre para adueñarse de la propiedad intelectual de cualquier otra persona desde el principio de los tiempos, siempre y cuando se encuentre en internet", afirma.

The New York Timesinterpuso una demanda en diciembre en la que alegaba que ChatGPT y el chatbotCopilot de Microsoft compiten contra los mismos medios con los que se entrenan y desvían el tráfico web del periódico y de otros dueños de derechos de autor que dependen de los ingresos publicitarios que generan sus sitios para seguir produciendo su periodismo. También presentó evidencias de que los chatbots repetían artículos del Times palabra por palabra. En otras ocasiones, los chatbots atribuyeron falsamente información errónea al periódico, lo que perjudica su reputación.

Un juez federal preside hasta ahora los tres casos, así como un cuarto de otros dos autores de no ficción que presentaron otra demanda la semana pasada. El juez federal de distrito Sidney H. Stein dirige el tribunal de Manhattan desde 1995, cuando fue nombrado por el entonces presidente Bill Clinton.

OPENAI RESTA CREDIBILIDAD A LAS DEMANDAS

OpenAI y Microsoft aún no han presentado contraargumentos formales sobre los casos de Nueva York, pero OpenAI sí ha hecho una declaración pública esta semana en la que se refiere a la demanda de The New York Times como "sin credibilidad" y señaló que los casos en que el chatbot repitió textualmente algunos artículos fue un "fallo inusual".

"El entrenamiento de modelos de inteligencia artificial con materiales de acceso público en internet es un uso legítimo, como demuestran precedentes antiguos y ampliamente aceptados", afirmó el lunes la empresa en su blog. También insinuó que The New York Times "ordenó al modelo que lo reprodujera o seleccionó sus ejemplos de entre muchos intentos".

OpenAI se refirió igualmente a los acuerdos de licencia que firmó el año pasado con The Associated Press, con la empresa alemana de medios Axel Springer y con otras organizaciones como ejemplos de cómo la compañía está tratando de apoyar un ecosistema de noticias saludable. OpenAI paga una cantidad no revelada por la licencia del archivo de noticias de la AP. The New York Times mantuvo conversaciones similares antes de decidir demandar.

OpenAI afirmaba que el acceso al "archivo de textos de alta calidad y basados en hechos" de AP mejoraría las capacidades de sus sistemas de IA. Pero su blog de esta semana restaba importancia al contenido de las noticias para el entrenamiento de la IA, argumentando que los grandes modelos lingüísticos aprenden de un "enorme conjunto de conocimientos humanos" y que "cualquier fuente de datos individual —incluido The New York Times— no es significativa para el aprendizaje previsto del modelo".

Gran parte del argumento de la industria de la IA se basa en la doctrina del "uso justo" de la ley de derechos de autor de Estados Unidos, la cual permite usos limitados de materiales protegidos por derechos de autor, para la enseñanza, la investigación o la transformación de la obra protegida en algo diferente.

En respuesta, el equipo legal que representa a The New York Times escribió el martes que lo que OpenAI y Microsoft están haciendo "no es uso justo bajo ningún concepto", porque están aprovechando la inversión del periódico en su periodismo "para construir productos sustitutivos sin permiso ni pago".

GUERRA EN LOS TRIBUNALES

Hasta ahora, los tribunales se han puesto mayoritariamente del lado de las empresas tecnológicas a la hora de interpretar cómo las leyes de derechos de autor deben tratar a los sistemas de IA. En una derrota para los artistas visuales, un juez federal de San Francisco desestimó el año pasado buena parte de la primera gran demanda contra los generadores de imágenes por IA. Otro juez de California rechazó los argumentos de la comediante Sarah Silverman de que la empresa matriz de Facebook, Meta, había infringido los derechos de su autobiografía para construir su modelo de IA.

Las demandas más recientes han aportado pruebas más detalladas de los supuestos perjuicios, pero Aggarwal asegura que cuando se trata de utilizar contenidos protegidos por derechos de autor para entrenar sistemas de inteligencia artificial que ofrecen una "pequeña parte de esos contenidos a los usuarios, los tribunales no parecen inclinados a considerar que se trata de una infracción de los derechos de autor".

Las empresas tecnológicas citan como precedente el éxito de Google a la hora de rechazar las impugnaciones legales contra su biblioteca de libros digitales. En 2016, el Tribunal Supremo de Estados Unidos confirmó la resolución de un tribunal de menor instancia que rechazaba el argumento de los autores de que la digitalización de millones de libros por parte de Google y la exhibición pública de fragmentos de los mismos constituían una infracción de los derechos de autor.

Pero los jueces interpretan los argumentos del uso justo caso por caso y "en realidad depende mucho de los hechos", en función del impacto económico y otros factores, asegura Cathy Wolfe, ejecutiva de la empresa holandesa Wolters Kluwer, que también forma parte del consejo del Copyright Clearance Center, que ayuda a negociar licencias de medios impresos y digitales en Estados Unidos.

"Sólo porque algo esté gratis en internet, en una página web, no significa que puedas copiarlo y enviarlo por correo electrónico, mucho menos utilizarlo para realizar negocios comerciales", dijo Wolfe. "¿Quién va a ganar? No lo sé, pero desde luego soy partidaria de proteger los derechos de autor para todos. Eso impulsa la innovación".

Algunos medios de comunicación y otros creadores de contenidos miran más allá de los tribunales y piden a los legisladores o a la Oficina de Derechos de Autor de la Biblioteca del Congreso de Estados Unidos que refuercen la protección de los derechos de autor en la era de la IA. Un grupo de la Comisión de Asuntos Jurídicos del Senado de Estados Unidos escuchará este miércoles el testimonio de ejecutivos y defensores de los medios de comunicación en una audiencia dedicada al efecto de la IA en el periodismo.

Roger Lynch, director general de la cadena de revistas Condé Nast, tiene previsto decir a los senadores que las empresas de IA generativa "están utilizando nuestra propiedad intelectual robada para construir herramientas de sustitución".

"Creemos que la solución legislativa puede ser sencilla: aclarar que el uso de contenidos protegidos por derechos de autor en relación con la IA generativa comercial no es un uso justo y requiere un permiso", dice una copia de las declaraciones preparadas por Lynch.

*El logo de OpenAI sobre una página de ChatGPT. MICHAEL DWYERAP

Sitios digitales: Infobae lideró en febrero de 2025, seguido por La Nación y TN

Publicado en "TotalMedios".- Se mantienen los tres primeros puestos en la categoría “News/Information” de Comscore. Clarín y Cronista completan el Top5. Por primera vez se mete un sitio de “nicho” como Meteored entre los diez primeros (generalistas). Hubo crecimientos de Los Andes, MinutoUno y Crónica. Infobae se mantuvo en febrero como el sitio de noticias más visitado de la Argentina, según los datos de Comscore, alcanzando los 15,4 millones de visitantes únicos. En el segundo lugar se ubicó La Nación con 13,9 millones, mientras que TN completó el podio con 12,6 millones. En total, la categoría de Comscore “News/Information” alcanzó los 33,5 millones de visitantes únicos, lo que representa una leve baja del -0,49% respecto a enero. La audiencia total de internet en Argentina se mantuvo estable, con 37,7 millones de usuarios. Entre los medios que registraron un crecimiento en su audiencia en comparación con enero, se destacaron Accuweather con una suba del 54,65%, Los Andes ...

NP

Buscar este blog

OpenAI contraataca a la demanda del New York Times contra ChatGPT: "Sus contenidos no son significativos para el aprendizaje del chatbot"

Comentarios

Publicar un comentario

Entradas populares de este blog

Cebrián: “El ‘Libro de estilo’ surge del respeto al lector”

Sitios digitales: Infobae lideró en febrero de 2025, seguido por La Nación y TN

Modelo de PR digital