Ir al contenido principal

OpenAI contraataca a la demanda del New York Times contra ChatGPT: "Sus contenidos no son significativos para el aprendizaje del chatbot"




Publicado en "El Mundo" (España)

Una avalancha de demandas en un tribunal federal de Nueva York pondrá a prueba el futuro de ChatGPT y otros productos de inteligencia artificial que se han nutrido de grandes cantidades de obras humanas protegidas por derechos de autor para conseguir la elocuencia que caracteriza a sus chatbots.

El avance, sin embargo, abre una falla entre la tecnología y los profesionales y medios de comunicación. La pregunta que habrán de dirimir las leyes que regulen el uso de la inteligencia artificial es: ¿incumplen estos productos ampliamente comercializados fabricados por OpenAI y su socio comercial Microsoft las leyes sobre derechos de autor y competencia leal?

"Me gustaría ser optimista en nombre de los autores, pero no lo soy. Creo que tienen una ardua batalla por delante", afirma la abogada especializada en derechos de autor Ashima Aggarwal, que trabajó para el gigante editorial John Wiley & Sons.

Una de las demandas procede de The New York Times. Otra, de un grupo de reconocidos novelistas como John Grisham, Jodi Picoult y George R.R. Martin. Una tercera, de escritores de no ficción de gran éxito, incluido el autor de la biografía ganadora del Premio Pulitzer en la que se basó la galardonada película Oppenheimer.

Cada una de las demandas presenta argumentos diferentes, pero todas se centran en que la empresa OpenAI, con sede en San Francisco, "ha creado este producto a partir de la propiedad intelectual de otras personas", explica el abogado Justin Nelson, que representa a los escritores de no ficción y cuyo despacho también representa a The New York Times. "Lo que dice OpenAI es que tiene vía libre para adueñarse de la propiedad intelectual de cualquier otra persona desde el principio de los tiempos, siempre y cuando se encuentre en internet", afirma.

The New York Timesinterpuso una demanda en diciembre en la que alegaba que ChatGPT y el chatbotCopilot de Microsoft compiten contra los mismos medios con los que se entrenan y desvían el tráfico web del periódico y de otros dueños de derechos de autor que dependen de los ingresos publicitarios que generan sus sitios para seguir produciendo su periodismo. También presentó evidencias de que los chatbots repetían artículos del Times palabra por palabra. En otras ocasiones, los chatbots atribuyeron falsamente información errónea al periódico, lo que perjudica su reputación.

Un juez federal preside hasta ahora los tres casos, así como un cuarto de otros dos autores de no ficción que presentaron otra demanda la semana pasada. El juez federal de distrito Sidney H. Stein dirige el tribunal de Manhattan desde 1995, cuando fue nombrado por el entonces presidente Bill Clinton.
OPENAI RESTA CREDIBILIDAD A LAS DEMANDAS

OpenAI y Microsoft aún no han presentado contraargumentos formales sobre los casos de Nueva York, pero OpenAI sí ha hecho una declaración pública esta semana en la que se refiere a la demanda de The New York Times como "sin credibilidad" y señaló que los casos en que el chatbot repitió textualmente algunos artículos fue un "fallo inusual".

"El entrenamiento de modelos de inteligencia artificial con materiales de acceso público en internet es un uso legítimo, como demuestran precedentes antiguos y ampliamente aceptados", afirmó el lunes la empresa en su blog. También insinuó que The New York Times "ordenó al modelo que lo reprodujera o seleccionó sus ejemplos de entre muchos intentos".

OpenAI se refirió igualmente a los acuerdos de licencia que firmó el año pasado con The Associated Press, con la empresa alemana de medios Axel Springer y con otras organizaciones como ejemplos de cómo la compañía está tratando de apoyar un ecosistema de noticias saludable. OpenAI paga una cantidad no revelada por la licencia del archivo de noticias de la AP. The New York Times mantuvo conversaciones similares antes de decidir demandar.

OpenAI afirmaba que el acceso al "archivo de textos de alta calidad y basados en hechos" de AP mejoraría las capacidades de sus sistemas de IA. Pero su blog de esta semana restaba importancia al contenido de las noticias para el entrenamiento de la IA, argumentando que los grandes modelos lingüísticos aprenden de un "enorme conjunto de conocimientos humanos" y que "cualquier fuente de datos individual —incluido The New York Times— no es significativa para el aprendizaje previsto del modelo".

Gran parte del argumento de la industria de la IA se basa en la doctrina del "uso justo" de la ley de derechos de autor de Estados Unidos, la cual permite usos limitados de materiales protegidos por derechos de autor, para la enseñanza, la investigación o la transformación de la obra protegida en algo diferente.

En respuesta, el equipo legal que representa a The New York Times escribió el martes que lo que OpenAI y Microsoft están haciendo "no es uso justo bajo ningún concepto", porque están aprovechando la inversión del periódico en su periodismo "para construir productos sustitutivos sin permiso ni pago".
GUERRA EN LOS TRIBUNALES

Hasta ahora, los tribunales se han puesto mayoritariamente del lado de las empresas tecnológicas a la hora de interpretar cómo las leyes de derechos de autor deben tratar a los sistemas de IA. En una derrota para los artistas visuales, un juez federal de San Francisco desestimó el año pasado buena parte de la primera gran demanda contra los generadores de imágenes por IA. Otro juez de California rechazó los argumentos de la comediante Sarah Silverman de que la empresa matriz de Facebook, Meta, había infringido los derechos de su autobiografía para construir su modelo de IA.

Las demandas más recientes han aportado pruebas más detalladas de los supuestos perjuicios, pero Aggarwal asegura que cuando se trata de utilizar contenidos protegidos por derechos de autor para entrenar sistemas de inteligencia artificial que ofrecen una "pequeña parte de esos contenidos a los usuarios, los tribunales no parecen inclinados a considerar que se trata de una infracción de los derechos de autor".

Las empresas tecnológicas citan como precedente el éxito de Google a la hora de rechazar las impugnaciones legales contra su biblioteca de libros digitales. En 2016, el Tribunal Supremo de Estados Unidos confirmó la resolución de un tribunal de menor instancia que rechazaba el argumento de los autores de que la digitalización de millones de libros por parte de Google y la exhibición pública de fragmentos de los mismos constituían una infracción de los derechos de autor.

Pero los jueces interpretan los argumentos del uso justo caso por caso y "en realidad depende mucho de los hechos", en función del impacto económico y otros factores, asegura Cathy Wolfe, ejecutiva de la empresa holandesa Wolters Kluwer, que también forma parte del consejo del Copyright Clearance Center, que ayuda a negociar licencias de medios impresos y digitales en Estados Unidos.

"Sólo porque algo esté gratis en internet, en una página web, no significa que puedas copiarlo y enviarlo por correo electrónico, mucho menos utilizarlo para realizar negocios comerciales", dijo Wolfe. "¿Quién va a ganar? No lo sé, pero desde luego soy partidaria de proteger los derechos de autor para todos. Eso impulsa la innovación".

Algunos medios de comunicación y otros creadores de contenidos miran más allá de los tribunales y piden a los legisladores o a la Oficina de Derechos de Autor de la Biblioteca del Congreso de Estados Unidos que refuercen la protección de los derechos de autor en la era de la IA. Un grupo de la Comisión de Asuntos Jurídicos del Senado de Estados Unidos escuchará este miércoles el testimonio de ejecutivos y defensores de los medios de comunicación en una audiencia dedicada al efecto de la IA en el periodismo.

Roger Lynch, director general de la cadena de revistas Condé Nast, tiene previsto decir a los senadores que las empresas de IA generativa "están utilizando nuestra propiedad intelectual robada para construir herramientas de sustitución".

"Creemos que la solución legislativa puede ser sencilla: aclarar que el uso de contenidos protegidos por derechos de autor en relación con la IA generativa comercial no es un uso justo y requiere un permiso", dice una copia de las declaraciones preparadas por Lynch.


*El logo de OpenAI sobre una página de ChatGPT. MICHAEL DWYERAP

Comentarios

Entradas populares de este blog

La semana de los Trolls

Por  "laaprendiz " (Bolg propio)     Un troll es la peor pesadilla de un community manager. Si no sabes gestionarlo, te puede arruinar tu reputación profesional y la de la marca que gestionas. Por ese motivo, he decidido dedicar esta semana a esas criaturas que pueblan nuestros territorios y nos amenazan. Así pues, desenvainad las espadas, pulid vuestros yelmos y encomendaros a vuestros dioses.  ¡Bienvenidos a la semana de los trolls! Aspecto de un troll Un troll no debe confundirse, en un primer momento, con un usuario enfadado o molesto con la marca que gestionamos. La principal característica de un troll es que nunca será aplacado con una respuesta satisfactoria en forma de disculpa o solución a un problema . ¡Para nada! Sus principales características son: Provocador. Va a intentar por todos los medios provocar el enfrentamiento con el community manager o con otros usuarios a través de sus comentarios. Y ni que decir tiene que sus

Más allá de los mitos: lo que la Generación Z quiere realmente del marketing digital

Publicado en "Marketing Digital".- Los  profesionales del marketing  tienden a definir a los miembros de  la  Generación Z   como «adictos» al scroll, que desean que todo el contenido sea corto y fácil de consumir, pero ese no es el caso de una generación realmente compleja. Las etiquetas no son nada nuevo para los «Gen Z», pero si hay una que destaca sobre todas las demás es la de nativos digitales. Como la primera generación que creció completamente inmersa en las posibilidades de la tecnología, los nacidos entre 1995 y 2009, han pasado más tiempo frente a las pantallas que otras generaciones, pero este hecho ha generado un mito: que la Generación Z prioriza la tecnología sobre las experiencias en el mundo real. Pero,  como recogen desde  Ad Age , es todo lo contrario. Los miembros de esta generación están desarrollando  un escepticismo creciente hacia la tecnología  y las redes sociales, lo que se manifiesta de diferentes formas: desde abandonar sus dispositivos móviles a

Jóvenes de Latinoamérica compartieron sus opiniones de la experiencia en línea de TikTok

Publicado en "TotalMedios".- Durante los meses de abril y mayo de 2024, TikTok y Chicos.net, una organización civil sin fines de lucro con sede en Buenos Aires que promueve los derechos de la juventud en entornos digitales, unieron esfuerzos para abrir espacios de discusión y diálogo con los adolescentes de Latinoamérica. Este espacio permitió escuchar sus recomendaciones, preocupaciones y nuevas ideas sobre temas como la seguridad juvenil, el bienestar y la salud mental con el objetivo de mejorar la plataforma, así como la experiencia en línea. Esta iniciativa impulsada por TikTok tuvo como propósito promover la participación de los jóvenes y fomentar su rol como ciudadanos digitales. Se convocaron participantes provenientes de Argentina, Chile, Colombia, El Salvador, Honduras y Perú de entre 14 y 19 años usuarios de la plataforma y a adolescentes que forman parte de organizaciones juveniles. Por medio de cinco sesiones dinámicas y a través de videos, frases y ejemplos, TikT