Actualizado el 11/05/2024

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. El New York Times demanda a OpenAI por entrenar a ChatGPT con sus artículos

El New York Times demanda a OpenAI por entrenar a ChatGPT con sus artículos

Escrito por Guillem Alsina el 16/01/2024 a las 08:42:26
406

Los modelos de inteligencia artificial necesitan de lo que se llama un ‘entrenamiento’ para aprender a crear contenidos. Dicho entrenamiento, que consiste en alimentar un motor de aprendizaje (que no deja de ser un algoritmo) con contenidos como ejemplo, requiere de grandes cantidades de aquello que va a acabar generando el modelo, sea esto texto o imágenes, según se tercie.


La mayoría de las compañías productoras de grandes modelos de lenguaje, lo que han hecho es ‘peinar’ toda Internet, utilizando todo el contenido posible para entrenar a sus respectivos modelos, ampliando así notablemente tanto su base de conocimiento, como sus habilidades y diversidad de estilos para generar contenidos. Y OpenAI no ha sido una excepción en esto para GPT (y también ChatGPT).


Ya han sido diversos los medios de comunicación y editoriales que han puesto demandas a OpenAI y otras empresas productoras de grandes modelos de lenguaje por el uso indebido de sus contenidos para entrenar a estos modelos. El último de estos medios ha sido el reputado The New York Times, que se ha personado ante los tribunales estadounidenses contra OpenAI y Microsoft, después de que las conversaciones para arreglar este asunto fuera de los tribunales no hayan acabado bien.


La demanda presentada por el NYT, que podemos encontrar aquí, empieza por poner de relieve los más de 170 años de existencia de un rotativo que se ha ganado a pulso la buena reputación de su periodismo de investigación, lo cual es indisociable de su amplio plantel de periodistas. Este, a su vez, supone una gran inversión económica por parte de la empresa.


Y, a partir de aquí, el rotativo acusa a OpenAI y Microsoft (esta última, por utilizar los algoritmos generativos de OpenAI en su producto Copilot) de utilizar el trabajo de estos periodistas y, por lo tanto, propiedad del New York Times, para entrenar el modelo de lenguaje GPT, de forma que este es capaz no solamente de imitar, sino también de copiar literalmente, artículos del afamado diario, los cuáles están protegidos por un muro de pago.


Además, y según la demanda, OpenAI dio especial énfasis al contenido del NYT en la construcción de sus modelos de lenguaje, lo cual, además, le da todavía mayor valor añadido a dicho contenido.


La empresa propietaria del rotativo solicita, a partir de aquí, una orden judicial que prohíba permanentemente a OpenAI de utilizar sus contenidos en los modelos de lenguaje que desarrolle, así como a Microsoft utilizarlos para sus servicios de cara al público.


También -y este es el punto más llamativo de la demanda- solicita la destrucción de los modelos GPT y cualquiera de los productos que los utilicen (tales como ChatGPT y Copilot) que hayan sido entrenados con datos procedentes del periódico.


Esto puede tener un impacto demoledor para los usuarios de los productos de OpenAI, ya sea ChatGPT o aplicaciones hechas a medida que utilicen las APIs de los modelos GPT, puesto que no es tan fácil como borrar los artículos del NYT del modelo, sinó que requeriría volver a entrenarlo de la forma prescrita por el juez.


En definitiva, es una demanda que, de salir adelante y resultar exitosa para el New York Times, puede suponer un vuelco enorme en el desarrollo de modelos de lenguaje y chatbots, y abrir la puerta a una época de incertidumbre entre los productores de este tipo de soluciones, además de poder afectar directamente y de forma muy impactante, a los usuarios del modelo GPT de OpenAI, incluidos los de ChatGPT.