El New York Times, uno de los periódicos más prestigiosos e influyentes del mundo, ha presentado una demanda contra OpenAI y Microsoft, acusándolos de violar sus derechos de propiedad intelectual al utilizar sus artículos para entrenar y probar sus sistemas de inteligencia artificial.
Según la denuncia, OpenAI y Microsoft han estado utilizando el contenido del New York Times sin autorización ni compensación para desarrollar y mejorar sus modelos de generación de lenguaje natural, como GPT-3 y GPT-4. La demanda afirma que estos modelos son capaces de producir textos que son indistinguibles de los artículos originales y que suponen una amenaza para la calidad, la credibilidad y la rentabilidad del periodismo.
El New York Times sostiene que sus artículos están protegidos por la ley de derechos de autor y que OpenAI y Microsoft han infringido sus derechos al copiar, distribuir, mostrar y crear trabajos derivados de su contenido. La demanda busca una orden judicial para impedir que OpenAI y Microsoft utilicen sus artículos, así como daños y honorarios de abogados.
OpenAI y Microsoft aún no han respondido a la demanda, pero anteriormente han defendido su uso de datos disponibles públicamente para entrenar sus sistemas de inteligencia artificial. También han afirmado que sus modelos están destinados a fines de investigación e innovación, y que cuentan con pautas éticas y salvaguardias para evitar el mal uso y abuso de su tecnología.
La demanda plantea preguntas importantes sobre las implicaciones legales y éticas de la generación de lenguaje natural, un campo de la inteligencia artificial que avanza rápidamente y que tiene muchas aplicaciones y desafíos potenciales. También resalta la tensión entre los intereses de los creadores de contenido y los desarrolladores de tecnología, quienes pueden tener diferentes puntos de vista sobre cómo equilibrar la innovación y la protección en la era digital.
OpenAI y Microsoft enfrentan acciones legales por parte del New York Times por datos de entrenamiento de IA
El New York Times ha presentado una demanda contra OpenAI y Microsoft, acusándolos de utilizar millones de sus artículos para entrenar sus modelos de inteligencia artificial sin autorización. La demanda alega que los grandes modelos de lenguaje (LLM) de las empresas, que pueden producir textos en lenguaje natural sobre diversos temas, han copiado, resumido e imitado el contenido y el estilo del Times.
Los LLM son la base de los productos chatbot de las empresas, ChatGPT y Copilot, que pueden interactuar con los usuarios y generar fragmentos de código respectivamente. La demanda afirma que las empresas han violado los derechos de autor y de marca del Times, así como sus derechos morales, al utilizar sus obras para formar a sus LLM.
La demanda afirma que las empresas han utilizado contenido de diversas fuentes para alimentar sus LLM, pero han dado especial peso al contenido del Times, reconociendo su calidad y valor. La demanda argumenta que esto constituye un uso injusto de las obras del Times y que las empresas se han beneficiado de la reputación y la inversión del Times.
La demanda busca impedir que las empresas utilicen el contenido del Times para capacitar a sus LLM en el futuro y eliminar el contenido del Times de sus conjuntos de datos existentes. También exige que las empresas paguen “miles de millones de dólares en daños legales y reales” por su infracción.
La demanda es uno de los primeros desafíos legales al uso de web scraping a gran escala para entrenar modelos de IA y plantea preguntas importantes sobre las implicaciones éticas y legales de tales prácticas. El caso podría tener implicaciones importantes para el futuro del periodismo y el desarrollo de la IA.