Su contenido en línea es material “gratuito” para módulos de capacitación • Registro

Mustafa Suleiman, director ejecutivo de inteligencia artificial de Microsoft, dijo esta semana que las empresas de aprendizaje automático pueden extraer la mayor parte del contenido publicado en línea y utilizarlo para entrenar redes neuronales porque es esencialmente «software libre».

Poco después, el Centro de Reportajes de Investigación Presentar una demanda contra OpenAI Su mayor inversor, Microsoft, “por utilizar el contenido de la organización de noticias sin fines de lucro sin permiso ni ofrecer compensación”.

Esto sigue los pasos de ocho periódicos Presentó una demanda contra OpenAI y Microsoft sobre supuesta apropiación indebida de contenido en abril, como lo hizo The New York Times cuatro meses antes.

Luego están los dos brillantes autores. Presentó una demanda contra OpenAI y Microsoft En enero afirmaron que habían entrenado modelos de IA en las obras de los autores sin permiso. Además, en 2022, varios desarrolladores anónimos presentaron una demanda contra OpenAI y GitHub basándose en acusaciones de que las organizaciones utilizaron código publicado públicamente para entrenar modelos generativos en violación de los términos de su licencia de software.

Se le preguntó en Entrevista Hablando con Andrew Ross Sorkin de CNBC en el Festival de Ideas de Aspen sobre si las empresas de inteligencia artificial han robado efectivamente la propiedad intelectual del mundo, Solomon reconoció la controversia y trató de distinguir entre el contenido que la gente pone en línea y el contenido respaldado por titulares corporativos de derechos de autor.

«Creo que en términos de contenido que ya existe en la web abierta, el contrato social para ese contenido desde la década de 1990 ha sido el uso legítimo», dijo. «Cualquiera podía copiarlo, recrearlo, reproducirlo. Era gratis, por así decirlo. Ese es el entendimiento».

READ  Cuestionario: Pon a prueba tus conocimientos generales sobre PlayStation - versión 15

Solomon permitió otra categoría de contenido, que es material publicado por empresas que tienen abogados.

«Existe una categoría separada donde un sitio web, editor u organización de noticias declara explícitamente: ‘No escanee ni rastree mi contenido por ningún motivo que no sea el de indexarlo’, para que otras personas puedan encontrar ese contenido», explicó. «Pero ésta es una zona gris. Creo que esto llegará a los tribunales».

Esto es por decirlo suavemente. Si bien parece seguro que las declaraciones de Solomon ofenderán a los creadores de contenido, no está del todo equivocado: no está claro dónde se encuentran las líneas legales con respecto al entrenamiento y la producción de modelos de IA.

La mayoría de las personas que publican contenido en línea como individuos han violado sus derechos de alguna manera al aceptar acuerdos de términos de servicio ofrecidos por las principales plataformas de redes sociales. La decisión de Reddit de otorgar licencias a OpenAI para las publicaciones de sus usuarios no sucedería si el gigante de las redes sociales creyera que sus usuarios tienen un derecho legítimo a los memes y los datos que difunde.

El hecho de que OpenAI y otras empresas que fabrican modelos de IA estén logrando acuerdos de contenido con los principales editores muestra que una marca fuerte, mucho dinero y un equipo legal pueden traer grandes operaciones tecnológicas a la mesa.

En otras palabras, quienes crean contenido y lo publican en línea están creando software libre a menos que contraten, o puedan atraer, abogados dispuestos a desafiar a Microsoft y sus semejantes.

en papel En un estudio publicado por SSRN el mes pasado, Frank Pasquale, profesor de derecho en Cornell Tech y Cornell Law School en los EE. UU., y Haochen Sun, profesor asociado de derecho en la Universidad de Hong Kong, exploran la incertidumbre legal que rodea el uso de datos protegidos por derechos de autor para entrenar inteligencia artificial y si los tribunales considerarían que dicho uso es justo. Concluyen que la IA debe abordarse a nivel de políticas, porque las leyes actuales son inadecuadas para responder las preguntas que ahora es necesario abordar.

READ  Las calificaciones de Forbesken son "difíciles" y las ventas son "mediocres", dice Square Enix

“Debido a que existe tanta incertidumbre sobre la legalidad del uso de obras protegidas por derechos de autor por parte de los proveedores de servicios de IA, los legisladores necesitarán articular una nueva visión audaz para reequilibrar los derechos y responsabilidades, tal como lo hicieron a raíz del desarrollo de Internet (liderando a la Ley de Copyright del Milenio y Publicación de Materiales Digitales de 1998), argumentan.

Los autores señalan que la continua cosecha no compensada de obras creativas amenaza no sólo a escritores, compositores, periodistas, actores y otros profesionales creativos, sino también a la propia inteligencia artificial, que acabará privada de datos de entrenamiento. Los autores predicen que la gente dejará de hacer que el trabajo esté disponible en línea si solo se utiliza para impulsar modelos de inteligencia artificial que reduzcan el costo marginal de la creación de contenido a cero y nieguen a los creadores la posibilidad de recibir alguna recompensa.

Este es el futuro que prevé Salomón. «La economía de la información está a punto de cambiar radicalmente porque podemos reducir a cero el costo de producir conocimiento», afirmó.

Todo el software gratuito que haya ayudado a crear puede ser suyo por una pequeña tarifa de suscripción mensual. ®

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *