• Los problemas de derechos de autor de la IA generativa no se resolverán con blockchain.
  • Múltiples demandas intentan recuperar los derechos de los propietarios.
  • El uso de materiales «raspados» es «uso legítimo».

La viabilidad económica del aprendizaje automático como servicio (MLaaS) se está viendo obstaculizada por una serie de demandas, en individual contra Anthropic y OpenAI. En todos los casos, los propietarios de product protegido por derechos de autor se oponen y buscan una compensación por el uso de materiales utilizados sin su permiso para entrenar modelos de aprendizaje automático.

Los modelos de IA generativa utilizados por empresas como OpenAI extraen grandes cantidades de datos de la Net pública, pero las empresas afirman que sus métodos constituyen un «uso justo» de materiales disponibles públicamente. Hay varios argumentos legales en juego, incluida la “conducta volitiva”, que se refiere a la concept de que se debe demostrar que una empresa que comete una infracción de derechos de autor tiene handle sobre la producción de los materiales en disputa. En resumen, si puede lograr que OpenAI publique una línea de poesía, palabra por palabra, que se publicó bajo un aviso de derechos de autor (por ejemplo, en la parte inferior de la página web en la que se publicó), OpenAI infringe los derechos de autor.

En el caso del New York OccasionsEn la acción contra OpenAI, el periódico afirma que el motor ML rastreó y absorbió millones de AHORA artículos para informar al well-liked motor de IA, obteniendo un “aprovechamiento gratuito de la enorme inversión del Situations en su periodismo”, según el texto de la demanda.

Demandas por derechos de autor de IA generativa

Getty Photographs ha presentado casos similares contra Midjourney y Balance AI (propietarios de Stable Diffusion), quienes también citan la infracción de derechos de autor de las imágenes de las que poseen los derechos. También se han presentado demandas colectivas contra DeviantArt, cuyos modelos de máquinas producen imágenes a partir de las indicaciones de texto de los usuarios.

Al presentar evidencia ante el Comité Selecto Electronic y de Comunicaciones de la Cámara de los Lores del Reino Unido, OpenAI afirmó: “[…] Sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor”. En esto, la compañía admite que sus modelos están entrenados en materiales que pertenecen legalmente a otros, pero es un «uso legítimo».

Toot que ilustra un artículo sobre derechos de autor sobre IA generativa.

Fuente: fosstodon.org

El caso de Getty Photographs es particularmente destacable. La compañía se había alejado de cualquier oferta de creación de imágenes de IA, citando «preocupaciones reales con respecto a los derechos de autor de los resultados de estos modelos y problemas de derechos no abordados con respecto a las imágenes, los metadatos de las imágenes y las personas contenidas en las imágenes», dijo. El director ejecutivo de Getty, Craig Peters, en un artículo publicado en El borde en 2022.

Sin embargo, la compañía anunció en CES 2024 &#39Generative AI by iStock&#39, que se basa en su biblioteca de imágenes, reclamando protección legal y derechos de uso para los creadores de contenido. «Puede estar seguro de que las imágenes que genera y licencia están respaldadas por nuestra indemnización ilimitada», afirma ahora el sitio net de la compañía, y que ha «creado un modelo que compensa […] creadores de contenido por el uso de su trabajo en nuestro modelo de IA, lo que les permite continuar creando más […] imágenes previas a la toma de las que dependes”.

Hacer cumplir los derechos de autor siempre ha sido problemático en línea, especialmente si el propietario de los medios publicados carece del respaldo de una falange de abogados de dientes afilados, muchos de los cuales tienden a congregarse en torno a grandes empresas y organizaciones en lugar de creadores de contenido independientes. La elección de artistas, músicos e incluso blogueros a tiempo parcial siempre, desde que surgió Web, ha sido publicar o no. Si se publica el mensaje o los medios, quedará abierto a una posible explotación por parte de otros. No publique digitalmente y corre el riesgo de quedar en la oscuridad. Los sitios intermedios como los archivos robots.txt que dicen «No se permiten rastreadores de ML» de la misma manera que se espera que los motores de búsqueda no indexen las páginas de los sitios world-wide-web («no seguir, por favor») son una apuesta que confía en el buena naturaleza inherente de grandes corporaciones que controlan los modelos de ML, como Microsoft en el caso de Open AI.

Porque nadie jamás se quemó por confiar en grandes corporaciones. ¿Bien?

¿Blockchain para resolver problemas de derechos de autor?

Hablando a Business Insider La semana pasada, el director ejecutivo del especialista en comercio de criptomonedas Greyscale, Michael Sonnenshein, sugirió que blockchain sería una forma inmutable de demostrar la procedencia del material protegido por derechos de autor. “[…] Para nosotros, es tan obvio que se necesita una tecnología irrefutable e inmutable para casarse. [authenticity and ownership]para abordar realmente algunos de los problemas, y esa tecnología es blockchain, que sustenta las criptomonedas[currency]. […] De repente, cuestiones como la procedencia, la autenticidad y la propiedad, and so on., se resuelven muy, muy rápido”.

Hay tres razones por las que las afirmaciones de Sonneshein son falaces. En primer lugar, ya tenemos una autenticidad comprobada a través de blockchain: es un esquema Ponzi llamado NFT, que sólo son valorados por los idiotas que comercian con ellos. En segundo lugar, la publicación blockchain tiene el potencial de ser ecológicamente desastrosa. La industria minera de monedas de Bitcoin, Ether y Monero generate cada año el equivalente de carbono de un país de tamaño mediano. Por ejemplo, cada valor de 1 dólar de Bitcoin generate ,50 dólares en daños ambientales y de salud (principalmente a través de la contaminación del aire por la generación de combustibles fósiles que alimentan las plataformas mineras). En tercer lugar, si nos aseguramos de que los creadores sean “compensados ​​y acreditados adecuadamente por lo que producen”, porque blockcahin nos dice, sin lugar a dudas, quiénes son, habremos cerrado el círculo. Para volver a citar la declaración de OpenAI en las salas del comité de la Cámara de los Lores del Reino Unido:

“[…] Sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor”. Lo que significa la palabra «imposible», en contexto, es «demasiado costoso». ¿Te imaginas un mundo en el que los grandes proveedores de IA como servicio rastrean y pagan a todos los creadores de contenido en World wide web por el uso de su trabajo para entrenar modelos de IA? No, nosotros tampoco podemos.

https://www.youtube.com/view?v=bRqwTP2eKJY

Como creador de contenido, la única forma segura de proteger los derechos de autor es cifrar digitalmente cada elemento o colocarlo detrás de algún tipo de barrera insuperable donde no pueda ser eliminado. Se trata de un muro de pago, o un jardín amurallado equivalente, frente al trabajo de cada creador. De un plumazo, World wide web –diseñada para ser un lugar para el intercambio libre y abierto de strategies, conocimientos y tal vez arte– se convierte en víctima de voraces algoritmos de aprendizaje automático controlados por empresas globales.

El mundo en el que la IA generativa y los derechos de autor coexisten pacíficamente puede ser alcanzable. Lo que no será rentable o fácil de lograr.

Navegando por los mares para ilustrar un artículo de debate generativo sobre derechos de autor sobre IA/ML.

“Golden Sky Trawler” de 4BlueEyes Pete Williamson tiene licencia CC BY-NC-ND 2..

Share.
Leave A Reply