¿Meta usó torrents para entrenar su IA? Un controvertido caso de derechos de autor
La empresa tecnológica Meta, dueña de Facebook e Instagram, se encuentra en el centro de la polémica. Se le acusa de haber descargado de forma masiva libros protegidos por derechos de autor para entrenar sus modelos de inteligencia artificial (IA). La acusación ha generado un intenso debate sobre la legalidad y la ética de las prácticas de entrenamiento de la IA.
La descarga masiva: 81,7 TB de libros vía torrent
Según documentos judiciales que han salido a la luz en el caso Kadrey vs. Meta, la empresa habría descargado nada menos que 81,7 terabytes de libros. ¿De dónde provenían estos libros? Principalmente de sitios como LibGen y Z-Library, plataformas conocidas por ofrecer acceso a millones de libros, muchos de ellos protegidos por derechos de autor. La acusación principal es que Meta utilizó estas obras sin el consentimiento de los autores, lo que podría significar una violación masiva de los derechos de autor.
Lo que añade más controversia al asunto son algunos correos electrónicos internos de Meta que han sido revelados. En ellos, algunos empleados expresaban sus preocupaciones sobre la legalidad de estas descargas. A pesar de ello, la empresa habría continuado con la práctica, incluso tomando medidas para ocultar sus métodos. Esta información ha generado una gran controversia sobre cómo las empresas de IA obtienen los datos que necesitan para entrenar sus modelos.
¿»Uso justo» o infracción de derechos de autor?
Ante las acusaciones, Meta se defiende argumentando que sus prácticas se amparan bajo la doctrina del «uso justo» (fair use). Esta doctrina permite el uso limitado de material protegido por derechos de autor sin necesidad de permiso del titular, en situaciones específicas como la crítica, la investigación o la educación. Sin embargo, la aplicación del «uso justo» en el contexto del entrenamiento de la IA es un tema muy discutido.
El punto clave es determinar si el uso que Meta hizo de los libros es realmente transformativo y si no perjudica el mercado potencial de las obras originales. Los críticos argumentan que la descarga masiva y el uso comercial de los libros para entrenar una IA no cumplen con los requisitos del «uso justo». Además, el hecho de que Meta haya intentado ocultar sus actividades podría debilitar su defensa legal.
Implicaciones legales y el futuro de la IA
Un caso que podría marcar un antes y un después
El caso Kadrey vs. Meta podría sentar un precedente importante sobre cómo las empresas de IA deben adquirir y utilizar datos protegidos por derechos de autor. La industria de la IA depende en gran medida de grandes cantidades de datos para entrenar sus modelos, por lo que cualquier cambio en las normas legales podría tener un gran impacto en el desarrollo de esta tecnología.
Si se demuestra que Meta violó los derechos de autor de forma sistemática, la empresa podría enfrentarse a importantes sanciones económicas y otras consecuencias legales. Además, este caso podría obligar a otras empresas de IA a revisar sus prácticas de adquisición de datos y a buscar alternativas legales para obtener los datos necesarios para entrenar sus modelos.
El papel de las «bibliotecas en la sombra»
Este caso también pone de relieve el papel de las llamadas «bibliotecas en la sombra», como LibGen y Z-Library. Estos sitios web ofrecen acceso a materiales protegidos por derechos de autor sin el permiso de los titulares, lo que los convierte en una fuente muy atractiva para las empresas de IA que buscan grandes cantidades de datos. Sin embargo, el uso de estos sitios plantea serias cuestiones éticas y legales.
Las autoridades han intentado cerrar estos sitios en el pasado, pero han demostrado ser difíciles de erradicar. Un ejemplo de ello es Anna’s Archive, un motor de búsqueda de bibliotecas en la sombra que surgió después de que las autoridades intentaran cerrar Z-Library en 2022. Esto demuestra la persistencia de este tipo de plataformas.
Reacciones y críticas ante la polémica
La noticia de las descargas masivas de libros por parte de Meta ha generado una fuerte reacción en la comunidad de autores y editores. Muchos consideran que estas prácticas son un claro ejemplo de piratería de datos a gran escala y exigen que Meta sea sancionada por sus acciones.
Los críticos argumentan que el uso de bibliotecas en la sombra por parte de Meta socava el sistema de derechos de autor y perjudica a los autores que dependen de la venta de sus obras para ganarse la vida. Además, señalan que Meta es una empresa con recursos suficientes para obtener los datos necesarios de forma legal, ya sea comprando licencias o creando acuerdos de colaboración con editoriales.
¿Es necesario actualizar las leyes de derechos de autor?
Por otro lado, algunos defensores de la IA argumentan que el uso de estos datos es necesario para el avance de la tecnología y que las leyes de derechos de autor deben ser revisadas para adaptarse a la era digital. Sostienen que las leyes actuales son demasiado restrictivas y dificultan el desarrollo de la IA.
Estos defensores proponen que se establezcan excepciones más amplias para el uso de obras protegidas por derechos de autor en el contexto del entrenamiento de la IA. Algunos incluso sugieren que se cree un sistema de licencias obligatorias que permita a las empresas de IA utilizar obras protegidas a cambio de una compensación justa para los titulares de los derechos.
Un debate abierto sobre el futuro de la IA y los derechos de autor
El caso de Meta y su uso de bibliotecas en la sombra para entrenar sus modelos de IA es un claro ejemplo de las complejas cuestiones legales y éticas que rodean el desarrollo de la IA. La industria de la IA necesita grandes cantidades de datos para avanzar, pero el uso de estos datos debe hacerse de forma responsable y legal.
Este caso subraya la necesidad de un diálogo más amplio sobre cómo las empresas de IA deben adquirir y utilizar datos protegidos por derechos de autor, y cómo las leyes de derechos de autor deben adaptarse a las nuevas realidades de la era digital. Es fundamental encontrar un equilibrio entre la protección de los derechos de los autores y la promoción de la innovación en el campo de la IA.
El futuro de la IA depende de que seamos capaces de abordar estas cuestiones de forma justa y equitativa. Solo así podremos aprovechar el potencial de la IA para mejorar nuestras vidas sin comprometer los derechos de los creadores.
Fuente: Meta descargó con torrent 81,7 TB de libros con copyright para entrenar a sus IA