Meta baixou 81,7 TB de torrents ilegais para treinar modelos de IA

Meta é acusada em processo judicial nos Estados Unidos de acessar bibliotecas como LibGen e Z-Library para obter livros ilegalmente Meta baixou 81,7 TB de torrents ilegais para treinar modelos de IA

Fev 8, 2025 - 02:57
 0
Meta baixou 81,7 TB de torrents ilegais para treinar modelos de IA

A Meta está sendo acusada de utilizar livros protegidos por direitos autorais para treinar modelos de inteligência artificial, sem a devida autorização. Um detalhe surpreendente nessa história é como os materiais foram acessados: por meio de torrents que, somados, chegam a pelo menos 81,7 TB de dados.

O assunto ganhou o noticiário em janeiro de 2025, quando veio à tona a informação de que detentores de direitos autorais nos Estados Unidos estavam processando a companhia liderada por Mark Zuckerberg.

A acusação principal é a de que a Meta teria acessado a LibGen (uma biblioteca online de obras frequentemente associada à pirataria) e outras fontes ilegais de distribuição de conteúdo com o intuito de obter livros para treinar a Llama, sua tecnologia de IA generativa.

E-mails de funcionários da companhia que foram anexados ao processo judicial indicam que milhões de livros foram baixados ilegalmente pela Meta a partir da LibGen por meio de um serviço de nome LibTorrent. Plataformas como Z-Library também teriam sido usadas.

Em linhas gerais, a Meta é acusada de baixar pelo menos 81,7 TB de dados ilegalmente em várias bibliotecas usando o site Anna’s Archive como ponto de partida. Desse total, ao menos 35,7 TB teriam origem na Z-Library (outro serviço associado a downloads ilegais) e na LibGen.

Além tido, a Meta teria baixado outros 80,6 TB de dados da LibGen em uma ocasião anterior.

Os e-mails anexados ao processo indicam ainda que os funcionários da Meta sabiam que o download dos arquivos era ilegal. Em uma das mensagens, um deles manifesta preocupação sobre o uso de endereços IP da empresa para obtenção de conteúdo pirata via torrent.

O que Meta diz sobre as acusações?

A Meta ainda não se manifestou publicamente sobre o assunto, mas tem buscado se defender judicialmente. Para tanto, a companhia alega que fez “fair use” (“uso justo” ou “de boa fé”) dos dados baixados, quando conteúdos protegidos por direitos autorais podem ser usados de modo limitado e sem permissão do detentor.

O fair use pode ser aceito pelo tribunal quando o uso do material protegido não visa lucro, entre outras razões, mas cada caso é sempre tratado individualmente.

Além disso, a Meta argumenta que os autores do processo não indicaram nenhuma instância de qualquer parte de algum livro que tenha sido baixada por um integrante da companhia via torrent, “muito menos que os livros dos demandantes foram de alguma forma distribuídos pela Meta”.

Este último argumento tem relação com a dinâmica do BitTorrent: se um computador obtém arquivos por esse meio, via de regra, também ajuda a disseminar esses dados, o que pode configurar distribuição ilegal.

Com informações de Ars Technica e TorrentFreak

Meta baixou 81,7 TB de torrents ilegais para treinar modelos de IA