17 Mai 2023
"O que enfrentamos ao lidar com programas como o ChatGPT é a corrosividade implacável do capitalismo em estágio avançado, no qual a autoria não tem valor. Tudo o que importa é o conteúdo", alerta o padre jesuíta Jim McDermott, escritor e roteirista de cinema em Los Angeles, em artigo publicado por revista America, 15-05-2023.
No ano passado, vimos uma explosão do chamado material produzido por IA. Primeiro foram obras de arte selvagens e incríveis, depois documentos de texto de todo tipo, de homilias a ensaios acadêmicos. Uma das questões na atual greve do Writers Guild é se os estúdios e as redes devem ter permissão para usar programas como o ChatGPT para criar esboços ou roteiros completos, que os escritores simplesmente reescreveriam ou poliriam.
Rotulamos os programas que fazem esse trabalho de “inteligência artificial”. E na superfície, a realidade desse conceito nunca pareceu tão persuasiva. Esses programas geram trabalhos completos e aparentemente originais em um instante. Eles também podem se comunicar com uma pessoa de uma maneira que se assemelha a uma conversa real.
Mas, na verdade, por enquanto, esses programas não são sensíveis, mas apenas uma forma muito complexa do tipo de bot de previsão de texto que você encontra usando o Gmail ou o Google docs. O ChatGPT-3, por exemplo, foi treinado e é informado por 500 bilhões de “tokens” – palavras ou frases selecionadas de livros, artigos e da internet por meio das quais interpreta e responde às solicitações que recebe. (Você também ouvirá isso chamado de aprendizado de máquina de "modelo de linguagem em larga escala".) Onde os documentos do Google podem sugerir o restante de uma frase quando você começa a digitar a primeira palavra, o ChatGPT tem tantos dados à sua disposição que pode sugerir um parágrafo ou uma redação inteira. E continua a aprender e se desenvolver a partir dos dados que inserimos e das respostas que recebemos.
Agora, você pode dizer, por que fazer tanto barulho sobre como chamamos isso? Ninguém está afirmando que ChatGPT é C-3PO ou que estamos nos aproximando da singularidade. Relaxa.
Mas, ao chamar esses programas de “inteligência artificial”, concedemos a eles uma reivindicação de autoria que é simplesmente falsa. Cada um desses tokens usados por programas como o ChatGPT – a “linguagem” em seu “grande modelo de linguagem” – representa um minúsculo pedaço de material criado por outra pessoa. E esses autores não são creditados por ele, pagos por ele ou solicitado permissão para seu uso. De certa forma, esses bots de aprendizado de máquina são, na verdade, a forma mais avançada de uma loja de desmanche: eles roubam material dos criadores (ou seja, usam sem permissão), cortam esse material em partes tão pequenas que ninguém pode rastreá-las e em seguida, reaproveite-os para formar novos produtos.
Talvez isso soe bobo. Estamos falando de coisas como dividir uma cena de uma peça em pequenas frases, não Robin Thicke e Pharrell Williams ou, mais recentemente, Ed Sheeran usando faixas de Marvin Gaye sem permissão. Onde o princípio do uso justo entra em jogo quando produtos criativos podem ser cortados em unidades tão microscópicas? Alguns podem argumentar que o que o ChatGPT faz é mais parecido com Sheeran argumentando que ele está apenas pegando blocos de construção e usando-os de novas maneiras. Mas eu não sei. “Ser ou não ser” ou “É preciso prestar atenção” certamente parecem propriedade intelectual de alguém.
É importante lembrar que esses algoritmos de programa são preditivos, ou seja, eles devem pensar em seus tokens em relação uns aos outros. Faz sentido que, tendo recebido mil tokens de um grande escritor como Toni Morrison ou Stephen King, bots como esses sejam capazes de reproduzir ou redirecionar as vozes, modos de pensar e frases desses autores.
E, mais uma vez, tudo isso foi feito sem que ninguém tivesse obtido a permissão desses escritores para permitir que seu trabalho ajudasse a informar a saída do programa. Vários desses programas baseados em arte estão atualmente enfrentando processos judiciais por alegações de que seus bancos de dados de bilhões de imagens protegidas por direitos autorais, que são então “difundidas” para criar novas imagens, constituem violação de direitos autorais. (Há também um caso atualmente na Suprema Corte considerando quando o uso do material de outro artista se torna transformador em vez de roubo.)
De certa forma, o ChatGPT e seus semelhantes são a forma mais elevada de separar os trabalhadores do fruto de seu trabalho. Recebemos uma resposta ou obra de arte de um bot de previsão de texto e os artigos e ideias originais dos quais foram gerados são tão distantes que nem mesmo os próprios criadores percebem que foram roubados. Na verdade, eles próprios podem se juntar àqueles que acham que esse argumento é absurdo. O que é como admirar o hot rod envenenado de alguém quando uma pequena parte de seu capô (ou design do motor) foi roubada de seu carro.
Naquela época, programas como o Napster faziam todo mundo acreditar que não deveríamos pagar por música. Se eu possuo algo, por que não poderia compartilhá-lo com quem eu quiser? Ainda hoje, continua difícil convencer alguns de que há algo de errado em baixar ilegalmente as músicas mais recentes de Lizzo ou um bootleg de “Guardiões da Galáxia 3”. Essas mesmas pessoas vão insistir sem ironia que são os maiores fãs desses artistas.
O mesmo já acontece com esses algoritmos preditivos. Estamos tão fascinados com o que eles podem fazer, ou com os bens sociais que parecem estar prontos para oferecer, que não queremos examinar de onde vem todo esse material. Em vez de apontar para alguma utopia futura (ou distopia de robôs versus humanos), o que enfrentamos ao lidar com programas como o ChatGPT é a corrosividade implacável do capitalismo em estágio avançado, no qual a autoria não tem valor. Tudo o que importa é o conteúdo.