03 Janeiro 2024
"Dado que este será um ano eleitoral em muitos países, podemos esperar utilizações muito criativas desta tecnologia e um ano muito movimentado para os serviços de segurança cibernética", escreve Nello Cristianini, professor de Inteligência Artificial no Departamento de Ciência da Computação da Universidade de Bath, em artigo publicado por Settimana News, 31-12-2023.
Qual ano! Não sei se 2023 será realmente lembrado como o ano em que trilhamos o caminho certo rumo à inteligência artificial, ou se é apenas parte daquele longo ciclo de estações que durante décadas neste campo se alternou entre picos de otimismo e períodos de desânimo, falsos começos, decepções espetaculares.
Descobriremos em breve. Certamente este foi o ano em que conversamos com máquinas inteligentes, em que aprovamos a primeira lei dedicada a regulamentá-las, em que chefes de estado e de governo falaram abertamente sobre os riscos globais desta tecnologia, e isto aconteceu sobretudo porque desde este ano a inteligência artificial não é mais um fenômeno de laboratório promissor e não está mais escondida em produtos como os que recomendam livros e vídeos.
A partir deste ano, a inteligência artificial está visível e acessível a todos, às mãos e até à mente dos consumidores.
O mercado de trabalho está se adaptando: a possibilidade oferecida pela inteligência artificial de escrever, conversar, criar vídeos e imagens, compreender o conteúdo das fotografias, não pode deixar a situação inalterada.
Lembro-me de que, há alguns anos, os alunos aprenderam que um computador não conseguia distinguir um cachorro de uma raposa, nem entender um texto, nem programar outro computador. Tudo isso é possível hoje.
O que não sabemos é a rapidez com que estas mudanças produzirão consequências econômicas.
Estas são as principais inovações: descobrimos que um mecanismo estatístico, se for suficientemente grande e com a arquitetura certa, pode desenvolver alguma compreensão do mundo, ligando dados textuais e visuais, e utilizando ambos para moldar o seu comportamento.
Este mecanismo é denominado "modelo de linguagem grande", e é criado automaticamente por um algoritmo de aprendizado de máquina, baseado em uma imensa quantidade de dados, com uma computação que requer recursos consideráveis: dados, energia, hardware, pessoal, dinheiro...
Esta última observação também explica porque neste momento existem poucas empresas capazes de criá-los e – muito importante – nenhuma universidade.
Isto é importante para a transparência e reprodutibilidade dos resultados, visto que neste momento muitas grandes empresas deixaram de publicar detalhes dos modelos mais avançados, incluindo as suas dimensões.
O próprio modelo aprendeu a programar computadores, criando a capacidade de criar com mais facilidade a próxima geração de modelos.
A IA também aprendeu a traduzir, responder perguntas, resumir grandes quantidades de documentos escritos em diferentes idiomas e assim por diante.
Não está claro o que mais ele poderá aprender a fazer, ou que outras habilidades surgirão, mas apenas o que listamos é suficiente para transformar a indústria do conhecimento.
A publicação, a investigação, a educação e o entretenimento já estão a incorporar estes métodos; o atendimento ao cliente e os call centers serão talvez os primeiros a sentir a concorrência, mas um dia, não tão longe, alguns aspectos da profissão médica e jurídica também poderão ser influenciados pela inteligência artificial.
Modelos de linguagem, como GPT e Gemini, são um mecanismo muito versátil, que pode ser usado como base para diversas aplicações muito diferentes. Na verdade, também são chamados de modelos de base e estão no centro das discussões políticas de alto nível, porque são um tipo de tecnologia que pode traduzir-se em vantagens econômicas reais, mas também difíceis de compreender e, portanto, de regular.
Um erro no modelo básico pode refletir-se num comportamento indesejado em muitos produtos; portanto, é correto ter cautela.
Sejamos claros: o modelo de linguagem é uma inovação muito importante, mas os mesmos princípios que regem o setor da inteligência artificial há anos ainda se aplicam. Por exemplo, a utilização de estatísticas em vez de teorias explícitas; a utilização de dados encontrados em documentos pré-existentes, como páginas web; e a necessidade de processar enormes quantidades de dados antes de obter quaisquer benefícios.
O que mudou foi o fato de ter sido encontrada uma forma de extrair informação útil de milhares de milhões de páginas, automaticamente, sem intervenção humana, e esta acabou por ser uma abordagem tão geral que estamos mais uma vez a falar de AGI, inteligência artificial geral.
Este é um conceito bastante vago, que quase parece criado para ser mal compreendido. enquanto alguns autores parecem referir-se a um tipo (impossível) de inteligência universal, outros simplesmente o utilizam para definir inteligências não muito especializadas.
Por esta razão, talvez seja mais útil distinguir entre IA especialista e generalista, e observar que a generalidade de um agente inteligente é apenas uma questão de grau: nem mesmo os seres humanos são dotados de inteligência universal, mas são certamente mais flexíveis do que um inseto ou o algoritmo que reproduz o jogo Go.
É o número de tarefas que um agente pode aprender que define a sua generalidade, e o GPT certamente parece capaz de aprender uma ampla gama de tarefas.
A empresa que lançou o ChatGPT, a OpenAI, define a inteligência artificial geral como uma IA que executa muitas tarefas realizadas por humanos e que têm valor econômico: conduzir, traduzir, conversar, resumir, investir, ensinar, diagnosticar? Nenhuma dessas coisas é teoricamente impossível. Todos eles poderiam ser executados pela inteligência artificial geral.
Espero que durante algum tempo continuemos a aperfeiçoar, a ampliar e a aprofundar as técnicas que criamos: há o suficiente para uma geração de cientistas, porque a verdade é que ainda não compreendemos como funcionam e, portanto, em que situações pode se comportar tão repentinamente.
Será importante aprender a minimizar os erros que a máquina ainda comete nas suas respostas, mas também proteger os valores e normas da nossa sociedade: igualdade de tratamento para todos, transparência, privacidade, e assim por diante.
A discussão também está passando para as mãos de cientistas sociais e políticos, como não poderia deixar de ser, visto que se trata de conceitos que vão além da competência dos cientistas da computação.
A ampliação dos modelos atuais, mesmo que seja apenas aumentando o tamanho dos dados de formação, pode levar a mais progressos, sem ter de mudar a tecnologia, e podemos esperar que isso aconteça em 2024.
Mas mesmo a simples utilização dos mesmos mecanismos que já criamos pode ser transformadora: temos componentes suficientes, neste momento, para falar muito tempo ao telefone com uma máquina, ou para que ela traduza uma conversa por vídeo em tempo real, ou peça a um serviço como o YouTube para criar um vídeo específico para nós.
Dado que este será um ano eleitoral em muitos países, podemos esperar utilizações muito criativas desta tecnologia e um ano muito movimentado para os serviços de segurança cibernética.