Os modelos de IA são poderosos, mas são biologicamente plausíveis?

19 Agosto 2023

Há cerca de seis anos, os cientistas descobriram um novo tipo de modelo de rede neural mais poderoso conhecido como transformador. Estes modelos podem alcançar um desempenho sem precedentes, como gerando texto a partir de comandos com precisão quase humana. Um transformador está subjacente a sistemas de IA como ChatGPT e Bard, por exemplo. Embora incrivelmente eficazes, os transformadores também são misteriosos: ao contrário de outros modelos de rede neural inspirados no cérebro, não tem sido claro como construí-los usando componentes biológicos.

A informação é de Adam Zewe, publicada por MIT News, e reproduzida por Techxplore, 15-08-2023.

Agora, pesquisadores do MIT, do MIT-IBM Watson AI Lab e da Harvard Medical School produziram uma hipótese que pode explicar como um transformador pode ser construído usando elementos biológicos no cérebro. Eles sugerem que uma rede biológica composta de neurônios e outras células cerebrais chamadas astrócitos poderia realizar o mesmo núcleo de computação que um transformador.

Pesquisas recentes mostraram que os astrócitos, células não neuronais que são abundantes no cérebro, se comunicam com neurônios e desempenham um papel em alguns processos fisiológicos, como regular o fluxo sanguíneo. Mas os cientistas ainda não têm uma compreensão clara do que estas células fazem computacionalmente.

Com o novo estudo, publicado esta semana em Proceedings of the National Academy of Sciences, os pesquisadores exploraram o papel que os astrócitos desempenham no cérebro de uma perspectiva computacional, e elaboraram um modelo matemático que mostra como eles poderiam ser usados, juntamente com os neurônios, para construir um transformador biologicamente plausível.

A hipótese deles fornece ideias que podem desencadear futuras pesquisas de neurociência sobre como o cérebro humano funciona. Ao mesmo tempo, poderia ajudar os pesquisadores de aprendizagem automática a explicar porque é que os transformadores são tão bem-sucedidos num conjunto diversificado de tarefas complexas.

Quando dois neurônios se comunicam, um neurônio pré-sináptico envia sinais químicos chamados neurotransmissores através da sinapse que o conecta a um neurônio pós-sináptico. Às vezes, um astrócito também está conectado - envolve um longo e fino tentáculo em torno da sinapse, criando uma sinapse tripartida (três partes). Um astrócito pode formar milhões de sinapses tripartidas.

O astrócito recolhe alguns neurotransmissores que fluem através da junção sináptica. Em algum momento, o astrócito pode sinalizar de volta aos neurônios. Porque os astrócitos operam numa escala de tempo muito mais longa do que os neurônios - eles criam sinais elevando lentamente a sua resposta ao cálcio e depois diminuindo-a - estas células podem segurar e integrar informações comunicadas a eles a partir dos neurônios. Desta forma, os astrócitos podem formar um tipo de buffer de memória, diz Krotov.

"Se pensarmos nisso a partir desta perspectiva, então os astrócitos serão extremamente naturais precisamente para a computação necessária para realizar a operação de atenção dentro dos transformadores".

Com esta visão, os pesquisadores formaram a sua hipótese de que os astrócitos poderiam desempenhar um papel na forma como os transformadores calculam. Então eles começaram a construir um modelo matemático de uma rede neurônios-astrócitos que funcionaria como um transformador.

Eles tomaram o núcleo da matemática que compõe um transformador e desenvolveram modelos biofísicos simples do que os astrócitos e neurônios fazem quando se comunicam no cérebro, com base num mergulho profundo na literatura e na orientação de colaboradores neurocientistas.

Depois combinaram os modelos de certas formas até chegarem a uma equação de uma rede neurônios-astrócitos que descreve a autoatenção de um transformador.

O próximo passo para os pesquisadores é dar o salto da teoria para a prática. Eles esperam comparar as previsões do modelo com aquelas que foram observadas em experiências biológicas, e usam este conhecimento para refinar - ou possivelmente refutar - a sua hipótese.

Além disso, uma implicação do seu estudo é que os astrócitos podem estar envolvidos na memória de longo prazo, uma vez que a rede precisa armazenar informações para poder agir sobre ela no futuro.

"Por muitas razões, os astrócitos são extremamente importantes para a cognição e comportamento, e operam de formas fundamentalmente diferentes dos neurônios".

Referência

KOZACHKOV, Leo; KASTANENKA, Ksenia V.; KROTOV, Dmitry. Building transformers from neurons and astrocytes. Proceedings of the National Academy of Sciences, v. 120, n. 34, 2023.

Os modelos de IA são poderosos, mas são biologicamente plausíveis?

Mais Lidos

No dia dos pais, palavras fundantes de um mestre e irmão. Breve reflexão para cristãos ou não. Comentário de Chico Alencar

Vídeos IHU

Revista ihu on-line

Referência

Leia mais

Os modelos de IA são poderosos, mas são biologicamente plausíveis?

Mais Lidos

No dia dos pais, palavras fundantes de um mestre e irmão. Breve reflexão para cristãos ou não. Comentário de Chico Alencar

Vídeos IHU

19º domingo do tempo comum – Ano C – Um convite à vigilância e a fazer escolhas a serviço do Reino

Revista ihu on-line

COMPARTILHAR

Twitter

LINKEDIN

WHATSAPP

IMPRIMIR PDF

COMPARTILHAR

Referência

Leia mais

Notícias relacionadas

Un marco de justicia económica para el debate tecnológico

60% dos jovens estão aprendendo profissões que a AI vai ocupar em menos de 20 anos

Hora de se reconectar: na era da inteligência artificial, é preciso ressaltar as virtudes humanas

“Facebook e Apple poderão ter o controle que a KGB nunca teve sobre os cidadãos”