24 Fevereiro 2008
Para o lingüista Gabriel de Ávila Othero, “em seu habitat natural, encontramos alguns meios de comunicação animal bastante interessantes (como a comunicação entre as abelhas ou entre alguns primatas superiores)”. Nada, no entanto, ele alerta, “pode se comparar à riqueza e à complexidade da faculdade de linguagem de que o ser humano parece ser geneticamente dotado”. Isso porque a linguagem humana é aberta, sendo possível, por exemplo, “formular infinitas frases a partir de um número finito de palavras e de regras sintáticas”. Além desse tema, Gabriel fala, nesta entrevista concedida por e-mail à IHU On-Line, sobre o português utilizada nas salas de bate-papo da internet, afirmando que nelas a língua-padrão conhece outras formas, e sobre a lingüística computacional, a qual estuda, com o intuito de desvendar a relação cada vez mais próximo entre o humano e o computador, não só para tarefas diárias, mas como meio de linguagem.
Gabriel é formado em Letras Português/Inglês e Letras-Português, pela Unisinos; especialista em Estruturas da Língua Português, pela Ulbra; e mestre em Lingüística, pela PUCRS, com a dissertação intitulada “Grammar Play: um parser sintático em Prolog para a língua portuguesa”. Atualmente, é aluno de doutorado em Lingüística na PUCRS, onde prepara a tese “A estrutura da sentença em português: uma descrição sintática formal com um olho na implementação computacional”. Além disso, é o editor-chefe da Revista Virtual de Estudos da Linguagem - ReVEL (www.revel.inf.br), escreve, no Jornal NH, a coluna Língua Portuguesa, e autor de alguns livros na área, como Introdução ao Português Histórico (São Leopoldo: Cooprac, 2000), A língua portuguesa nas salas de b@te-p@po: uma visão lingüística de nosso idioma na era digital (Novo Hamburgo: Edição do Autor, 2002), Lingüística computacional: teoria & prática (São Paulo: Parábola, 2005), em co-autoria com Sérgio Menuzzi, e Teoria X-barra: descrição do português e aplicação computacional (São Paulo: Contexto, 2006).
Confira a entrevista.
IHU On-Line – Qual é a aproximação que pode ser feita entre a linguagem humana e a linguagem animal, tema de estudo do seu ensaio “A comunicação animal: uma forma de linguagem” (1)? Poderia nos apresentar, nesse sentido, o ponto de vista de Noam Chomsky (2) e, caso queira, de outros estudiosos do campo?
Gabriel de Ávila Othero – Como menciono em meu artigo, Chomsky acredita que, ao contrário do homem, os animais sejam incapazes de usar a linguagem de maneira rica e criativa. Por isso, seria até mesmo um equívoco chamar seus sistemas de comunicação de linguagem – e nesse ponto, eu concordo com ele. Chomsky costuma argumentar que o ponto central da faculdade de linguagem humana está relacionado à capacidade de recursão nas línguas humanas. Todas as línguas do mundo permitem formular infinitas frases a partir de um número finito de palavras e de regras sintáticas. Ou seja, podemos formar sentenças de maneira infinita, sem nunca repetir qualquer sentença. Cada sentença que eu digo provavelmente nunca foi dita antes. O ser humano tem a capacidade de combinar elementos finitos (as palavras da língua, que, no meu vocabulário, podem girar em torno de 20.000, digamos) para formar infinitas frases inéditas. Por exemplo, veja as frases em (1), (2) e (3):
1)
a. Em 2008, o homem irá à Lua novamente.
b. Em 2009, o homem irá à Lua novamente.
c. Em 2010, o homem irá à Lua novamente.
d. Em 2011, o homem irá à Lua novamente.
Etc. ad infinitum
2)
a. O João gosta de chocolates.
b. O João gosta de chocolates e balas.
c. O João gosta de chocolates, balas e sorvetes.
d. O João gosta de chocolates, balas, sorvetes e bolos.
Etc. ad infinitum
3)
a. O João ama a Maria que ama o Pedro.
b. O João ama a Maria que ama o Pedro que ama a Joana.
c. O João ama a Maria que ama o Pedro que ama a Joana que ama o André.
d. O João ama a Maria que ama o Pedro que ama a Joana que ama o André que ama a Adriana.
Etc. ad infinitum
Essa capacidade de criar infinitas frases (que poderiam, por sua vez, em teoria, ser infinitas) é exclusiva da linguagem. E uma prova disso é a recursão de elementos, como vimos no exemplo (3). Essa capacidade é exclusiva ao homem. O que acontece no caso dos animais treinados em laboratório que dominam alguma linguagem de sinais é que eles apresentam uma sintaxe bastante rudimentar, sem essa capacidade de criação e de recursão na língua. Além disso, esses animais passam por treinamentos exaustivos e artificiais – não vemos na natureza animais se comunicarem pela linguagem de sinais.
Em seu habitat natural, encontramos alguns meios de comunicação animal bastante interessantes (como a comunicação entre as abelhas ou entre alguns primatas superiores). Mas nada pode se comparar à riqueza e à complexidade da faculdade de linguagem de que o ser humano parece ser geneticamente dotado.
IHU On-Line – A lingüística computacional mescla dois campos, cada vez mais importantes para o ser humano: o estudo da linguagem e a importância do computador na vida cotidiana. Como isso acontece?
Gabriel de Ávila Othero – Publiquei em 2005, em co-autoria com Sérgio Menuzzi, justamente um livro que trata desse assunto. Começamos o livro propondo a seguinte cena, que aqui tomo a liberdade de repetir: imagine-se no ano de 2025. Já passa da meia-noite, e você ainda não conseguiu dormir. Resolve, então, acessar a Internet para ver se consegue um pouco de distração. Ao ligar seu computador, ele automaticamente lhe diz: “– Boa noite! Diga-me sua senha, por favor”. Você, como de costume, informa-lhe a sua senha pessoal, e a máquina responde com um amigável “– Olá, eu já estava com saudades! Afinal, faz doze horas e dezesseis minutos que não nos víamos”. Para conectar-se à Internet, basta ordenar oralmente: “– Quero me conectar à Internet e checar meus e-mails”. Após verificar seus e-mails, você se lembra de que faz muito tempo desde a última vez em que comprou um CD de música (afinal, ultimamente tem sido muito mais barato e rápido simplesmente “baixar” as músicas da Internet e pedir para que o computador lhe grave um CD). Por isso, resolve visitar a loja virtual CDthèque, loja francesa especializada em músicas européias, do Rock ao Pop, do folk ao techno. Você, então, comanda oralmente o seu computador: “– Gostaria de acessar o site da loja de CDs CDthèque. Imediatamente, a máquina leva-o à página da loja desejada. Chegando lá, você encontra um atendente virtual que lhe dá as boas-vindas, em forma de texto: “- Bonne nuit. Parlez-vous français, Deutsch, English, español ou português?”.
Entendendo ou não a pergunta, você clica em “português”, o que faz com que uma atendente virtual, a Persephone, venha lhe atender no canto da tela, em uma pequena janela com espaço para um chat entre vocês dois. Somente mais tarde você descobrirá que ela é, na verdade, um chatterbot. Persephone lhe diz: “– Olá. Você gosta de música européia? A nossa loja tem a maior coleção de músicas européias do mundo”. Imaginemos, então, um diálogo: “– Sim, eu gosto bastante. Por falar nisso, onde fica a sede da sua loja?”. “– Aqui mesmo, em www.cdthèque.com. Somos a primeira loja exclusivamente virtual especializada em CDs de músicas européias. Não temos sede em lugar algum e, ao mesmo tempo, estamos em todos os lugares”. Você diz: “– Bem, eu estou procurando um CD dos Beatles, já bastante antigo. Acho que ele foi lançado há mais de vinte anos. Não consigo me lembrar do título”. A máquina responde: “- Você quer dizer The Beatles, a banda de rock de Liverpool, Inglaterra?”. Você: “– Sim. O CD é uma coletânea de músicas””. A máquina: “– Você procura o CD ‘The Beatles - 1’, de 2000?”. Você: “– Sim, acho que é esse! Posso dar uma olhada nele?”.
Um diálogo como esse – isto é, uma conversa natural entre um homem e um computador – não é uma realidade hoje, mas poderá ser no ano 2025 – ou talvez até antes. De maneira bastante simplificada, dá para se dizer que o trabalho em Lingüística Computacional almeja, de alguma forma, fazer com que uma máquina se comunique em linguagem natural com um ser humano. Em outras palavras, queremos fazer com que os computadores entendam mais português, inglês, francês ou chinês. Isso para que nós, humanos, não precisemos aprender a “falar” em Basic, DOS, Delphi ou Prolog para lidar com as máquinas.
IHU On-Line – Você poderia falar um pouco sobre as áreas da lingüística computacional e a importância dela para o estudo da fonologia, da sintaxe e da semântica?
Gabriel de Ávila Othero – Eu particularmente trabalho com a sintaxe do português em ambiente computacional. Em minha dissertação de mestrado, desenvolvi um parser, ou seja, um analisador sintático computacional. Grosso modo, o programa que apresentei – Grammar Play é o nome dele – faz a análise sintática automática de alguns tipos de sentenças do português. Hoje, em meu doutorado, continuo a pesquisar e a descrever a estrutura sintática do português visando sempre a uma aplicação computacional.
Muitas são as áreas da Lingüística que têm prestado seus serviços à Lingüística Computacional. Quem, por exemplo, possui qualquer aparelho eletrônico que responda a comandos de voz (computadores, celulares etc.) faz uso de uma tecnologia que só se tornou possível por causa de estudos em Fonética e Fonologia. Quem já utilizou um corretor ortográfico e gramatical em seu processador de textos também está se beneficiando de outros frutos dos estudos sintáticos e morfológicos em ambiente computacional. Há diversos outros aplicativos que resultam de estudos em Lingüística aplicada ao Processamento de Linguagem Natural, como tradutores automáticos, chatterbots (como a Persephone do diálogo acima), sumarizadores, classificadores automáticos de texto, sintetizadores de voz etc.
IHU On-Line – Como se constrói seu estudo sobre a linguagem utilizada na internet, A língua portuguesa nas salas de b@te p@po? Para muitos, a internet acaba cometendo verdadeiros crimes contra a língua portuguesa. Há um lado positivo de certas inovações feitas na linguagem e que podem ser incorporadas ao dia-a-dia?
Gabriel de Ávila Othero – A língua portuguesa escrita no meio virtual, em mensagens eletrônicas e canais e salas de bate-papo, está, acima de tudo, adaptando-se para melhor servir seus usuários: novas formas são criadas para expressar o máximo possível em tempo mais ágil - como os emoticons, as abreviações... – e outras formas, menos usadas pelos falantes, vão entrando em desuso. Por a linguagem nos bate-papos ser uma mistura entre a língua oral e a escrita (justamente para os internautas poderem “conversar pelo teclado” e “bater papo”), e por a língua escrita não passar apenas de uma tentativa de representação da língua oral, é que acontecem tantas modificações lexicais, sintáticas e semânticas. E tudo isso ocorre com um objetivo central: propiciar ao usuário da língua total liberdade para expressar suas idéias, sentimentos e emoções. Além do mais, a linguagem marca a identidade de um grupo. O grupo dos internautas criou uma linguagem que os pais têm dificuldades de acompanhar. O que é ótimo para o próprio grupo.
Se a língua portuguesa está se modificando na Internet, é porque há uma necessidade de haver essa modificação, essa adaptação aos novos tempos e meios. Acredito que seja um pouco infantil e superficial afirmar que a língua está se descaracterizando ou empobrecendo.
IHU On-Line – Por que isso ocorre?
Gabriel de Ávila Othero – Em primeiro lugar, todas as línguas são mutáveis, é de sua natureza sofrer alterações ao longo do tempo. Gosto muito de uma frase de Sírio Possenti (em Por que (não) ensinar gramática na escola, 1996, p. 38): “não há língua que permaneça uniforme. Todas as línguas mudam. Esta é uma das poucas verdades indiscutíveis em relação às línguas, sobre a qual não pode haver nenhuma dúvida.” Consciente desse caráter mutável das línguas, não há uma maneira de se afirmar que um idioma está se “descaracterizando”; ele está apenas seguindo o curso natural das coisas, ou seja, modificando-se, alterando sua forma (lexical, fonológica, sintática ou semântica) para se adaptar a seus usuários e poder melhor servi-los.
Em termos de empobrecimento ou enriquecimento da língua, também parece um tanto imaturo afirmar que a língua portuguesa está sendo maltratada e empobrecida nas salas de bate-papo virtuais. Ora, se a língua está justamente se modificando para melhor atender a seus novos usuários em suas novas formas de comunicação e uso, e se a cada dia novos vocábulos, símbolos e abreviações passam a fazer parte do léxico dos internautas, a língua portuguesa está, na verdade, enriquecendo-se, através dessas formas e usos inovadores. Ela está ficando mais expressiva.
IHU On-Line – A linguagem utilizada em conversas informais por e-mails chegarão a se sobrepor, na sua opinião, à troca de correspondência mais formal, ou tudo representa apenas a pressa do mundo atual? Por quê?
Gabriel de Ávila Othero – A verdade é que ainda é muito cedo para se comprovar as influências da linguagem da Internet em outros meios, e seria por demais precipitado afirmar algo sobre a relação entre a revolução da língua dos internautas e a evolução dita oficial da língua portuguesa. As comunicações via rede, em tempo real, são de uso muito recente no Brasil, mas, ainda assim, é possível levantar alguns aspectos da influência do discurso digital em outros meios, assunto do qual tratei em meu livro A língua portuguesa nas salas de b@te-p@po.
Muitas pessoas que lidam com correspondência eletrônica formal (como o envio de e-mails de negócios, na relação entre os funcionários de uma empresa etc.) obedecem à chamada netiqueta, a “etiqueta” de comportamento na linguagem eletrônica. Quem, por exemplo, escreve sua mensagem com letras maiúsculas pode querer representar que está brabo ou “gritando” com seu interlocutor. Muitos e-mails formais, que supostamente deveriam respeitar a norma culta da língua, sofrem a influência da praticidade do internetês. Por isso, seguidamente leio (e escrevo) algumas formas típicas do internetês, como “pq”, “q”, “lah”, “jah”, entre outras. Isso mostra que algumas modificações do internetês estão sendo adotadas em língua escrita formal em meio eletrônico. Mas o internetês não está mostrando sua força apenas no meio digital.
IHU On-Line – Em que outros meios ele está mostrando força?
Gabriel de Ávila Othero – Por minha própria experiência como professor de língua portuguesa e corretor de redações de vestibulares, percebo que até mesmo em contextos de escrita formal fora do computador (como em redações escolares, provas de vestibular etc.), muita gente desliza na norma culta e acaba utilizando uma forma típica do internetês. Estamos presenciando in loco a mudança da língua. Nesse caso específico, do código escrito formal. Mas isso não é uma preocupação (ou não deveria ser). Afinal, já disse Ferdinand de Saussure (3) (lingüista suíço, cuja obra póstuma, Cours de Linguistique Générale é um marco na Lingüística): todas as coisas mudam e não há razão alguma para crer que as línguas escapem a essa lei universal.
Notas
(1) A comunicação animal: uma forma de linguagem?. Cadernos do IL (UFRGS), v. 30, p. 239-251, 2005.
(2) Noam Chomsky é um crítico de mídia norte-americano que estuda as relações da mídia e poder. É professor de Lingüística no Instituto de Tecnologia de Massachusetts (MIT, em inglês). Escreveu, entre outros, Contendo a democracia (Rio de Janeiro: Record, 2003).
(3) Ferdinand de Saussure foi um lingüista suíço, cujas elaborações teóricas propriciaram o desenvolvimento da lingüística enquanto ciência e desencadearam o surgimento do estruturalismo. Além disso, o pensamento de Saussure estimulou muitos dos questionamentos que comparecem na lingüística do século XX.