02 Novembro 2009
A possibilidade de computadores processarem, interpretarem e concatenarem conceitos são alguns dos recursos por trás da web semântica. As máquinas, portanto, podem ter a possibilidade de integrar informações já disponíveis da forma que gostaríamos. Mas há um detalhe: a web semântica não tem como objetivo fazer com que os computadores emulem o pensamento humano. “Os computadores vão ficar muito longe de tomar decisões, mas darão opções que são mais interessantes”, aponta Karin Breitman, professora do Departamento de Informática da PUC-Rio, na entrevista concedida, por telefone, à IHU On-Line. Karin apresenta a relevância da aplicação semântica à web e quais são suas contribuições para a Internet e contextos sociais. “Acho que a grande contribuição da web semântica está na acessibilidade das informações por comunidades mais carentes. Estamos sempre pensando em aplicações estapafúrdias, e, na verdade, precisamos pensar nesta tecnologia que já temos para resolver os problemas que existem. Não inventar mais, e sim aplicar melhor”, revela.
Karin Koogan Breitman possui graduação em Engenharia Eletrônica pela Universidade do Estado do Rio de Janeiro, mestrado em Engenharia de Sistemas e Computação pela Universidade Federal do Rio de Janeiro e doutorado em Informática pela PUC-Rio. Atualmente, é professora do Departamento de Informática da PUC-Rio e diretora de Publicações da Sociedade Brasileira de Computação.
Confira a entrevista.
IHU On-Line – A partir das possibilidades que a Internet nos oferece hoje, qual a importância da obtenção da semântica da informação na rede?
Karin Breitman – Dado o volume enorme de dados que temos, petabytes [1], se não usarmos semântica, não será possível fazer as máquinas nos ajudar a processar esta informação. Avançamos muito em termos de mecanismo de busca, mas não temos um mecanismo de seleção. Recuperamos a informação, mas não conseguimos achar, ou seja, separar o joio do trigo, por assim dizer. A semântica, e a web semântica em particular, vão auxiliar na construção de máquinas que nos ajudem a fazer isso. Quando faço uma busca na Internet, não adianta colocarem 400 respostas e, dentro dessas 400, ter a que me interessa. Quero chegar logo na que me interessa, se não terei que ficar interpretando as respostas. Existem alguns mecanismos de busca, mas não se tem mecanismos de interpretação. A semântica dará isso.
IHU On-Line – Qual a ideia que está por trás da web semântica?
Karin Breitman – É a utilização de formalismos, em lógica e matemática, para darmos uma semântica formal para conceitos que são definidos em linguagem natural. E, dessa forma, fazer com que as máquinas sejam capazes de processar esses conceitos também. Porque, do jeito que está, é a web sintática, uma web só processada por seres humanos, e as máquinas, os computadores, não conseguem nos ajudar muito com isso.
IHU On-Line – O que as possibilidades da web semântica de hoje nos indicam para o futuro da Internet?
Karin Breitman – Acho que agora a web semântica vai possibilitar a construção de grandes mashups [2] de dados, que são a concatenação de informações de fato relevantes. Os bancos de dados já existem, mas quando vamos viajar, por exemplo, precisamos de várias informações, dos vôos, dos hotéis, da disponibilidade destes, informações de distâncias, tabela de trem etc. Quero, na verdade, juntar todas as informações para conseguir uma solução integrada. Quero conseguir todas as informações que me interessam, o vôo que vai me deixar na hora certa para que eu possa pegar um trem, chegar em um lugar que eu já tenha uma reserva de hotel, ou descobrir qual é a melhor opção para mim, a que eu fico menos tempo esperando no aeroporto, a que eu pago menos ou a que vou chegar mais rápido. Quero fazer isso em um nível mais alto, quero que os computadores façam isso para mim, integrem essas informações que já existem e estão disponíveis de alguma forma. Elas só não estão disponíveis na forma que gostaríamos. Este é o futuro.
IHU On-Line – Com a web semântica plenamente desenvolvida, computadores agirão como humanos, no sentido de processar o “pensamento”?
Karin Breitman – Não. Eles nunca vão pensar como seres humanos, mas podem fazer muito melhor do que já fazem. Existe uma frase de um pesquisador americano, James Allen, que diz o seguinte: “Um pouquinho de semântica leva-nos longe à beça”. Os computadores vão ficar muito longe de tomar decisões, mas darão opções que são mais interessantes. Então, se existem 400 opções para a minha viagem, vou ter três opções que de fato me interessam, e aí vou poder fazer minhas escolhas e outras composições. Mas não é nem esse o objetivo, não queremos que a web semântica ajude a fazer coisas que emulem o pensamento humano, mas sim que utilizem melhor o poder de computação das máquinas.
IHU On-Line – Qual o papel de ontologias para organizar informação na internet?
Karin Breitman – O papel da ontologia, na verdade, é servir como uma maneira de se classificar e organizar informação. A ideia de usar ontologia, taxonomias e vocabulários é muito antiga. Se formos às bibliotecas, veremos que os livros estão organizados conforme uma ordem. Se observamos a analogia do livro, a Internet é como se fosse uma biblioteca monumental em que todos os livros estivessem misturados. Na biblioteca da Unisinos, que é particularmente bacana, se você for buscar os livros de ciências da computação eles estarão lá, dentro de uma classificação, livros de computação, depois de banco de dados, engenharia de software etc. As ontologias irão servir para isso, para dizer a classificação daquele objeto e em que sentido estarei enxergando o objeto. A linguagem natural tem esse problema, é polissêmica, então cada vocábulo tem vários sentidos. A palavra “tanque” pode ser um veículo de guerra, pode ser uma medida de combustível, pode ser o lugar em que lavamos a roupa, então preciso classificar um objeto dentro do seguinte: esse objeto é um veículo, do tipo tanque militar, ou esse objeto é de louça, que usamos em todas as casas para lavar roupas. Esse é o papel da ontologia, dar uma semântica bem definida para que possamos classificar objetos de maneira com que consigamos integrá-los com mais facilidade.
IHU On-Line – A senhora pode nos dar exemplos de serviços que já usam a web semântica?
Karin Breitman – Um exemplo interessantíssimo é aquele do Search Monkey [3], que é um plug-in pequeno do Yahoo que já dá um pouco de informação sobre as páginas. Então, toda vez que o browser encontra aquela página, ele consegue classificar de uma maneira muito mais legal. Ao invés de ter só aquela listinha, tem uma foto, tem links associados. Esse é um killer application [4] da web semântica. Outro interessantíssimo é o Wolfram Alfa [5] que também utiliza a web semântica.
IHU On-Line – A web semântica pode pautar uma nova cultura digital?
Karin Breitman – Não, mas irá contribuir na evolução desse nosso mundo digitalizado. A integração de técnicas semânticas com redes sociais, com acesso à tecnologia, inclusão digital, mobilidade, redução do tamanho dos dispositivos eletrônicos, o barateamento dos chips. A web semântica é mais um fator nesta história que vai facilitar e acelerar essa evolução.
IHU On-Line – A web semântica é vinculada à web 3.0. Como ela pode ser aplicada às redes sociais?
Karin Breitman – Por exemplo, podemos fazer anotações semânticas sobre objetos que temos. Então, imagina que quero integrar informações que tenho no meu desktop, tenho lá minha lista de pessoas na minha agenda do e-mail, tenho papers que eu leio por ser professora, tenho algumas aplicações que me interessam, então vou usar isso para anotar coisas novas que apareceram. A web semântica pode fazer coisas do tipo: olha Karin, você que tem 25 papers sobre deep web, naquele site apareceu um novo e talvez seja do seu interesse. Posso identificar pessoas que não podem ser do meu grupo e estão listadas como amigas e talvez eu possa me encontrar com elas na quinta-feira à noite. Agora, se for terça-feira de manhã, e eu estiver em uma conferência em Porto Alegre, vai dizer assim: Karin, nesta conferência, tem um paper que foi na web, no programa da conferência, e informa que tem um paper aceito do professor Sérgio Crispo e que ele talvez esteja na conferência. Aí pode tentar achar o dispositivo móvel dele se estiver na rede, ou então só dá um alerta que é possível que ele esteja na conferência.
Acho que a grande contribuição da web semântica está na acessibilidade das informações por comunidades mais carentes. Se pensarmos na utilização deste tipo de tecnologia para ajudar no acesso de pessoas que têm dificuldades de leitura e escrita, ou então analfabetos funcionais, ou em comunidades muito carentes, por exemplo. Temos lugares no Brasil em que a rede elétrica, as condições sanitárias e médicas são muito ruins. Estamos sempre pensando em aplicações estapafúrdias, e, na verdade, precisamos pensar nesta tecnologia que já temos para resolver os problemas que existem. Não inventar mais, e sim aplicar melhor. Acho que o grande ganho está no acesso da tecnologia à população em geral, aquela porção da população que sempre ficou muito excluída.
Notas:
[1] Unidade de medida de informação que equivale a 1.000.000.000.000.000 Bytes. Um byte é um dos tipos de dados integrais em computação. É usado com frequência para especificar o tamanho ou quantidade da memória ou da capacidade de armazenamento de um computador, independentemente do tipo de dados armazenados.
[2] Mashups é a denominação dada ao uso conjunto de aplicativos interativos que possuem conteúdos oriundos de diversas fontes de dados externos, criando um serviço inteiramente novo.
[3] SearchMonkey é um buscador de arquivos usando expressões regulares. O objetivo é fornecer um buscador simples de usar e acessível ferramenta de pesquisa para os utilizadores usuário finais, os programadores de software e afins.
[4] Killer application é uma aplicação cuja implantação supõe a definitiva assimilação dos usuários. Ela exerce uma enorme influência no desenvolvimento de aplicativos futuros da informática.
[5] Wolfram Alfa é um mecanismo de conhecimento computacional desenvolvido pela Wolfram Research. É um serviço on-line que responde às perguntas diretamente, mediante o processamento da resposta extraída de base de dados estruturados, em lugar de proporcionar uma lista dos documentos ou páginas web que poderiam conter a resposta, tal como fazem os mecanismos de busca.