Por: Patricia Fachin | 30 Junho 2017
A demarcação entre as atividades que poderiam ser solucionadas por uma máquina e por um humano eram claramente definidas há alguns anos, entretanto, hoje, essa diferença já não é tão evidente em algumas tarefas, diz Claudio Jung, especialista em sistemas de inteligência artificial de reconhecimento de imagem, à IHU On-Line, na entrevista a seguir, concedida por telefone. “Hoje, se colocarmos duas fotos, a de um círculo e a de um quadrado, com mais ou menos o mesmo tamanho, e perguntarmos a uma máquina e a um humano qual é maior, certamente a máquina vai responder com mais precisão a essa pergunta do que o humano. Então isso já é verdade numa classe de problemas”, relata.
Segundo ele, as máquinas também estão avançando em tarefas mais complexas, como o reconhecimento facial. “Nesse tipo de atividade o humano sempre foi muito melhor que a máquina, mas nos últimos anos os novos algoritmos de inteligência artificial têm conseguido taxas de acerto equivalentes ou superiores ao humano”. Como consequência desse avanço, diz, “algumas tarefas que envolvem simplesmente o operador humano, como analisar imagens para extrair informação, serão automatizadas em um futuro bem próximo — se já não estão automatizadas”.
Na avaliação de Jung, a automatização de processos que hoje são desenvolvidos por pessoas não pode ser vista como “uma via de mão única, porque quando se tira emprego de um lado, se ganha emprego de outro lado. Isso acaba forçando uma especialização da sociedade, e cada vez mais as tarefas que requerem pouca habilidade vão ser substituídas por robôs ou algoritmos computacionais”. Para ele, o avanço da tecnologia não representa uma catástrofe para o mundo do trabalho, porque “a tendência é que — como aconteceu na revolução industrial —, em vez de aprender a apertar parafusos, as pessoas terão de aprender a manipular máquinas que apertam parafusos. A sociedade vai acabar, inevitavelmente, se adaptando a isso”.
Como contraexemplo para refletirmos sobre o impacto dessas tecnologias no mundo do trabalho, Jung propõe o seguinte caso hipotético: “Vamos imaginar que um cientista descubra a cura do câncer, e com isso vai se desempregar uma cadeia de profissionais que hoje trabalham com remédios relacionados ao tratamento do câncer. A questão é que se trata de uma escolha que para mim é óbvia: tudo bem que algumas pessoas vão perder seu emprego ou vão ter que se adaptar, mas o benefício dessa tecnologia é muito maior”.
Claudio Jung (Foto: Arquivo pessoal)
Claudio Jung é mestre em Matemática Aplicada e doutor em Computação pela Universidade Federal do Rio Grande do Sul – UFRGS e é professor de Ciência da Computação da UFRGS.
Confira a entrevista.
IHU On-Line — O que são os sistemas de inteligência artificial? Como surgiram e por qual razão?
Claudio Jung — Primeiro é preciso dizer que a minha área principal de atuação é a que trata de imagem, porque na computação existem dois grupos de pesquisa: um que trabalha com inteligência artificial e outro que trabalha com imagens, embora exista uma convergência muito forte entre essas duas áreas. Não sou a melhor pessoa para responder sobre temas de inteligência artificial, mas a ideia dos sistemas de inteligência artificial é, basicamente, desenvolver sistemas computacionais que consigam aprender algumas tarefas, em geral com base em um conjunto de dados de treinamento. Isto é, esses sistemas observam um problema e tentam aprender para poder resolver problemas parecidos com dados que eles nunca viram antes. Redes neurais artificiais desse tipo estão no mercado científico há várias décadas, mas se tornaram populares nos últimos anos por conta das redes profundas ou o que costumamos chamar de deep learning. Essas redes com camadas mais profundas se popularizaram bastante a partir de 2010, ou seja, nos últimos cinco, sete anos elas se tornaram bastante populares.
IHU On-Line — Qual o panorama atual dos sistemas de inteligência artificial? Em que estágio as pesquisas sobre o tema se encontram?
Claudio Jung — A maioria dos sistemas de técnicas de inteligência artificial com mais sucesso nos últimos anos — vou falar sobre as imagens, que é a minha área — está relacionada ao processamento de linguagem natural, processamento de fala. Essas redes neurais profundas têm tido, em algumas tarefas, desempenhos equivalentes à interpretação humana, o que era, na área de imagens, impensável há alguns anos.
Essas redes precisam de uma grande quantidade de dados de treinamento. Por exemplo, se eu quero desenvolver um algoritmo para detectar um veículo em uma imagem, preciso informar para o meu algoritmo, em uma etapa de treinamento, um conjunto de imagens com carros já anotados. Então, existe um trabalho de anotação para o algoritmo saber o que ele precisa detectar e a partir daí, após o treinamento, ele consegue executar essa tarefa de modo razoavelmente rápido. O gargalo desses algoritmos, e um dos focos de pesquisa atualmente, é como reaproveitar treinamentos que foram feitos para um contexto no sentido de reutilizar esse treinamento para resolver outro problema, com amostras de imagens conhecidas; esse é um dos desafios atuais desses sistemas de inteligência artificial.
IHU On-Line — Como funcionam, especificamente, os sistemas de inteligência que têm a capacidade de reconhecer imagens? Como essa tecnologia surgiu e como tem se desenvolvido desde então?
Claudio Jung — Dentro da área de visão computacional de processamento de imagens tem uma série de algoritmos; o cientista pensava em um problema específico, desenhava alguns filtros específicos para aquele tipo de problema e fazia o design de classificadores específicos para o problema. Como isso começou a convergir? Com base nessas redes neurais convolucionais — que são redes neurais onde existe uma relação de vizinhança entre os pixels de uma imagem — e com base em um conjunto de dados de treinamento, os sistemas aprendem essas relações que existem entre os pixels vizinhos. O interessante dessas redes é que uma mesma rede consegue aprender e resolver problemas com uma natureza bastante diversa. Então, se eu treino essa rede com imagens de face, ela vai aprender a reconhecer faces; se tenho esse mesmo esqueleto e treino com imagens para reconhecer veículos, o sistema vai aprender a reconhecer veículos.
IHU On-Line — O senhor já declarou que as profissões que trabalham com imagens serão afetadas por essa tecnologia. Que tipo de alterações estão ocorrendo e ainda ocorrerão nessas profissões?
Claudio Jung — Essa proliferação das técnicas de inteligência artificial em imagens afeta potencialmente qualquer problema que envolve análise de imagens, desde a manipulação de imagens com Photoshop, por exemplo, até tarefas que são resolvidas por algoritmos hoje em dia. Sem dúvida, algumas tarefas que envolvem simplesmente o operador humano, como analisar imagens para extrair informação, serão automatizadas em um futuro bem próximo — se já não estão automatizadas. Um exemplo bem simples disso é o controle de acesso a um estacionamento usando reconhecimento e detecção de placas. Se o critério para acessar um estacionamento é o reconhecimento da placa do veículo cadastrado, por meio de uma câmera, um computador e um algoritmo eficiente, isso pode ser automatizado hoje em dia.
As tarefas que vão demorar um pouco mais para serem desenvolvidas por esses sistemas são aquelas que envolvem informações temporais, análises de vídeos, a detecção de eventos suspeitos em câmeras de vigilância, mas tarefas mais objetivas, que envolvem reconhecimento facial ou acesso biométrico, já têm uma taxa de acerto equivalente ao operador humano.
IHU On-Line — De que modo esses sistemas tendem a alterar a lógica de funcionamento das redes sociais?
Claudio Jung — Há muitas questões envolvendo análise semântica de textos, ou seja, sistemas tentam identificar tendências como, por exemplo, se uma mensagem desperta comentários bons ou ruins com base no que os usuários estão escrevendo nas redes sociais. Muitas dessas análises automatizadas são feitas hoje e esse realmente é um dos interesses de companhias como o Facebook e similares.
Agora, com relação à questão da avaliação de imagens, a grande verdade é que empresas como o Facebook basicamente têm acesso a uma quantidade quase inesgotável de imagens, que são aquelas que todo mundo posta no site. Então, por exemplo, nós postamos imagens e marcamos as pessoas que aparecem nas fotos e com isso estamos oferecendo para o Facebook e para as empresas imagens de treinamentos para que elas possam desenvolver os algoritmos de inteligência. Se eu marcar você numa das minhas fotos, o sistema vai aprender a te identificar em outras fotos.
Para que eles podem usar essas informações? Bom, para uma aplicação inocente, que talvez seja útil para o usuário no sentido de tentar organizar os álbuns de fotos por pessoas, por categorias ou por diferentes aspectos pelos quais esses álbuns podem ser organizados automaticamente, como, por exemplo, organizar todas as fotos em que aparecem cachorros, as fotos em que aparecem o papa etc. Isso pode ser feito de maneira automatizada e isso já vem sendo feito.
De outro lado, a detecção de imagens de pornografia e conteúdo impróprio é um problema que vem sendo estudado há algum tempo.
IHU On-Line – Especificamente sobre essa questão, aí entra um outro nível de julgamento no sentido de identificar se as imagens são artísticas ou se são pornografia?
Claudio Jung — Exatamente, porque não sei o quão objetivo pode ser formulado esse problema para uma técnica de inteligência artificial no sentido de um sistema conseguir diferenciar o que é uma obra de arte do que é uma foto essencialmente pornográfica. Entretanto, diferenciar uma pintura de uma foto real já é possível, dadas as características das imagens. Tem um aplicativo que permite, inclusive, fazer upload de uma foto e ele gera uma imagem que parece uma pintura, a qual tem as características de um determinado pintor.
IHU On-Line — Alguns especialistas em sistemas de inteligência de reconhecimento de imagens afirmam que os robôs criados com essa tecnologia verão coisas que o olho humano não tem capacidade de enxergar. Essa é a tendência? Quais os efeitos disso?
Claudio Jung — Algum tempo atrás havia uma diferenciação muito clara entre classes de problemas que as técnicas computacionais podem resolver versus o conjunto de atividades que o humano pode fazer. Mas hoje, se colocarmos duas fotos, a de um círculo e a de um quadrado, com mais ou menos o mesmo tamanho, e perguntarmos a uma máquina e a um humano qual é maior, certamente a máquina vai responder com mais precisão a essa pergunta do que o humano. Então isso já é verdade numa classe de problemas. O que está migrando agora é a questão de tarefas de mais alto nível, como reconhecimento facial. Nesse tipo de atividade o humano sempre foi muito melhor que a máquina, mas nos últimos anos os novos algoritmos de inteligência artificial têm conseguido taxas de acerto equivalentes ou superiores ao humano.
Outro problema diz respeito ao reconhecimento de emoções: alguns estudos demonstram que em alguns contextos as emoções são detectadas por robôs, quando eles veem uma foto em que a pessoa está triste e outra em que a pessoa está feliz. O que chamamos de robô na verdade é uma câmera; o robô é um fator secundário, porque o importante é o sistema de visão e análise através da imagem. Então, com essas técnicas podemos alimentar um sistema desse tipo com uma quantidade imensa de imagens a que o ser humano não tem acesso. Os avanços das técnicas de inteligência artificial têm derrotado os melhores enxadristas humanos, porque esses sistemas têm acesso a um conjunto de treinamentos gigantesco. Então, a tendência é ocorrer uma migração, e as máquinas vão desempenhar tarefas que os humanos não conseguem.
IHU On-Line – Hoje vivemos numa sociedade altamente vigiada e, mesmo assim, com um alto grau de insegurança. Nesse sentido, imagino que os agentes de segurança e especialistas nesse tema devem estar muito atentos aos avanços tecnológicos relacionados a imagens e inteligência artificial.
Claudio Jung — Sim, eu inclusive tenho um projeto nessa área de vigilância eletrônica. Na área específica de vigilância de ambientes externos por câmeras, existem várias técnicas para fazer contagem de pessoas. Por exemplo, amanhã [30-06-2017] tem greve geral. Nessas situações de greves ou manifestações, os manifestantes dizem que cem mil pessoas participaram e a polícia diz que dez mil participaram. As notícias dos jornais mostram que as informações são desencontradas e ninguém vai ficar contando o número de pessoas que participou da manifestação, mas hoje já existem técnicas que fazem essa contagem com uma acurácia muito maior do que as estimativas visuais.
Obviamente já são desenvolvidas tecnologias para rastreamento de pessoas e veículos, e já se usam câmeras embarcadas, como nos veículos autônomos, mas existem áreas que ainda não foram muito desenvolvidas em casos de eventos não usuais. Várias empresas, como a IBM, vendem sistemas baseados em câmeras para vigilância. Existem sistemas comerciais para monitorar áreas em que não deve entrar ninguém. Se alguém entrar nessa área, o sistema emite um alerta.
IHU On-Line — Uma preocupação com o avanço das tecnologias é a possível crise que isso pode gerar no mundo do trabalho, provocando, por exemplo, desemprego em massa. Como essa questão tem sido discutida entre os especialistas da área de tecnologia?
Claudio Jung — Vou confessar que no meio acadêmico, pelo menos com as pessoas com quem converso, não se tem muito esse tipo de discussão. O que se percebe, entretanto, no mercado de trabalho é uma migração do perfil das pessoas. Se olharmos os EUA em particular, onde há uma série de startups que trabalham com imagens, há uma busca absurda por talentos de jovens que ainda estão na graduação. Vários pesquisadores que são pioneiros nessa área estão trabalhando em empresas, como o Yann LeCun, que trabalha no Facebook. Claro que a tendência desse tipo de trabalho, em que o trabalhador fica simplesmente olhando uma imagem e anotando informações, será substituído por técnicas automatizadas. Mas, por outro lado, isso abre campos de trabalhos mais especializados.
IHU On-Line – Na área de automação, por exemplo, um robô provoca o desemprego de seis, sete pessoas na indústria automobilística. Há uma preocupação no campo da tecnologia com essas questões ou os esforços se concentram mais nas questões tecnológicas?
Claudio Jung — Vou responder com base na minha experiência pessoal: com as pessoas com quem converso, o foco é desenvolver ciência e desenvolver aplicações. Claro que se pensa muito em automatizar processos, mas isso não é uma via de mão única, porque quando se tira emprego de um lado, se ganha emprego de outro lado. Isso acaba forçando uma especialização da sociedade, e cada vez mais as tarefas que requerem pouca habilidade vão ser substituídas por robôs ou algoritmos computacionais. Um exemplo simples são aqueles robôs que limpam o chão; isso é muito comum no exterior. A tendência é que as pessoas que hoje fazem esse tipo de tarefa, amanhã terão outro emprego.
Essa é uma discussão relevante, mas normalmente o meio acadêmico pensa mais na questão científica e tenta melhorar a qualidade de vida das pessoas. Agora, o que acontecerá com as pessoas que potencialmente perderão o emprego? A tendência é que — como aconteceu na revolução industrial —, em vez de aprender a apertar parafusos, as pessoas terão de aprender a manipular máquinas que apertam parafusos. A sociedade vai acabar, inevitavelmente, se adaptando a isso.
IHU On-Line — Muitas das funções desempenhadas hoje pelos sistemas de inteligência artificial, como carros que circulam sem motorista, pareciam ficção científica há alguns anos. Considerando que o senhor pesquisa o tema, até que ponto esses sistemas tendem a se desenvolver? O que se pode esperar para o futuro em termos de novas tecnologias?
Claudio Jung — Eu pessoalmente era um cético. Já trabalho há algum tempo com monitoramento de ambientes usando câmeras e sempre fui muito cético com esses veículos autônomos, mas essa realidade chegou. Claro que nesse tipo de operação que envolve algum risco, surgirão problemas de outra ordem para serem resolvidos. Já aconteceu, por exemplo, de um motorista utilizar a direção autônoma e o carro entrar embaixo de um caminhão. Num caso como esse, de quem é a culpa? Essa é uma questão: até que ponto podemos deixar a máquina tomar conta de um veículo completamente? Se o robô está numa situação em que ele vai atropelar uma pessoa ou um grupo de pessoas, no caso de um acidente, a culpa é de quem? Nesse caso, o que ele faz? Tem uma série de tarefas em que o operador humano é responsabilizado pelos seus atos. Um exemplo clássico é esse da direção. Vamos imaginar que se coloque um veículo autônomo numa estrada brasileira que não tem sinalização, e ele sai da estrada. A culpa é do motorista que optou por deixar o carro autônomo, ou é da companhia que fez um sistema que não é robusto, ou então é do governo ou da concessionária que deveriam manter a estrada em condições de uso?
Esses dias vi uma reportagem sobre um agente policial robótico, como uma versão do RoboCop. Vamos imaginar que exista um RoboCop e que por alguma razão ele acabe matando alguém. Quem é responsabilizado por isso? Tem uma série de discussões sobre isso, porque às vezes temos uma base tecnológica que permite avanços, mas as implicações éticas e legais são muito grandes. Se existe uma tarefa em que um humano é responsável e trocamos a pessoa pelo robô, quem passa a ser responsável? A empresa que fez o robô? Porque o robô não vai ser o responsável. Até pode se optar por aplicar pena de morte ao robô e desmontá-lo, mas isso não serve para resolver os problemas.
IHU On-Line — Nas ciências humanas, especialmente na Filosofia e na Sociologia, tende-se a refletir sobre os possíveis impactos dessas tecnologias para a vida humana. Que aproximações são necessárias entre as ciências que desenvolvem essas tecnologias e as ciências humanas, quando se trata de analisar os avanços das tecnologias? Esse diálogo é necessário?
Claudio Jung — Certamente é, porque esses exemplos que acabei de relatar são exemplos clássicos disso. As perguntas anteriores que você fez têm a ver com isso: primeiro, o que acontece com os empregos que são substituídos pelas novas tecnologias? Isso já vem acontecendo há algum tempo, mas quais mudanças em termos de ensino e sociedade têm que ser feitas para que uma nova tecnologia seja inserida de forma massiva? A questão é que essas tecnologias são inseridas pouco a pouco, e não é de uma hora para a outra que todos os carros vão virar autônomos.
Uma discussão que está sendo feita em algumas prefeituras do Brasil é se é bom ou ruim substituir o cobrador de ônibus por sistemas biométricos. Essa é uma pergunta complicada de fazer. Do ponto de vista dos custos, um sistema automatizado, assumindo que ele seja eficiente, é melhor do que ter um cobrador, mas o que acontece com esse cobrador? Na minha visão quem tem que se preocupar com essas implicações são as pessoas que vão implementar essas tecnologias no dia a dia, porque a academia em geral desenvolve a base teórica que permite desenvolver esse tipo de tecnologia.
Vamos supor que exista um algoritmo que substitua completamente o médico humano por um médico robótico. Você acha que valeria a pena usar uma tecnologia dessas? Sem dúvida alguma, porque essa tecnologia vai ajudar a salvar vidas, mas isso vai implicar em tirar o emprego de muitos médicos. Acho que num futuro próximo isso não vai acontecer, embora existam muitos avanços na área de imagens para auxiliar diagnósticos. Mas vamos imaginar que um cientista descubra a cura do câncer, e com isso vai se desempregar uma cadeia de profissionais que hoje trabalham com remédios relacionados ao tratamento do câncer. A questão é que se trata de uma escolha que para mim é óbvia: tudo bem que algumas pessoas vão perder seu emprego ou vão ter que se adaptar, mas o benefício dessa tecnologia é muito maior.