Por: Jonas | 03 Março 2015
Muitas mulheres sofrem discriminação no trabalho, na política, na economia e nas relações pessoais. A Wikipédia também reproduz a desigualdade? Um estudo sobre a presença feminina nos artigos da grande enciclopédia deste tempo revela que estão bem representadas na quantidade dos artigos. Porém, sua análise revela vieses de gênero. Nas peças sobre as grandes mulheres, destacam as referências a sua condição de mulher, o que não ocorre com os homens.
Fonte: http://goo.gl/Ij6YEZ |
A reportagem é de Angel Criado, publicada por Página/12, 01-03-2015. A tradução é do Cepat.
A Wikipédia é utilizada por milhares de pessoas independente das diferenças entre sexos. No entanto, dos 300.000 editores que modificaram algum de seus artigos ao menos 10 vezes, apenas entre 9 e 15% (segundo os estudos) são mulheres. Consciente de que esta diferença poderia afetar o conteúdo da enciclopédia, a Fundação Wikimedia colocou em andamento várias iniciativas para acabar com a lacuna de gênero. Não conseguiu totalmente.
Partindo desta desigual contribuição de base, um grupo de pesquisadores analisou a presença das mulheres, não na edição, mas, sim, nos artigos da Wikipédia. Para comparar com a vida real, selecionaram uma lista de mais de 100.000 grandes homens e mulheres da história de três bases de dados diferentes, Freebase, o projeto do MIT, Pantheon, e a lista das grandes conquistas da Humanidade reunidas no livro Human Accomplishment, do cientista político e historiador Charles Murray.
Os pesquisadores de várias universidades centro-europeias mediram a presença da mulher na Wikipédia com quatro análises diferentes. Dos mais quantitativos buscavam saber quantas das grandes mulheres mereceram um artigo na enciclopédia e se algumas delas apareciam na Wikipédia: Today’s featured article, uma seção da web que todos os dias destaca um artigo por sua relevância. Outras duas análises qualitativas mediram a rede de conexões entre os artigos e seu conteúdo para buscar vieses de gênero.
“O resultado é que em alguns casos os vieses são mais fortes, e em outros são mais frágeis e inclusive estão se reduzindo”, disse o pesquisador do Instituto Federal de Tecnologia de Zurique (ETH) e coautor do estudo, o espanhol David García. “Os vieses mais fáceis de serem notados em um simples olhar, como se há páginas de mulheres na entrada principal ou se essas páginas têm boa qualidade, se estão corrigindo e são menores do que em outras referências enciclopédicas”, acrescenta em alusão às análises quantitativas.
A lista de personagens da Freebase analisada, por exemplo, inclui mais de 100.000 e apenas 12.000 são mulheres. Dos 11.327 artigos do Pantheon, apenas 1.500 faziam referência a uma mulher. No caso do livro de Murray, a distância é ainda maior: 3.578 homens para 83 mulheres. Na Wikipédia, ao contrário, e para surpresa dos pesquisadores, a proporção de mulheres referenciadas – ainda que inferior a dos homens – é até 15% maior do que nas três bases de dados.
Mediram também a extensão dos artigos e viram que, em geral, as entradas sobre mulheres na Wikipédia eram mais longas que as dos homens. Realizaram a análise a partir das seis edições dos principais idiomas europeus, entre elas a edição em espanhol. Enquanto na edição inglesa ou na alemã, o viés em favor dos homens se mantém, nas edições latinas (francês, italiano e espanhol) as referências a personagens femininas superam as que aparecem nas bases de dados comparadas.
O mesmo acontece com os artigos destacados na página da Wikipédia. Ainda que a maioria se refira a acontecimentos históricos e não a personagens, quando destacam algum, a proporção de homens e mulheres chega a 60-40, muito perto da paridade. Como escrevem os autores, “isto possivelmente seja o resultado do esforço dos wikipedianos para melhorar a cobertura das minorias, neste caso, as mulheres”.
Porém, quando se afina a análise, a desigualdade reaparece. “Os vieses mais sutis, como o uso de palavras sobre o gênero ou as tendências de links, são ainda coisa de homens”, comenta o pesquisador espanhol. Em relação aos links, os cientistas estudaram dois aspectos chaves na teoria de redes. Por um lado, a centralidade de um nó (neste caso, o artigo sobre um personagem). Os mais relevantes tendem a receber mais links, ao passo que os menos aparecem na periferia da rede. Por outro lado, existe o que chamam assortatividade, “uma propriedade das redes em que nós de certo tipo tendem a se conectar entre eles”, explica García.
Na Wikipédia encontraram assortatividade de gênero. As páginas de homens tendem a se relacionar com as páginas de homens e as de mulheres com as de mulheres. Porém, em sua análise, publicada no repositório científico Arxiv, viram que um link que chega ao artigo sobre um homem possui maior probabilidade de proceder de um artigo sobre uma mulher do que ao contrário.
A última análise foi a das palavras. “Para analisar o texto usamos uma técnica de linguística computacional que detecta as palavras que predizem classes de textos. Neste caso, a classe é se a página é sobre um homem ou uma mulher, e os termos mais discriminatórios são os que ajudam a um preditor automático a saber, somente com o texto, se a página é de um homem ou uma mulher”, explica o pesquisador espanhol.
Os pesquisadores buscaram a presença de palavras que deram pistas sobre o gênero do protagonista do artigo (homem, mulher, cavaleiro, senhora...), sobre suas relações pessoais (casado, divorciada, esposa, marido...) e outras relacionadas com a família (filho, mãe, avô...). Assim, até ter uma lista de 150 palavras mais relevantes para determinar o gênero. Os resultados agoniam.
Nas seis edições analisadas, ao redor de 30% das palavras nos artigos protagonizados por mulheres faziam referência a sua condição de mulher, mãe, esposa... No caso dos artigos sobre os homens, entre 0 e 3% das palavras destacavam sua condição como tal. O relevante neste enorme viés é que aparece em artigos redigidos para Wikipédia, ou seja, são, como disse García, “palavras que diferenciam sexos na Wikipédia, não se referem a processos sociais de discriminação”.
Ainda que não haja muitas diferenças entre alguns idiomas e outros, as edições da Wikipédia em russo, alemão e inglês apresentam um viés maior de gênero do que as escritas em italiano, francês e espanhol. Para os pesquisadores, os editores da Wikipédia deveriam tentar balancear tanto os links como o vocabulário dos artigos. Caso contrário e como concluem em seu estudo, continuarão reproduzindo a desigualdade: “Como os sistemas de busca atuais e os algoritmos de recomendação se apoiam tanto na informação estrutural como léxica da Wikipédia, as mulheres poderiam ser discriminadas na classificação dos artigos sobre pessoas relevantes”.