Guarani do Google Tradutor não é o falado por indígenas brasileiros

Criação tecnológica da empresa acabou incorporando à plataforma apenas o Guarani Paraguaio, ignorando a pluralidade do idioma

Foto: iG Tecnologia/Dimítria Coutinho
Google Tradutor adiciona idioma Guarani, mas foca no falado no Paraguai

Na última semana, o Google adicionou o idioma Guarani ao Tradutor , junto com 23 outras línguas. Na ocasião, a empresa afirmou que queria romper barreiras com "populações que falam línguas pouco ou nada representadas no mundo da tecnologia".

Embora a notícia seja vista como animadora por linguistas e indígenas, o idioma trazido pelo Google Tradutor não é exatamente o falado por populações indígenas que vivem no Brasil. De acordo com análise de Marci Fileti Martins, professora do Mestrado Profissional em Linguística e Línguas Indígenas (PROFLLIND), do Museu Nacional/UFRJ, a língua presente na plataforma é o chamado Guarani Paraguaio.

"O Guarani é um complexo de línguas e dialetos", comenta a professora. Ao todo, são nove, sendo sete delas faladas atualmente. Isso significa que o Guarani falado no Paraguai não é o mesmo falado por povos indígenas espalhados pelo Brasil, por exemplo.

Por que o Google Tradutor só fala o Guarani Paraguaio?

As novas línguas contempladas pelo Tradutor foram adicionadas ao sistema por meio de um modelo de aprendizado de máquina. Apesar de ter contado com a ajuda de falantes nativos e de especialistas na área de linguística, o Google afirma que as traduções foram construídas usando sistemas de inteligência artificial.

"As 24 línguas adicionadas são as primeiras que acrescentamos à ferramenta usando a tradução automática Zero-Shot, na qual um modelo de aprendizado de máquina vê apenas textos monolíngues – ou seja, aprende a traduzir para outro idioma sem jamais ter visto um exemplo", disse Isaac Caswell, engenheiro de software do Google Tradutor, no lançamento da novidade.

Segundo o Google, não é possível afirmar que o Guarani presente no Tradutor é, de fato, o Paraguaio, já que o desenvolvimento da tradução foi baseado no Guarani falado comumente por todos os povos do Brasil, Paraguai, Argentina e Bolívia.

O que a empresa afirma ter feito, portanto, é fornecido materiais de diversas variações do Guarani para que um sistema fizessem uma análise e encontrasse, sozinho, uma maneira de traduzir esse idioma. Como há uma maior documentação do Guarani Paraguaio, é bastante provável que ele tenha se sobressaído em relação aos demais na hora de encontrar textos, o que fez com que o resultado da tecnologia fosse um tradutor que utiliza a gramática, as palavras e as expressões do Guarani Paraguaio.

Guarani não é um só

O Guarani Paraguaio é, junto com o Espanhol, a língua oficial do Paraguai, o que faz com que a maioria da população do país fale o idioma. Por esse motivo, apesar da origem indígena, a língua hoje é falada, sobretudo, por pessoas não indígenas.

Justamente por essa inserção na população paraguaia, esta variedade do Guarani incorporou muitos elementos do Espanhol, comenta Wilmar da Rocha D'Angelis, professor no Departamento de Linguística da Universidade Estadual de Campinas (UNICAMP) e especialista em Línguas Indígenas. Segundo ele, essa foi uma forma do idioma se atualizar e se perpetuar na sociedade local.

Enquanto isso, as diversas variedades do Guarani não foram valorizadas ao longo da história brasileira, fazendo com que a língua não tivesse espaço por aqui. "Nas comunidades indígenas daqui, quando vai se tratar de assuntos novos, esse assunto é tratado, digamos, fora da aldeia. A tecnologia vem de fora, os brancos vêm com toda uma nomenclatura; o posto de saúde vai para dentro da aldeia, mas o funcionário é branco", exemplifica Wilmar. "Então, o indígena tem que falar em Português, e as Línguas Indígenas vão sendo comprimidas a essa invasão da Língua Portuguesa".

Diante disso, as variedades do Guarani foram se desenvolvendo às suas maneiras, levando em consideração a cultura dos falantes e, por consequência, se distanciando umas das ouras. "Tem palavras usadas nas aldeias que se tornaram obsoletas ao longo da história no Guarani Paraguaio. Há também palavras diferentes entre as variedades porque têm a ver com a realidade de comunidades", afirma o pesquisador.

Marci diz que, a grosso modo, é possível comparar as diferenças entre as diversas variedades do Guarani com as diferenças entre o Português do Brasil e o de Portugal, apesar das versões da língua indígena contarem com distinções tanto gramaticais quanto sonoras.

Quando o Google trata o Guarani como uma língua única e homogênea, ele "mitiga a diversidade linguística e cultural dos povos Guarani", opina a pesquisadora. Além disso, Marci afirma que misturar textos de diversas variedades da língua para criar um padrão único, como o Google diz ter feito, pode causar falhas de tradução.

Indígenas brasileiros não estão bem representados

Diante dessas diferenças, alguns tipos de Guarani falados no Brasil estão mais bem representados pelo Google Tradutor do que outros, já que alguns se assemelham mais da versão paraguaia por proximidades geográficas.

"O Guarani Paraguaio tem semelhanças e diferenças com o Guarani-Ñadeva, por exemplo. Aqui no Mato Grosso do Sul, a gente fica perto da fronteira com o Paraguai, então há bastante similaridades. Já o Guarani-Ñadeva de São Paulo e do Paraná é totalmente diferente", afirma Edson Amaurilio, indígena do povo Guarani-Ñadeva e mestre em Línguas Indígenas pelo Museu Nacional/UFRJ. 

Para ele, seria de extrema importância que essas variedades fossem contempladas pelas tecnologias, não apenas para que as populações não-indígenas conhecessem as diferentes culturas, mas também para que os povos indígenas locais pudessem ser mais bem representados. "Até os nossos mais jovens têm desconhecimento em relação a essa variedade", comenta.

Jose Benites, indígena do povo Guarani-Mbya e mestre em Línguas Indígenas pelo Museu Nacional/UFRJ, diz que é importante que o Guarani esteja presente nessas soluções tecnológicas, mas "não somente o paraguaio, como também o Guarani falado em todo o território onde vive o povo Guarani".

Mesmo com erros, o importante é começar

Apesar das críticas, os pesquisadores concordam que a inserção do Guarani no Google Tradutor, mesmo que de forma limitada, é um bom ponto de partida. Os indígenas afirmam que esse tipo de iniciativa é vista com bons olhos por eles. Jose conta que os mais velhos ainda têm dificuldades de aceitar as novidades tecnológicas, mas que os mais novos reconhecem que esses recursos podem potencializar a comunicação entre povos.

"Apesar das críticas, continuo destacando a importância dessa ação", afirma Marci. "Agora, falantes do português, do inglês e qualquer um que tenha sua língua inscrita no Google Tradutor pode ter acesso a traduções de texto em Guarani. Isso com certeza garante uma acessibilidade ao Guarani até então limitada aos estudiosos da língua e aos próprios falantes", complementa.

Assim como Edson, Wilmar também enxerga que as tecnologias têm o poder de impactar não somente os não-indígenas, que podem passar a conhecer mais sobre a cultura, mas também os próprios indígenas mais jovens. "As gerações mais jovens vão ver a sua língua em um lugar de prestígio. Você não ouve só na escolinha da aldeia ou nas conversas dos mais velhos, mas também em um equipamento tecnológico de última geração. Esse é um impacto altamente positivo na valorização da língua e que tem um papel muito importante na conservação e na manutenção da língua nas gerações mais novas", diz o pesquisador.

Quando adicionou o Guarani, o Google alertou que alguns erros poderiam aparecer, já que a tradução foi feita por um sistema. Marci diz que já encontrou algumas falhas, mas Wilmar reitera que não existe tradução perfeita. "É melhor ter isso e as coisas vão se consertando no caminho", comenta o professor.

O Google disse que ainda não tem informações sobre uma possível chegada de outras variedades do Guarani ao Tradutor. A empresa ainda disse que "está focada em melhorar a experiência das 24 novas línguas para que as pessoas tenham a mesma experiência que já conhecem em traduções de idiomas como espanhol ou alemão, por exemplo. Para quem tem interesse em ajudar a plataforma com um idioma nas próximas atualizações, é possível oferecer avaliações ou traduções em Contribuir com o Google Tradutor ".

Além do Google, outras empresas também já investiram em soluções tecnológicas que incorporam línguas indígenas. O aplicativo de aprendizado Duolingo, por exemplo, possui o curso de Guarani desde 2016. "O desenvolvimento de cursos das línguas minoritárias faz parte de uma iniciativa do Duolingo que visa ajudar a proteger estes idiomas e as suas culturas", afirma a empresa. A Motorola é outro exemplo: no ano passado,  a marca adicionou as línguas indígenas brasileiras Kaingang e Nheengat aos seus smartphones.