O Google anunciou nesta quarta-feira (11), durante sua conferência anual Google I/O, que o Tradutor começou a oferecer suporte a 24 novos idiomas, dentre eles o Guarani, língua de origem indígena falada em países como Brasil, Argentina, Paraguai e Bolívia.
Com os 24 novos idiomas, o Google Tradutor contempla 133 línguas no total. As novas foram incorporadas ao serviço através de uma tecnologia de aprendizado de máquina chamada Zero-Shot.
"Esta notícia representa um grande avanço técnico para o Google Tradutor. As línguas listadas acima são as primeiras que acrescentamos à ferramenta usando a tradução automática Zero-Shot, na qual um modelo de aprendizado de máquina vê apenas textos monolíngues – ou seja, aprende a traduzir para outro idioma sem jamais ter visto um exemplo", anunciou Isaac Caswell, engenheiro de software do Google Tradutor.
Caswell alertou, porém, que a tecnologia utilizada não é perfeita e pode trazer erros de tradução neste primeiro momento. "Continuaremos melhorando nossos modelos para oferecer a mesma experiência que as pessoas já conhecem em traduções de idiomas como espanhol ou alemão, por exemplo", prometeu o engenheiro.
Confira os 24 novos idiomas presentes no Google Tradutor
- Assamês, falada por cerca de 25 milhões de pessoas no nordeste da Índia;
- Aymara, falada por cerca de dois milhões de pessoas na Bolívia, no Chile e no Peru;
- Bambara, falada por cerca de 14 milhões de pessoas em Mali;
- Bhojpuri, falada por cerca de 50 milhões de pessoas no norte da Índia, no Nepal e em Fiji;
- Dhivehi, falada por cerca de 300 mil pessoas nas Maldivas;
- Dogri, falada por cerca de três milhões de pessoas no norte da Índia;
- Ewe, falada por cerca de sete milhões de pessoas em Gana e no Togo;
- Guarani, falada por cerca de sete milhões de pessoas no Paraguai, na Bolívia, na Argentina e no Brasil;
- Ilocano, falada por cerca de dez milhões de pessoas no norte das Filipinas;
- Konkani, falada por cerca de dois milhões de pessoas na Índia Central;
- Krio, falada por cerca de quatro milhões de pessoas em Serra Leoa;
- Curdo (Sorani), falada por cerca de oito milhões de pessoas, sobretudo no Iraque;
- Lingala, falada por cerca de 45 milhões de pessoas na República Democrática do Congo, na República do Congo, na República Centro-Africana, em Angola e na República do Sudão do Sul;
- Luganda, falada por cerca de vinte milhões de pessoas em Uganda e Ruanda;
- Maithili, falada por cerca de 34 milhões de pessoas no norte da Índia;
- Meiteilon (Manipuri), falada por cerca de dois milhões de pessoas no nordeste da Índia;
- Mizo, falada por cerca de 830 mil pessoas no nordeste da Índia;
- Oromo, falada por cerca de 37 milhões de pessoas na Etiópia e no Quênia;
- Quechua, falada por cerca de dez milhões de pessoas no Peru, na Bolívia no Equador e em países vizinhos;
- Sânscrito, falada por cerca de vinte mil pessoas na Índia;
- Sepedi, falada por cerca de 14 milhões de pessoas na África do Sul;
- Tigrinya, falada por cerca de oito milhões de pessoas na Eritreia e na Etiópia;
- Tsonga, falada por cerca de sete milhões de pessoas em Eswatini, Moçambique, África do Sul e no Zimbábue;
- Twi, falada por cerca de onze milhões de pessoas em Gana.