Um tradutor simultâneo de Libras para textos e áudios em português ganhou destaque na premiação de um dos maiores eventos de inovação e tecnologia do mundo, o SXSW. Desenvolvido em parceria entre o CESAR (Centro de Estudos e Sistemas Avançados do Recife) e a Lenovo , o projeto foi finalista na categoria Inteligência Artificial e abre portas para expandir a acessibilidade em plataformas de atendimento ao cliente, por exemplo.
A tecnologia inovadora interpreta e traduz a Língua Brasileira de Sinais (Libras) para derrubar qualquer tipo de barreira nos diálogos. Esse processo acontece de maneira simultânea e em tempo real com auxílio de uma solução proprietária de IA que identifica os gestos individuais para contextualizá-los visualmente a partir de um conjunto de dados.
"O propósito deste projeto vai muito além de oferecer um novo serviço”, disse o gerente de ciência de dados do CESAR que co-liderou a iniciativa, Vitor Casadei. “Nós entendemos a importância da acessibilidade e inclusão e, juntamente com a Lenovo, buscamos desenvolver algo com impacto na sociedade."
-
Baixe nosso aplicativo para iOS
e Android
e acompanhe em seu smartphone as principais notícias de tecnologia em tempo real.
-
Sem modelos de IA comerciais
O projeto é resultado de cinco anos de desenvolvimento e contou com uma equipe de 80 pessoas, incluindo cinco profissionais com deficiência auditiva. Ao Canaltech, o CESAR explicou que a ferramenta não utiliza modelos comerciais da OpenAI, Google e afins. No lugar, os componentes são customizados e desenvolvidos exclusivamente para a solução.
Todo a iniciativa gira em torno de um grande desafio: trabalhar com uma grande quantidade de dados, como vídeos de diálogos e saudações, especialmente ao considerar as nuances dos sinais ou até mesmo as variações regionais.
Para isso, os desenvolvedores contaram com o auxílio da computação de borda para executar o modelo e interpretar os dados. Essa tecnologia, popularmente conhecida pelo termo em inglês “edge computing”, ajuda a processar as informações sem depender de um servidor de nuvem distante, muitas vezes localizados até em outros estados ou países.
“Embora a computação em nuvem seja uma opção, os servidores Edge fornecem maior velocidade e confiabilidade no local exato em que a IA é necessária”, explicou a instituição. “Depender exclusivamente da nuvem – e, consequentemente, da velocidade muito rápida da Internet – funciona em alguns casos, mas não em todos.”
Dos sinais para texto e áudio
O arcabouço garante que a ferramenta interprete os sinais feitos na frente de uma câmera para, posteriormente, fazer a tradução. O resultado é entregue em textos e áudios em português e possibilita que mesmo quem não entenda a língua de sinais consiga manter um diálogo sem ruídos com pessoas surdas.
“Essa solução de AI preenche lacunas de comunicação existentes, além de potencializar seu uso para acelerar o aprendizado de Libras, usando visão computacional para rastrear a precisão dos gestos e ‘instruir’ os usuários a fazerem ajustes”, apontou o diretor de P&D da Lenovo, Hildebrando Lima.
Tradutor de libras pode ser facilmente integrado
Apesar da apresentação na competição do SXSW 2024, o tradutor simultâneo de libras ainda não possui um aplicativo aberto ao público. Os desenvolvedores explicam que a solução está no processo final de testes e homologação, mas que deve ser lançada ainda em 2024 para o atendimento de suporte de laptops da Lenovo no Brasil.
Contudo, essa pode não ser a única aplicação do novo tradutor. Os responsáveis pelo projeto também apontam que o tradutor possibilita a integração com “qualquer outra solução por meio de APIs”. Ou seja, é possível levá-la para outros sites e aplicativos para oferecer mais acessibilidade a todos.
"Nosso objetivo sempre foi trazer inovação de ponta para nossos parceiros e contribuir significativamente para melhorar e inovar produtos e serviços por meio da tecnologia”, concluiu o presidente do conselho do CESAR, Giordano Cabral.
Leia a matéria no Canaltech .
Trending no Canaltech:
- Spin | Instagram deve ganhar novo recurso para republicar Reels
- TCL lança TVs com até 165 polegadas e brilho de 10 mil nits
- Os 45 filmes mais esperados de 2024
- Quais as diferenças entre Galaxy A05, A15, A25, A35 e A55?
- One UI 6.1 chegará ao S23 e mais celulares a partir de março
- Copilot está mais poderoso e oferece GPT-4 Turbo de graça