Google anuncia Gemini 1.5 com foco em tarefas mais complexas
Bruno De Blasi
Google anuncia Gemini 1.5 com foco em tarefas mais complexas

O Google apresentou, nesta quinta-feira (15), a atualização para o Gemini 1.5, nova versão do modelo de linguagem que é usado para processar informações do chatbot que leva o mesmo nome. O lançamento promete melhoria no desempenho e mais eficiência no processamento de informações.

A atualização vem a público poucos meses após o anúncio da primeira versão, em dezembro de 2023 , que colocou o Google no páreo com a OpenAI, dona dos modelos de linguagem (LLM, em inglês) GPT-3 e GPT-4.

Mais desempenho

O pacote de novidades é completamente incremental, com foco em melhorias. Para isso, o Google explorou uma nova arquitetura conhecida como Mixture-of-Experts (MoE), que divide os modelos em pequenas redes neurais “especializadas” em vez de uma rede gigante.

-
Siga o Canaltech no Twitter e seja o primeiro a saber tudo o que acontece no mundo da tecnologia.
-

Esse processo garante mais eficiência e ajuda a processar tarefas mais complexas com agilidade. A vantagem também é aplicada no treinamento do Gemini, que se tornou mais rápido com a atualização.

Não à toa, o Google afirma que o Gemini 1.5 Pro tem desempenho similar ao Ultra 1.0, o modelo mais avançado da companhia até o momento — vale lembrar que o modelo tem três tamanhos: Nano (nos celulares Pixel ), Pro (disponível no chatbot Gemini) e Ultra (disponível no Gemini Advanced ).

“Quando testado em um painel abrangente de avaliações de texto, código, imagem, áudio e vídeo, o 1.5 Pro supera o 1.0 Pro em 87% dos benchmarks usados para desenvolver nossos LLMs”, disse a companhia.

Mais tokens

A versão 1.5 também expandiu o tamanho da janela de contexto, que é o limite de informações que podem ser aplicadas simultaneamente no modelo. Essa fronteira é estabelecida a partir da quantidade máxima de tokens — ou seja, blocos usados para processar dados.

De 32 mil tokens da versão 1.0, o Gemini 1.5 passou a suportar até 1 milhão de tokens. Quantidade que, segundo o Google, permite a análise de 1h de vídeo, 11h de áudio, 30 mil linhas de código ou mais de 700 mil palavras.

A empresa chegou a usar o Gemini 1.5 para analisar o PDF com a transcrição da missão Apollo 11, que levou o homem à lua, como exemplo. Ao solicitar os momentos cômicos das falas, o algoritmo levou apenas segundos para ler as 402 páginas do documento e trazer resposta.

Gemini 1.5 ainda está em testes

Por enquanto, o Google vai liberar o Gemini 1.5 apenas para a versão Pro, mas ainda em fase de testes. A partir desta quinta-feira (15), os desenvolvedores e clientes corporativos conseguem experimentar a nova versão pelo AI Studio ou Vertex AI em um contexto limitado.

Além disso, a companhia oferece inicialmente o Gemini 1.5 Pro com suporte a apenas 128 mil tokens. Depois, com as melhorias do modelo, a empresa pretende apresentar outros planos para oferecer até 1 milhão de tokens.

“Os primeiros testadores podem experimentar a janela de contexto de 1 milhão de tokens sem nenhum custo durante o período de teste, embora devam esperar tempos de latência mais longos com esse recurso experimental”, complementou a empresa.

Não há previsão de lançamento do Gemini 1.5 para o público em geral, inclusive para o chatbot que tem o mesmo nome.

Leia a matéria no Canaltech .

Trending no Canaltech:

    Mais Recentes

      Comentários

      Clique aqui e deixe seu comentário!