Stable Diffusion 3 Medium é a IA geradora de imagens mais avançada da Stability
André Lourenti Magalhães
Stable Diffusion 3 Medium é a IA geradora de imagens mais avançada da Stability

A Stability AI anunciou o Stable Diffusion 3 Medium, a primeira versão aberta da nova geração do modelo de IA para gerar imagens. De acordo com a empresa, é o “modelo aberto de texto para imagem mais avançado até o momento”, com dois bilhões de parâmetros.

Os maiores destaques estão no realismo e na habilidade com tipografia. As primeiras imagens reveladas pelo SD3 Medium chamam a atenção pela quantidade de detalhes nos quais a IA normalmente tem dificuldade de acertar, como rostos e mãos, além de proporcionar resultados de alta qualidade.

A arquitetura do Diffusion Transformer permite criar imagens com textos sem erros de digitação ou problemas na formatação das letras, enquanto o modelo é capaz de compreender prompts cada vez mais complexos para ajudar na personalização do resultado.

-
CT no Flipboard : você já pode assinar gratuitamente as revistas Canaltech no Flipboard do iOS e Android e acompanhar todas as notícias em seu agregador de notícias favorito.
-

Performance otimizada

O modelo de dois bilhões de parâmetros é otimizado para garantir eficiência em computadores pessoais e GPUs de nível empresarial — o Stable Diffusion 3 tem modelos que podem chegar a oito bilhões de parâmetros, por exemplo, então a Stability AI pretende usar o tamanho da versão média como um padrão para conversão de texto para imagem.

A empresa informa que o consumo de VRAM foi reduzido, o que melhora a performance da ferramenta em placas de vídeo mais limitadas. Além disso, a desenvolvedora contou com a colaboração de NVIDIA e AMD para otimizar o Stable Diffusion 3 em diferentes dispositivos, como as placas de vídeo da série RTX e APUs da AMD.

Já disponível

A Stability AI anunciou a família de modelos do Stable Diffusion 3 em fevereiro deste ano , mas ainda não era possível testá-la em diferentes ferramentas. O SD3 Medium está disponível para uso via API da Stability Platform ou pelos serviços pagos Stable Assistant e Stable Artisan.

A empresa também é responsável por outros modelos de IA generativa, como é o caso do Stable Audio , capaz de criar músicas com até três minutos de duração a partir de prompts de texto.

Leia a matéria no Canaltech .

Trending no Canaltech:

    Mais Recentes

      Comentários

      Clique aqui e deixe seu comentário!