A Stability AI anunciou o Stable Diffusion 3 Medium, a primeira versão aberta da nova geração do modelo de IA para gerar imagens. De acordo com a empresa, é o “modelo aberto de texto para imagem mais avançado até o momento”, com dois bilhões de parâmetros.
- Image Playground | Tudo sobre a IA para criar imagens da Apple
- Dona do Kwai lança IA que cria vídeos realistas estilo Sora
Os maiores destaques estão no realismo e na habilidade com tipografia. As primeiras imagens reveladas pelo SD3 Medium chamam a atenção pela quantidade de detalhes nos quais a IA normalmente tem dificuldade de acertar, como rostos e mãos, além de proporcionar resultados de alta qualidade.
A arquitetura do Diffusion Transformer permite criar imagens com textos sem erros de digitação ou problemas na formatação das letras, enquanto o modelo é capaz de compreender prompts cada vez mais complexos para ajudar na personalização do resultado.
-
CT no Flipboard
: você já pode assinar gratuitamente as revistas Canaltech no Flipboard do iOS e Android e acompanhar todas as notícias em seu agregador de notícias favorito.
-
Performance otimizada
O modelo de dois bilhões de parâmetros é otimizado para garantir eficiência em computadores pessoais e GPUs de nível empresarial — o Stable Diffusion 3 tem modelos que podem chegar a oito bilhões de parâmetros, por exemplo, então a Stability AI pretende usar o tamanho da versão média como um padrão para conversão de texto para imagem.
A empresa informa que o consumo de VRAM foi reduzido, o que melhora a performance da ferramenta em placas de vídeo mais limitadas. Além disso, a desenvolvedora contou com a colaboração de NVIDIA e AMD para otimizar o Stable Diffusion 3 em diferentes dispositivos, como as placas de vídeo da série RTX e APUs da AMD.
Já disponível
A Stability AI anunciou a família de modelos do Stable Diffusion 3 em fevereiro deste ano , mas ainda não era possível testá-la em diferentes ferramentas. O SD3 Medium está disponível para uso via API da Stability Platform ou pelos serviços pagos Stable Assistant e Stable Artisan.
A empresa também é responsável por outros modelos de IA generativa, como é o caso do Stable Audio , capaz de criar músicas com até três minutos de duração a partir de prompts de texto.
Leia a matéria no Canaltech .
Trending no Canaltech:
- Clientes do C6 Bank relatam sumiço de investimentos nesta quarta (12)
- 😱 CAIU MAIS | Compre PS5 Slim com 2 jogos em super oferta com cupom
- Caixa da JBL sobrevive após 25 dias embaixo da lama no RS
- Paciente usa implante de plástico transparente que mostra o cérebro
- Dia dos Namorados | Doodle interativo do Google mistura química e amor
- 8 IAs para criar animações