top of page
Foto do escritorLeo Saldanha

Novo modelo de IA da Stability cria imagens incríveis a partir de textos com rapidez e qualidade

O Stable Cascade usa uma nova arquitetura que reduz o consumo de memória e melhora o alinhamento e a estética das imagens geradas


O Stable Cascade é o mais recente modelo de geração de imagens da Stability AI, que promete superar o seu antecessor, o Stable Diffusion, que é a base de muitas outras ferramentas de IA que transformam textos em imagens.


O Stable Cascade pode criar imagens e dar variações da mesma imagem que produziu, ou tentar melhorar a resolução de uma imagem já existente. Outras funcionalidades de edição de imagens a partir de textos incluem inpainting e outpainting, onde o modelo preenche apenas uma parte específica da imagem, e canny edge, onde os usuários podem fazer uma nova imagem usando apenas as bordas de uma imagem já existente.





O novo modelo está disponível no GitHub para pesquisadores, mas não para uso comercial, e oferece mais opções mesmo com empresas como Google e Apple lançando seus próprios modelos de geração de imagens.



O Stable Cascade é diferente dos outros modelos da Stability, que são muito grandes. Ele usa três modelos menores que funcionam com a arquitetura de Würstchen. O primeiro modelo transforma os textos em códigos menores, que são usados pelos outros dois modelos para criar as imagens.


O gráfico mostra que o Stable Cascade é mais rápido e usa menos memória do que os outros modelos da Stability. Ele também faz imagens mais bonitas e alinhadas com os textos. Ele demora 10 segundos para fazer uma imagem, enquanto o outro modelo demora 22 segundos.



A Stability AI foi uma das pioneiras no método de Stable Diffusion e também foi alvo de vários processos alegando que o Stable Diffusion usou dados protegidos por direitos autorais sem permissão dos donos dos direitos - um processo da Getty Images contra a Stability AI está marcado para ir a julgamento em dezembro. Ela começou a oferecer licenças comerciais por meio de uma assinatura em dezembro, que a empresa disse ser necessária para ajudar a financiar sua pesquisa.


Faça parte do Fotograf.IA. Mais do que um ebook com grupo Vip, uma comunidade voltada para a revolução e o avanço da IA na fotografia. São mais de 15 horas de conteúdo em vídeo, ebook com quase 300 páginas e dois grupos com mais de 150 membros para acompanhar e interagir com IA na fotografia. Participe clicando aqui >>> Faça parte da iniciativa Fotograf.IA e turbine seu negócio e sua arte na fotografia


Quer se conectar com inovação na fotografia? Participe do grupo NFoTo >>> NFoTo: fotograf.IA, NFT e inovação


Precisando de ajuda com seu marketing na fotografia? Conheça o Novo Plano de Marketing 2024 >>> Plano de Marketing 2024

0 comentário

Posts recentes

Ver tudo

Comments


bottom of page