Bard, a IA do Google, também terá em breve um gerador de imagens a partir de texto

19 de jan. de 2024
2 min de leitura

O Google anunciou que vai integrar seu gerador de imagens baseado em IA, o Imagen, ao seu chatbot de IA Bard, permitindo que os usuários criem imagens a partir de descrições textuais

O Google está prestes a lançar um novo recurso para seu chatbot de IA Bard, que permitirá que os usuários criem imagens a partir de descrições textuais. O novo recurso usará o Imagen, o gerador de imagens baseado em IA do Google, que usa uma tecnologia chamada “difusão” para transformar texto em imagem. Com isso, veremos mais um avanço na popularização da tecnologia de geração de imagens com IA, já que o Google é o maior buscador do mundo e sua entrada neste mercado deve aquecer a competição.

O desenvolvedor Dylan Roussel compartilhou no X (anteriormente conhecido como Twitter) um changelog inédito do Google Bard datado de 18 de janeiro (2024) que mostra como você pode “Criar imagens com Bard”. Roussel escreveu: "Aqui está o que vem a seguir em Bard… amanhã. A geração de imagens com a Bard usará o Imagen, a “tecnologia de difusão” Text-to-Image do Google. No entanto, o desenvolvedor também observou que o “conteúdo deste changelog ainda pode ser alterado até o lançamento oficial”. Segundo fontes, hoje (19) o gerador já estaria disponível para usuários do Bard ainda em fase de testes.

O Imagen é uma família de modelos de IA do Google que pode gerar imagens realistas a partir de descrições textuais, como “um gato preto com olhos verdes” ou “um castelo medieval”. O Imagen usa uma técnica chamada “difusão”, que consiste em começar com uma imagem aleatória e ir refinando-a gradualmente até que ela se pareça com a descrição dada. O Imagen pode gerar imagens de alta resolução e qualidade, e pode até mesmo criar imagens de coisas que não existem, como “um unicórnio com asas de borboleta”. Algo que os outros geradores de IA também fazem. A entrada do Google contudo é atrasada, já que a Microsoft está bem na frente com o Bing e o Dall-E 3.

O Bard é um chatbot de IA do Google que pode conversar com os usuários sobre vários tópicos, desde notícias até poesia. O Bard usa um modelo de linguagem natural chamado GPT-3, que pode gerar textos coerentes e criativos a partir de palavras-chave ou frases. O Bard pode responder a perguntas, contar histórias, fazer piadas, escrever poemas e muito mais.

Ao integrar o Imagen ao Bard, o Google pretende oferecer aos usuários uma nova forma de expressar sua criatividade e imaginação, permitindo que eles criem imagens com suas palavras. Os usuários poderão conversar com o Bard e pedir-lhe que crie imagens para eles, simplesmente descrevendo o que eles querem ver. Por exemplo, um usuário poderia pedir ao Bard que crie uma imagem de “um dragão vermelho voando sobre uma floresta encantada”, e o Bard usaria o Imagen para gerar uma imagem correspondente.

2024 será o ano da IA avançar ainda mais na tecnologia, nos smartphones, nas câmeras, redes sociais e programas. E na fotografia não será diferente. Você está preparado e atento a essa transformação? Prepare-se e aprenda fazendo parte do Grupo VIP Fotograf.IA (com direito ao ebook Fotograf.IA). Saiba mais aqui >>> Fotograf.IA: o guia definitivo para usar a inteligência artificial na fotografia

Bard, a IA do Google, também terá em breve um gerador de imagens a partir de texto

Posts recentes

Comentários