top of page
Foto do escritorLeo Saldanha

O futuro da I.A. na geração de imagens pode ser ainda mais alucinante

Recentemente li uma matéria da Smithsonian e decidi compartilhar aqui os achados de um novo estudo para gerar imagens com inteligência artificial





Usar uma I.A para fazer a varredura de ondas mentais e assim gerar imagens. Segundo o artigo, a tecnologia foi testada com quatro pessoas, ainda está em estágio inicial, mas poderia um dia ajudar as pessoas a se comunicar ou decodificar sonhos, dizem pesquisadores.




Os pesquisadores treinaram com sucesso um sistema de inteligência artificial para recriar imagens que as pessoas analisaram com base em suas varreduras cerebrais. A IA gerou imagens de objetos, incluindo um ursinho de pelúcia, torre do relógio e avião, depois que os participantes visualizaram imagens semelhantes.


"A precisão desse novo método é impressionante", diz Iris Groen, neurocientista da Universidade de Amsterdã que não esteve envolvida na pesquisa, a Kamal Nahas, da Science.


Embora essa tecnologia de IA de varredura cerebral para imagem esteja longe de estar pronta para uso público, os pesquisadores dizem que ela pode um dia ser útil para entender o que está acontecendo dentro da mente das pessoas. Quando estiver mais ajustada, os médicos poderão por exemplo ser capazes de usá-lo para ajudar as pessoas, como aquelas que sofrem de paralisia, a se comunicar. Ou para ajudar os neurocientistas a interpretar sonhos ou até mesmo entender como outras espécies percebem o mundo ao seu redor.





Os pesquisadores da Universidade de Osaka, no Japão, estão entre as fileiras de cientistas que usam IA para entender as varreduras do cérebro humano. Sua abordagem para isso, no entanto, é a primeira a usar o gerador de texto para imagem Stable Diffusion, que entrou no cenário de IA em rápido crescimento em agosto de 2022. Seu modelo também é muito mais simples, exigindo apenas milhares, em vez de milhões, de parâmetros ou valores aprendidos durante o treinamento.


A equipe compartilhou mais detalhes em um novo artigo, que não foi revisado por pares, publicado no servidor de preprints bioRxiv. Eles também planejam apresentar suas descobertas em uma próxima conferência de visão computacional, de acordo com a Science.


Como funciona? Normalmente, um usuário insere uma palavra ou frase no DALL-E 2 e Midjourney e aquele texto é transformado em uma imagem. Esse processo funciona porque as tecnologias de IA estudaram muitas imagens existentes e suas legendas de texto ao longo do tempo, esse treinamento permite que a tecnologia identifique padrões, que podem ser recriados com base em um prompt.


Os pesquisadores levaram esse treinamento um passo adiante, ensinando um modelo de IA para vincular dados de ressonância magnética funcional (fMRI) com imagens. Mais especificamente, os pesquisadores usaram os exames de fMRI de quatro participantes que analisaram 10.000 imagens diferentes de pessoas, paisagens e objetos como parte de um estudo anterior e não relacionado. Eles também treinaram um segundo modelo de IA para vincular a atividade cerebral em dados de fMRI com descrições de texto das imagens que os participantes do estudo analisaram.





Juntos, esses dois modelos permitiram que a Stable Diffusion transformasse os dados de fMRI em imitações relativamente precisas de imagens que não faziam parte do conjunto de treinamento de IA. Com base nas varreduras cerebrais, o primeiro modelo poderia recriar a perspectiva e o layout que o participante havia visto, mas suas imagens geradas eram de figuras turvas e inespecíficas. Mas então o segundo modelo entrou em ação, e ele pôde reconhecer para qual objeto as pessoas estavam olhando usando as descrições de texto das imagens de treinamento. Assim, se ele recebesse uma varredura cerebral que se assemelhasse a uma de seu treinamento marcada como uma pessoa visualizando um avião, ele colocaria um avião na imagem gerada, seguindo a perspectiva do primeiro modelo. A tecnologia alcançou cerca de 80% de precisão.


A tecnologia se mostra promissora, mas ainda tem algumas limitações. Ele só pode recriar imagens de objetos incluídos em seu material de treinamento. E, como a IA processou a atividade cerebral de apenas quatro pessoas, ampliá-la para incluir outras exigiria o treinamento do modelo nas varreduras cerebrais de cada novo indivíduo – um processo caro e demorado. Como tal, a tecnologia provavelmente não se tornará amplamente acessível ao público – pelo menos em sua forma atual.



O debate sobre inteligência artificial está cada vez mais acirrado e na fotografia tem ficado mais intenso. Sobretudo com a notícia recente do fotógrafo e artista alemão que levou prêmio do Sony World Photography Awards e recusou o prêmio. >>> Fotógrafo vence no Sony World Award Photography com IA e recusa prêmio





Minha visão sobre o assunto é de curiosidade e espanto. A velocidade com que essa tecnologia avança de fato é surpreendente. No fim de 2022 indiquei que essa seria uma tendência dominante em 2023, mas confesso que não esperava tanto.

Algumas questões cabem no debate:


Como será o controle disso e como artistas, marcas e a sociedade vai controlar isso? E se vai controlar?


Como um fotógrafo pode se beneficiar da ferramenta sem deixar a I.A ser protagonista? Em um processo de colaboração?


Como ficarão as questões éticas? como o combate a desinformação? E como coibir para os concursos e na arte um impacto nocivo?


Câmeras profissionais vão acompanhar o ritmo das inovações? Lembrando que smartphones estão mais integrados nessa tecnologia.


Como aproveitar os benefícios para a produtividade? Como aproveitar para o marketing? Como fazer da I.A. um co-piloto criativo?

E você? Qual sua opinião sobre o tema? Comente nos comentários deste post por favor.


Em tempo: nesta semana ocorre Conexão NFoTo para você aprender e entrar nesta nova fase de valor da fotografia. Saiba mais e participe clicando aqui >>> Conexão NFoTo: o caminho para a nova fase de valor da fotografia


Antecipe-se a grande transformação da fotografia com a nova fase blockchain. Faça parte do NFoTo e comece a avançar nessa nova fronteira do mercado - Quero ser Membro NFoTo


Precisando acertar o seu marketing ou se reposicionar? Conheça o Plano de Marketing 2023? Eu Quero Meu Plano de Marketing




Assine a newsletter grátis Spotlink e receba as notícias desse site no seu email - Quero ficar por dentro com Spotlink - Newsletter




0 comentário

Komentarze


bottom of page