Frame IA | Google leva a lógica do Nano Banana para o vídeo
- há 4 dias
- 4 min de leitura
Com o Gemini Omni, a empresa aproxima geração, edição e preservação de aparência em cenas curtas. Para fotógrafos, o ponto central não está no efeito visual, mas no avanço da imagem sintética para o território da identidade.

O Google apresentou no I/O 2026 o Gemini Omni, novo modelo multimodal criado para gerar e editar vídeos a partir de texto, fotos, vídeos e áudio. A comparação feita pela própria empresa é simples: depois do Nano Banana nas imagens, a mesma lógica começa a chegar ao vídeo.
O tema já apareceu aqui no blog em uma análise mais ampla sobre o que o Gemini Omni sinaliza para fotógrafos, vídeo e inteligência artificial. Quem quiser entender melhor o contexto pode ler aqui. Agora, com os primeiros relatos e reações circulando, o ponto mais relevante fica mais evidente: o Google não está apenas lançando outro gerador de clipes curtos. Está levando a IA visual para uma etapa em que aparência, movimento e edição começam a se combinar dentro do mesmo fluxo.
O Nano Banana chamou atenção porque melhorou a preservação de rostos e características visuais em imagens geradas a partir de referências. Isso já mexia com retrato, avatar, branding pessoal e uso de imagem. No Gemini Omni, a proposta avança para cenas em movimento. O modelo pode transformar personagens, objetos e ambientes sem perder completamente a ligação com a cena original. Também permite alterar estilo, enquadramento e atmosfera por comando.
Para fotógrafos, esse detalhe pesa.
A fotografia profissional sempre esteve ligada à ideia de presença. O cliente aparece diante da câmera, confia sua imagem a alguém, escolhe um olhar, uma direção, uma forma de ser representado. Quando a IA passa a gerar vídeos com aparência semelhante à de uma pessoa real, a discussão muda de escala. Não se trata apenas de criar conteúdo. Trata-se de simular presença.
Esse é o ponto que deveria interessar mais ao mercado.
O vídeo gerado por IA tende a ser vendido como produtividade, criatividade e expansão de possibilidades. Tudo isso é verdadeiro em alguma medida. Um retrato pode virar teaser. Um ensaio pode gerar peças em movimento. Uma campanha pode ganhar variações sem nova diária. Um conteúdo estático pode se desdobrar em vídeo curto para redes sociais. A fronteira entre fotografia, motion, avatar e edição começa a ficar menos nítida.
Mas existe outro lado.
Quanto mais fácil for produzir imagem em movimento a partir de poucas referências, maior será a pressão sobre confiança, autorização e percepção de valor. O público já convive com excesso de imagens artificiais. Em muitos casos, a reação não é encantamento. É cansaço. A expressão “AI slop”, usada para descrever conteúdo sintético em massa, apareceu com força justamente porque muita gente percebe que a abundância visual nem sempre melhora a experiência.
O próprio Google tenta responder a esse problema com o SynthID, sua marca d’água invisível para conteúdos gerados por IA. A empresa também vem ampliando formas de identificação em produtos como Gemini, Busca e Chrome. O movimento é revelador. A mesma indústria que acelera a criação sintética precisa criar mecanismos para sinalizar a origem do que foi criado.
Essa tensão deve marcar os próximos anos da imagem.
A novidade não elimina a fotografia, mas muda o ambiente ao redor dela. Se vídeos, retratos simulados e cenas reimaginadas ficam mais acessíveis, o valor do fotógrafo precisa aparecer com mais precisão. Não basta entregar arquivo bonito. Será cada vez mais importante deixar claro o que foi capturado, o que foi dirigido, o que foi editado, o que foi gerado e qual é o compromisso ético por trás da entrega.

Também por isso, a integração entre Gemini e Adobe merece atenção. A Adobe anunciou que seus aplicativos, incluindo Photoshop, Lightroom, Premiere, Illustrator e Express, devem se conectar ao Gemini dentro de uma lógica de IA agente. Na prática, o usuário descreve o que deseja e o sistema executa etapas dentro dos aplicativos. Isso aponta para um fluxo em que a IA deixa de ser apenas um gerador separado e passa a atuar dentro das ferramentas que fotógrafos e criadores já usam.
Essa talvez seja a parte mais importante da mudança.
A IA não avança apenas quando cria uma imagem impressionante. Ela avança quando entra no fluxo cotidiano, reduz etapas, sugere caminhos, adapta formatos, reorganiza arquivos, edita, corta, redimensiona e prepara versões. O impacto real costuma aparecer menos no espetáculo da demonstração e mais na rotina de trabalho.
Para o fotógrafo, o risco não está apenas em ser substituído por uma ferramenta. Essa leitura é pobre. O risco maior é continuar comunicando valor como se o mercado ainda estivesse no mesmo lugar.
Se a produção visual fica mais rápida, a confiança fica mais cara. Se a edição fica mais acessível, a direção fica mais importante. Se qualquer pessoa consegue gerar variações, o olhar consistente ganha peso. Se a presença pode ser simulada, a relação entre fotógrafo, cliente e imagem precisa ser mais bem explicada.
O Gemini Omni deve ser observado por esse ângulo.
Não como curiosidade de tecnologia. Nem como ameaça automática. Mas como mais um sinal de que a imagem entrou em uma fase em que criar ficou mais simples e interpretar ficou mais difícil. Para quem vive da fotografia, essa diferença importa.
Grande parte do que publico aqui fica aberta porque esse debate precisa circular. Na Fotograf.IA + C.E.Foto, esse tipo de leitura continua com mais profundidade, exemplos práticos e discussão direta com fotógrafos que estão tentando entender o que muda no trabalho, no marketing e no valor percebido da imagem. Aliás, ontem testamos isso na prática na mentoria coletiva quinzenal.
Este texto fica aberto porque o assunto já afeta todo o mercado. Na Fotograf.IA + C.E.Foto, aprofundo essas leituras com mais contexto, exemplos práticos e discussão direta com fotógrafos que estão tentando entender o que muda no valor da imagem.



Comentários