DALL-E 3: A nova (e mais poderosa) versão da plataforma de arte visual generativa da OpenAI

21 de set. de 2023
3 min de leitura

A OpenAI anunciou a terceira versão da sua plataforma de arte visual generativa baseada em inteligência artificial, DALL-E, que agora permite aos usuários usar o ChatGPT para criar prompts e inclui mais opções de segurança. Veja como isso pode ser bom para fotógrafos e fotógrafas que usam ou querem usar IA na fotografia

DALL-E é uma plataforma que converte textos em imagens. Mas até mesmo a DALL-E 2 tinha problemas, muitas vezes ignorando palavras específicas. A versão mais recente, segundo os pesquisadores da OpenAI, entende melhor o contexto.

Uma nova funcionalidade da DALL-E 3 é a integração com o ChatGPT. Ao usar o ChatGPT, alguém não precisa inventar seu próprio prompt detalhado para guiar a DALL-E 3; basta pedir ao ChatGPT que crie um prompt, e o chatbot escreverá um parágrafo (DALL-E funciona melhor com frases mais longas) para a DALL-E 3 seguir. Outros usuários ainda podem usar seus próprios prompts se tiverem ideias específicas para a DALL-E.

Segundo o site Trecnoblog: entre as melhorias na qualidade das imagens, a OpenAI promete que o Dall-E 3 será capaz de fazer mãos e textos melhores, dois pontos fracos das ferramentas do tipo disponibilizadas até aqui. Também será possível pedir ajustes em uma imagem já criada.

https://www.youtube.com/watch?v=sqQrN0iZBs0

Em uma demonstração para o The Verge, Aditya Ramesh, pesquisador líder e chefe da equipe DALL-E, pediu ao ChatGPT que o ajudasse a criar um logotipo para um restaurante de ramen nas montanhas. O ChatGPT então escreveu um prompt mais longo, e a DALL-E apresentou quatro opções. Entre elas uma representação de uma montanha com ramen como neve, caldo escorrendo como uma cachoeira, e ovos em conserva no chão como pedras de jardim - embora parecesse mais uma ilustração para alguma mercadoria legal do que um logotipo convencional de restaurante. Essa conexão com o chatbot, disse a OpenAI, permite que mais pessoas criem arte com IA porque elas não precisam ser muito boas em criar um prompt.

DALL-E, lançada pela primeira vez em janeiro de 2021, veio antes de outras plataformas de arte generativa de texto para imagem da Stability AI e Midjourney. Quando a DALL-E 2 foi lançada em 2022, a OpenAI abriu uma lista de espera para controlar quem podia usar a plataforma depois de críticas de que a DALL-E podia gerar imagens explícitas fotorrealistas e mostrava viés ao gerar fotos. A empresa removeu a lista de espera em setembro do ano passado e abriu a DALL-E 2 para o público.

Esta nova versão da DALL-E será lançada primeiro para os usuários do ChatGPT Plus e ChatGPT Enterprise em outubro, seguida por laboratórios de pesquisa e seu serviço de API no outono. A OpenAI planeja lançar a DALL-E 3 em etapas, mas não se comprometeu com quando uma versão pública gratuita será lançada.

A OpenAI afirma que se concentrou muito no trabalho da DALL-E 3 na criação de medidas robustas de segurança para evitar a criação de imagens obscenas ou potencialmente odiosas. A OpenAI disse que trabalhou com red teamers externos - um grupo que tenta intencionalmente quebrar um sistema para testar sua segurança - e se baseou em classificadores de entrada, uma forma de ensinar modelos de linguagem a ignorar certas palavras para evitar prompts explícitos ou violentos. A DALL-E 3 também será incapaz de recriar imagens de figuras públicas - desde que o prompt mencione especificamente um nome.

Sandhini Agarwal, pesquisadora de políticas da empresa, disse que tem “alta confiança” em suas medidas de segurança, mas esclareceu que o modelo melhora continuamente e não é perfeito. Representantes da OpenAI disseram em um email que a DALL-E 3 foi treinada para recusar gerar imagens no estilo de artistas vivos. Ao contrário da DALL-E 2 que, quando solicitada, pode meio que imitar arte no estilo de certos artistas.

A OpenAI, possivelmente para evitar processos judiciais, também permitirá que os artistas optem por retirar sua arte das futuras versões dos modelos de IA de texto para imagem. Os criadores podem enviar uma imagem da qual possuem os direitos e solicitar sua remoção em um formulário em seu site. Uma versão futura da DALL-E pode então bloquear resultados que se pareçam com a imagem e o estilo do artista.

Para fotógrafos e fotógrafas que usam ou querem usar IA na fotografia, a DALL-E 3 pode ser uma ferramenta interessante para explorar novas possibilidades criativas, experimentar diferentes estilos e temas, e até mesmo gerar inspiração para seus próprios projetos. A integração com o ChatGPT pode facilitar o processo de criação de prompts, e as medidas de segurança podem garantir que as imagens geradas sejam adequadas e respeitosas. A DALL-E 3 também pode ser uma forma de aprender mais sobre como a IA funciona e como ela pode ser aplicada à arte visual.

Em tempo: Membros Fotograf.IA tiveram uma visão mais em profundidade sobre a novidade! A propósito, se você quiser dar os primeiros passos com IA na Fotografia clique aqui >>> Fotograf.IA

Veja também >>>> Que tal dar os primeiros passos com I.A. na fotografia? (enfbyleosaldanha.com)

DALL-E 3: A nova (e mais poderosa) versão da plataforma de arte visual generativa da OpenAI

Posts recentes

Comentários