Neste último fim de semana, o gerador de IA para vídeos Pika adicionou um novo recurso que permite aos usuários gerar automaticamente efeitos sonoros para seus vídeos de IA feitos na plataforma web, pika.art
A mudança promete adicionar uma nova dimensão aos vídeos gerados por IA, a maioria dos quais são sem som e anteriormente exigiam que um usuário adicionasse seus próprios arquivos de som por meio de outros softwares de edição. Agora, com a nova adição do Pika, eles podem fazer isso diretamente dentro do aplicativo e criar novos arquivos de som sem obtê-los separadamente.
A mudança ocorre menos de duas semanas após o lançamento de recursos de sincronização labial e leva o conteúdo gerado por IA a um nível totalmente novo, tornando-o mais adequado para criadores individuais e casos de uso corporativos. Junto com a sincronização labial e o fabricante de visuais de vídeo de IA generativa existente, Pika criou uma das primeiras grandes plataformas de criação de vídeo de IA generativa "tudo-em-um", onde os usuários podem fazer tudo com IA - efeitos sonoros, narrações e visuais - tudo com algoritmos de IA em um só lugar.
Ao oferecer essas três grandes capacidades, Pika poderia provar ser uma proposta atraente para os cineastas e eliminar a necessidade de cineastas, cinegrafistas, designers de som e até mesmo atores, ou as responsabilidades de um único cineasta fornecendo todo esse conteúdo por conta própria – pelo menos para certos projetos. Em vez de o cineasta sair para filmar em campo ou classificar diferentes bancos de dados e programas de imagens e sons para encontrar todos os arquivos para costurar um filme, Pika agora permite que o usuário digite nele e gere todos eles muito mais rápido do que antes, e mais diretamente de sua imaginação.
No entanto, a partir de agora, a empresa diz que o recurso está sendo oferecido apenas para aqueles que fazem parte de seu programa de supercolaboradores ou estão pagando US $ 58 / mês por sua assinatura Pro. Eventualmente, planeja tirá-lo do estágio beta e disponibilizá-lo para todos os usuários da plataforma.
Como os vídeos de IA da ferramenta terão efeitos sonoros?
Em um comunicado à imprensa e um post anunciando a capacidade, a marca confirmou que os usuários obterão efeitos sonoros de duas maneiras.
Uma delas seria a geração contextual, em que os modelos de IA sob a plataforma decidiriam qual áudio seria melhor com o clipe sendo produzido a partir do prompt de texto.
Enquanto isso, a segunda seria uma abordagem de acompanhamento, onde o usuário poderia adicionar sons específicos gerados por IA depois de gerar ou carregar um clipe sem áudio na plataforma.
Para o primeiro, explicou a empresa, tudo o que um usuário teria que fazer é ativar o botão de "efeitos sonoros" ao entrar no prompt. O modelo proprietário fará o resto do trabalho e fornecerá uma saída audiovisual completa – com sons relevantes para a cena – em questão de segundos.
No entanto, para a abordagem de acompanhamento, o usuário teria que clicar em 'Editar' e 'Efeitos sonoros' (disponíveis ao lado para modificar a região e expandir as funções de tela) e, em seguida, escrever um prompt de texto completo descrevendo que tipo de som deseja adicionar ao clipe em questão. Com base no prompt fornecido, o modelo gerará várias opções de som, permitindo que o usuário escolha e adicione o que funciona melhor para sua necessidade.
Embora o recurso tenha acabado de ser anunciado, seu lançamento deve dar aos criadores de vídeo de IA uma ferramenta muito necessária para aprimorar suas criações. Anteriormente, os usuários eram obrigados a usar áudio de outras fontes – o que trazia atrito ao processo e levava mais tempo. Pika afirma ser o primeiro no espaço de vídeo AI a incluir áudio gerado como parte da saída de vídeo.
Dito isso, é importante notar que a a ferramenta não é a única a explorar a geração de som com prompts de texto. Recentemente, a ElevenLabs, conhecida por sua tecnologia de IA de texto para fala e fala para fala, também abriu inscrições iniciais para sua IA de texto para som, que permitirá aos criadores gerar efeitos sonoros simplesmente descrevendo sua imaginação em palavras. A Meta também oferece uma tecnologia semelhante chamada AudioGen. No entanto, nenhum desses rivais também oferece um modelo de IA generativa de vídeo.
Com informações de Venturebeat
Faça parte do Fotograf.IA. Mais do que um ebook com grupo Vip, uma comunidade voltada para a revolução e o avanço da IA na fotografia. São mais de 20 horas de conteúdo em vídeo, ebook com 320 páginas (oitava versão) e dois grupos com 160 membros para acompanhar e interagir com IA na fotografia. Participe clicando aqui >>> Fotograf.IA
Quer se conectar com inovação na fotografia? Participe do grupo NFoTo >>> NFoTo: fotograf.IA, NFT e inovação
Precisando de ajuda com seu marketing na fotografia? Conheça o Novo Plano de Marketing 2024 >>> Plano de Marketing 2024 | NFoTo (enfbyleosaldanha.com)
Comentários