O melhor pedaço da Maçã.

V1: Midjourney lança modelo de IA que cria vídeos a partir de imagens

Midjourney V1

O Midjourney lançou hoje o seu primeiro modelo de geração de vídeos com inteligência artificial, chamado V1. A ferramenta permite transformar imagens em pequenos clipes animados, de até 21 segundos. Ela está disponível pelo Discord, na versão web.

Publicidade

Na prática, o modelo funciona no formato “imagem para vídeo” (“image-to-video”), isto é: a partir de uma imagem (seja criada na própria plataforma ou enviada de fora), o sistema gera quatro vídeos de cinco segundos cada.

Apresentamos nosso modelo de vídeo V1. Divertido, fácil e incrível. Disponível por apenas US$10 por mês, é o primeiro modelo de vídeo feito para *todo mundo* e já está no ar.

É possível escolher entre animação automática, em que a IA define os movimentos, ou manual, no qual o usuário descreve como quer que a cena se movimente. Também há opções de controle de movimento, com as configurações “low motion” (baixo movimento) e “high motion” (movimento mais intenso).

Low motion funciona melhor para cenas mais suaves, em que a câmera fica praticamente parada e só o elemento principal se move, de forma lenta ou mais controlada. A desvantagem é que, às vezes, o resultado pode acabar sem nenhum movimento.

High motion é ideal para quando você quer tudo em movimento, tanto a câmera quanto o que aparece na cena. Por outro lado, esse excesso de movimento pode gerar alguns erros visuais ou distorções no resultado.

Atualmente, os vídeos são entregues em resolução 480p a 24 quadros por segundo e sem possibilidade de upscaling. Cada geração de vídeo custa, em média, 8 vezes mais do que gerar uma imagem na plataforma.

O recurso está disponível para assinantes dos planos Basic (US$10), Pro (US$60) e Mega (US$120); sendo os dois últimos com geração ilimitada no modo mais lento (Relax).

Publicidade

Com o lançamento, o Midjourney passa a disputar espaço com outras ferramentas de IA para vídeos, como Sora (OpenAI), Gen-4 (Runway), Firefly (Adobe) e Veo 3 (Google). A empresa, porém, mantém o foco em atender principalmente demandas criativas, e não apenas comerciais.

Segundo o CEO 1Chief executive officer, ou diretor executivo. da empresa, David Holz, o V1 é apenas uma etapa no desenvolvimento de sistemas mais avançados, que no futuro deverão ser capazes de simular mundos em 3D, em tempo real. A empresa também planeja lançar modelos voltados para renderização 3D e experiências interativas.

Esse lançamento acontece enquanto o Midjourney enfrenta um processo na Justiça da Califórnia, movido pela Disney e pela Universal. Elas acusam a empresa de usar imagens não autorizadas de personagens como Darth Vader e Minions, pedindo indenização e a proibição do uso desse material. Esse tipo de disputa não é novidade para a companhia, que já responde a processos semelhantes desde 2023. Procurada, ela não se manifestou sobre o caso; também não há informações públicas sobre os dados utilizados no treinamento do modelo de vídeo.

via TechCrunch

Notas de rodapé

  • 1
    Chief executive officer, ou diretor executivo.

Ver comentários do post

Compartilhe este artigo
URL compartilhável
Post Ant.

De volta ao mercado brasileiro, HUAWEI lança smartphones de até R$33 mil!

Próx. Post

Apple promove iPhone 16 Pro em novo curta da campanha “Shot on iPhone”

Posts relacionados