Meta Entra na Corrida das Aplicações de IA para Geração de Vídeos
O Movie Gen, que cria vídeos a partir de texto, vem competir com a Sora da OpenAI e a Jimeng AI da ByteDance
A Meta, empresa-mãe do Facebook, Instagram e WhatsApp, anunciou o lançamento do Meta Movie Gen, uma nova ferramenta de inteligência artificial (IA) capaz de gerar vídeos a partir de prompts de texto. Este anúncio marca a entrada da gigante tecnológica num mercado em rápida expansão, onde já competem a Sora da OpenAI e a Jimeng AI da chinesa ByteDance.
O Meta Movie Gen é descrito pela empresa como uma “investigação revolucionária em IA generativa para media”, abrangendo modalidades como imagem, vídeo e áudio. Segundo o comunicado oficial, esta nova tecnologia permite aos utilizadores produzirem vídeos personalizados, editarem vídeos existentes e até transformarem imagens pessoais em vídeos únicos, tudo isto utilizando simples comandos de texto.
A Meta afirma que o Movie Gen supera modelos semelhantes da indústria em várias tarefas, conforme avaliado por humanos. Esta ferramenta faz parte de uma longa trajectória de investigação em IA da empresa, que começou com a série de modelos Make-A-Scene e evoluiu para os modelos de fundação Llama Image.
O Movie Gen representa a terceira vaga desta evolução, combinando várias modalidades e oferecendo um controlo mais preciso aos utilizadores. A empresa prevê que estes modelos possam acelerar a criatividade e permitir o desenvolvimento de novos produtos.
Tecnicamente, o Movie Gen assenta num modelo de transformador de 30 mil milhões de parâmetros, optimizado tanto para texto-para-imagem como para texto-para-vídeo. É capaz de gerar vídeos de até 16 segundos a uma taxa de 16 fotogramas por segundo, demonstrando capacidade de raciocínio sobre movimento de objectos, interacções sujeito-objecto e movimento de câmara.
A entrada da Meta neste mercado com o Movie Gen promete intensificar a competição no campo da IA generativa para vídeo, potencialmente acelerando o desenvolvimento de novas ferramentas criativas e democratizando o acesso à produção de conteúdo visual de alta qualidade.