Meta Lança AudioCraft: Geração de Áudio por Inteligência Artificial
A Meta, a gigante das redes sociais, entrou no jogo da inteligência artificial (IA) aplicada ao áudio e à música com o lançamento da nova ferramenta AudioCraft.
Este sistema de IA permite gerar música e efeitos sonoros a partir de texto, num processo tão simples como escrever uma mensagem no Instagram.
O AudioCraft é um pacote de três modelos de IA: MusicGen, AudioGen e EnCodec. O primeiro, o MusicGen, foi treinado com música licenciada pela Meta para gerar músicas a partir de texto. O segundo, o AudioGen, transforma texto em efeitos sonoros, tendo sido treinado com sons do público. O terceiro, o EnCodec, funciona como um decodificador aprimorado que produz música de maior qualidade com menos ruído indesejado.
Os modelos do AudioCraft são capazes de criar uma série de efeitos sonoros, desde um simples latido de cão a sons mais complexos, como passos num soalho de madeira ou buzinas de carros. Mas, se está a pensar que poderá criar o próximo grande sucesso da música com esta ferramenta, pense duas vezes. Embora esta ferramenta possa facilitar a vida de muitos, por enquanto, ainda não permitirá a criação de um ‘pop hit’.
A Meta abriu o código-fonte de todos estes modelos para a comunidade, dando a oportunidade a investigadores e entusiastas de treinarem os seus próprios modelos com os seus dados. Esta é uma grande oportunidade para quem está envolvido no campo do áudio e música gerados por IA e deseja contribuir para o seu avanço.
Mas é importante manter as expectativas realistas. Apesar da IA ter avançado muito nos últimos anos, o campo do áudio tem sido um pouco negligenciado. Produzir áudio de alta-fidelidade, particularmente música, é um desafio notável devido à complexidade dos sinais e padrões necessários.
O AudioCraft é um passo na direcção certa para simplificar a geração de áudio, permitindo a produção de áudio de alta qualidade com consistência a longo prazo. É um sistema fácil de usar e construir em cima, permitindo que as pessoas criem melhores geradores de som, algoritmos de compressão e geradores de música na mesma base de código.
A Meta acredita que esta base de código aberto irá impulsionar a inovação no futuro da produção e consumo de áudio e música. Com mais controle e manipulação, o MusicGen poderá até tornar-se um novo tipo de instrumento. Mas, por enquanto, não espere que gere o novo ‘sucesso do verão’. Por mais avançada que seja a tecnologia, a arte de compor uma canção que toque os corações das pessoas ainda é uma tarefa principalmente humana.