Criar vídeos falsos com deepfake nunca foi tão assustadoramente fácil

Criar vídeos fake ficou tão fácil quanto digitar o que você quer que uma pessoa fale. Cientistas da Universidade de Stanford, do Instituto Max Planck de Informática, da Universidade de Princeton e da Adobe Research desenvolveram novos softwares que usam aprendizado de máquina para permitir a edição da transcrição do texto de um vídeo para adicionar, excluir ou alterar as palavras que saem da boca de uma pessoa.

As falsificações são tão realistas que é difícil diferenciá-las do material original, tanto do ponto de vista da imagem quanto do áudio, informou o site The Verge. A prova disso é que os pesquisadores pediram para os participantes de um estudo gravarem um novo áudio usando IA com as mudanças feitas no texto da fala e a qualidade comprovou que as falsificações estão perto de se tornarem perfeitas.

O projeto ainda está no início e não foi disponibilizado ao consumidor. Mas como a Adobe já divulgou detalhes do protótipo de software que foi usado na pesquisa, chamado VoCo, que permite aos usuários editar gravações de fala tão facilmente quanto modificar uma imagem, o lançamento do projeto não estaria tão longe.

Em simulações divulgadas pelos pesquisadores, o sistema foi capaz de alterar a famosa frase do filme Apocalypse Now. De “Eu amo o cheiro de napalm pela manhã” a citação foi alterada com perfeição para “Eu amo o cheiro de rabanada pela manhã”.

Para criar as falsificações de vídeo, os cientistas combinam várias técnicas. Primeiro, eles escaneiam o vídeo original para isolar os fonemas falados pelo sujeito. Eles então combinam esses fonemas com visemas (que representam a expressão da face e da boca ao dizer uma palavra) para criar um modelo 3D da parte inferior do rosto do emissor no vídeo falso.

Desse modo, o software consegue combinar todos os dados capturados a partir dos fonemas, visemas e do modelo 3D quando o texto do vídeo é editado. Assim, novas cenas são recriadas com base nos textos inseridos e adicionados no vídeo final. Os algoritmos funcionam apenas em vídeos que mostram a cabeça de uma pessoa e exigem 40 minutos de material inicial para que os dados sejam capturados.

Em testes realizados com um grupo de 138 participantes, cerca de 60% afirmaram que as edições eram reais. Em comparação, 80% desse mesmo grupo consideraram que a gravação original e não editada também era legítima.

A tecnologia ainda está em desenvolvimento, mas seus resultados atestam que a disponibilização de um software que permite a qualquer pessoa editar o que as pessoas dizem em vídeos está mais próxima do que nunca. Os pesquisadores, no entanto, reconhecem que o projeto pode ser usado para “falsificar declarações pessoais e caluniar indivíduos”, como enfatizaram em um paper sobre o novo software.

Fonte: It Midia

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *