Por volta dessa época do ano passado, a mídia social estava em chamas com a tecnologia viral ‘Deep Nostalgia’ do MyHeritage, cuja magia de IA animava nossas antigas fotos de família com um realismo assombroso. Bem, se isso te assustou, espere até ver o novo recurso que acabou de ser lançado chamado história ao vivo.
Desta vez, a tecnologia da empresa de genealogia online não cria apenas um pequeno clipe de 10 a 20 com base em uma foto antiga de seu parente. Em vez disso, o LiveStory vai além criando um vídeo animado mais longo de seu antepassado que conta toda a história de vida dele, completo com áudio sincronizado com os lábios e uma apresentação de slides de fotos antigas.
Como antes, ele funciona usando a tecnologia de ‘recriação’ alimentada por IA que anima uma foto do rosto de seu parente. Mas desta vez você também obtém áudio criado automaticamente a partir de uma árvore genealógica do MyHeritage ou inserido manualmente por você. A tecnologia de conversão de texto em fala dá vida à história e o áudio é sincronizado com a cabeça falante animada do seu parente.
Como funciona?
Como a tecnologia ‘Deep Nostalgia’ do ano passado, as animações do LiveStory são criadas usando um grande conjunto de ‘drivers videos’. Depois que os algoritmos do serviço analisaram a foto que você enviou, seus recursos notáveis ou “marcos” faciais são mapeados no vídeo do motorista para criar uma impressão de movimento. Os algoritmos também preenchem os detalhes que faltam. Um gerador de fala sintética também cria uma narração com base nas informações do perfil da pessoa, ou você pode criar seu próprio texto do zero. Você também pode fazer upload de sua própria gravação de áudio.
MyHeritage e D-ID, a empresa israelense que cria e licencia a tecnologia, dizem que o resultado final é totalmente personalizável, dando a você a capacidade de alterar a narrativa, fotos e voz antes de enviá-lo para a família ou redes sociais. Aparentemente, o LiveStory também suporta 31 idiomas, dezenas de dialetos e centenas de personas de voz, além de várias opções de voz masculina e feminina.
Apesar de tudo isso, não há dúvida de que a tecnologia é um pouco assustadora e está nos levando a uma jornada ainda maior no vale misterioso. Para alguns, a adição de áudio pode levar as coisas longe demais, e o MyHeritage teve que adicionar algumas isenções de responsabilidade para garantir que a tecnologia não seja abusada. Ele diz que o LiveStory é “destinado a ser usado apenas em fotos de pessoas falecidas, geralmente seus próprios ancestrais” e que “nunca deve ser usado em uma foto de uma pessoa viva sem sua permissão”.
Ainda assim, muitos nas mídias sociais acharam a tecnologia ‘Deep Nostalgia’ do ano passado uma maneira reconfortante ou mesmo comovente de virtualmente ‘conhecer’ relacionamentos que nunca haviam visto na vida real. E assim como esse recurso, o LiveStory atualmente é gratuito para experimentar em desktop, web móvel (ambos através do Site MyHeritage) e no aplicativo móvel MyHeritage. Você pode criar várias LiveStories gratuitamente, mas precisará pagar por uma assinatura (a partir de $ 119 / £ 89 por ano).
Análise: Um passo mais ousado no vale misterioso
Como o ‘Deep Nostalgia’ do ano passado, estamos um pouco divididos sobre o novo recurso ‘LiveStory’ do MyHeritage. Não há dúvida de que a tecnologia é fascinante, e o fato de poder criar automaticamente uma biografia em vídeo de 90 segundos a partir de uma foto, uma árvore genealógica e algum texto é impressionante e aterrorizante.
No entanto, não podemos deixar de sentir que grande parte do sucesso viral anterior da tecnologia (resultando em 100 milhões de animações) foi devido à sua sutileza. Os rostos animados produzidos por ‘Deep Nostalgia’ ocasionalmente piscavam ou inclinavam a cabeça, mas era só isso, e essa restrição ajudou a criar uma ilusão enquanto mascarava as limitações da tecnologia.
Adicionar áudio é um passo lógico, e não temos dúvidas de que será uma ferramenta popular para aqueles que não se arrepiam com seu inegável fator de fluência. Mas pelos exemplos que vimos até agora, a entonação é ocasionalmente robótica e o fato de a voz não ser sampleada da pessoa original a torna um pouco artificial demais.
No momento, parece que o LiveStory é um pouco mais adequado para museus ou educação, onde sua capacidade de dar vida a figuras históricas (em vez de relacionamentos pessoais) pode ser uma maneira útil de tornar a história mais atraente para os espectadores, visitantes e crianças.
Claro, também existe a possibilidade de uso indevido, embora a D-ID (fabricante da tecnologia) tenha criado algumas medidas de segurança para evitar que isso aconteça. Todos os usuários devem concordar com os termos, incluindo a promessa de não usá-los em pessoas vivas, antes que possam criar uma LiveStory. Há também um algoritmo de moderação de texto integrado para verificar informações ofensivas, difamatórias ou falsas, embora não esteja claro como estas últimas são verificadas.
Quando conversamos com o D-ID no ano passado em uma entrevista exclusiva, ficamos impressionados com seu compromisso em garantir que sua tecnologia de IA não seja usada de maneira nefasta, embora também tenhamos ficado um pouco inquietos com sua previsão de que a maioria da mídia visual que vemos na Internet será sintética “em 5-10 anos.” .” LiveStory é claramente mais um passo nesse caminho, mesmo que não seja o sucesso viral que ‘Deep Nostalgia’ foi no ano passado.