AI Midjourney v5 imager impressiona com imagens fotorrealistas e mãos de 5 dedos – Ars Technica

AI Midjourney v5 imager impressiona com imagens fotorrealistas e mãos de 5 dedos – Ars Technica
Prolongar / Um exemplo de iluminação e efeitos de pele no gerador de imagens AI Midjourney v5.

Quarta-feira, metade da viagem Anunciado versão 5 de seu serviço comercial de síntese de imagens de IA, que pode produzir imagens fotorrealistas em um nível de qualidade que alguns fãs de arte de IA chamam repugnante e “perfeito demais.” Midjourney v5 agora está disponível como um teste alfa para clientes que assinam o serviço Midjourney, que está disponível via Discord.

“Atualmente, MJ v5 me parece que finalmente consegui óculos depois de ignorar a deficiência visual por muito tempo”, disse Julie Wieland, uma designer gráfica que muitas vezes compartilha suas criações Midjourney no Twitter. “De repente, você vê tudo em 4k, parece estranhamente opressor, mas também incrível.”

Wieland compartilhou algumas de suas compilações do Midjourney v5 com a Ars Technica (visto em uma galeria abaixo e na imagem principal acima), e eles certamente mostram uma progressão nos detalhes da imagem desde que o Midjourney chegou pela primeira vez em março de 2022. A versão 3 estreou em agosto e a versão 4 estreou em novembro. Cada iteração adicionou mais detalhes aos resultados gerados, como mostram nossos experimentos:

Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (meio) e v5 (direita) com o indicador
Prolongar / Uma comparação entre a saída de Midjourney v3 (esquerda), v4 (meio) e v5 (direita) com a mensagem “um bárbaro musculoso com armas ao lado de uma TV CRT, cinematográfica, 8K, iluminação de estúdio”.

Ars Technica

O Midjourney funciona de maneira semelhante a sintetizadores de imagem como Stable Diffusion e DALL-E, pois gera imagens com base em descrições de texto chamadas “pistas” usando um modelo de IA treinado em milhões de obras de arte feitas pelo homem. Midjourney esteve recentemente no centro de uma controvérsia de direitos autorais em relação a uma história em quadrinhos que usava versões mais antigas do serviço.

Depois de experimentar a v5 por um dia, Wieland notou melhorias, incluindo texturas de pele e características faciais “incrivelmente realistas”; iluminação mais realista ou cinematográfica; melhores reflexos, realces e sombras; ângulos ou visões gerais mais expressivos de uma cena e “olhos quase perfeitos e não mais tortos”.

E, claro, as mãos.

No ano passado, a ideia de que os geradores de arte de IA não podem renderizar as mãos corretamente tornou-se uma espécie de tropo da cultura. Em particular, Midjourney v5 pode renderizar mãos humanas realistas muito bem. “As mãos estão corretas na maioria das vezes, com 5 dedos em vez de 7-10 em uma mão”, disse Wieland.

Nas notas de lançamento do Discord do serviço, Midjourney também observou que a v5 agora é responsiva com uma “faixa estilística muito mais ampla” do que a versão 4, além de ser mais responsiva aos prompts, gerando menos spam e oferecendo um aumento de 2x na resolução da imagem.

Se há uma desvantagem visual na atualização do Midjourney para os fãs da arte da IA, talvez ela venha dos visuais que podem ser tão realistas e “perfeitos” que a precisão do modelo tira um pouco da emoção de gerar repetidamente imagens de IA para encontrar um resultado adequado, o que se pode chamar de “efeito caça-níqueis”. Embora um usuário do Twitter chamado Philipp Lenssen observado“Se você tem um tema de imagem específico em mente, ainda é um pouco como a loteria. Mas com uma chance maior de ganhar do que v4.”

You May Also Like

About the Author:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *