Quarta-feira, metade da viagem Anunciado versão 5 de seu serviço comercial de síntese de imagens de IA, que pode produzir imagens fotorrealistas em um nível de qualidade que alguns fãs de arte de IA chamam repugnante e “perfeito demais.” Midjourney v5 agora está disponível como um teste alfa para clientes que assinam o serviço Midjourney, que está disponível via Discord.
“Atualmente, MJ v5 me parece que finalmente consegui óculos depois de ignorar a deficiência visual por muito tempo”, disse Julie Wieland, uma designer gráfica que muitas vezes compartilha suas criações Midjourney no Twitter. “De repente, você vê tudo em 4k, parece estranhamente opressor, mas também incrível.”
Wieland compartilhou algumas de suas compilações do Midjourney v5 com a Ars Technica (visto em uma galeria abaixo e na imagem principal acima), e eles certamente mostram uma progressão nos detalhes da imagem desde que o Midjourney chegou pela primeira vez em março de 2022. A versão 3 estreou em agosto e a versão 4 estreou em novembro. Cada iteração adicionou mais detalhes aos resultados gerados, como mostram nossos experimentos:
O Midjourney funciona de maneira semelhante a sintetizadores de imagem como Stable Diffusion e DALL-E, pois gera imagens com base em descrições de texto chamadas “pistas” usando um modelo de IA treinado em milhões de obras de arte feitas pelo homem. Midjourney esteve recentemente no centro de uma controvérsia de direitos autorais em relação a uma história em quadrinhos que usava versões mais antigas do serviço.
Depois de experimentar a v5 por um dia, Wieland notou melhorias, incluindo texturas de pele e características faciais “incrivelmente realistas”; iluminação mais realista ou cinematográfica; melhores reflexos, realces e sombras; ângulos ou visões gerais mais expressivos de uma cena e “olhos quase perfeitos e não mais tortos”.
E, claro, as mãos.
Apenas um aviso: a IA do Midjourney agora pode fazer as mãos corretamente. Seja mais crítico com qualquer imagem política (especialmente fotografia) que você veja online que esteja tentando incitar uma reação. pic.twitter.com/ebEagrQAQq
— Del Walker (@TheCartelDel) 16 de março de 2023
No ano passado, a ideia de que os geradores de arte de IA não podem renderizar as mãos corretamente tornou-se uma espécie de tropo da cultura. Em particular, Midjourney v5 pode renderizar mãos humanas realistas muito bem. “As mãos estão corretas na maioria das vezes, com 5 dedos em vez de 7-10 em uma mão”, disse Wieland.
Nas notas de lançamento do Discord do serviço, Midjourney também observou que a v5 agora é responsiva com uma “faixa estilística muito mais ampla” do que a versão 4, além de ser mais responsiva aos prompts, gerando menos spam e oferecendo um aumento de 2x na resolução da imagem.
Se há uma desvantagem visual na atualização do Midjourney para os fãs da arte da IA, talvez ela venha dos visuais que podem ser tão realistas e “perfeitos” que a precisão do modelo tira um pouco da emoção de gerar repetidamente imagens de IA para encontrar um resultado adequado, o que se pode chamar de “efeito caça-níqueis”. Embora um usuário do Twitter chamado Philipp Lenssen observado“Se você tem um tema de imagem específico em mente, ainda é um pouco como a loteria. Mas com uma chance maior de ganhar do que v4.”