Imagen 4 do Google Modelo de texto promete ‘Imagens significativamente aprimoradas’ Imagens chatas

Google tem revelado Seu mais recente modelo de texto para imagem Imagen 4 com a promessa usual de “renderização de texto significativamente aprimorada” sobre a versão anterior, Imagem 3. A empresa também introduziu uma nova versão de luxo chamada Imagen 4 Ultra, projetada para seguir instruções de texto mais precisas, se você estiver disposto a pagar mais. Ambos chegam a uma prévia paga no API de Gêmeos e para testes gratuitos limitados em Google para estudar.
O Google descreve o modelo Imagen 4 principal como “seu objetivo para a maioria das tarefas” com um preço de US $ 0,04 por imagem. Enquanto isso, o Imagen 4 Ultra é para “quando você precisa que suas imagens sigam com precisão as instruções” com a promessa de resultados de saída “fortes” em comparação com outros geradores de imagens como Dall-E e Midjourney. Esse modelo aumenta o preço em 50 %, para US $ 0,06 por imagem.
A empresa exibiu uma variedade de imagens, incluindo uma história em quadrinhos de três painéis gerada pela Imagen 4 Ultra mostrando uma pequena nave espacial sendo atacada por um lagarto espacial azul gigante … Com alguns efeitos sonoros como “Crunch!” E inexplicavelmente, “teve !!” A imagem seguiu o prompt listado Beat for Beat e parecia bem, não muito diferente de uma renderização de toon de um aplicativo 3D.
Outra leitura rápida “Frente de um cartão postal de viagem vintage para Kyoto: pagode icônico sob flores de cerejeira, montanhas cobertas de neve em distância, céu azul claro, cores vibrantes. ” Imagen 4 produzi isso para um “t”, embora em um estilo genérico sem nenhum charme. Outra imagem mostrou um casal acenando de uma rocha e outra, uma falsa sessão de moda de “Avant Garde”. As imagens eram definitivamente de boa qualidade e seguiram o texto com precisão, mas ainda pareciam altamente geradas por máquina.
O Imagen 4 é bom e parece uma melhoria leve de antes, mas não estou exatamente impressionado com isso-principalmente em comparação com os líderes de mercado, Dall-E 3 e Midjourney 7. Plus, após uma onda inicial de entusiasmo, o público parece estar cansado de arte de IA, com o principal caso de uso aparentemente sendo anúncios de spam na mídia social ou no fundo dos artigos.