AS EXPECTATIVAS / PROMESSAS
Essa semana apareceram no meu feed do Instagram duas ferramentas diferentes para renderização de imagens com IA. As promessas eram animadoras (“Faça imagens hiper-realistas clicando apenas um botão”) e os resultados apresentados eram de fazer brilhar os olhos de qualquer arquiteto.
Como eu já havia utilizado uma ferramenta de IA, que não era especializada para Arquitetura, para fazer uns renders de uma apresentação, acreditei estar finalmente diante de uma ferramenta poderosa para aumentar minha produtividade. Decidido a experimentar o teste gratuito, e disposto a pagar por uma versão Premium, caso a ferramenta entregasse o prometido, entrei em um dos sites de venda. Porém para minha decepção não havia uma versão gratuita de avaliação, ou eu pagava para usar ou eu não poderia testar a ferramenta. Deste modo, decidi procurar os relatos de outros usuários antes de efetuar o pagamento, e em uma simples pesquisa no Google, fui parar no site do ReclameAqui. 😐
Infelizmente os relatos não eram nada bons, e acabei decidindo não pagar para fazer o teste. Porém ao ler as reclamações de quem já havia utilizado a ferramenta, percebi que o problema não era apenas da promessa exagerada passada aos usuários, mas também havia uma certa falta de conhecimento, por parte dos usuários, do que esperar de uma ferramenta de IA para geração de renders. Assim, resolvi escrever esse artigo para que a partir da minha experiência você possa saber o que esperar ao utilizar esse tipo de ferramenta, e não acredite em promessas mirabolantes ou crie expectativas que não condizem com o que essas ferramentas entregam >>>>atualmente!<<<<<.
TESTES E ALTERNATIVAS COM IA
Meu objetivo ao pesquisar por ferramentas que fizessem upscale em imagens era deixar algumas imagens um pouco mais realistas. Comecei testando a utilização do Dall-E que faz parte da OpenAI, que é quem desenvolve o Chat-GPT. Embora o Dall-E tenha criados imagens incríveis de acordo com as minhas solicitações, havia um problema, ele não atualizava a imagem base que eu dava como input pra ele, mas ele criava uma imagem totalmente nova, ou seja, não serviam para minha apresentação. Decidi então pesquisar na Internet por sites que conseguissem receber uma imagem e devolver a mesma imagem com uma qualidade superior. Depois de algum tempo garimpando e testando em alguns sites, consegui finalmente um resultado satisfatório.
OpenArt
O site que acabei conseguindo os melhores resultados foi o OpenArt. Esse site é uma plataforma dedicada a entusiastas de arte criada por IA, e é desenvolvido por uma startup fundada por ex-Googlers. O site possui diversos módulos para trabalhar com imagens, e dentre eles há o módulo “Realistic Image Transformer” que basicamente pega uma imagem e deixa ela mais realista. A interface é bem simples: há um local para inserir a imagem arrastando ou carregando do computador, uma caixa para inserção do prompt de comando e alguns campos para ajuste. Dentro desse módulo o prompt já vem preenchido com alguns comandos para auxiliar na tarefa de transformação da imagem. As imagens custam 2 créditos para serem feitas e são geradas em aproximadamente 20 segundos e os resultados podem ser conferidos abaixo! 😉
Ao finalizar as imagens ainda é possível editá-las no módulo de edição. Para realizar as correções na imagem é necessário utilizar a ferramenta Brush e marcar na imagem as regiões que se deseja alterar, criando uma “máscara”. Em seguida é preciso preencher o prompt indicando o que se deseja alterar. Cada edição custa 2 créditos e por padrão gera duas alternativas de imagem. Para edições simples a ferramenta é boa, porém para edições mais complexas os resultados nem sempre são tão precisos quanto deveriam, o que acaba tornando mais fácil e assertivo fazer as edições em um software destinado para isso, ou até mesmo refazer a imagem a partir do módulo “Realistic Image Transformer”.
DANDO “A REAL”
Poderia terminar o artigo por aqui e deixar para você a impressão de que é tranquilo e fácil obter resultados fantásticos com o simples clique de um botão, porém isso não é verdade. 🤔 Obter uma imagem satisfatória pode ser um trabalho demorado e trabalhoso, chegando ser necessário pedir para a IA criar a mesma imagem dezenas de vezes até finalmente conseguir aquela que será usada na apresentação ao cliente. Na sequência comentarei sobre alguns pontos que precisam ser considerados na hora de usar uma IA na criação de “renders”.
PONTOS FUNDAMENTAIS PARA OBTER BOAS IMAGENS
PROMPT
Como em qualquer uso de IA o prompt com a solicitação é muito importante e influencia diretamente no resultado que será gerado. Lembre-se sempre da frase “Garbage In, garbage Out”. Uma dica para a criação do prompt ideal é usar outra IA como o ChatGPT para te auxiliar, e de preferência peça para ele escrever o prompt em Inglês. Quando tiver dificuldades para que uma IA te entenda, coloque outra IA para “conversar” com ela.
[ Garbage In, garbage Out ]
IMAGEM BASE
Assim como no caso do prompt, a qualidade da imagem que você vai usar interfere no resultado. Imagens muito simples, como uma imagem extraída direto do software de modelagem, podem acabar gerando um resultado menos refinado. Se possível, faça um “pré render” com a sua imagem, isso facilitará o processo de upgrade pela IA. Outra dica importante é fazer a imagem “limpa”, ou seja, sem muitos elementos. Quanto mais elementos houver na imagem, maiores as chances da IA mesclar alguns deles e acabar criando objetos e formas que não existem. Foque em mostrar os objetos que quer dar destaque de forma clara, por exemplo, se quiser focar no sofá de uma sala, evite deixar outros elementos, como uma luminária, na frente desse sofá.
INTERPRETAÇÕES DA IA
Por vezes algum objeto inserido na imagem pode ser interpretado de forma totalmente equivocada pela IA. Um quadro pode ser interpretado como uma janela e uma cafeteira pode ser interpretada como um equipamento futurista. Quando perceber que algum elemento não está sendo interpretado da forma correta, mesmo com instruções claras no prompt, talvez seja melhor refazer a imagem base e remover esse objeto.
TREINAMENTO DA IA
Esse é um ponto que você não tem muito controle, uma vez que não temos acesso ao treinamento que a IA teve para interpretar e reproduzir os elementos que compõem uma edificação. Porém nos meus testes notei alguns padrões que se repetiram. Por exemplo, a IA utilizada pelo “Realistic Image Transformer” tem a tendência de inserir tomadas nas paredes, mesmo que a imagem de entrada possua as paredes lisas. Em uma imagem de uma copa onde havia uma pequena bancada e uma torneira as imagens geradas vieram com uma representação de um cooktop, mesmo não havendo nenhum elemento que remetesse às bocas de um fogão. Isso possivelmente ocorre pela associação que a IA deve fazer de que paredes costumam possuir tomadas e interruptores e que ambientes que remetam à cozinha devem possuir um fogão. O mesmo ocorre no caso dos quadros que são interpretados como janelas, afinal, um retângulo em uma parede pode facilmente ser entendido como uma janela. Conforme essas ferramentas se popularizarem e forem recebendo mais inputs para treinamento esse tipo de confusão será cada vez mais raro. 😉
CONCLUSÃO
Realmente é possível obter, em alguns segundos, imagens extraordinárias comparáveis a renders profissionais. Porém a promessa, bastante divulgada em perfis de Instagram, de que é apenas clicar um botão e está tudo pronto não é verdadeira. As chances da primeira imagem sair exatamente como o esperado são baixas e possivelmente serão necessários ajustes na imagem base e nas instruções do prompt.
Espero que esse artigo tenha ajudado você a ajustar as expectativas com relação ao que esperar de um render criado por IA e que o tenha motivado a explorar essas ferramentas que podem aumentar a produtividade e qualidade do material que apresentamos para nossos clientes.
*OpenArt– 50 créditos Free 5000 créditos– 12 dólares, aproximadamente 80 reais considerando impostos.
Sobre o Autor
Olá! Meu nome é Ezequiel, sou Arquiteto e BIM Manager com uma paixão por inovação e tecnologia. Atualmente, dedico-me ao desenvolvimento de plugins para Revit que ajudam a otimizar e inovar processos no campo da arquitetura, buscando sempre integrar soluções criativas e eficientes. Fora do ambiente profissional, sou um entusiasta de música e cinema, hobbies que me permitem explorar novas perspectivas e me inspiram no dia-a-dia.
Deixe um comentário