Imagens artísticas com IA são feitas automaticamente com base em descrições de textos
Pesquisadores da Universidade de Waterloo, no Canadá, e do Instituto Courant de Ciências Matemáticas de Nova York, nos Estados Unidos, desenvolveram uma ferramenta de inteligência artificial (IA) capaz de gerar imagens artísticas exclusivas automaticamente com base em descrições de texto.
Imagens artísticas com IA
De acordo com os cientistas, o método ocorre por meio de uma rede adversária que gera a memória dinâmica (DM-GAN). Isso nada mais é que um modelo com duas redes neurais artificiais que atuam juntas para produzir imagens extremamente convincentes e próximas da realidade.
Segundo o coautor do estudo, o professor de engenharia Jean-Claude Franchitti:
“Criamos um modelo que usa entradas de texto para gerar figuras conforme são descritas. Isso permite que pessoas com deficiências incapacitantes, ou que não são muito habilidosas para desenhar, possam produzir belas imagens artísticas.”
Treinamento
Para isso, os pesquisadores utilizaram o modelo DM-GAN para gerar uma imagem realista que representasse uma descrição de texto. A partir daí, uma rede neural artificial com várias camadas chamada ResNet foi aplicada para classificar a figura produzida pelo sistema de IA.
WikiArt
Tal imagem foi colocada em uma das categorias de gênero do conjunto de dados, conhecido como WikiArt. Ele funciona como uma base de código aberto que contém mais de 40 mil pinturas produzidas por 195 artistas. Ela é amplamente usada para treinar sistemas de aprendizado profundo.
Franchitti acrescenta:
“Depois de classificar a imagem produzida pelo DM-GAN em uma das categorias de gênero descritas pelo WikiArt, nosso modelo pode selecionar um estilo de pintura compatível com essa categoria de gênero e transferi-lo para a figura gerada, utilizando uma rede neural de estilização artística.”
Resultados
Contudo, mesmo diante dos primeiros resultados que foram bons do ponto de vista de utilização de uma inteligência artificial com capacidades artísticas, os pesquisadores pretendem melhorar o desempenho da rede neural. E isso especialmente em relação ao método de entrada de dados, feito exclusivamente por meio de textos.
Futuro
Por fim, o intuito é que, no futuro, os usuários possam utilizar um módulo de reconhecimento de fala para gerar as imagens. A alternativa permite que pessoas com deficiências manuais consigam usar a própria voz sem ter que digitar caracteres descritivos para criar figuras artísticas. É o que explica o professor de ciência da computação Qinghe Tian, autor principal do estudo.
“Seria fantástico se essa técnica fosse integrada em aplicativos gráficos ou de desenho, permitindo que qualquer pessoa pudesse produzir imagens de alta qualidade, independentemente de suas habilidades e talentos artísticos.”
*Foto: Reprodução