Imagens artísticas com IA ocorrem a partir de textos

Imagens artísticas com IA

Imagens artísticas com IA são feitas automaticamente com base em descrições de textos

Pesquisadores da Universidade de Waterloo, no Canadá, e do Instituto Courant de Ciências Matemáticas de Nova York, nos Estados Unidos, desenvolveram uma ferramenta de inteligência artificial (IA) capaz de gerar imagens artísticas exclusivas automaticamente com base em descrições de texto.

Imagens artísticas com IA

De acordo com os cientistas, o método ocorre por meio de uma rede adversária que gera a memória dinâmica (DM-GAN). Isso nada mais é que um modelo com duas redes neurais artificiais que atuam juntas para produzir imagens extremamente convincentes e próximas da realidade.

Segundo o coautor do estudo, o professor de engenharia Jean-Claude Franchitti:

“Criamos um modelo que usa entradas de texto para gerar figuras conforme são descritas. Isso permite que pessoas com deficiências incapacitantes, ou que não são muito habilidosas para desenhar, possam produzir belas imagens artísticas.”

Treinamento

Para isso, os pesquisadores utilizaram o modelo DM-GAN para gerar uma imagem realista que representasse uma descrição de texto. A partir daí, uma rede neural artificial com várias camadas chamada ResNet foi aplicada para classificar a figura produzida pelo sistema de IA.

WikiArt

Tal imagem foi colocada em uma das categorias de gênero do conjunto de dados, conhecido como WikiArt. Ele funciona como uma base de código aberto que contém mais de 40 mil pinturas produzidas por 195 artistas. Ela é amplamente usada para treinar sistemas de aprendizado profundo.

Franchitti acrescenta:

“Depois de classificar a imagem produzida pelo DM-GAN em uma das categorias de gênero descritas pelo WikiArt, nosso modelo pode selecionar um estilo de pintura compatível com essa categoria de gênero e transferi-lo para a figura gerada, utilizando uma rede neural de estilização artística.”

Resultados

Contudo, mesmo diante dos primeiros resultados que foram bons do ponto de vista de utilização de uma inteligência artificial com capacidades artísticas, os pesquisadores pretendem melhorar o desempenho da rede neural. E isso especialmente em relação ao método de entrada de dados, feito exclusivamente por meio de textos.

Futuro

Por fim, o intuito é que, no futuro, os usuários possam utilizar um módulo de reconhecimento de fala para gerar as imagens. A alternativa permite que pessoas com deficiências manuais consigam usar a própria voz sem ter que digitar caracteres descritivos para criar figuras artísticas. É o que explica o professor de ciência da computação Qinghe Tian, autor principal do estudo.

“Seria fantástico se essa técnica fosse integrada em aplicativos gráficos ou de desenho, permitindo que qualquer pessoa pudesse produzir imagens de alta qualidade, independentemente de suas habilidades e talentos artísticos.”

*Foto: Reprodução

Outras postagens

Postagens relacionadas

Últimas postagens

Servidora da Saúde ganha prêmio de inovação e tecnologia

Servidora da Saúde recebeu o reconhecimento da FAPDF que homenageia profissionais que desenvolvem projetos nas áreas científica e tecnológica Uma servidora da Secretaria de Saúde...

Vazamento de ar na ISS: NASA e Rússia ainda não entraram em acordo

Vazamento de ar na ISS ainda carece de solução; e a NASA teme que o grave incidente leve a uma falha catastrófica de parte...

Transplante com células-tronco: É possível restaurar a visão?

Um transplante com células-tronco foi capaz de restaurar a visão de três pessoas. Para chegar a esta realidade, um estudo foi elaborado por cientistas...