Porque é que as coisas criadas por Inteligência Artificial parecem sempre mais do mesmo?
A impressão quando vemos algo criado por Inteligência Artificial (IA) é que já vimos aquilo antes. Isso acontece devido a algo que está por trás de quase todas as ferramentas.
Quando olhamos para alguma coisa criada por IA, seja uma imagem ou texto, a impressão é que já vimos aquilo antes. As imagens não parecem originais e os textos parecem vários outros textos. A falta de criatividade nos conteúdos criados por IA é um debate constante nas redes sociais e em estudos.
O motivo dessa impressão é o próprio pilar de como essas ferramentas são criadas e como são treinadas. A aprendizagem de máquina - ou machine learning - é o segredo por trás de quase todos os modelos atuais e ao mesmo tempo traz uma limitação nos resultados. Durante esta aprendizagem, o modelo aprende através de observação de padrões de dados que foram alimentados.
Como os dados alimentados geralmente foram criados por humanos, o modelo só consegue aprender os padrões e relações entre coisas que já existem. Recentemente, uma discussão sobre o uso de dados de artistas cresceu e levantou pontos importantes. A discussão mostra que o uso de aprendizagem de máquina na IA generativa pode ser o problema por detrás destas questões.
IA x IA Generativa
Desde que o ChatGPT ganhou popularidade, a IA generativa tem sido o tópico mais debatido dentro da comunidade de IA. As grandes empresas de tecnologia têm focado recursos e investimentos na área de IA generativa. A popularidade cresceu tanto que é comum que a IA e a IA generativa sejam confundidas.
Dentro da IA, há outras áreas como preditiva, de classificação, de regressão e entre outras. Cada área possui objetivos diferentes e a parte de criação de dados, incluída na generativa, é apenas uma de várias aplicações. Recentemente, a potência da generativa aumentou consideravelmente com a introdução das transformers.
Aprendizagem de máquina
Algo em comum em quase todas as áreas é o uso deste tipo de aprendizagem. Esta refere-se a um conjunto de técnicas que uma máquina aprende através de observação de padrões. A ideia é alimentar uma grande quantidade de dados para um modelo que aprenderá a identificar padrões e relações entre esses dados.
Há dois tipos de aprendizagens mais comuns: o supervisionado e o não-supervisionado. O supervisionado refere-se a quando há uma entrada e uma saída com a resposta, a máquina aprende a relação da entrada com a saída através de uma função. O não-supervisionado refere-se a quando a máquina recebe dados de entrada e aprende relações por contra própria.
Como é que a inteligência artificial generativa aprende?
No caso da inteligência artificial, pode ocorrer uma combinação de ambos os tipos de aprendizagem ou até mesmo de um outro chamado semi-supervisionado. Algumas técnicas de aprendizagem de inteligência artificial generativa dependem de observar padrões e reconstruir esses padrões, como rostos humanos. Uma dessas técnicas é das redes neurais generativas (GANs).
Em 2017, a Google introduziu as camadas de atenção juntamente com as transformers. A ideia é que durante essa observação de padrões, as camadas de atenção seriam utilizadas para priorizar regiões importantes numa imagem ou texto. Alguns tipos de transformers aprendem através de supervisionado como alguns tipos de tradutores, já outros podem apresentar uma mistura de métodos.
Porque é que tudo parece mais do mesmo?
Como a aprendizagem de máquina é a técnica mais utilizada nas ferramentas atuais, estas aprendem através de dados já pré-existentes. Textos, imagens, vídeos que já observaram durante o processo de treinamento. Com isso, esses modelos aprendem padrões que já são conhecidos e faz relação entre eles para criar algo.
Como estas se baseiam nesses padrões conhecidos, é natural que as coisas criadas por inteligência artificial não pareçam originais. Esta é uma crítica constante de muitas pessoas e o motivo é que o próprio método de aprendizagem limita a criação de coisas novas. Atualmente é possível apenas criar e fazer relações com coisas já existentes.
Polémica
Uma das principais críticas é sobre a questão de direitos autorais visto que muitas dessas ferramentas treinam e aprendem com dados obtidos na internet. Esses dados, muitas vezes, de arte feita por artistas é usada para um modelo reproduzir o estilo daquele artista. Desta forma, a ferramenta não está a criar, está a copiar o estilo.
Isto também está ligado à própria limitação de que as ferramentas não conseguem criar alguma coisa original e muitas vezes o estilo é a cópia de artistas. Atualmente, existe um debate sobre direitos de autor em imagens disponíveis na internet. Outro ponto é que sem a arte humana, estas ferramentas atingem um limite que as impede de criar algo novo.