Como a inteligência artificial está a criar coisas que não existem?
Um ramo da inteligência artificial está a ganhar forças com as aplicações dos últimos anos. A inteligência artificial generativa é uma área da inteligência artificial que tende a criar coisas que não existiam antes apenas ao observar padrões, desde rostos até obras de arte.
Recentemente, estamos a ver o sucesso do ChatGPT que consegue gerar desde textos expositivos-explicativos até mesmo roteiros de filmes. Também vemos o StableDiffusion que é um modelo capaz de gerar imagens e vídeos extremamente realistas.
A ideia de uma inteligência artificial a criar coisas novas não é nova. Modelos que são capazes de gerar frases já vem desde os anos 90 com o advento dos chatbots. O próprio corretor automático de telemóveis são exemplos de inteligência artificial generativa.
A inteligência artificial generativa é um exemplo de modelos que geram coisas novas a partir das observações de um conjunto de dados. Elas aprendem ao observar uma série de dados, como imagens ou textos, e através de técnicas de probabilidade, aprendem a criar novos dados.
Exemplos de redes neurais generativas
O exemplo mais recente e que tem chamado muita atenção é o ChatGPT. O ChatGPT é um modelo de linguagem natural que utiliza técnicas de aprendizagem de máquina para conseguir gerar textos após uma entrada de texto. Abaixo um texto gerado pelo ChatGPT com a entrada de texto: Descreva a história da música All Too Well de Taylor Swift.
Outro exemplo são as imagens geradas pelo DALL-E 2 que consegue criar imagens a partir de uma entrada de texto. Abaixo exemplos de gerações da DALL-E 2.
Estes são alguns exemplos de aplicações de inteligência artificial generativa. Elas criam algo após aprender a usar observações de padrões que a priori não existiam.
Machine learning: aprender através de observações
A aprendizagem de máquina, ou machine learning, é uma técnica que consiste em alimentar dados para um algoritmo. Este algoritmo vai observando uma função após encontrar padrões naquele conjunto de dados. Um exemplo é que você pode alimentar uma série de pinturas de Van Gogh, o algoritmo irá gerar uma função capaz de entender o estilo de Van Gogh.
Há diferentes formas de aprendizagem de máquina mas uma delas chama a atenção: a aprendizagem supervisionada.
Imagine que dá várias imagens de um cão de pequeno porte para um algoritmo aprender a reconhecer um cão pequeno juntamente com a classificação “cão pequeno” ou imagens de gatos com a classificação “gato”. Em suma, é dado ao algoritmo a resposta que é pretendida e ele aprende ao observar estes conjuntos.
Outra forma são as aprendizagens não-supervisionadas que deixa para que o modelo consiga aprender sozinho após observar vários dados.
Como uma inteligência artificial generativa funciona?
A inteligência artificial generativa é um exemplo de aprendizagem de máquina. Ela recebe um conjunto de dados e consegue reproduzir após observar e aprender os padrões.
As redes neurais generativas (GANs) são redes neurais criadas com a intenção de gerar coisas novas. Elas funcionam da seguinte forma: há duas redes, uma chamada geradora e uma chamada discriminadora. A geradora tem o objetivo de receber um conjunto de dados e aprender a recriar eles. A discriminadora tem o objetivo de reconhecer o que é real e o que foi criado pela geradora.
Já o ChatGPT recorre a um outro tipo de rede chamada de transformers. As transformers utilizam uma técnica chamada de attention que é capaz de processar textos e prestar atenção em diferentes partes de um texto. A atenção funciona como uma camada que consegue colocar a atenção matematicamente na compreensão de um texto.
Estão de facto a criar coisas que não existem?
Estes modelos de inteligência artificial precisam de observar dados para conseguir aprender. Estes dados são gerados de forma humana, seja através de fotografias, textos ou pinturas. Não criam do zero, são muito boas em encontrar padrões e fazer predições que parecem criadas.
É sempre bom lembrar que por trás de todos estes modelos há um algoritmo que utiliza matemática para conseguir encontrar funções que conseguem modelar algo, seja geração de textos ou de imagens.