Robôs rápidos e eficientes a executar qualquer tipo de trabalho? Sim, é possível com o novo modelo do MIT
Investigadores americanos prometem inaugurar um novo ciclo na robótica, com modelos capazes de treinar os robôs a realizar rapidamente uma série de tarefas diferentes.
Os robôs das gerações mais avançadas já fazem quase tudo. Patrulham as ruas, constroem casas, cozinham e servem à mesa de cafés e restaurantes, atendem os pedidos de hóspedes nos quartos dos hotéis e até executam cirurgias comandadas por humanos a milhares de quilómetros de distância. Mas quase tudo não é tudo. Executar alternadamente diferentes tarefas é algo que ainda não conseguiram aprender.
Há uma boa razão para isso. Os robôs são geralmente programados para desempenhar trabalhos específicos em ambientes controlados, o que por só si, já requer uma enorme quantidade de dados recolhidos. Diante de um novo desafio ou de um lugar desconhecido, a máquina autómata depara-se com um obstáculo que o impede de se adaptar para poder ultrapassá-lo.
Um marco na robótica
Há, no entanto, boas perspetivas que levam os especialistas a acreditar ser possível inaugurar um novo ciclo na robótica, com máquinas polivalentes capazes de cumprir os requisitos mais exigentes das sociedades modernas: o multitasking. Essa é, pelo menos, a ambição dos investigadores do MIT - Instituto de Tecnologia de Massachusetts, nos Estados Unidos.
Um novo método, que agrega diversos dados de diferentes fontes, é o trunfo mais recente que está a permitir treinar os robôs a realizar uma série de distintas tarefas rapidamente.
A inovadora técnica, denominada Transformadores Pré-treinados Heterogéneos (HPT, sigla em inglês para Heterogeneous Pretrained Transformers), combina dados e recursos, como simulações, interações com outros robôs ou vários tipos de sensores, como, por exemplo, de visão, de movimento, de temperatura ou de navegação.
Essa informação é depois processada numa linguagem entendida pelos robôs e que lhes permite aprender mais rapidamente novas e distintas tarefas. A diversidade de bases de dados usada nesta abordagem reduz significativamente a quantidade de referências específicas necessárias para ensinar um robô. Nos testes, a equipa de engenheiros robóticos do MIT verificou que o desempenho melhorou em 20% comparado com os métodos convencionais.
Acelerar a aprendizagem
A abordagem utilizada pelos investigadores recorre a um sistema de aprendizagem automática denominado de “transformer”, o mesmo, aliás, usado também em grandes modelos de linguagem, como o GPT-4. O processo harmoniza diferentes formatos de dados num sistema unificado, que vai permitir ao modelo extrair informação de diversas fontes, ajudando os robôs a ampliar as suas valências.
A técnica HPT, usada nos ensaios, incluiu desde logo um vasto conjunto de vídeos com demonstrações humanas e ações simuladas por robôs. O treino implicou ainda recorrer a mais de 200 mil ações de robôs, desempenhando funções em diferentes ambientes e domínios.
Para tornar o modelo mais eficiente, foi necessário compatibilizar os dados visuais e propriocetivos (a sensação ou sensibilidade do robô sobre o seu próprio movimento, equilíbrio ou peso do corpo).
A informação foi, numa fase posterior, combinada numa estrutura de dados unificada numa chave eletrónica (ou tokens). O modelo HTP processa depois esses mecanismos digitais, facilitando a execução de tarefas complexas por parte dos robôs.
O cérebro robótico universal
Com esta abordagem, os investigadores asseguram que o utilizador terá apenas de fornecer os dados básicos do seu robô e a tarefa que desejam ver executada. O modelo irá então transferir o seu vasto leque de conhecimentos pré-aprendidos para que o robô desempenhe com sucesso a nova tarefa.
Os testes demonstraram a eficácia do modelo, mas a equipa do MIT está convencida de que a sua aplicabilidade poderá evoluir bastante nos anos vindouros. A expectativa dos investigadores é que seja possível desenvolver um cérebro robótico universal que possa ser descarregado e utilizado em qualquer robô sem a necessidade de o sujeitar a um novo treino.
O intuito, a longo prazo, é que, tal como aconteceu com os modelos de linguagem, a expansão deste método possibilite um grande avanço na programação e flexibilidade da robótica. Já estivemos mais longe dos cenários futuristas que colocam os humanoides nas nossas cozinhas, nos jardins ou nas garagens sempre fiéis e prontos a obedecer a qualquer tipo de comando.