Mais de 160 mil novos vírus descobertos pela IA: o que isto significa para a ciência?
A inteligência artificial consegue a maior descoberta de novas espécies de vírus, lançando luz sobre a virosfera oculta que vive em todos os cantos do planeta.
Foram descobertas 161.979 novas espécies de vírus RNA (vírus que usam ácido ribonucleico (RNA) como material genético, ou que requerem RNA no seu processo de replicação) graças a uma ferramenta de aprendizagem de máquina.
O estudo, publicado na Cell e realizado por uma equipa internacional de investigadores, é o maior trabalho de descoberta de espécies de vírus já publicado. Segundo os autores, isto melhorará muito a caracterização da vida na Terra e poderá ajudar a identificar muitos milhões de vírus a mais não identificados.
O autor principal, Professor Edwards Holmes, da Faculdade de Medicina e Saúde da Universidade de Sydney, disse: “Foi-nos oferecida uma janela para uma parte da vida na Terra que de outra forma estaria oculta, revelando uma biodiversidade extraordinária”.
“Este é o maior número de novas espécies de vírus descobertas num único estudo, expandindo enormemente o nosso conhecimento sobre os vírus que vivem entre nós”, disse Holmes. “Descobrir tantos vírus novos de uma só vez é alucinante e apenas arranha a superfície, abrindo um mundo de descobertas. Há outros milhões para descobrir, e podemos aplicar esta mesma abordagem à identificação de bactérias e parasitas”.
Vírus em ambientes múltiplos e variáveis no planeta Terra
Embora os vírus RNA estejam frequentemente associados a doenças humanas, também são encontrados em ambientes extremos em todo o mundo e podem até desempenhar papéis importantes nos ecossistemas globais. Neste estudo foram encontrados a viver na atmosfera, em fontes termais e em fontes hidrotermais.
“O facto de ambientes extremos albergarem tantos tipos de vírus é apenas mais um exemplo da sua extraordinária diversidade e tenacidade em viver nos ambientes mais hostis, o que poderá dar-nos pistas sobre como surgiram os vírus e outras formas de vida elementares.”
Como funcionou a ferramenta de IA para identificar novos vírus
Os investigadores criaram um algoritmo de aprendizagem profunda, chamado LucaProt, para computar grandes quantidades de dados de sequência genética, incluindo longos genomas de vírus de até 47.250 nucleotídeos e informações genómicas complexas para descobrir mais de 160.000 vírus.
“A grande maioria destes vírus já tinha sido sequenciada e aparecia em bases de dados públicas, mas eram tão divergentes que ninguém sabia o que eram”, explicou Holmes. “Eles constituíram o que muitas vezes é chamado de ‘matéria escura’ das sequências. “O nosso método de IA foi capaz de organizar e classificar todas estas informações díspares, lançando luz sobre o significado desta matéria escura pela primeira vez.”
A ferramenta de IA foi treinada para calcular a matéria escura e identificar vírus com base nas sequências e estruturas secundárias da proteína que todos os vírus RNA usam para se replicarem. Desta forma, a descoberta de vírus poderia ser consideravelmente acelerada, algo que demoraria muito se fossem utilizados métodos tradicionais.
O professor Mang Shi, coautor do estudo, disse: “Anteriormente, dependíamos de procedimentos tediosos de bioinformática para descobrir vírus, o que limitava a diversidade que poderíamos explorar. Agora temos um modelo baseado em IA muito mais eficaz, que oferece sensibilidade e especificidade excecionais, ao mesmo tempo que nos permite aprofundar a diversidade viral. “Planeamos aplicar este modelo a diversas aplicações.”
O professor Holmes acrescentou: “O próximo passo natural é treinar o nosso método para encontrar ainda mais desta incrível diversidade, e quem sabe que surpresas adicionais aguardam por nós.”
Referência da notícia:
Hou, Xin et al. Using artificial intelligence to document the hidden RNA virosphere. Cell. DOI: 10.1016/j.cell.2024.09.027