Ontologia Gênica: o Dicionário Aurélio das Ciências Biológicas

Texto de autoria de Ana Paula da Silva Wives, Camilla Brückmann de Mattos, Isabelli Seiler de Medeiros Mendes e João Vítor Almeida Petrucci, discentes do Curso de Biotecnologia da UFRGS.

1- Definindo ontologia gênica

Apesar da área da ontologia gênica ser importantíssima dentro da Biologia Molecular e da Bioinformática, pouco se conhece sobre o termo propriamente dito e o que ele compreende. Em resumo, esse nicho envolve o desenvolvimento de ferramentas que utilizam ontologias para a descrição e caracterização de dados genéticos de uma forma estruturada e padronizada. Mas o que quer dizer ontologia? A palavra ontologia refere-se do grego e junta dois termos: ontos, que significa “ente”, e logia, que significa um “discurso lógico”. Dessa forma, ontologia significa algo próximo de “a ciência do ser” ou “as coisas do mundo”. Dentro das Ciências Sociais, é onde se estuda conceitos como existência, ser e realidade.

Neste sentido, quando aplicamos esse conceito nas Ciências Biológicas, ontologia gênica nada mais é do que a estrutura formal que descreve os termos e relações da Biologia Molecular, baseando-se em fundamentos de Bioinformática. Ela pode incluir termos que descrevem genes, funções biológicas, moléculas e tudo que compreende esse nicho da ciência, visando uma linguagem comum que descreve e compartilha informações genéticas de uma maneira simples e padronizada. Portanto, a ontologia gênica não é apenas uma ferramenta técnica, mas uma infraestrutura essencial para a pesquisa biológica moderna, um arcabouço de padrões e estruturas que capacitam descobertas e inovações as quais beneficiam tanto a ciência básica quanto a aplicada. Segundo o próprio site no qual todas estas definições estão dispostas, o “Gene Ontology”, esses fundamentos estão dispostos em três principais categorias, para cada um dos três domínios biológicos: funções moleculares, funções celulares e processos biológicos. Assim, o grande objetivo das ontologias gênicas é unificar dados e definições dentro da biologia.

2- Sobre a plataforma Gene Ontology (GO)

A plataforma Gene Ontology Resource (GO) possibilita ao pesquisador ter acesso à maior fonte de informações disponível a respeito das funções de genes de todas as espécies, bem como dos produtos desses genes. Assim, através dessa plataforma, é possível realizar análises computacionais de experimentos biológicos e genéticos em larga escala.

O GO foi fundado em 1998 a partir de um consórcio de pesquisadores. Na época, eram estudados principalmente os genomas de três organismos modelo — Drosophila melanogaster (mosca da fruta), Mus musculus (camundongo) e Saccharomyces cerevisiae (levedura de cerveja ou de pão). O objetivo central desses pesquisadores era a criação de um esquema de classificação comum para as diversas funções de genes, contribuindo para o melhor entendimento e dispersão do conhecimento científico. A plataforma possui dois recursos principais para manuseio, sendo eles: GO Ontology e GO Annotations.

GO Ontology permite o entendimento de ontologias do domínio biológico a partir da relação de três aspectos: função molecularcomponente celular processo biológico. A função molecular se trata da descrição de atividades a nível molecular, informando a realização dessa ação, mas sem especificar onde, quando ou em que contexto essa ação ocorre. Como exemplo de função molecular, pode-se citar a “atividade da proteína quinase”. Já o componente celular está mais associado à localização de produtos genéticos, como compartimentos e estruturas celulares. Essas localizações podem ser descritas a partir de entidades anatômicas celulares, em que o produto realiza uma função molecular (ex: membrana plasmática), ou através de complexos macromolecularescomo o complexo de clatrina. E, por fim, o processo biológico faz referência aos processos que abrangem várias atividades moleculares em que o gene está envolvido, como reparo de DNA e o transporte transmembrana de glicose.

O outro recurso principal da plataforma é o GO Annotations, como já mencionado. Ele faz a associação de um gene (ou o produto de um gene) a um termo. Esse termo é responsável por descrever a função desse gene desejado, assim, “traduzindo” ele a uma linguagem comum a todos. Dessa forma, a partir do GO Annotations, é possível obter informações a respeito da função molecular de um gene, bem como sua localização na célula e quais processos biológicos ele está envolvido.

Além desses dois recursos, o GO conta com os recursos GO-CAM TOOLS & GUIDE. O primeiro permite a associação de uma GO Annotation a um sistema biológico mais completo. Já o segundo traz ferramentas de curagem, pesquisa, visualização e download de ontologias e anotações, assim como guias relacionados à bioinformática.

3- Acessando a plataforma GO

Ao acessar a plataforma do Gene Ontology (geneontology.org), diversas informações podem ser encontradas na barra superior, as quais são a respeito do próprio site e seus recursos. Logo abaixo, temos uma descrição breve do que a plataforma se propõe - uma ferramenta de modelo computacional de sistemas biológicos - e, em seguida, há a barra de pesquisa por “GO terms” (termos GO) ou “Gene Products” (produtos gênicos), referentes às ações moleculares de produtos gênicos, aos processos biológicos nos quais essas ações ocorrem e às suas localizações celulares.

Abaixo disso, temos outro campo de pesquisa alimentado pela plataforma PANTHER (Protein ANalysis THrough Evolutionary Relationships), que foi projetado para classificar proteínas - e seus genes - com o objetivo de facilitar a análise de alta capacidade. Neste campo, a busca por genes pode ser feita com filtros por função molecular, componente celular ou processo biológico, além da espécie desejada. Ademais, o campo reconhece nomes e símbolos de outras plataformas, como o UniProt, o que facilita na busca.

Após isso, os quatro principais recursos, já mencionados aqui, podem ser acessados individualmente. O GO-CAM, por exemplo, fará a associação do GO Annotation a outro sistema, mas como? Primeiro, ele usará uma GO Annotation padrão, que é um produto gênico associado a um GO term que usa um código de evidência - como evidências experimentais, filogenéticas ou computacionais - e outra de suporte. Com isso, ele terá um produto gênico associado a uma função molecular, processo biológico ou componente celular, obtido através das evidências. Depois, o GO-CAM combina essas informações a um sistema que as une, formando um sistema biológico.

Por exemplo, com anotações separadas de diferentes produtos gênicos associados a funções distintas, quando submetidas ao GO-CAM, pode-se revelar uma via metabólica, em que cada anotação individual foi adicionada a um sistema superior. Com isso, cada anotação serviu como uma peça em um quebra-cabeça maior. Este recurso é interessante quando se procura confirmar uma suspeita de duas ou mais proteínas pertencerem a uma mesma via.

4- Conclusão
De maneira geral, ontologias gênicas são um elemento chave para estudos 
de Biologia Molecular, sendo um tópico muito importante dentro da grande área da Bioinformática. É a partir delas que se padroniza a descrição de termos e relações de genes e proteínas, unificando dados genéticos para facilitar a pesquisa e a inovação em biologia. Com elas, consegue-se informações como a função molecular, o componente celular e o processo biológico associados a um gene/uma proteína. Hoje, basta acessar a plataforma Gene Ontology (GO) e explorar o seu vasto universo de informações para encontrar o que se precisa. Assim, o domínio da plataforma GO mostra-se uma habilidade essencial para quem trabalha com essa área de pesquisa.

Referências:
https://geneontology.org/docs/ontology-documentation/ site do Gene Ontology, acesso em 16 de julho.

https://pantherdb.org/ site do PANTHER. Acessado em 12 de agosto.