Decodificando os novos resultados do ENCODE
O projeto ENCODE (Encyclopedia Of DNA Elements), um grande consórcio de instituições de pesquisa envolvendo centenas de pesquisadores, liberou novos dados [1] extremamente interessantes sobre o assunto que indicariam que pelo menos 80% do nosso genoma seria 'funcional' através de um artigo publicado hoje na revista Nature. Segue uma tradução do abstract:
“O genoma humano codifica uma planta da vida, mas a função da grande maioria dos seus quase três bilhões de bases é desconhecida. O projeto da Enciclopédia de Elementos de DNA (ENCODE) tem sistematicamente mapeado regiões de transcrição, associação a fatores de transcrição, estrutura da cromatina e modificação de histonas. Estes dados permitiram atribuir funções bioquímicas a 80% do genoma, em especial regiões fora das bem estudadas de codificação de proteínas. Muitos elementos reguladores candidatos foram descobertos estão fisicamente associados uns aos outras e com genes expressos, fornecendo novas perspectivas sobre os mecanismos de regulação dos genes. Os elementos identificados recentemente também mostram uma correspondência estatística de variantes de sequência associadas à doenças humanas e podem, assim, guiar a interpretação desta variação. No geral, o projeto fornece novas pistas sobre a organização e regulação de nossos genes e do genoma, e é um recurso expansivo de anotações funcionais para a pesquisa biomédica”*.[Nature 489, 57–74; 06 September 2012; doi:10.1038/nature11247]
Porém, a forma que o os pesquisadores do ENCODE definem 'função' diverge bastante da maneira como ela é normalmente compreendida pela maioria dos biólogos que investigam a evolução fenotípica e até mesmo a evolução molecular que geralmente preferem deixar este termo para algum tipo de sequência genômica que produza algum tipo de modificação que influencie na aptidão dos organismos, tendo um papel mais específico ao nível celular, tecidual, organísmico e ecológico por exemplo. Contudo, no projeto ENCODE por motivos técnicos e por causa do objetivos da empreitada qualquer elemento do DNA que seja transcrito em um RNA ou que seja alvo de ligação de proteínas, especialmente se esta ligação variar entre tipos celulares é considerado 'funcional'. Isto é, para o projeto ENCODE qualquer nível de atividade bioquímica ao nível do DNA é considerada 'função', uma vez que são este tipo coisas é que os métodos e técnicas empregadas estão a vasculhar. Esta definição que não pode ser considerada errada, mesmo por que esta atividade básica também pode ser considerada fenotípica em um nível mais básico, infelizmente acabou por causar muitas confusões, principalmente do ponto de vista da evolução molecular e da natureza de boa parte do nosso genoma.
De fato, os estudos do ENCODE revelam que até o momento, juntamente com os cerca de 1,5% do genoma, apenas 8,5% do genoma corresponde a sequências que parecem ter realmente uma relevância funcional em sentido mais restrito e significativo para a evolução, uma vez que além de genes tradicionais codificadores de proteínas, estão incluídas nesta estimativa mais modesta sequências altamente conservadas - isto é, que variam muito pouco entre os organismos e entre os indivíduos - e que são realmente alvos de ligação de proteínas regulatórias, devendo portanto estar diretamente envolvidas na regulação gênica. Como a cobertura de tipos celulares é incompleta, os pesquisadores estimam que estes número de cerca de 8,5% deva representar cerca de metade das porções genômicas realmente funcionais, em um sentido mais relevante, e que devem estar associadas a características funcionais específicas dos organismos.
Mas existem outros problemas sobre o tipo de coisas que estão sendo concluídas a partir desses novos dados do ENCODE. Uma delas é que sabemos que boa parte do chamado DNA sucata corresponde a sequências de elementos genéticos móveis defeituosos, isto é, que não funcionam direito e não conseguem saltar ou se replicar de forma independente e adequada, mas que eventualmente podem ser transcritas parcialmente. Portanto, essas e outras sequências acabam por entrar na conta das estimativas mais exageradas de funcionalidade e podem na realidade até mesmo mesmas terem um impacto indireto na aptidão dos organismos que as portam, já que podem atrapalhar os processos de transcrição de certos genes. E aí entramos em outra questão interessante, pois existem evidências que o silenciamento por modificações estruturais do DNA, como a metilação de citosinas e condensação de cromatina, dois critérios utilizados para diagnosticar funcionalidade pelo ENCODE, podem ter evoluído como forma de controle desses parasitas genômicos, como vírus [2, 3], o que tornaria boa parte destas estimativas um mero artefato de definição, consequência indiretas de respostas evolutivas muito gerais de controle de danos. Muitos dos artigos apontam as conclusões do ENCODE como revelando segredos inesperados do genoma humano, mas na verdade as coisas não são bem assim e o que está sendo revelado é a enorme complexidade da questão e a intrincamento das estruturas biológicas e a dinâmica de processos evolutivos que as moldaram em diversos níveis.
Na página principal de Ewan Birney, um dos responsáveis pelo projeto e que comentou extensamente sobre estes resultados, está uma visão bem mais nuançada e equilibrada desses achados que mostra os problemas de se definir função dentro do projeto ENCODE e a natureza metodológica operacional deste procedimento. No blog de Larry Moran existe uma discussão na sessão de comentários sobre o assunto, enfocando o artigo de Ed Young em seu blog no site d a revista Discovery “Not Rocket Science” explicando o projeto que segundo muitos dos comentaristas exagerou o impacto dos achados e não deu a devida a atenção ao fato de coisas muito diferentes estarem sendo comparadas e quantificadas, além de ainda estarmos muito longe de saber a significância dos resultados particulares de modo que possamos discutir sua relevância para evolução genômica e de nossa espécie de modo geral.
Um excelente remédio para isso é o texto do biólogo evolutivo especialista em genômica T. Ryan Gregory que criou o chamado 'teste da cebola' que através de um simples exemplo, usando a comparação dos tamanhos genômicos de plantas da família das cebolas (que variam entre 7 bilhões a 31, 6 bilhões de pares de bases, comparados as parcas 3 bilhões do genoma humano), ilustra bem por que as estimativas do cientistas ligados ao ENCODE, e a definição de 'função' adotada por eles, não poder ser diretamente transferidas para a biologia evolutivas; mesmo por que creio que poucos cientistas que estudam os elementos genéticos móveis - como transposons e retroposons, ERVs, pseudogenes, sequências repetitivas das mais variadas ['What's in Your Genome?' e veja também o nosso artigo, “Sobre sucata, lixo, DNAs egoístas, comensais e simbiontes:”] - realmente acreditavam que mais de 90% do genoma fosse realmente estático (inativo bioquimicamente) ou mesmo completamente irrelevante do ponto de vista evolutivo, uma vez que a dinâmica evolutiva desses trechos de DNA egoístas ou simbiontes podem interferir com outras funções do organismo- mesmo que eles mesmos não tenham um papel funcional, em sentido estrito, bem definido e adaptativo no organismos – o que, por sinal, ainda assim tornara estas sequências relevante s de um ponto de vista biomédico .
As diferenças de objetivos e as peculiaridades metodológicas por trás do projeto ENCODE justificam esta definição mais frouxa e genérica, uma que se quer anotar minuciosamente o que está acontecendo com as diversas regiões do genoma e não sabemos previamente o que pode ou não ser realmente essencial. Porém, o excesso de alarde sobre o suposto significado dessas descobertas e a falta de contextualização sobre exatamente o que os cientistas envolvidos estão investigando e anotando, com sua ênfase em 'atividade bioquímica' amplo senso pode trazer muitas confusões que devem ser evitadas, caso queiramos realmente compreender a importância do projeto e o que ele pode e, principalmente, o que ele não pode nos dizer neste estado atual de desenvolvimento.
______________________________________
*”The human genome encodes the blueprint of life, but the function of the vast majority of its nearly three billion bases is unknown. The Encyclopedia of DNA Elements (ENCODE) project has systematically mapped regions of transcription, transcription factor association, chromatin structure and histone modification. These data enabled us to assign biochemical functions for 80% of the genome, in particular outside of the well-studied protein-coding regions. Many discovered candidate regulatory elements are physically associated with one another and with expressed genes, providing new insights into the mechanisms of gene regulation. The newly identified elements also show a statistical correspondence to sequence variants linked to human disease, and can thereby guide interpretation of this variation. Overall, the project provides new insights into the organization and regulation of our genes and genome, and is an expansive resource of functional annotations for biomedical research.” [Nature 489, 57–74; 06 September 2012; doi:10.1038/nature11247]
__________________________________________________
Udpdate (06/09/2012 - 17:30) Valem muito a pena os posts e comentários de T. Ryan Gregory ("The ENCODE media hype machine") e Jonathan Eisen ("Michael Eisen’s take on ENCODE — there’s no junk?"), ambos no blog de Gregory, sobre a hype em cima dos artigos com as novidades do ENCODE (Até a geralmente comedida e ótima jornalista científica Elizabeth Pennisi embarcou na Hype com um artigo/comentário intitulado "ENCODE Project Writes Eulogy for Junk DNA" na revista Science) que estão sendo divulgadas como se demolissem a ideia de DNA sucata, mas baseando-se em definições e resultados que simplesmente não tem muito a ver com o que os especialistas afirmam sobre esta questão. De novo, não me lembro de nenhum desses cientistas que investigam as regiões não codificantes e repetitivas do DNA dizendo que grande parte dele é um marasmo sem graça, onde não acontece nada de interessante e nas quais não ocorre qualquer atividade bioquímica. Isso é um simples espantalho.
_______________________________________
Referências:
The ENCODE Project Consortium [Afiliations]An integrated encyclopedia of DNA elements in the human genome Nature 489, 57–74 (06 September 2012) doi:10.1038/nature11247 [Link]
Riddihough G, Pennisi E. The evolution of epigenetics. Science. 2001 Aug 10;293(5532):1063. PubMed PMID: 11498569 [Link].
Matzke MA, Mette MF, Aufsatz W, et al. 1999. Host defenses to parasitic sequences and the evolution of epigenetic control mechanisms. Genetica 107: 271–287.