Pistas sobre os estágios iniciais da evolução regulatória
Tem sido cada vez mais reconhecido que a evolução dos sistemas regulatórios genético-desenvolvimentais são a base da evolução morfológica e mesmo comportamental dos seres vivos. Nisso estão incluídas as mudanças nos sistema 'cis-trans', ou seja, nas sequências cis-regulatórias (como os 'promotores e 'amplificadores/reforçadores'), nas quais ligam-se proteínas trans-ativas específicas, como os fatores de transcrição, que modulam expressão dos genes ligados as sequẽncias cis.
Recentemente, cientistas ligados ao Instituto Europeu de Bioinformática, do Laboratório Europeu de Biologia Molecular (EMBL-EBI), e da Universidade de Cambridge, divulgaram um estudo conduzido em espécies bem próximas de camundongos, abrindo uma janela para a compreensão dos primeiros passos da evolução destes sistemas de regulação. [Ao lado ilustração de um fator de transcrição modulando a expressão gênica.]

O grupo de cientistas tinha por objetivo caracterizar mecanicamente os tipos de processos microevolutivos que são responsáveis por mudanças na ligação das proteínas que funcionam como fatores de transcrição (FTs). Os pesquisadores encontraram uma quantidade enorme de variação entre as sequências de ligação entre os animais das diferentes espécies de roedores, entretanto, os os padrões de ligação de combinações de fatores de transcrição mostraram-se bem similares nas diferentes linhagens:
"Muitas vezes, você verá uma combinação específica destes fatores de transcrição que atuam em concerto - e foi fascinante para nós vermos o quão importante são essas combinações. Elas são muito mais propensas a serem conservadas ao longo da evolução do que qualquer sequência de DNA as quais podem estar ligadas.", afirmou Paul Flicek.
Os pesquisadores estudaram quatro espécies de camundongos intimamente relacionadas umas com as outras (e duas linhagens de laboratório distintas de uma delas), ou seja, ainda no começo de sua divergência evolutiva. De uma perspectiva evolutiva, os comprimentos relativamente menores dos ramos da filogenia das quatro espécies do gênero Mus analisadas no estudo são, aproximadamente, uma ordem de magnitude menores do que os comprimentos dos ramos que separam o seres humanos e os ratos de seu ancestral comum, do qual divergiram a cerca de 80 milhões de anos atrás.
Portanto, foram os tempos de divergência substancialmente menores, refletidos no comprimento dos ramos da filogenia destas espécies de roedores, que permitiu ao pesquisadores identificarem como as variações genéticas entre as espécies contribuem para as diferenças iniciais interespecíficas nos padrões de ligação a FTs [2].
Foram comparadas as formas com que três fatores de transcrição (HNF4A, CEBPA e FOXA1) distintos ligam-se aos regiões regulatórias do DNA para controlar se os genes a elas associadas estão ativados ou desativados em células do fígado ao longo do genoma de animais das cinco espécies.
"Ao olhar para os camundongos que tão intimamente aparentados entre si, fomos capazes de capturar um instantâneo do que está acontecendo na evolução regulatória", explica Duncan Odom, da Universidade de Cambridge. "Isso é importante porque é muito mais difícil de ver como algo evoluiu quando você não tem uma visão clara do ponto de partida."
Entre as principais diferenças que já haviam sido encontradas em outros estudos em eucariontes, e que foram corroboradas por este, estão o fato de os mamíferos exibirem alterações quantitativas generalizadas nas intensidades de ligação dos TFs ao DNA, mesmo em espécies estreitamente relacionadas, o que de início mostra que as diferenças morfológicas e comportamentais entre as diferentes espécies não são proporcionais a este tipo de diferenças moleculares, pelo menos, no começo do processo de divergência. Embora mutações individuais, as VUNs ('Variações de Único Nucleotídeo) em regiões de ligação, nas sequências de ligação do DNA a FTs (e mesmo próximas a elas), possam ser responsáveis por uma fração modesta das diferenças, outras influências parecem desempenhar um papel mais importante.
[Fonte: Wikicommons; Autor: Kelvinsong ]
Valendo-se desta abordagem comparativa e experimental foi também corroborado que as regiões genômicas, nas quais ligam-se várias proteínas reguladores, mostram alterações coordenadas em seus padrões de ligação entre as diferentes espécies e mesmo durante o desenvolvimento ontogenético de uma mesma espécie [2]. Os cientistas demonstraram que FTs funcionam em conjuntos que são conservados, aparentemente, por garantirem a estabilidade genética e evolutiva.
A principal evidência disso é que estes conjuntos de FTs que ligam-se conjuntamente e, aparentemente, cooperam entre si estabilizando-se mutuamente tendem a desaparecer em concerto. Os autores do artigos testaram esta hipóteses ao nocautearem o gene de um dos FTs componentes destes aglomerados de fatores coligados. Ao investigar os efeitos deste processo de deleção genética, os cientistas descobriram que este procedimento levava a uma concomitante desestabilização sistemática da ligação combinatória dos aglomerados que envolviam o FT geneticamente removido [2].
Para ganharem insights mais amplos, os autores do artigo comparam seus resultados com os padrões de conservação de FT em camundongos com os observados em Drosófilas, outro modelo de pesquisa muito conhecido e estudado.
Ao contrastaram os padrões de ligação individual do FTs, os pesquisadores constaram que haviam muito mais diferenças entre linhagens de camundongos estreitamente relacionadas do que havia entre as linhagens de moscas da fruta distantemente relacionadas, o que sugere uma maior flexibilidade regulatória por parte dos camundongos e, possivelmente, mamíferos de modo geral.
Os resultados deste estudo também deixam claro que a ligação combinatória é mais robusta às variações nas sequências dos motivos nos quais estes fatores ligam-se diretamente do que alguns imaginavam, mostrando também que quanto mais espécies em que uma região de ligação de TF é encontrada, mais forte tende ser a sua ocupação genômica. Portanto, a sequência específica e a região genômica específicas as quais se liga um fator de transcrição parece menos importante e conservada do que a combinação específica de fatores de transcrição.
Segundo os autores, estes resultados permitem concluir que, em resumo, as propriedades bioquímicas e biofísicas da ligação entre os TFs e o DNA que são compartilhadas entre todos os eucariontes são o principal fator que estabelece as muitas características comuns na evolução da ligação a estes fatores entre grupos evolutivamente mais distantes, como são o caso dos roedores e moscas de fruta.
Os cientistas também relataram outros contrastes reveladores na forma como a evolução da ligação do FTs ocorre nos mamíferos e nas moscas:
1) As diferenças dos locais de ligação dos TF, que estariam ligados aos ganhos e perdas qualitativas destes sítios, acumulam entre mamíferos intimamente relacionadas a uma taxa exponencial.
Por exemplo, nos cerca de 6 milhões de anos, tempo que marca a divergência da espécie Mus musculus domesticus (cepa C57BL/6J) e Mus caroli em relação ao seu ancestral comum, estas duas espécies compartilham apenas metade dos sítios de ligação determinados experimentalmente para estes três FTs principais ligados a diferenciação de células do fígado. Em comparação, praticamente, não são observadas diferenças entre as espécies de mosca de frutas Drosophila melanogaster e D. yakuba (no que concerne a ao Fatores de Transcrição) que acreditamos terem divergido há muito mais tempo, um tempo maior até mesmo que a distância evolutiva entre camundongos (Mus) e ratos (Ratus).
2) Enquanto em moscas de frutas as regiões genômicas funcionais mais fortemente ligadas a FTs tendem a estar próximas ao genes-alvo (sendo que esta ligação entre FTs e os sítios próximos aos genes-alvo ocorre em mais espécies de moscas e são mais fortes em intensidade total), nos mamíferos não há uma correspondência clara com estes resultados.
De fato, os locais de ligação dos TFs presentes em todas as cinco espécies (incluindo aí o rato) de roedores não são preferencialmente localizados perto dos genes alvo de TFs conhecidos [2]. Estes resultados geram, porém, uma dúvida:
Caso as muitas semelhanças moleculares na ligação dos TF entre as moscas e os humanos sejam, na verdade, atribuídas às similaridades bioquímicas e biofísicas compartilhadas entre os contatos e interações DNA-proteína, o que teria impulsionado as profundas diferenças na estabilidade na ligação dos TFs entre as espécies?[2]
Estas grandes diferenças qualitativas, em relação ao padrão de ligação e conservação das regiões genômicas ligadas a estes conjuntos de FTs cooperativos, entre mamíferos intimamente aparentados, quando comparadas diferenças menores, quantitativas nos padrões de coligação entre as espécies Drosófila, refletem como a estrutura do genoma e fatores da genética populacional interagem para moldar a evolução dos sistemas regulatórios.
"Os mamíferos têm grande quantidade de DNA amplamente distribuídos que não codifica proteínas, enquanto as moscas de fruta têm relativamente pouco deste tipo. Então fiação regulatória de um camundongo vai ter muito mais espaço de manobra do que a de uma mosca de fruta tem ", diz Flicek. "Isso nos dá uma imagem mais clara do que mais podemos esperar aprender sobre regulação genética dos mamíferos a partir das moscas de fruta." [1]
Os pesquisadores, portanto, defendem que as diferenças estão associadas a diferenças na distribuição e distâncias médias entre os sítios de ligação aos FTs entre os dois grupos de animais. Com os camundongos e mamíferos de modo geral tendo populações bem menores, ciclos geracionais mais longos, genomas maiores e cheios de sucata e, portanto, uma menor eficiência na seleção natural purificadora, o que contrastaria com as maiores populações, menor quantidade de DNA sucata e maior eficiência da seleção natural tipica das moscas de fruta. A melhor explicação para estas observações, desta maneira, envolveriam as diferenças inerentes a estrutura e dinâmica populacional das moscas e dos mamíferos que resultaram em arquiteturas genômicas bastante distintas em cada uma das duas linhagens.
A primeira e mais importante diferença está no fato das populações acasalantes das moscas do gênero Drosophila serem enormes, o que eleva um importante parâmetro populacional que influência diretamente o impacto relativo de certos fatores evolutivos, tamanho efetivo da população (Ne), especificamente a deriva genética e a seleção natural. Neste caso, favorecendo a ação da seleção natural em purgar mesmo alterações genéticas com impactos menores no sucesso reprodutivo dos indivíduos [2]. Enquanto isso, os mamíferos exibem populações acasalantes muito menores, diminuindo o tamanho efetivo da população, Ne, e aumentando o poder da deriva genética aleatória e de outros fatores estocásticos em relação a seleção natural purificadora, o que acaba por permitir a fixação maior de variantes neutras ou mesmo ligeiramente desvantajosas em termos do seu impacto no sucesso reprodutivo dos indivíduos [2].
As moscas-de-fruta têm por volta de 15 mil genes que cobrem 24 milhões de pares de bases de sequências codificantes distribuída por um genoma constituído de 120 milhões de pares de base eucromáticas, sendo que cerca de 80 milhões destas bases não codificantes estão sob restrição seletiva. Já os mamíferos têm cerca de 26.000 genes distribuídos em 45 milhões de pares de base de sequências codificantes distribuídas em um genoma constituído de quase 3 bilhões de bases eucromáticas, com apenas 126 milhões de pares de base sob restrição seletiva. Isso quer dizer que apesar de, em média, cada gene de um mamífero ter, aproximadamente, o mesmo número de bases não codificantes reguladoras sob restrição seletiva que um gene de Drosophila, em mamíferos, estas bases estão distribuídas entre vinte vezes mais DNA eucromático que não estão sob restrição seletiva óbvia. Este resultado é consistente com um modelo de interação molecular em que TFs competiriam com os nucleossomos (proteínas as quais o DNA liga-se alterando seu estado de empacotamento e portanto acessibilidade a transcrição) por ocupação DNA [2].
A explicação para tais resultados foi originalmente proposta em um artigo de Lin e Riggs, publicado em 1975 [citado por 2]. De acordo com esta hipótese, seria necessário um aumento correspondente nas proteínas reguladoras no núcleo de modo que pudessem ocupar locais de ligação aos TFs totalmente funcionais, compensando a diluição deste DNA funcional não codificante em meio ao DNA eucromático evoluindo neutralmente que resultaria em muito mais sítios não funcionais.
Este aumento do número de sítios de ligação de TFs (não-funcionais) poderia explicar, portanto, as duas grandes discrepâncias entre as moscas e mamíferos. Isso ocorreria por causa de dois fatores principais. O primeiro deles está associado ao fato da ligação dos TF dos eucariontes ocorrer ao longo de faixas relativamente estreitas de ocupação (enriquecimento de 10-100 vezes) [2]. Desta maneira, o aumento de 20 vezes no número de potenciais sítios de ligação de TF espúrios não funcionais por gene, em mamíferos, poderia estar mascarando a conexão simples entres função-intensidade facilmente observada em moscas do gênero Drosophila, em parte, complicando as tentativas de associar TFBRs com genes alvo de regulação.
O segundo fator seria que, na presença de 20 vezes mais potenciais locais de ligação de TFs, seria mais fácil a eventual migração dos sítios funcionais para locais diferentes (ocupando um sítio originalmente espúrio) nas proximidades, bem como o rápido ganho e perda de sítios TFs específicos observados em mamíferos estreitamente relacionadas. Isso poderia ocorrer, simplesmente, por que eventuais mutações que interferissem com ligação de FTs poderiam ser compensadas por mutações que ativassem qualquer um dos sítios espúrios que, por meio, da coligação de fatores transcrição voltariam a estabilizar de maneira cooperativa os demais fatores [2]. Na falta destes sítios extras, onde os FTs se ligariam, por mero acaso, uma mutação que interferisse com função de um dos FTs só poderia ser compensada por uma outra mutação no mesmo sítio, o que seria probabilisticamente menos esperado e, portanto, levando a seleção negativa desta variante por meio da menor chance de sobrevivência e reprodução dos indivíduos que a carregassem, principalmente, por que nas grandes populações características das moscas de fruta a seleção natural e consideravelmente mais eficiente.
A maior tolerância mutacional dos genomas dos mamíferos e maior volume de DNA genômico, apesar de um número parecido de genes e sequências regulatórias em roedores e drosófilas sob ação da seleção purificadora, resultaria em maior 'mobilidade' dos sítios de ligação por causa do maior número potencial de sítios espúrios e, portanto, não funcionais:
Em suma, nossos resultados confirmam que as diferenças quantitativas sutis na de ligação TF entre as espécies de mamíferos e outras espécies (como moscas) é muito provavelmente o resultado das biofísica da ligação DNA-proteína que tem sido há muito investigados. Por outro lado, a acumulação de ganhos e perdas qualitativas de TF ligação entre as espécies (mais lentos em moscas e mais rápidas em mamíferos) parece refletir a estrutura de seus respectivos genomas, conforme determinado pela genética da população. [2]
Por fim, os pesquisadores acreditam que este estudo pode ajudar os cientistas a compreenderem melhor a regulação dos genes humanos e como diferenças nestes aspecto de uma pessoa para a outra podem explicar como e porque certas doença afligem algumas pessoas, tendo efeitos distintos em outras [1].
---------------------------------------------------------------------------------
Referência:
"Wired for change” EMBL-EBI News.
Stefflova K, Thybert D, Wilson MD, Streeter I, Aleksic J, Karagianni P, Brazma A, Adams DJ, Talianidis I, Marioni JC, Flicek P, & Odom DT (2013). Cooperativity and rapid evolution of cobound transcription factors in closely related mammals. Cell, 154 (3), 530-40 PMID: 23911320
Phillips, T. & Hoopes, L. (2008) Transcription factors and transcriptional control in eukaryotic cells. Nature Education 1(1) [Link]