Mudanças regulatórias e a evolução das mãos
A partir da década de 70, principalmente após a publicação do artigo seminal de Allan Wilson e Mary-Claire King, intitulado “Evolution at two levels in humans and Chimpazees”*, começou a ficar claro que as maiores e mais relevantes diferenças genéticas entre seres humanos e os demais grandes primatas, talvez, não devessem ser encontradas nas regiões codificadoras dos genes, uma vez que apenas uma fração muito pequena delas difere apreciavelmente entre chimpanzés e seres humanos. Desde então, com o avanço das técnicas de sequenciamento de comparação de DNA, esta perspectiva passou a ser abraçada por mais e mais cientistas.
Estas diferenças, suspeitavam eles, deveriam encontrar-se muito mais nas porções e elementos regulatórios associados aos genes do que nas sequências codificantes, pois é através da regulação gênica que as diferentes células e tecidos de um organismo, originadas de um único genoma presente no zigoto, assumem suas identidades e por meio da qual ocorrem os processos morfogenéticos, associados a proliferação, apoptose, deformações e interações teciduais em organismos multicelulares em desenvolvimento. São estes processos e eventos celulares, portanto, que definem nossa morfologia, fisiologia e comportamento a medida que o organismos em desenvolvimento interage com o ambiente em diversos níveis. Por exemplo, as habilidades gestuais e de manipulação de objetos - que foram importantíssimas para nossa evolução e nos diferenciam dos demais primatas não-humanos – dependem de mudanças nas proporções dos membros e do seu controle neural. Alterações estas que certamente envolveram mutações em elementos genéticos regulatórios como os que estamos nos referindo, responsáveis pelo controle processos desenvolvimentais bem específicos. Desta maneira, compreender as bases genéticas e as vias desenvolvimentais pelas quais estas mudanças ocorreram é crucial caso queiramos compreender o que nos tornou humanos.
Por causa disso, vários pesquisadores têm desenvolvido métodos e estratégias que permitem vasculhar os níveis de expressão dos produtos gênicos, bem como a atividade e as características das porções regulatórias do genoma, particularmente, as associadas aos chamados elementos cis-regulatórios [sobre os quais falamos bastante em outas ocasiões; veja por exempplo, "É a evolução genética previsível? Parte I”, “É a evolução genética previsível? Parte II ou Além da genética parte I”, “Evolução paralela em peixes esgana-gatas revelada por novo estudo genômico”, “Superexpressão do gene 13Hoxd: Mais pistas sobre a transição entre peixes e tetrápodes:”, “É a evolução genética previsível? Parte II ou Além da genética parte I”], como as sequências dos elementos 'promotores' e 'reforçadores' ('enhancers'), nas quais podem ligar-se proteínas conhecidas como fatores de transcrição que modulam a expressão dos produtos gênicos, fazendo com que certos RNAs (mensageiros e regulatórios) sejam mais ou menos expressos em resposta a um dado estímulo ou mesmo sejam produzidos ou não em um tecido ou fase do desenvolvimento específica.
Estes esforços têm se intensificado nas últimas décadas, especialmente após a revolução genômica, com muitos grupos de cientistas tentando mapear modificações nestas sequências ao longo de todo o genoma humano, não apenas concentrando-se em alguns poucos genes de maneira isolada. Esta estratégia, caso seja seguida de maneira comparativa - ou seja, com o mapeamento em paralelo da atividade de sequências equivalente nos genomas de outros organismos relacionados - nos possibilita identificar várias regiões e elementos candidatos que poderiam responder pelas diferenças entre os seres humanos e dos demais primatas.
Agora, um estudo bem recente, publicado na revista Cell [2] em julho deste ano, nos trouxe alguns vislumbres das alterações genéticas que podem estar envolvidas com a diferenciação dos membros em nossa linhagem.
Em um ampla análise, a equipe de cientistas procurou identificar atividade em sequências regulatórias nos tecidos dos membros em desenvolvimento de embriões humanos, comparando-a com o tipo de atividade que ocorre nos promotores e reforçadores nos membros embrionários em desenvolvimento de outras duas espécies, o macaco rhesus e o camundongo, em períodos e estágios de desenvolvimento equivalentes.
"Nós agora temos uma lista de peças que podem ser responsáveis por estas mudanças biológicas", disse James P. Noonan, professor associado de genética, investigador do Instituto Kavli e autor sênior do estudo [1].
Em estudos anteriores já haviam sido comparadas certas regiões não-codificantes, mas funcionalmente relevantes, do genoma humano e de outras espécies de primatas afim de identificar alterações de sequências de DNA que pudessem ter ocorrido especificamente durante a evolução da linhagem humana. Noonan e seus colegas haviam empregado esta abordagem em 2008, conseguindo identificar uma sequência regulatória de um gene que mostrava atividade humano-específica no embrião durante o desenvolvimento dos membros. Esta sequência estaria associada com com a evolução do polegar humano [3]. Porém, estes estudos não deixam claro quantos elementos deste tipo existem no genoma humano exibindo este tipo de padrão de ativação espécie específico.
O novo estudo, bem mais abrangente que o anterior, valeu-se de vários métodos de análise estatística para dados comparativos complexos e mostrou que certas regiões, características de promotores e reforçadores, parecem particularmente mais ativas nos primórdios embrionários dos membros em seres humanos [1].
Mas como os pesquisadores conseguiram identificar atividade diferencial nestas sequências regulatórias que são indicativas de ganhos na atividade regulatória nos tecidos embrionários em questão?
Este panorama amplo da evolução cis-regulatória ao longo de todo o genoma em tecidos embrionários humanos foi obtido por meio de uma estratégia indireta. A questão foi abordada através da análise comparativa de um tipo de modificação 'epigenética' (isto é, que ocorrem 'sobre o genoma', o que significa que envolvem modificações no padrão de rotulação química dos genes ou, no caso, de proteínas associadas aos genes) particular nos tecidos dos membros em vários estágios de desenvolvimento em embriões de seres humanos, macacos rhesus (Macaca mulatta) e camundongos (Mus musculus) [2].
Os membros são estruturas bastante apropriadas para este tipo de estudo, pois sua homologia não é ambígua em todas as três espécies, além do seu desenvolvimento ter sido alvo de muitos estudos em vários sistemas modelo. Além disso, os membros, especialmente as mãos, apresentam nas fases do desenvolvimento examinadas o aparecimento dos traços morfológicos especificamente humanos que interessam tanto aos pesquisadores.
O que acontece é que genomas de organismos eucariontes são bastante organizado, com o DNA encontrando-se agrupado em estruturas chamadas de cromossomos que são formados por cromatina, resultado da interação do DNA com uma série de proteínas, entre as quais estão as histonas, nas quais o DNA enrola-se. Ao enovelar-se em torno delas, o DNA forma os chamados nucleossomos que por sua vez enovelam-se uns aos outros dando origem aos solenoides que por fim enovelam-se dando origem aos cromossomos que adquirem seu maior estado de compactação e estruturação durante a metáfase na divisão celular. Porém, quando as células deixam a mitose e os cromossomos desenrolam-se, algumas porções permanecem um pouco mais condensadas, dando origem a áreas coradas de maneira mais escura, conhecidas como heterocromatina, enquanto outras áreas ficam menos condensadas, dando origem a porções que quando coradas apresentam-se mais claras, a chamada eucromatina [4]. O fato crucial é que estes padrões de condensação da cromatina estão intimamente associados com os padrões de expressão gênica.

Assim, proteínas como as histonas, como estão fortemente associadas com o 'empacotamento' do DNA, podem afetar diretamente a acessibilidade das sequências regulatórias do DNA, como promotores e reforçadores, aos fatores de transcrição e a própria enzima RNA transcriptase, responsável pela transcrição dos genes e, portanto, por sua expressão. Isso é possível por que o nível de condensação da cromatina é controlado, entre outras coisas, por modificações pós-traducionais - ou seja, que ocorrem após a proteína ter sido sintetizada e atingido seu estado de enovelamento nativo. Estas modificações químicas bem específicas em alguns dos resíduos de aminoácidos das histonas, tais como a metilação e acetilação, parecem ter um papel especial na ativação e no silenciamento dos genes presentes naquelas porções de DNA [4, 5, 6].
Alguns pesquisadores têm chamado isso de “código histônico” (em analogia superficial ao 'código genético') e desvendá-lo seria um passo fundamental para compreendermos como é controlada a regulação da transcrição.
No diagrama acima a direita é possível ver a condensação da cromatina. Analisando-o da direita para são mostrados os estágios pelos quais um longo filamento de DNA (ácido desoxirribonucleico, na extrema direita) ao ser complexado com várias proteínas formando a cromatina, e é, então, enrolada e compactada para formar um cromossomo. As etapas intermediárias incluem núcleos de histonas que formam um "colar de contas” de forma. Outras proteínas servem como andaime e ajudam a enrolar a fibra (centro-esquerda). Este processo de compactação é necessário para que as cadeias de DNA, com cerca de 2 metros de comprimento, caibam no interior do núcleo das células que tem menos de 0,1 milímetros de diâmetro [4].

Na figura acima (instituto RIKEN) podemos observar o processo de ativação/desativação dos genes em virtude de mudanças estruturais da cromatina. Por exemplo, quando um grupo acetil (Ac) é transferido para um resíduos específico de uma das histonas, através de uma enzima específica, a estrutura da cromatina naquela região afrouxa-se, o que permite que o gene seja ligado, como pode ser visto na à esquerda da figura. Em contraste, a transferência de um grupo metil (Me) para outro resíduo específico de aminoácido de uma outra histona, por uma outra enzima específica, provoca uma maior condensação da cromatina ('heterocromatinização'), resultando no silenciamento (desligamento) do gene, como podemos ver à direita na figura [5]. Caso estas modificações ocorram em regiões onde existem sequências reforçadoras, ao invés do simples desligamento e ativação dos genes, podemos observar mudanças mais sutis, como as que envolvem os níveis de expressão dos produtos gênicos [5, 6, 7, 8]. Abaixo são mostradas algumas das várias modificações nas histonas que estão ligadas com o estado de condensação da cromatina e acessibilidade gênica [retirado de Bannister, Kouzarides (2011); referência 9].

Para investigar o papel destes processos de modificação das histonas na regulação gênica, na diferenciação celular e no desenvolvimento como um todo, os cientistas têm empregado uma combinação de métodos, como imunoprecipitação de cromatina (CHIP-seq) e medidas de expressão por meio de métodos de identificação e quantificação dos transcritos totais de RNA (RNA-seq), como forma de identificarem as correlações entre a modificação das histonas e a expressão gênica [2, 7, 8].
O chamado RNA-Seq emprega as novas tecnologias de sequenciamento de alta performance para fornecer um perfil dos transcritos totais das células eucariontes, permitindo uma medida muito mais exata dos níveis de transcritos e de suas isoformas do o permitido por outros métodos [10]. Na figura a direita podemos ver uma ilustração geral de como funciona esta técnica.
O processo de RNA-seq envolve inicialmente a conversão de longass sequências de RNAs em uma biblioteca de fragmentos de cDNA (DNAs complementares derivados dos RNAs) por meio da fragmentação dos RNAs ou dos DNAs. Posteriormente são adicionadas pequenas sequências, conhecidas como adaptadores de sequenciamento (em azul), a cada fragmento de cDNA, com a obtenção de uma sequência curta derivada de cada um dos cDNAs através de métodos de sequenciamento de alto performance. As sequências lidas resultantes são, então, alinhadas com o genoma ou transcriptoma de referência e a partir daí classificadas em três tipos: 1) leituras exônicas; 2) leituras de junções e; 3) leituras de caudas terminais de poli (A). É através destes três tipos de leituras de sequências que um perfil de expressão dos transcritos, com resolução ao nível das bases individuais, é gerado para cada gene [10].
Já o ChIP-seq (sequenciamento por imunoprecipitação da cromatina) é uma plataforma de análise molecular que permite o sequenciamento de fragmentos de DNA genômicos que são co-precipitados por meio de anticorpos específicos, com alguma proteína que liga-se ao DNA que está sendo investigada, como, por exemplo, uma histona modificada pós-traducionalmente, mas também pode ser feito para outras proteínas como fatores de transcrição (como o p53 e NFkB), bem como enzimas modificadoras de cromatina (como a P300, que seriam deacetilases de histonas), além dos componentes da maquinaria de transcrição basal, como a própria RNA polimerase II.
O princípio por trás desta técnica é simples e depende do fato dos complexos formados por sequências DNA e proteínas específicas, como as histonas e fatores de transcrição, poderem sofrer ligações cruzadas (crosslinking) por meio da exposição a certas soluções químicas, como o formaldeído, de modo que possam ser coprecipitadas ao utilizarmo-nos um anticorpo específico para proteína ligada a sequência de DNA que, em virtude da ligação cruzada com o DNA, trará também a sequência de interesse quando o lisado celular for devidamente centrifugado Em princípio esta abordam permite identificar todos os segmentos de DNA genômicos associados fisicamente com uma proteína de ligação ao DNA específica, já que apenas o DNA que será imunoprecipitado conjuntamente com a proteína é sequenciado [11]. [A figura ao lado traduzida de uma adaptação do diagrama de 'Células Animais' de LadyOfHats, como informações obtidas a partir dos dados da Illumina, bem como de artigos técnicos sobre CHIP e imunoprecipitação, pelo autor: Jkwchui; Fonte: Wikicommons]
A escassez de material embrionário humano e de macacos rhesus, entretanto, obrigou os cientistas limitarem-se a um único marcador*, altamente sensível da atividade de promotores e reforçadores.
O que os pesquisadores fizeram foi usar uma dessas modificação específica a acetilação de um resíduo de aminoácido específico (lisina 27) da histona 3 (H3K27ac), como marcador de ganho de atividade de regiões cis-regulatórias.
Estudos anteriores já haviam estabelecido que os perfil de CHIP-seq da H3K27ac conseguia identificar promotores e reforçadores ativos em tecidos embrionários e de adultos, podendo esta técnica ser empregada de maneira eficaz, mesmo com pequenas quantidades de material biológico. Somando-se a isso, já havia sido estabelecido que o nível de marcação de H3K27ac nos promotores e reforçadores correlaciona-se com o nível de expressão da atividade de elementos regulatórios de da expressão gênica, linhagens específicos, ao serem identificados aumentos de atividade da H3K27ac específicos na linhagem humana [1, 2].
Assim, com base no aumento H3K27ac, os pesquisadores descobriram que 13% dos promotores e 11% de reforçadores parecem ter tornado-se ativos, em tecidos embrionários dos membros, na linhagem humana desde a divergência entre os ancestrais comuns dos seres humanos e dos ancestrais dos macacos rhesus. De acordo com os cientistas autores do artigo, estes ganhos de atividade, em grande medida, teriam originado-se por meio da modificação das atividades dos promotores e reforçadores dos próprios tecidos embrionários de nossos ancestrais que já eram ativos nos tecidos dos membros ou através da cooptação de promotores e reforçadores ativos em outros tecidos de nossos ancestrais e que passaram a estar ativos nos tecidos dos membros em desenvolvimento.
As prováveis causas genéticas particulares por trás destas mudanças parecem, entretanto, serem bem variadas, com estas sequências, provavelmente, tendo ganho nova atividade desde a divergência da linhagem que deu origem aos seres humanos dos ancestrais comuns com os macacos rhesus, cerca de 25 milhões de anos atrás [1, 2].
Os autores do trabalho também puderam verificar que a maioria da atividade de reforçadores ganha nos membros em desenvolvimento de nossa linhagem tiveram sua origem nos mamíferos, ou seja, não eram sequências tão ancestrais que tivessem originado-se já no começo da evolução dos vertebrados tetrápodes ou amniotas, mas também não eram tão recentes, como as sequências que devem ter surgido especificamente durante a evolução dos primatas.
Outra constatação bem sugestiva do estudo foi que os ganhos em promotores e reforçadores identificados durante o desenvolvimento dos membros humanos estão associados com o aumento da expressão dos genes a eles associados, o que é consistente com a ideia destes ganhos de atividade de sequências cis-regulatórias terem promovido as modificações na expressão gênica que estariam por trás da evolução morfológica humana [1, 2]. Os estudos de RNAseq permitiram identificar 302 genes cuja expressão é, pelo menos, 4 vezes maior nos membros em desenvolvimento dos embriões humanos do que nos membros embrionários do camundongo e do macaco rhesus que estão associadas com ganhos em atividade em promotores e reforçadores nos seres humanos. Estes resultados vinculam diretamente os ganhos H3K27ac de promotores e reforçadores em humanos ao aumento de expressão gênica [2].
Os pesquisadores estimam que, dependendo do período de tempo examinado, cerca de 2% a 16% dos elementos reforçadores mostram evidências de ganho de atividade na linhagem humana, por meio da marcação H3K27ac, em relação ao observado em embriões de macacos rhesus e de camundongos. Infelizmente não é viável a obtenção de tecidos embrionários de chimpanzés e bonobos, de modo que ainda não foi possível determinar diretamente a taxa de ganhos destas sequências cis-regulatórias em seres humanos desde nossa divergência de nossos ancestrais comuns com o ancestral comum dos chimpanzés e bonobos, algo em torno de 6 milhões de anos atrás. Porém, os pesquisadores afirmam que, como estes eventos são um subconjunto das diferenças entre seres humanos vs macacos rhesus que foram identificadas, a taxa de ganho de atividade específica da linhagem humana de sequências reforçadores em relação aos chimpanzés e bonobos, provavelmente, será uma fração das estimativas obtidas para estes ganhos desde a separação entre nossos ancestrais e os ancestrais dos macacos rhesus [2].
Os autores, na discussão do trabalho, enfatizam que estes resultados permitem a interpretação direta dos estudos que mostram regiões que parecem evoluir aceleradamente nos genomas humanos (HARS ou HACNSs), permitindo estabelecer prioridades para a análise dos genes a elas à jusantes [Veja mais sobre estas regiões no post "Perdendo para ganhar?"]. Originalmente estas regiões conservadas que mostram aceleração nos padrões de substituição de nucleotídeos em nossa espécie, e não em outras, haviam sido definidas por estratégias puramente computacionais, tendo resistido aos esforços em grande escala de identificação de funções por causa da falta de dados experimentais sobre estas regiões [2]. Porém, por meio da identificação de ganhos em H3K27ac na linhagem humana torna-se possível empregar este método na identificação, nestas sequências aceleradas humanas, de atividades específicas. Por exemplo, neste estudo em particular foram identificadas 16 regiões aceleradas humanas que mostram aumentos significativos na marcação H3K27ac em nossa linhagem [2].
De acordo como Noonan [1], o próximo passo do estudo é transferir alguns desses elementos regulatórios específicos dos seres humanos para o genoma de camundongos de modo que sua equipe possa investigar quais os aspectos do desenvolvimento dos membros humanos seriam afetados por estas sequências:
"Tem sido difícil entender como traços humanos evoluíram, porque não temos ideia de onde as mudanças importantes genéticas ocorreram", disse Noonan [1].
"Agora nós sabemos e temos as ferramentas experimentais para determinar quais efeitos biológicos essas mudanças podem ter tido. Nosso estudo também fornece um roteiro para a compreensão de outras características específicas do ser humano que surgem durante o desenvolvimento, tais como o aumento do tamanho e complexidade do cérebro", completou [1].
Este fascinante estudo, como os próprios autores enfatizam [2], tem suas limitações. Além do poder estatístico ser baixo (apesar das várias técnicas estatísticas e protocolos experimentais desenvolvidos para torná-los o mais precisos possíveis) em função da baixa quantidade de material biológico, também envolvem comparação de espécies bastante distantes, uma vez que o material biológico necessário de chimpanzés e bonobos é ainda mais escasso do que o de seres humanos e macacos rhesus. Porém, esta nova abordagem é muito promissora já que permite, mesmo com pouco material, identificar candidatos às regiões genômicas e elementos genéticos envolvidos na evolução humana que podem ser os responsáveis por nossas peculiaridades evolutivas.
---------------------------------
* Apesar das visões de Wilson e King originais serem um tanto diferentes do que hoje cremos ser o caso das diferenças de regulação gênica entre os seres humanos e os demais grandes macacos sem cauda, tendo menos a ver com as sequências regulatórias não-codificantes e mais como a crença de ambos que rearranjos cromossômicos teriam um papel crucial nas diferenças entre os seres humanos e demais hominines. O artigo de Michel Morange ajuda a contextualizar melhor a questão e nos imuniza contra certa tendência de reinterpretar demais antigas descobertas ignorando o contexto em que foram propostos e mesmoalgumas ideias que destoam bastante de nossa compreensão moderna.
**As dificuldades de obtenção de tecidos embrionários de seres humanos e macacos rhesus (que foram coletados e utilizados com aprovação do comitê de investigação humana de Yale) fez com que para cada replicata de pontos no tempo no estudo, apenas um único membro anterior e único membro autópode anterior do mesmo embrião fossem combinados e usado. O tecido fetal dos membros de macacos rhesus dos períodos de gestação entre 31 a 36 dia forma coletados, também de acordo, com protocolos aprovados pelo comitê de ética (Yale IACUC). O mesmo procedimento de combinação de um único membro posterior e um único autópode anterior, empregado para o tecido humano, também foi utilizado para os experimentos com o tecido embrionário de macacos rhesus. Os embriões de camundongos foram também em acordo com protocolos aprovados pelo comitê de ética (IACUC). Os dados destes experimentos foram combinados computacionalmente para gerar valores de expressão de membros compostos (Procedimentos Experimentais Alargada) [2].
----------------------------------------
Referências:
Bill Hathaway, Bill 'Development of hands and feet may help unlock evolution’s toolkit' Yale News, July 3, 2013.
Cotney J, Leng J, Yin J, Reilly SK, Demare LE, Emera D, Ayoub AE, Rakic P, & Noonan JP (2013). The evolution of lineage-specific regulatory activities in the human embryonic limb. Cell, 154 (1), 185-96 PMID: 23827682
Prabhakar S, Visel A, Akiyama JA, Shoukry M, Lewis KD, Holt A, Plajzer-Frick I, Morrison H, Fitzpatrick DR, Afzal V, Pennacchio LA, Rubin EM, Noonan JP* (2008). Human-specific gain of function in a developmental enhancer. Science 321:1346-50.
Lodish H, Berk A, Zipursky SL, et al. Molecular Cell Biology. 4th edition. New. Freeman; 2000. Section 9.6, Morphology and Functional Elements of Eukaryotic Chromosomes [link].
Nakayama, Jun-ichi The role of chromatin structure in the regulation of gene switching Riken Research, 15 January, 2010. [link]
Annunziato, A. (2008) DNA packaging: Nucleosomes and chromatin. Nature Education 1(1)
Ralston, A. (2008) Examining histone modifications with chromatin immunoprecipitation and quantitative PCR. Nature Education 1(1)
Creyghton MP, Cheng AW, Welstead GG, Kooistra T, Carey BW, Steine EJ, Hanna J, Lodato MA, Frampton GM, Sharp PA, Boyer LA, Young RA, Jaenisch R. Histone H3K27ac separates active from poised enhancers and predicts developmental state. Proc Natl Acad Sci U S A. 2010 Dec 14;107(50):21931-6. doi: 10.1073/pnas.1016071107.
Bannister AJ, Kouzarides T. Regulation of chromatin by histone modifications. Cell Res. 2011 Mar;21(3):381-95. doi: 10.1038/cr.2011.22.
Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009 Jan;10(1):57-63. doi: 10.1038/nrg2484.
Liu ET, Pott S, Huss M. Q&A: ChIP-seq technologies and the study of gene regulation. BMC Biol. 2010 May 14;8:56. doi: 10.1186/1741-7007-8-56.
Créditos das Figuras:
HENNING DALHOFF / SCIENCE PHOTO LIBRARY
LAGUNA DESIGN/SCIENCE PHOTO LIBRARY
ART FOR SCIENCE/SCIENCE PHOTO LIBRARY
STEVE GSCHMEISSNER/SCIENCE PHOTO LIBRARY