Ancestralidade comum universal: A evidência está nas proteínas [Tradução]
Embora, do ponto de vista qualitativo, as evidências de ancestralidade comum universal sejam consideradas esmagadoras pela comunidade científica, até muito pouco tempo não havia sido realizado nenhum teste quantitativo formal que avaliasse outras possibilidades,além da ancestralidade comum universal, para explicar o padrão de similaridades moleculares entre todos os organismos vivos conhecidos. Entre as hipóteses rivais estariam as que postulam múltiplas origens e que implicam, portanto, que as semelhanças seriam devidas da convergência evolutiva, isto é, teriam surgido como resultado de demandas ecológico-funcionais semelhantes que teriam feito linhagens independentemente evoluírem biomoléculas com sequências muito parecidas por meio da seleção natural, apenas por que as funções que elas desempenhariam seriam muito semelhantes e essenciais. Embora esta possibilidade possa soar menos parcimoniosa e existam muitos argumentos qualitativos que reforcem esta ideia, não estava claro se ela não poderia realmente explicar melhor os dados biomoleculares, especialmente levando-se em conta os modernos modelos de evolução de sequências de biomoléculas.
O bioquímico, especializado em bioinformática estrutural e evolução molecular, Douglas L. Theobald - que já havia escrito um excelente compendio de evidências em apoio a evolução (o famoso, “29+ Evidences for Macroevolution: The Scientific Case for Common Descent”) - tomou para si esta tarefa e, usando diversos modelos de evolução de biosequências e métodos estatísticos de escolha e seleção entre modelos (veja o verbete 'model selection' da wikipedia) - como o critério de informação Akaike ('Akaike information criterion', AIC) - produziu um impressionante artigo sobre o assunto, no qual apresenta resultados que não só dão apoio a visão mais canônica de que toda a vida atual é derivada de um ancestral comum universal, mas obteve um apoio probabilístico para esta hipótese de cair o queixo, como pode ser visto na tradução do artigo de Katherine Harmon para a Scientific American sobre o incrível trabalho de Theobald publicado na Nature em 2010.
Assim, ao serem comparados com uma ampla gama de modelos biológicos de evolução que envolvem a ancestralidade independente de grandes grupos taxonômicos, os modelos de ancestralidade comum universal, ao serem avaliados por testes de seleção do modelos, dão um apoio espetacular à hipótese de ancestralidade universal comum, independentemente da presença de transferência horizontal de genes e eventos de simbiogênese entre linhagens.
Segue a tradução de um artigo da Scientific American de 2010 que resume o que Theobald fez e mais alguns comentários meus ao final, contextualizando mais a questão e abordando algumas das críticas feitas por outros cientistas e as respostas dadas a eles por Theobald.
-------------------------------------------------------------
A prova [1] está nas Proteínas:
Teste apóia ancestral comum universal para toda a Vida
Um pesquisador coloca à prova o pressuposto biológico básico de um único ancestral comum - e descobre que a análise genética avançada e estatísticas sofisticadas apoiam a antiga proposta de Darwin.
Fonte: Scientific American [The Proof Is in the Proteins: Test Supports Universal Common Ancestor for All Life ]
Autora: Katherine Harmon quinta-feira, 13 de maio, 2010 | 22
Tradução: Rodrigo Véras
TUDO EM FAMÍLIA: A suposição comum de que toda a vida na Terra surgiu de um único ancestral comum tem sido uma hipótese difícil de provar. Nova análise seleciona algumas das teorias concorrentes. Imagem: ISTOCKPHOTO/EBSTOCK
A primeira forma de vida da terra, flutuando na espuma proverbial dos mares primordiais que, eventualmente, deu origem às árvores, as abelhas e aos seres humanos, não é apenas popular pressuposição Darwiniana, mas também uma premissa biológica essencial da qual muitos pesquisadores tomam como parte da fundação de seu trabalho.
No século 19, Charles Darwin foi além de outros, que tinham proposto que poderia haver um ancestral comum a todos os mamíferos ou animais, e sugeriu que provavelmente houve um ancestral comum para toda a vida no planeta - plantas, animais e bactérias.
Uma nova análise estatística leva essa suposição para a bancada e descobre que não só se segura, mas na verdade é esmagadoramente sólida.
Não era já óbvio, a partir da descoberta e decifração do DNA, que todas as formas de vida são descendentes de um único organismo comum, -ou, pelo menos, uma espécie basal? Não, diz Douglas Theobald, professor assistente de bioquímica da Brandeis University e autor do novo estudo, detalhado na edição de 13 de maio da revista Nature. (Scientific American faz parte do Nature Publishing Group). Na verdade, ele diz: "Quando eu entrei nesse negócio, eu realmente não sabia qual seria a resposta."
Apesar das dificuldades de testar formalmente a evolução - especialmente voltando eras atrás até o surgimento da vida em si-Theobald foi capaz de executar análises estatísticas rigorosas das sequências de aminoácidos de 23 proteínas universalmente conservadas entre as três principais divisões da vida (eucariotas, bactérias e archaea). Ao introduzir essas sequências em vários modelos relacionais e evolutivos, ele descobriu que um ancestral comum universal é pelo menos 10^2860 mais provável (ou 'verossímil' [2]) de ter produzido as modernas variações de seqüência das proteínas do que até mesmo cenário seguinte mais provável (envolvendo vários ancestrais separados).*
"A evolução faz bem onde ele pode ser testado", diz David Penny, um professor de biologia teórica no Instituto de Biologia Molecular BioSciences da Universidade Massey, na Nova Zelândia e co-autor de um editorial de acompanhamento. No entanto, ele observa que a evolução pode fazer "previsões testáveis sobre o passado (especialmente as quantitativas)", no mínimo, complicadas. "QueTheobald possa ter concebido um teste formal", diz ele, "foi excelente .... Provavelmente vai levar a um salto no que se espera da avaliação formal de hipóteses, o que iria ajudar a todos."
Animosidade ancestral comum
As descobertas de meados do século 20, sobre a universalidade do DNA "realmente definiram isso para as pessoas" em termos estabelecer na cultura popular - e acadêmica - que houve um ancestral universal comum único para toda a vida conhecida na Terra, Theobald diz. E desde então, "tem sido amplamente assumido como verdade", observa ele.
Mas, nas duas últimas décadas, novas dúvidas surgiram em alguns círculos. Microbiologistas adquiriram uma melhor compreensão do comportamento genético das formas de vida simples, que pode ser muito mais amorfo do que a típica transferência vertical de genes de uma geração para a seguinte. A capacidade de microorganismos, tais como bactérias e vírus, de trocarem genes lateralmente entre os indivíduos - e mesmo entre espécies – mudaram alguns dos conhecimentos básicos estruturais do mapa da evolução. Com as transferências de genes horizontais, assinaturas genéticas podem mover-se rapidamente entre os ramos, rapidamente transformando uma árvore tradicional em uma teia emaranhada. Esta dinâmica "lança dúvida sobre este modelo da árvore da vida", diz Theobald. E "uma vez que você lança dúvidas sobre isso, meio que lança uma dúvida sobre ancestralidade comum também."
Com a descoberta dos archaea como o terceiro principal domínio da vida - além das bactérias e dos eucariontes - muitos microbiologistas tornaram-se mais duvidosos de um único ancestral comum por trás de todos.
Um teste para a evolução
Outros pesquisadores haviam colocado certas seções de vida à prova, incluindo uma análise estatística de 1982 semelhante feita por Penny testando a relação de várias espécies de vertebrados. Theobald descreve o artigo como "legal, mas o problema lá é que eles não estão testando ascestralidade universal." Com os avanços na análise genética e poder estatístico, no entanto, Theobald viu uma maneira de criar um teste mais abrangente para toda a vida.
No decorrer de sua pesquisa, Theobald foi bater contra comum, mas “quase insolúvel, problema evolutivo" em biologia molecular. Muitas macromoléculas, como proteínas, têmestruturas similares tridimensionais, mas seqüências genéticas muito diferentes. A pergunta que o atormentava era: Seriam essas estruturas semelhantes de evolução exemplos de evolução convergente ou evidência de ancestralidade comum?
"Todas as evidências clássicas para a ancestralidade comum são qualitativas e baseiam-se em semelhanças compartilhadas", diz Theobald. Ele queria descobrir se ter focado nas semelhanças teria levado os cientistas a se extraviarem.
Suposições abandonadas
A maioria das pessoas e até mesmo cientistas operam sob a premissa de que as semelhanças genéticas implicam uma relação ou antepassado comum . Mas, assim como semelhanças na aparência física ou estrutura, essas suposições "podem ser criticadas", observa Theobald. A seleção natural forneceu numerosos exemplos da evolução física convergente, tais como as caudas preênsis de gambás e macacos-aranha ou a línguas pegajosas longas de comer insetos dos tamanduás e tatus. E com a transferência horizontal de genes em cima disso tudo, argumentos similares poderiam ser feitos para as sequências genéticas.
"Eu realmente dei um passo para trás e tentei assumir o mínimo possível ao fazer essa análise", diz Theobald. Ele rodou vários modelos evolutivos estatísticos, incluindo aqueles que levavam em em consideração a transferência horizontal de genes e outros que não. E os modelos que consideravam a transferência horizontal de genes acabaram fornecendo o maior suporte estatístico para um ancestral comum universal.
Origens obscuras
Theobald disse que seus resultados mais surpreendentes foram "o quão fortemente eles apoiam a ancestralidade comum." Em vez de simplesmente terem sido desapontados com o apoio a um pressuposto de longa data, ele diz que, pelo menos, "é sempre bom saber que estamos no caminho certo."
Estas descobertas não significam que um ancestral comum universal estabelece o padrão da "árvore da vida" o começo da dinâmica evolutiva. Nem, no entanto, que eles inferiram uma estrutura em "teia da vida". O debate árvore contra teia continua sendo "muito controverso agora mesmo na biologia evolutiva", diz Theobald, relutante em escolher um lado para si mesmo.
Uma das outras grandes incógnitas que restam é quando esse ancestral universal comum teria vivido e o com o que ele pode ter se parecido - uma questão que vai demandar mais do que os modelos estatísticos de Theobald para responder. Theobald também observa que o apoio para um ancestral comum universal não exclui a idéia de que a vida surgiu de forma independente mais de uma vez. Caso outras linhagens, totalmente distintas surgiram, no entanto, elas ou foram extintas ou permanecem ainda não descobertas.
A pesquisa provavelmente avançará para esses cantos escuros do início da evolução, nota Penny, uma vez que "os cientistas nunca estão satisfeitos." Ele espera que os pesquisadores irão tentar resolver voltar para ainda mais cedo, antes do DNA assumir, e avaliar os estágios iniciais da evolução durante os dias de RNA.
Em um nível mais fundamental, Penny diz, que o artigo não deve pôr fim à avaliação dos pressupostos da ancestralidade. Em vez disso, deve ser um lembrete de que "nós nunca pensamos em todas as hipóteses possíveis", diz ele.
"Então, nunca devemos deixar de considerar alguma abordagem nova que não tenhamos pensado ainda."
* Errata (5/13/10): Esta frase foi alterada após a publicação. Ela inicialmente afirmava que um ancestral comum universal é mais de 10 vezes mais provável.
----------------------------------------------
Notas do Tradutor:
[1] O termo 'prova' segue o artigo original de Harmon que usa a palavra 'proof', mas fica claro - especialmente conhecendo outros textos de Theobald e declarações no artigo de resposta aos críticos - que o termo ideal seria 'evidência'.
[2] Cabe a ressalva que o termo originalmente usado é 'likely' que apesar de ser muitas vezes traduzido como 'provável', tem um significado técnico diferente relacionado com o conceito de verossimilhança ('likelyhood') que é de fato no que se baseiam as comparações relativas entre os modelos [Para mais, veja oartigo de Nick Matzke sobre o artigo no blog Panda's Thumb].
-----------------------------------------
Comentários Adicionais:
A figura abaixo extraída do comentário de Steel e Penny (2010) mostra que tipo de hipóteses foram testadas por Theobald, entre muitas outras combinações.
Uma das possibilidades de ascendência múltipla retratada na figura (a) é a de que a vida atual é oriunda de duas linhagens que se originaram independentemente uma da outra, com as proteínas com funções similares tendo surgido em decorrência da evolução adaptativa convergente. Na figura (b) podemos observar a origem única (ancestralidade comum universal), pelo menos, após a evolução da síntese de proteínas. As transferências, por endossimbiose ou por transferência de lateral de genes, são mostradas por linhas tracejadas. As correlações entre os padrões de aminoácidos em diferentes posições são usadas para testar entre as duas possibilidades. A abordagem, adotada por Theobald, compara os valores das verossimilhanças de quão bem diferentes modelos de evolução de sequências e ancestralidade ajustam-se aos dados, compensando para diferentes números de parâmetros.
Como diz Penny, as conclusões de Theobald não encerram o assunto, embora ofereçam um forte argumento para a ancestralidade comum universal e uma forma explícita de testar tal hipótese que pode ser refinada e corrigida a medida que novas informações e métodos de análise forem surgindo. Por exemplo, na mesma edição da revista Nature, dois pesquisadores,Yonezawa and Hasegawa, [veja aqui] oferecem críticas as conclusões de Theobald e deram um exemplo de duas famílias de sequências de ácidos nucleicos codificadoras de proteínas, aparentemente não relacionadas, que, ao serem analisadas usando o 'critério de informação Akaike' (AIC) de seleção de modelo, usado por Theobald, acabaram por favorecer a hipótese da origem comum das mesmas, o que estaria em erro com o que sabemos sobre este caso específico. Porém, em resposta, Theobald lembra que, embora possa parecer surpreendente, as sequências codificantes do exemplo dos dois pesquisadores foram alinhadas não no mesmo marco de leitura e as restrições do código genético acabam provocando correlações entre estas seqüências (e entre todas as seqüências codificantes) que realmente não são devidas à ancestralidade comum. Algumas delas surgem pelo simples fato de existir um viés de códons e por causa da própria estrutura do código genético. Por exemplo, na segunda posição dos tripletos de nucleotídeos que formam os códons existe uma forte inclinação para a Timina que tem uma chance duas vezes acima da média do que o esperado de ser encontrada nesta posição, enquanto a terceira posição é geralmente preenchida por uma Adenina por volta de 50% das vezes e por uma Guanidina, apenas por volta de 4% das vezes. Porém, estas correlações e vieses de sequência podem ser levadas em conta adotando-se modelos e parâmetros adequados que já são implementados em vários programas de análise filogenética de sequências de uso comum que utilizam codons, como o PAML, ou que usam os aminoácidos codificados (como o PhyML). E quando isso é feito, o resultado espúrio citado por Yonezawa e Hasegawa desaparece e a origem independente é escolhida como sendo muito mais 'provável'.
Yonezawa e Hasegawa também criticam o fato de Theobald não ter explicitamente testado modelos que levassem em conta que sequências similares poderiam ter sido geradas por causa de restrições biofísicas e da seleção natural que teriam produzido correlações entre sequências que haviam se originado independentemente. Acontece que, além de não existirem modelos filogenéticos que permitam o teste específico destes cenários, uma ampla gama de resultados empíricos sugere fortemente que este não seria o caso para a altíssima similaridade do conjunto de proteínas universalmente presentes empregado nas análises por Theobald. Sem mencionar que a premissa de que restrições biofísicas poderiam levar a estas correlações espúrias não é sustentada pela simples observação de que não parecem existir modos únicos de se executar uma dada função bioquímica. De fato, existem inúmeros exemplos de proteínas com similaridade de sequência indetectável e conformações tridimensionais que desempenham a mesma função bioquímica e celular. Além disso, mesmo caso se presuma que certas conformações protéicas sejam necessárias para uma determinada função, as evidências de biologia estrutural atuais indicam que os requisitos em termos de sequências para que se atinjam quaisquer conformações são extremamente baixos, na realidade, quase indistinguíveis da aleatóriedade. Muitas grandes classes de proteínas com padrões tridimesionais muito parecidos não têm similaridade de seqüência detectável, o que fornece evidência direta que as exigências de seqüência, para qualquer configuração espacial particular de uma proteína e portanto de uma função, serem quase indistinguíveis do esperado pelo acaso.
Theobald, entretanto, admite que estes argumentos são circunstanciais e qualitativos, não devendo substituir um teste mais formal quando houverem dados e modelos mais apropriados; admitindo que ele, realmente, não testou todas as hipóteses concorrentes possíveis (o que seria pedir um pouco demais, não?). Portanto, Theobald, tem plena consciência de que sua análise não será a “última palavra sobre ancestral comum'', enfatizado que, em nenhum momento, ele pretendeu oferecer uma "prova" absoluta de ancestralidade comum universal. Como ele mesmo afirma, o ponto principal é que este arcabouço de teste com base na seleção de modelos traz uma enorme vantagem em relação ao que era feito até então, pois caso um novo modelo, com uma bem definida função de probabilidade, venha a ser proposto, então, será possível facilmente compará-lo aos modelos de ancestralidade comum e ver como ele se sai frente a eles.
É neste espírito que avançamos na compreensão de nosso passado, botando à prova mesmo pressuposições consideradas básicas e avaliando sua 'probabilidade' frente a outras possibilidades sempre que for possível.
------------------------------------------------------------------------------
Referências
Theobald DL "A formal test of the theory of universal common ancestry." Nature 465(7295):219-222. [pdf]
Yonezawa T, Hasegawa M. Was the universal common ancestry proved? Nature. 2010 Dec 16;468(7326):E9; discussion E10. doi: 10.1038/nature09482. PubMed PMID: 21164432.
Theobald DL (2010) "Was the universal common ancestry proved? Reply" Nature 468(7326):E10. [pdf]
Steel M, Penny D. Origins of life: Common ancestry put to the test. Nature. 2010 May 13;465(7295):168-9. doi: 10.1038/465168a. PubMed PMID: 20463725. [pdf]
Theobald DL. On universal common ancestry, sequence similarity, and phylogenetic structure: the sins of P-values and the virtues of Bayesian evidence. Biol Direct. 2011 Nov 24;6(1):60. PubMed PMID: 22114984; PubMed Central PMCID: PMC3314578. [pdf]
Kadane, J.B. and Lazar, N.A. Methods and Criteria for Model Selection Journal of the American Statistical Association Volume 99, Issue 465, 2004 DOI: 10.1198/016214504000000269