O alvorecer da filomedicina
A biologia evolutiva é essencialmente um campo de pesquisa básica cujos principais objetivos são compreender os padrões e processos por trás da evolução dos organismos vivos desde o nível genético-molecular, passando pela evolução das células procariontes e eucarionte, investigando origem e evolução dos seres multicelulares, pela origem da biodiversidade no contexto da história da vida em nosso planeta, inclusive buscando a compreensão de como se formaram, e mudam ao longo das eras, os ecossistemas e biomas que formam nossa biosfera. Porém, é inegável que o tipo de conhecimento produzido pela biologia evolutiva compreendida de forma ampla, que se sobrepõem a áreas como a genética, bioquímica, bioinformática, sistemática, ecologia, fisiologia, anatomia e embriologia, microbiologia, biogeografia e paleontologia, têm implicações diretas na forma como vivemos nossas vidas em sociedade e desta maneira torna-se aplicável de maneira mais direta a melhoria desta mesama sociedade. Neste contexto, uma nova técnica promete melhorar nossa capacidade de identificar genes associados a várias doenças comuns e assim aumentar a reproducibilidade de estudos de associação genômica [1].
O impacto das pragas, pestes e patógenos sobre os seres vivos, e especialmente a forma como mudam e se adaptam frente a utilização de defensivos agrícolas e antimicrobianos, são um exemplo claro da relevância do estudo da evolução. Também o são, os estudos sobre interações entre espécies e sua coevolução, fundamentais como base para compreendermos o efeito da introdução de novas espécies em novos ambientes e para nortearmos os esforços de conservação de espécies ameaçadas, assim como são os estudos sobre macroevolução e sobre as extinções e como elas afetam as biotas e como estas se recuperam, conhecimento que podem nos dar insights importantes sobre como diagnosticar eventuais extinções que estejam se avizinhando, como a possível sexta extinção em massa que podemos estar provocando, e também como, em princípio, evitá-las ou, pelo menos, lidar com seus efeitos de modo que minimizemos seu impacto negativos em nossas espécie e nas várias outras com as quais partilhamos estas fração do tempo e do espaço.
Na realidade, toda a ideia de testes com organismos-modelos - base da farmacologia, fisiologia, cirurgia experimental, toxicologia e biomedicina de modo mais geral -, mesmo precedendo a consolidação dos estudos evolutivos, é informada e cosubstanciada pela biologia evolutiva e as similaridades filogenéticas entre os organismos (associadas a considerações mais pragmáticas relativas a obtenção, manutenção e facilidade de uso) é que dão substância a uma série de práticas nestas disciplinas, desde a escolha dos organismos até como usar as informações obtidas a partir da análise bioquímica, fisiológica e genômica de animais e outros organismos vivos para identificar moléculas, sistemas e processos fisiopatológicos relevantes para nossa espécie.
Boa parte desta interação e intercâmbio entre as formas mais aplicadas de biomedicina e biologia humana, infelizmente, é feito de maneira pouco clara e às vezes até não refletida. Contudo, mais recentemente têm se aumentado os esforços de desenvolver uma medicina informada pela biologia evolutiva, por exemplo, tentando compreender várias condições, transtornos e doenças humanas crônicas, por exemplo, como sendo frutos de nosso passado evolutivo e resultado de eventos ancestrais, como as diminuições drásticas das nossas populações há dezenas de milhares de anos atrás, conhecidos como efeitos gargalos de garrafa, que, ao reduzirem a população efetiva, aumentaram o poder da deriva e contribuíram assim para fixação, ou pelos menos aumentar a frequência em nossa população, de uma série de genes e alelos ligeiramente desvantajosos que podem estar por trás vários dos nossos problemas de saúde crônicas e propensões a certas doenças que dependem da exposição a certos ambientes e modos de vida, dando mais peso àquilo que se convencionou chamar de "medicina evolutiva".
Entre os cientistas que preocuparam-se com estas possibilidades estão o famoso geneticista de populações James F. Crow (1916-2012,) que aparece acima a esquerda tocando seu
violino e que infelizmente faleceu aos 96 anos de idade, neste mesmo ano, e o geneticista evolutivo da Universidade de Indiana cujos artigos foram resenhados várias vezes aqui no evolucionismo, Michael Lynch. (Veja por exemplo sobre este tema em especial o artigo "Qual será o futuro genético da humanidade?"]
Além de usar a história demográfica pregressa de nossa espécie em combinação com os modelos matemáticos da genética de populações evolutivas para compreender a saúde humana, outras abordagens objetivam compreender algumas de nossas fragilidades como sendo derivadas de 'trade offs' evolutivos em que certos alelos e loci aumentaram suas frequências nas populações humanas mesmo causando uma série de problemas simplesmente por que estavam associados a vantagens reprodutivas precoces, sendo dificilmente purgados pela seleção negativa por que seus efeitos mais drásticos e negativos ocorriam bem depois do auge reprodutivo, especialmente em épocas em que as tecnologias e as práticas socioculturais não haviam ainda aumentado tanto a nossa expectativa devida média ao nascer e atrasado tanto o início da reprodução de várias populações, como podemos obsevar hoje em dia, particularmente, em países e regiões mais industrializadas e abastadas.
Esta segunda abordagem sofreu grande influência do biólogo evolutivo George C. Williams, um dos principais teórico da moderna biologia evolutiva da segunda metade do século XX, após o período da síntese moderna nos anos 30 e 40, e o médico Randolph M. Nesse que, junto a Willians nos anos 90, começou a divulgar a ideia de "Medicina Darwiniana" que tem crescido a passos lentos, mas contínuos, e que dão especial ênfase, como já comentado, ao conceito de trade-offs e ideias a ele relacionadas como 'pleiotropia antagônica'.
Porém, até recentemente, estas abordagens eram mais explicativas do que propriamente possibilitadoras de intervenções ou mesmo de identificação de mecanismos fisiopatológicos relevantes, ainda que já pudessem reforçar certas formas de tratamento e corroborar indicações de mudanças de hábitos dietários e comportamentais, com atividade física.
Com a aurora dos estudos genômicos (e das outras 'ômicas') e da bioinformática - disciplinas que surgiram da necessidade de lidar a montanha de dados gerados por métodos de sequenciamento e perfis de expressão de RNAs e proteínas e suas interações em larga escala – novas formas de empregar as informações evolutivas tem sugerido formas de identificar de maneira mais direta genes e regiões genômicas mais passíveis de serem relevantes às doenças complexas crônicas que desfiam a medicina moderna.
Como explica Richard Harth [2], os genomas humanos são enormes estruturas constituídas por cerca de impressionantes de 3 bilhões de pares de bases de nucleotídeos, sendo que a maioria deles está repleta de variações nas posições de nucleotídeos, desafiando os pesquisadores a identificarem àquelas que ficariam lá à toa, sem fazer nada de mais, como os polimorfismos neutros, das que realmente podem traduzir-se em doenças.
A ideia geral de que haveriam componentes genéticos em várias doenças crônicas veio inicialmente do fato que algumas doenças bem conhecidas apresentam uma correspondência de um para um entre uma dada substituição em um determinado gene e uma dada doença bem caracterizada. Estas chamadas doenças monogênicas como os diversos erros inatos de metabolismo, têm características bem particulares, sendo como já foi dito resultadso de geralmente uma única mutação em apenas um locus, além de geralmente terem um início precoce, cobrando seu preço pago pelo paciente ainda na juventude. Entre as doenças monogênicas mendelianas mais conhecidas podemos citar a fibrose cística, a doença de Tay Sachs, a anemia falciforme e a doença de Huntington, está última destoando das demais por que seus efeitos tendem aparecer na idade adulta dos pacientes. Contudo, estas são apenas uma minoria das doenças em que acredita-se que haja um componente hereditário ainda que não tão direto e tristemente confiável, mas que tendem a mostrarem-se parcialmente herdáveis aparecendo em estudos de herdabilidade e nos levantamentos de históricos de 'pedigrees' familiares.
As doenças complexas, como outras características complexas fisiológicas, anatômicas, cognitivas e comportamentais, são causadas por múltiplos fatores que interagem muitas vezes de maneira complicada, o que torna às vezes bem difícil a separação dos componentes ambientais e psicossociais daqueles hereditários que, mesmo assim, normalmente envolvem vários loci, possivelmente com vários alelos cada. Esta labilidade torna necessário que sejam usados métodos estatísticos e grandes estudos populacionais casos-controle ou de coorte em que pacientes saudáveis e acometidos são investigados à procura de eventuais diferenças genéticas. Entre essas doenças estariam algumas condições que têm preocupado cada vez mais as autoridades de saúde e os governos, além da sociedade como um todo, de forma mais geral, como a hipertensão, a artrite reumatoide, a doença de Alzheimer, a diabetes tipo II etc.
Uma das principais maneiras de investigar as contribuições genéticas a estas chamadas doenças complexas envolve o uso de estudos genômicos associativos ou GWAS (Genome-Wide Association Studies) em que são contrastados grupos de pessoas com certas doenças, os casos, com grupos de pessoas da mesma população com características equivalentes (como idade, sexo, peso, ocupação etc) exceto que não possuem a doença em questão, os controles, e, a partir daí, são comparadas diversas regiões genômicas em busca de variações que sejam muito mais frequentes nas porções doentes das amostras do que nas sãs. As formas mais investigadas de variações genéticas são os chamados SNPs, que são 'polimorfismos de nucleotídeo único', ou seja, sequências em que um dos nucleotídeos (as 'letras' do alfabeto genético, 'A', 'T', 'C', 'G', associadas, respectivamente, às bases nitrogenadas adenina, timina, citosina, guanina), além de outros marcadores genéticos, que revelariam arquiteturas genéticas subjacentes as doenças humanas que estão sendo investigadas.
O problema com esta abordagem é que vários dos esforços mais sistemáticos ao longo da última década, acabaram se mostrando não reproduzíveis. Por isso variantes genéticas que explicam uma parte substancial do risco hereditário de certas doenças humanas comuns ainda não foram descobertas, embora vários candidatas tenham sido levantadas e inicialmente se mostrado promissoras. Em muitos casos as associações encontradas em uma população não são confirmadas em outra muito semelhante. Isso pode ocorrer por vários motivos, um deles é que muitas vezes os SNPs e outros marcadores não são eles próprios os causadores das doenças mas encontram-se próximos, geneticamente ligados, aos genes que realmente teriam um papel causal, entretanto, em outras populações essas ligação pode ter sido quebrada como efeito da recombinação.
Além disso, como as relações entre a posse de uma dada variante e uma condição são bem pouco diretas e dependem de uma combinação de fatores, e complicadas interações, é também possível que uma dada variante que realmente faz parte das cadeias causas por trás de uma dada doença, em outra população, tenham seu efeito compensado por um outro pano de fundo genético ou por uma sutil mudança de ambiente que altera a forma como os genes interagem uns com os outros e como seus produtos são expressos. Além disso, boa parte dos 'sinais' produzidos por estes estudos podem ser espúrios e estarem correlacionados com as doenças apenas por causa de um fator comum talvez associado a origem da população particular ou surgirem como artefato de múltiplas comparações, o que pode ocorrer no caso de estudos prospectivos com desfechos mais amplos e não muito bem definidos. Porém, novos esforços e procedimentos vêm sendo desenvolvidos para lidar com estas frustrantes limitações deste tipo de estudo.
Um grupo de biocientistas, liderados por Sudhir Kumar, do Biodesign Institute da Universidade do Estado do Arizona - e que contava também com a participação de Rong Chen, Maxwell Sanderford, Atul J. Butte e Joel T. Dudley, do Programa em Informática Biomédica, Stanford University School of Medicine, este último, primeiro autor do artigo publicado em abril deste ano na revista Molecular Biology and Evolution - empreendeu uma análise em que foram investigadas 5.831 supostas variantes genéticas envolvidas em possíveis riscos à saúde humana e que estavam associadas a mais de 230 fenótipos de doença e que, por sua vez, haviam sido relatados em 2.021 estudos [1].
Este tipo de estudo é conhecido como meta-análise, um grande estudo estatístico que aglutina vários estudos estatísticos de associação do tipo anteriormente descrito. Neste estudo, o grupo de Kumar combinou estes dados com informações filogenéticas que permitiram aos autores desenterrarem padrões e tendências evolutivas que estariam ocultas nos dados e que poderiam indicar uma maior relevância das associações entre certos alelos e as doenças com as quais deveriam estar correlacionados.
"Cada posição no genoma humano entre os bilhões de pares de bases evoluiu ao longo do tempo" [2]
diz Kumar e acrescenta:
"Como o genoma evolui, algumas posições permitem mudanças com maior freqüência, enquanto outras não." [2]
Nos estudos genômicos associativos, do tipo analisado por Dudley et al. [1], normalmente são calculadas as probabilidades de alelos, ao longo do genoma, estarem relacionados à doenças. Estas probabilidades, por sua vezes, aparecem na forma de estatísticas bem conhecidas, como o valor-p que indica a probabilidade daquela associação, ou de uma mais extrema, ser real caso a hipótese de nulidade - ou seja, que as correlações são apenas fruto do acaso e que não há uma vinculação necessária - seja verdadeira. Assim, os alelos com os menores valores-p são considerados os menos prováveis de estarem associados as doenças pelo mero efeito do acaso e passam a ser os melhores candidatos para fatores causais.
O esquema acima ilustra um exemplo do cálculo envolvido nos estudos de associação genômica que seguem o delineamento de estudos casos-controle. As contagens de alelos de cada SNPs medido são avaliadas, neste caso com um teste de Chi-quadrado (χ2), a fim de se identificar variantes associadas com a característica em questão. Os números neste exemplo são tomados de um estudo de 2007 sobre doença arterial coronariana (DAC) que mostraram que os indivíduos com o alelo G do SNP1 (rs1333049) estavam 'sobrerepresentados' entre os pacientes com DAC. [Wellcome Trust Case Control Consortium (June 2007). "Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls". Nature 447 (7145): 661–78. doi:10.1038/nature05911.; Fonte: wikicommons; Autor:Lasse Folkersen; Data: 16 de janeiro de 2012]
Dudley afirma que:
"Mesmo se uma variante GWAS não tiver um papel funcional em uma doença, a informação evolutiva é ainda muito relevante, porque cada posição no genoma humano tem uma assinatura evolutiva que nos dá informação prévia sobre a forma como os alelos naquela posição são suscetíveis de variar em populações humanas modernas " [2]
Os pesquisadores de posse dos resultados da meta-análise constataram que a maioria dos alelos presumivelmente relacionados a doenças, descobertos nos estudos associativos genômicos, ocorriam em regiões genômicas que evoluíam de maneira relativamente lenta. Essas posições que mostram-se menos propensas a mudar com o tempo e mantém-se estáveis em várias espécies de organismos vivos, no caso do estudo, outros mamíferos, são ditas 'evolutivamente conservadas' [2].
Isto é, as abordagens atuais mostram uma tendência à descobrir SNPs associados à doenças (dSNPs) em posições conservadas do genoma, já que tanto o tamanho do efeito (razão de chance/odds ratio) como os valores-p alélicos de associação genética de um SNP correlacionam-se fortemente com a conservação evolutiva da sua posição genômica. Segundo Kumar, como parafraseado por Harth:
“Este fato dá conta da pobre reprodutibilidade de muitos alelos de doenças putativos através de diferentes populações, uma vez que alelos que ocorrem em locais conservados tendem a ser raros.” [2]
Kumar então explica:
"Você pode continuar encontrando alelos raros como este o dia inteiro, mas eles têm utilidade clínica limitada em uma população mais ampla." [2]
A partir daí os autores propuseram um nova sistema de ranqueamento de SNPs que integraria os scores (pontuações) de conservação evolutiva e o valores-p que foi chamado de ''E-rank". Este sistema incorpora, portanto, a informação filogenética de estudos envolvendo múltiplas espécies de mamíferos e os aplica aos dados provenientes dos estudos associativos e as medidas de significância das associações. Assim, os autores conseguiram remover o viés intrínseco de amostragem de alelos raros de pequeno efeito, permitindo que alelos mais comuns e que ocorrem em sítios que evoluem mais rapidamente nos genomas sejam descobertos de forma mais fácil.
Com base nisso, usando os dados publicados de um estudo caso-controle muito grande, os cientistas puderam demonstrar que o método de E-rank prioriza SNPs, com maior verossimilhança (likelihood), associações de doenças fidedignas e reprodutíveis, muitas das quais podem explicar a maior proporção da variância genética. Dudley afirma:
"Nosso método elimina este viés, o que dá um 'gás' nas variantes comuns de alta freqüência que são mais propensas a serem reproduzidas através de populações devido à história evolutiva da posição genômica onde elas se encontram" [2]
Isso mostra que, a longo prazo, o histórico evolutivo das posições genômicas ofereceriam uma forma útil e prática mais confiável de reavaliar os dados de estudos de associação de doenças existentes, além de poderem ser usados para melhorar o delineamento e análise de futuros estudos deste tipo que pretendessem mostrar a base genética das várias doenças humanas comuns.
Estas aplicações biologia evolutiva não deveriam causar espanto de maneira alguma. Como produtos de um longo processo evolutivo não é de se estranhar que nossas próprias doenças tenham elas mesmas um histórico evolutivo, especialmente quando estão associadas a variabilidade genética humana e a interação dos nossos organismos com o meio ambiente. Recusar-se a encarar a importância da evolução biológica e relegar a biologia evolutiva a um segundo plano não é só uma atitude ignorante de quem não quer aceitar a realidade e aventurar-se em compreendê-la da melhor forma possível, mas é socialmente perigosa e medicamente contraproducente. Queiram ou não, a evolução é uma realidade e a biologia evolutiva está aqui para ficar.
_______________________________________________
Referências:
Dudley, J. T,. Chen, R. ,Sanderford, M.,Butte, A. J. , Kumar, S. Evolutionary Meta-Analysis of Association Studies Reveals Ancient Constraints Affecting Disease Marker Discovery. Molecular Biology and Evolution, 2012; DOI: 10.1093/molbev/mss079
Harth, Richard Evolutionary information improves discovery of mutations associated with diseases Biodesign Institute Latest News, July 17, 2012. [Link]
Referências adicionais:
Crow JF. The origins, patterns and implications of human spontaneous mutation. Nat Rev Genet. 2000 Oct;1(1):40-7. Review. PubMed PMID: 11262873.
Crow JF. The high spontaneous mutation rate: is it a health risk? Proc Natl Acad Sci U S A. 1997 Aug 5;94(16):8380-6. Review. PubMed PMID: 9237985; PubMed Central PMCID: PMC33757.
Lynch M. Rate, molecular spectrum, and consequences of human mutation. Proc Natl Acad Sci U S A. 2010 Jan 19;107(3):961-8. Epub 2010 Jan 4. PubMed PMID: 20080596; PubMed Central PMCID: PMC2824313. DOI: 10.1073/pnas.0912629107 [PDF]
Nesse RM. How is Darwinian medicine useful? West J Med. 2001 May;174(5):358-60. Review. PubMed PMID: 11342524; PubMed Central PMCID: PMC1071402. [PDF]
Nesse RM, Ganten D, Gregory TR, Omenn GS. Evolutionary molecular medicine. J Mol Med (Berl). 2012 May;90(5):509-22. Epub 2012 Apr 29. PubMed PMID: 22544168
Nesse RM. What evolutionary biology offers public health. Bull World Health Organ. 2008 Feb;86(2):83. PubMed PMID: 18297156; PubMed Central PMCID:PMC2647384. [PDF]
Nesse RM, Williams GC. Evolution and the origins of disease. Sci Am. 1998 Nov;279(5):86-93. Erratum in: Sci Am 1999 Mar;280(3):14. PubMed PMID: 9796548.
Créditos das Figuras: