A origem de nova informação genética. Parte I
Um dos argumentos mais irritantes, repetidos ad nauseam por aqueles que negam a evolução biológica, é o de que não existem mecanismos que aumentem o "conteúdo de informação", ou a complexidade genética, dos seres vivos. Este argumento é irritante por dois motivos. O primeiro deles é o uso abusivo do termo 'informação', um conceito de aplicação muito ampla, porém, com um sentido matemático bastante rigoroso, desenovlvido a partir dos trabalhos de Claude Shannon e, posteriormente, de Kolmogorov e Chaitin, sobre a teoria algorítmica da informação. Ambas versões são constantemente, implícita ou explicitamente, trazidas à baila pelos criacionistas, principalmente os adeptos do Design Inteligente, de forma abusiva e distorcida (teoria da informação e criacionismo). O problema é que existem muitas aplicações da teoria da informação na biologia molecular e, especialmente, na biologia evolutiva, como fica bastante claro ao analisarmos a teoria das máquinas moleculares de Tom Schneider e os trabalhos, do físico teórico, Christoph Adami e, do cientista da computação, Charles Ofria. Em segundo lugar, a afirmação de que não existem, ou não se conhecem, mecanismos naturais, que aumentem o conteúdo informacional dos genomas (E olha que esta quantidade jamais é definida de forma rigorosa pelos criacionistas) é, simplesmente, falsa. Existem muitos mecanismos que fazem exatamente isso, ou seja, aumentam o conteúdo de informação dos genomas, possibilitando a criação de novos genes, e aumentando a complexidade das redes de regulação. Em um post futuro , pretendo aprofundar-me em algumas novas abordagens que explicam como certos mecanismos estocásticos podem contribuir para a complexidade da arquitetura genômica e estrutural dos genes em eucariontes, como a criação de introns, explorando os trabalhos do grupo do biólogo evolutivo, Michael Lynch.
Neste post pretendo dar uma rápida passada neste tema e citar alguns destes mecanismos que, em outra ocasião, serão explorados em artigos mais específicos.
Duplicação gênica:
A existência de genes muito semelhantes, às vezes em estreita proximidade física, que muitas vezes formam “clusters” de chamados genes parálogos, são um dos mais claros exemplos de como novos genes podem surgir. Isto é, a partir de 'velhos' genes. Ao estudarmos os mecanismos de duplicação do DNA é possível perceber como determinados processos podem gerar duplicações de determinadas seqüências genéticas. Por exemplo, o chamado DNA polimerase slippage ('deslise' da polimerase) e crossing over desigual,
além da ação de elementos genéticos móveis (que podem, ao se multiplicar, levar com eles seqüências de DNA), são alguns dos mecanismos que podem duplicar segmentos de DNA contíguos. Na realidade, existem evidências de duplicações muito mais extensas, de cromossomos e, até mesmo, de genomas inteiros (por exemplo na origem dos vertebrados), envolvendo processos de poliploidia ou não disjunção meiótica, durante a produção de gametas, ou mitótica, durante a primeira divisão do zigoto. Eventos, como estes, acontecem em nosso tempo de vida em várias espécies, sendo muito bem documentados. Não são meras especulações teóricas ou fantasias dos biólogos. São realidades empiricamente atestadas.
Pesquisadores, como Masatoshi Nei, tem defendido que boa parte da evolução genômica dos seres multicelulares, envolva este tipo de dinâmica, de perda e ganho de genes duplicados. Esta dinâmica, por sua vez, abre espaço à diversificação molecular crescente e especialização funcional contingente. A origem de certas redes de controle genéticas, como a formada pelos 'clusters' de genes homeóticos (que possuem a sequência de 180 nucleotídios que codifica o domínio proteico homeobox de interação com o DNA distribuídos co-linearmente nos cromossomos, responsáveis pelo formação do eixo cabeça-cauda em animais e formação de apêndices em vertebrados), são um dos maiores exemplos do poder da duplicação gênica. Além disso, estudos genéticos recentes indicam que existe, intra-especificamente, uma grande quantidade de variação no número de cópias de genes e pseudogenes, inclusive na nossa própria espécie, o que mostra o quão frequente é a ocorrência de duplicação gênica.
Após a duplicação de um gene, pelo menos, três coisas podem acontecer. Em primeiro lugar, este gene pode sofrer mutações que o tornem não funcional. Por exemplo, ao ganhar uma mutação do tipo nonsense, cuja
alteração de um dos nucleotídeos, cria um códon de parada precoce, resultando em uma proteína truncada, não funcional; ou ainda, uma mutação no sítio promotor que pode tornar o gene não transcrito. Neste caso, temos a formação de um pseudogene que acumulará mutações de forma muito mais acentuada, do que o gene original, tendo seus destino guiado pela deriva genética ao aproximar-se da neutralidade funcional. Estes genes, ainda assim, podem adquirir funções novas ao serem, mais tarde, "ressuscitados" por mutações fortuitas.
Em segundo lugar, mutações podem acometer os dois genes parálogos, comprometendo sua função (por exemplo ao diminuir suas taxas de transcrição), apenas parcialmente, fazendo que ambos passem a ser necessários para a homeostasia do organismo, já que individualmente não conseguiriam dar conta do recado. Esta chamada 'subfuncionalização' é a porta de entrada para a complexificação de circuitos genéticos que pode conduzir da redundância à subdivisão de papéis funcionais.
Em terceiro lugar, as mutações sofridas pela nova cópia podem criar uma função nova, ou liberar o gene antigo para adquirir uma função nova, através de mutações adicionais e seleção natural, através do processo que se convencionou chamar de 'neofuncionalização'.
O ponto principal é que a redundância, oferecida pela nova cópia, pode facilitar a diversificação mutacional posterior, além da co-optação funcional por uma outra rede genética, por exemplo, através de mutações nas regiões reguladoras de um dos genes duplicados. Este mesmo mecanismo pode funcionar quando existem duplicações parciais, apenas de segmentos dos genes, como de regiões regulatórias ou de exons, podendo contribuir para a evolução de novos domínios proteicos, o que é fortemente sugerido pelo fato de que muitos destes domínios são codificados por éxons, sendo unidades funcionais distintas (modulares) , inclusive enovelando-se (isto é, adquirindo sua conformação tridimensional, fundamental para a atividade proteica) de forma semi-autônoma.
As mutações, em uma região regulatória duplicada de um gene, podem acabar por fazê-lo interagir com outro fator de transcrição, facilitando sua co-optação por outra rede genética em outro tecido, por exemplo.
Todos estes processos, duplicação (mesmo duplicações múltiplas sequenciais), subfuncionalização, neofuncionalização e co-optação funcional, não são excludentes e podem se suceder, colaborando para criar novos circuitos genéticos e, desta forma, novas características, ao modificarem as propriedades de diferenciação, proliferação, adesividade, secreção de matriz extra-celular e interação hormonal das células e tecidos.
Transferência lateral:
A transferência de material genético lateral, principalmente, através de vírus e bactérias, pode ser outra forma de um organismo adquirir um gene, uma sequência reguladora, ou mesmo, um conjunto de genes já prontinhos, de um única vez. Claro, um processo de evolução subseqüente deverá ocorrer para a ustar funcionalmente os novos genes ao novo organismo.
As transferências de plasmídios, com genes de resistência a os antibacterianos, são bem comuns em procariontes e ilustram a importância da transferência genética lateral. Em eucariontes, incluindo certos animais, possuímos evidências de que genomas de bactérias comensais, como a Wolbachia, foram parcialmente transferidos para os genomas nucleares dos hospedeiros, algo semelhante acontecendo com parte do genoma das bactérias que deram origem as nossas mitocôndrias. Então, neste caso, a simbiose pode ser o passo prévio fundamental para o surgimento de uma nova função,. Assim a transferência lateral pode ocorrer aos poucos, seja ao ponto de incorporar completamente ao genoma alheio, (descartando a necessidade do simbionte ou comensal), seja incorporando o próprio simbionte, ou comensal, como uma organela endossimbiótica, como no caso das mitocôndrias e cloroplastos. Além disso, nosso genoma é repleto daquilo que parecem ser sequências virais dormentes, além de certos tipos de elementos genéticos móveis que só fazem se replicar, sendo verdadeiros "DNAs egoístas". Esta é mais uma evidência de como a transferência lateral, e os 'genes saltadores', não são mera ficção, mas sim uma realidade genômica importante durante a evolução.
Domesticação de elementos genéticos móveis:
Como já foi dito, elementos genéticos móveis como os transposons e os retroposons, são basicamente formas parasíticas de DNA, e só fazem se multiplicar, aumentando o tamanho do genoma, as vezes mutando genes, ao se inserirem dentro deles, além de não codificarem proteínas funcionalmente relevantes para a célula. Porém, uma forma de adquirir novos genes, e novas funcionalidades, é através da mutação e “domesticação” destes transposons e retrotransposons (que ao se copiarem criam um intermediário de RNA), recrutando as proteínas codificadas por estas sequências para funções específicas, ao mesmo tempo que perdem a capacidade de se copiarem e se inserirem livremente no genomas. Exemplos, associados a formação de redes de controle genético e origem do sistema imune de vertebrados, tem sido bastante investigados nas últimas décadas.
Fusão e fissão gênica:
Genes podem tanto se fundir, ou seja, formar um único transcrito que gera uma única proteína; como podem sofrer fissão, dando origem a dois transcritos. Estes processos, principalmente se combinados com a duplicação genica (como alguns estudo em Drosphila sugerem), contribuiem para evolução de novas proteínas, principalmente no caso da fusão de genes dupilcados e na formação de proteínas quiméricas.
Origem de novo:
Outra possibilidade é a de que novos genes surjam a partir de regiões não codificantes, por exemplo, pelo acréscimo de uma sequência reguladora e elementos promotores, em um segmento de DNA,, ajustando em uma janela de leitura apropriada. Estes segmentos promotores, podem ser derivados da inserção parcial de um genoma viral (ou elemento genético móvel) ou causada por uma falha no mecanismo de duplicação e reparo de DNA. Neste caso uma proteína nova pode surgir e ser, posteriormente, alvo da seleção natural. O exemplo mais famoso de aquisição de uma nova enzima, por mutações envolvendo alterações na janela de leitura de uma sequência, é da 'nylonase', uma enzima capaz de metabolizar nylon.
Além destes processos, o embaralhamento de éxons e conversão gênica, podem contribuir para a criação de novas funções a partir de genes já existentes, especialmente aqueles derivados de duplicação, artificialmente protegidos da seleção negativa por causa da redundância funcional. Outro ponto, não abordado neste post, é a origem de genes de micro-RNAs e outros RNAs regulatórios. Estes sistemas de controle genético, entretanto, também podem ser explicados por mecanismos naturais, principalmente os associados à replicação de retrotransposons, captura e reinserção, no genoma, de RNAs mensageiros. Em outro post pretendo abordar esta questão mais a fundo. A figura a seguir retirada com fins exclusivamente didáticos ilustra os principais mecanismos comentados acima.

Os exemplos, acima citados, são apenas alguns dos mecanismos investigados por cientistas que buscam explicar, como as novidades evolutivas surgem e evoluem,. Estes processos lançam luz aos mecanismos de evolução biológica, sobretudo, se combinados com a investigação de processos estocásticos (associadas a diminuição na população efetiva e consequente relaxamento da seleção purificadora), além de certas tendenciosidades nos tipos de erros dos mecanismos de duplicação, reparo de DNA e divisão celular. Estes processos, em conjunto, podem gerar a tremenda complexidade estrutural e funcional dos genomas de eucariontes, principalmente dos multicelulares.
Voltando a questão dos que negam a evolução, o que mais me impressiona é o fato da ideia de duplicação genética ter um pedigree relativamente antigo. Susumu Ohno, no começo dos anos setenta, foi o primeiro a especular e mostrar evidências para a importância da duplicação de genes e formação de pseudogenes. Por´´em, desde a década de trinta já haviam especulações sobre o assunto, e indícios cromossômicos. Este, portanto, não é um conhecimento inteiramente novo e guardado a sete chaves. Claro, agora, através de nossa habilidade de sequenciamento de genes (e, mesmo, genomas inteiros) com grande precisão, somos capazes de investigar em detalhe este e outros processos. Porém, este fato não diminui o paradoxo associado a negação veemente de que processos e mecanismos com estes existam e sejam, há décadas, alvo de pesquisa científica. Os cientistas sabem, e investigam a fundo, diversos mecanismos naturais que geram nova informação genética. Isto é um fato.
A insistência no discurso de que os biólogos evolutivos não conhecem nenhum mecanismos capaz de criar novas funcionalidade, aumentar a complexidade (ou mesmo, o conteúdo informacional de um genoma, ou ser vivo) não pode ser sustentado de forma honesta. Apenas a ignorância e a desonestidade intelectual podem justificar tal atitude. Veja a Parte II
Esta lista de processos que explicam a origem de novos genes é inspirada no artigo do portal Scitable:
Chandrasekaran , C. & Betrán , E. (2008) Origins of new genes and pseudogenes. Nature Education 1(1)
Para saber mais sobre a teoria da informação na biologia molecular e evolução:
http://www.ccrnp.ncifcrf.gov/~toms/papers/ev/
http://www.ccrnp.ncifcrf.gov/~toms/papers/shannonbiologist/
---------------------------------------------------------------------
Referências:
Adami C. Information Theory in Molecular Biology Physics of Life Reviews 1 3-22 (2004).
Force A, Lynch M, Pickett FB, Amores A, Yan YL, ostlethwait J. Preservation of duplicate genes by complementary, degenerative mutations. Genetics. 1999 Apr;151(4):1531-45. Review. PubMed PMID: 10101175; PubMed Central PMCID: PMC1460548.
Hotopp JC, Clark ME, Oliveira DC, Foster JM, Fischer P, Torres MC, Giebel JD, Kumar N, Ishmael N, Wang S, Ingram J, Nene RV, Shepard J, Tomkins J, Richards S, Spiro DJ, Ghedin E, Slatko BE, Tettelin H, Werren JH. Widespread lateral gene transfer from intracellular bacteria to multicellular eukaryotes. Science. 2007 Sep 21;317(5845):1753-6. Epub 2007 Aug 30. PubMed PMID: 17761848.
Kasahara M. The 2R hypothesis: an update. Curr Opin Immunol. 2007 Oct;19(5):547-52. Epub 2007 Aug 17. Review. PubMed PMID: 17707623.
Long M, Betrán E, Thornton K, Wang W. The origin of new genes: glimpses from the young and old. Nat Rev Genet. 2003 Nov;4(11):865-75. Review. PubMed PMID:14634634.
Lynch M, Conery JS. The origins of genome complexity. Science. 2003 Nov 21;302(5649):1401-4. PubMed PMID: 14631042.
Nam J, Nei M. Evolutionary change of the numbers of homeobox genes in bilateral animals. Mol Biol Evol. 2005 Dec;22(12):2386-94. Epub 2005 Aug 3. PubMed PMID: 16079247; PubMed Central PMCID: PMC1464090.
Nei M, Rooney AP. Concerted and birth-and-death evolution of multigene families. Annu Rev Genet. 2005;39:121-52. Review. PubMed PMID: 16285855; PubMed Central PMCID: MC1464479.
Perry GH, Yang F, Marques-Bonet T, Murphy C, Fitzgerald T, Lee AS, Hyland C, Stone AC, Hurles ME, Tyler-Smith C, Eichler EE, Carter NP, Lee C, Redon R. Copy number variation and evolution in humans and chimpanzees. Genome Res. 2008 Nov;18(11):1698-710. Epub 2008 Sep 4. PubMed PMID: 18775914; PubMed Central PMCID: PMC2577862.
Schneider TD. Evolution of biological information. Nucleic Acids Res. 2000 Jul 15;28(14):2794-9. PubMed PMID: 10908337; PubMed Central PMCID: PMC102656.
Zhang J (2003). "Evolution by gene duplication: an pdate". Trends in Ecology & Evolution 18 (6): 292–8. doi:10.1016/S0169-5347(03)00033-8.
Créditos das imagens:
VICTOR DE SCHWANBERG / SCIENCE PHOTO LIBRARY
PASIEKA / SCIENCE PHOTO LIBRARY
ANDERSON / OMIKRON / SCIENCE PHOTO LIBRARY
PROFESSOR STANLEY COHEN / SCIENCE PHOTO LIBRARY