Sobre sucata, lixo, DNAs egoístas, comensais e simbiontes:
O chamado "DNA lixo" ou "DNA sucata"[1] é motivo de contínua confusão entre leigos, sendo arrastado às discussões por criacionistas de todas as estirpes que gostam de afirmar que a descoberta de novas funções, nestas 'misteriosas' e extensas porções genômicas, refutariam a evolução. Não é incomum entre os adeptos do criacionismo do Design Inteligente afirmar que estas eventuais funções adicionais em regiões não codificadoras dos genomas seriam uma previsão da teoria do Design Inteligente que, por sua vez, seria contrária a previsão dos biólogos evolutivos que teriam afirmado que essas extensas regiões do genoma não teriam qualquer função. Estas e outras afirmações similares, entretanto, não sobrevivem ao exame da própria história do conceito de "DNA sucata" que, por sinal, vêm se alterando ao longo dos anos.
Primeiro de tudo, é importante compreendermos o que, hoje em dia, é entendido por "DNA sucata" e o que não é "DNA sucata". O DNA sucata não é sinônimo de "DNA não codificante", embora uma grande porção dele seja realmente não codificante e muitos pesquisadores dêem especial atenção a estes trechos. Além disso, "DNA não codificante" não é sinônimo de DNA "não funcional", pois conhecemos as funções de muitos trechos não codificantes. O fenômeno de regulação gênica atesta a importância de sequências não codificadoras na regulação da transcrição gênica e ele já era bem conhecido a partir do estudo de fagos e bactérias feitos desde os nos anos 60. Uma questão importante refere-se ao fato que a estrutura dos genes dos eucariontes ser bastante diferente da dos procariontes.
Os genes dos eucariontes são formados por sequências codificantes, os exons, entrecortadas por sequências não codificantes intervenientes, chamadas de introns, que perfazem a maior parte dos genes. Essas sequências são transcritas em um RNA(pré)mensageiro não-processado, fato esse que dependem de um complexo holoenzimático formado por várias proteínas que trabalham em associação a RNA polimerase. Além dessas regiões transcritas existem porções não codificantes mas que desempenham um enorme papel funcional, como os elementos promotores, nas quais ligam-se a RNA polimerase e diversas proteínas que ajudam a controlar a expressão e os níveis de transcrição do gene. Essas regiões regulatórias imediatamente à montante (sequência acima) das regiões codificadoras, formam juntamente, como outras sequências a montante e à jusante mas que em geral estão muitas centenas de bases distantes, como reforçadores e repressores, coletivamente chamados de elementos cis-regulatórios.
Os RNAs pré-mensageiros são então processados por complexos riboenzimáticos, os spliceossomos, que removem os introns e reconectam os exons formando uma cadeia de RNA mensageiro que pode ser então traduzida pelos ribossomos. No entanto, mesmo nestes transcritos ainda existem regiões não-traduzidas, chamadas de UTR (do inglês, "UnTranslated Regions").
Os genes eucariontes, portanto, em média encontram-se bem afastados uns dos outros. Mas além desses genes tradicionais, ou seja que estão envolvidos na codificação de polipeptídeos, também são conhecidos genes cujos transcritos são diretamente ativos, como os dos RNAs ribossômicos (RNAr), transportadores (RNAt) e, mais recentemente, os "microRNAs" e outros RNAs regulatórios.
Por fim, existem outras regiões que servem como elementos estruturais de ancoragem ou espaçamento importantes, cujas funções para os organismos também não dependem de sua transcrição; além de sequências envolvidas no silenciamento de genes que servem como alvos para a metilação, como certas sequências CG que resultam na heterocromatinização de algumas regiões do genoma, importantes no controle epigenético da diferenciação tecidual. Porém, todos esses elementos genéticos formam apenas uma fração do nosso genoma, com as sequências dos cerca de 20000 genes que codificam proteínas propriamente ditas, constituindo menos de 2% do total de DNA, e com as demais sequências sabidamente funcionalmente [2] importantes correspondendo a mais 10 ou 12% do genoma, ainda que possam variar muito em termo de extensão em indivíduos diferentes, sugerindo que parte delas não é realmente essencial.
Mas a questão mais importante é que apesar de realmente não conhecermos o que fazem exatamente (se é que fazem alguma) grandes porções que poderíamos chamar de "DNA sucata", já temos uma ótima ideia do que fazem uma boa porcentagem dessas regiões e a aparente grande maioria delas não é relevante para a sobrevivência dos organismos. Da mesma maneira, regiões não codificantes que exerciam um papel estrutural também já eram bem conhecidas. O fato de que muitas das sequências do "DNA sucata" serem hoje tidas como não codificantes e sem relevância funcional para o organismo não os tornam sinônimos, mesmo por que muitas outras porções parecem também não ter significado funcional dos organismos que os contém, mas sabemos que codificam proteínas que sabemos o que fazem.
A lista que segue foi compilada pelo bioquímico Larry Moran e está disponível em seu blog Sandwalk:
Segundo, é importante ressaltar que estas extensas regiões genômicas não codificantes e sem relevância funcional óbvia para os organismo que as portam, surgiram como uma descoberta inesperada para os cientistas, especialmente em virtude do conhecimento prévio de genomas, bem mais enxutos, de procariontes associada a própria confiança que a seleção natural manteria apenas elementos funcionalmente relevantes.
O mito que se espalhou - e que é às vezes repetido por alguns cientistas, fazendo a alegria dos criacionistas - afirma que a descoberta dessas grandes porções de DNA não codificantes foram, desde o início, desprezadas por serem consideradas funcionalmente irrelevantes, mas isso é simplesmente falso. Um dos motivos para isso é que na época em que estas questões começaram a serem discutidas a visão mais difundida entre os biólogos evolutivos ainda era o chamado adaptacionismo, isto é, a ideia que quase tudo no organismos são um produto direto da seleção natural, devido as vantagens correntes que a característica em questão trás ao organismo em termos de sobrevivência e sucesso reprodutivo. Exatamente, por causa deste fato muitos, biólogos evolutivos propuseram que a maioria destas sequências deveriam desempenhar alguma função que seria descoberta em um futuro próximo com o aumento dos conhecimentos da biologia molecular de tais regiões [3]. Portanto, receberam com certo ceticismo as propostas de alguns cientistas que especulavam que a maioria dessas sequências eram de fato apenas sucata, refugos não essenciais para o organismo, subprodutos não-adaptativos da evolução.
O biólogo evolutivo T. Ryan Gregory tem alertado para a disseminação deste mito que, como disse, faz a alegria dos criacionistas, mas que não tem procedência histórica. Apenas no anos 90 é que a balança começou a pender realmente a favor da interpretação que o "DNA sucata" era, em sua maioria, mesmo, apenas sucata, ou seja, refugo de nosso passado evolutivo ou, pelo menos, sem relação direta com a sobrevivência dos organismos portadores, com apenas uma fração dessas regiões sendo vistas como tendo uma relevância funcional para o organismo que as carregam. Apesar desta perspectiva ser uma das mais comuns e contar com evidências e argumentos persuasivos (mas não conclusivos) em seu favor, nem por isso é unânime, e vários cientistas evolutivos defendem explicitamente que muitas dessas regiões devem ter, sim, funções importantes e têm proposto várias hipóteses para quais seriam essas funções. Essas hipóteses jamais deixaram de ser postuladas, apenas nunca ganharam amplo apoio na comunidade científica por seus proponentes não conseguiram apresentar muitas evidências que as corroborassem. Note bem, que estamos falando de explicações funcionais universais que valham para as várias criaturas que possuem enormes quantidades deste material sem função óbvia ou mesmo completamente desconhecida, e que sejam capazes de explicar a variação dessas sequências em composição e quantidade. Gregory elaborou o "teste da cebola" cujo post original foi traduzido como parte da nota [4] e serve como um alerta para explicações muitos forçadas e nos lembram que tipo de coisas uma hipótese funcional coerente deveria ser capaz de explicar.
Em seu blog, Gregory, tem reunido citações da literatura científica do período envolvendo o começo do uso da expressão “DNA sucata”, especialmente, as em que eram discutidas as possíveis funções desses trechos não codificantes, bem como as primeiras sugestões de alguns cientistas de que (grande) parte delas poderiam ser apenas resquícios de genes quebrados, inclusive de outras espécies ou formas de DNA egoístas que basicamente parasitavam nossos genomas. Mas desde o começo, mesmo os proponentes destas hipóteses jamais afirmaram peremptoriamente que não poderíamos (ou não deveríamos) achar funções mesmo dentro desse tipo de sequências presumidamente parasíticas ou comensais, simplesmente, devido a natureza oportunística da evolução biológica. Crucial aqui, também é a observação que a provável falta de relevância funcional para o organismo não quer dizer necessariamente que essas sequências não sejam importantes, seja por causa de seu efeito nocivo ao organismo ou por causa de seu eventual papel na evolução de novos genes, funcionando como fonte de matéria prima evolutiva ou indiretamente ao tornar a replicação e pareamento cromossômico menos perfeita e, desta maneira aumentando as chances de duplicação de sequências.
O geneticista Susumu Ohno foi provavelmente o primeiro a empregar o termo, “sucata” (“junk”), mas em relação ao que, hoje, chamamos de pseudogenes, como parte de seu argumento em prol da importância da duplicação gênica na evolução de novos genes e funções. Para Ohno estes eventos em sua maioria terminavam em cópias de genes defeituosas, degradadas por mutações que não eram mais capazes de serem expressos.Contudo, algumas delas, ao adquirirem novas funções ou compartilharem das funções originais com o gene copiado (no que hoje chamamos de “neofuncionaização” e “subfuncionalização”, respectivamente), seriam mantidas e permitiriam a evolução dos genomas e dos organismos. Este termo foi mais tarde expandido para descrever também as grande porções de heterocromatina, ou seja, porções de DNA que permanecem bem empacotadas, portanto, inacessíveis a transcrição, mas que não pareciam ter qualquer papel estrutural, como, em contrapartida, outras porções não-codificadoras como os centrômeros, telômeros e espaçadores.
Com o tempo a descoberta de grandes quantidades de sequências repetitivas cujas funções eram desconhecidas e que variavam bastante de indivíduo para indivíduo de uma espécie, acabou levando à ampliação do uso do termo. Particularmente importante, foram a descoberta de sequências capazes de se expandir ativamente como as LINE, as SINE (especialmente as Alu) e os transposons, também conhecidos como gene saltadores ou elementos genéticos móveis, além de sequências virais, especialmente as ERVs ('Endogenous RetroVirus'), os retrovírus endógenos.
Explicações mais genéricas para o acumulo de tanto material não codificante e não (aparentemente) relevante para o funcionamento dos organismos, tem sido propostas dentro de uma perspectiva não adaptativa, como a preferida por Ohno e que deu origem ao termo "DNA sucata". Este material simplesmente se acumularia ao longo do tempo evolutivo impulsionado por fatores estocásticos como a deriva genética aleatória, a pressão de mutação e, como resultando em duplicações de segmentos do genoma, dos quais apenas uma fração dariam origem a genes funcionas, com a maioria deles se deteriorando pelo acúmulo de mutações e pela manutenção genes cuja função havia sido perdida. Hoje sabemos que os processos de fossilização gênica, só consegue explicar uma fração das porções não codificantes e, não nos ajudam muito a compreender a redução no tamanho dos genomas que ocorrem eventualmente em muitas linhagens (para maiores detalhes veja Gregory, 1999).
Porém, outra possibilidade bastante interessante, e que é confirmada pela existência de LINEs, que encontram-se entre as sequências consideradas sucatas, mas que são, na verdade, codificantes, advém de uma compreensão estendida do processo de seleção natural. Como sabemos este mecanismo depende do sucesso reprodutivo diferencial dos indivíduos (ou grupos de) que podem ser vistos como “replicadores egoístas” (como defendido por Dawkins em seu célebre “O gene egoísta”) que alcançam esse sucesso ao influenciar as suas próprias chances de replicação. Mas isso pode ser feito não só a partir do efeito desses replicadores nos organismos como um todo, mas através da capacidade de proliferação de cópias nos próprios genomas em esses replicadores habitam, a despeito de quaisquer efeitos sobre o organismo hospedeiro (como proposto por Doolittle e Sapienza, 1980; Orgel e Crick, 1980 ambos citados por Gregory, 1999 e veja mais citações específicas aqui); e, às vezes mesmo, apesar de eventuais danos ao organismos:
"O DNA de organismos superiores normalmente se divide em duas classes, uma específica e outra comparativamente não específica. Parece plausível que a maior parte do último originou-se pela amplificação de sequências que tinham pouco ou nenhum efeito sobre o fenótipo. Examinamos essa idéia do ponto de vista da seleção natural de replicadores preferências dentro do genoma."[Orgel e Crick, 1980]
"A seleção natural operando dentro dos genomas inevitavelmente resultará no aparecimento de DNAs sem expressão fenotípica cuja única 'função' é a sobrevivência dentro dos genomas. Elementos transponíveis de procariontes, as seqüências intermediárias repetitivas dos e eucariontes podem ser vistas como tal DNAs e, portanto, nenhuma função fenotípica ou evolutiva precisam ser atribuídos a eles." [Doolittle, Sapienza, 1980]
Esta perspectiva nos faz considerar a possibilidade de conflitos entre esses parasitas intragenômicos e os organismos que os contém, além de outros conflitos em níveis diferentes da organização biológica (Gregory, 1999 e Werren, 2011). A eventual supressão da amplificação dessas sequências pode ser encarada então como parte desse conflito, impulsionada pelo efeito nocivo que o aumento exagerado de cópias poderia causar ao organismo, o que favoreceria aqueles indivíduos capazes de suprimir a replicação ou incapacitar de vez essas sequências.
Assim, o resultado desse processo de acúmulo ou não desses elementos é fruto de uma batalha contínua entre esses elementos egoísta, selecionados intragenomicamente à aumentar em número, e dos genomas dos hospedeiros, selecionados para minimizar os custos de replicação associados carregamento de uma grande bagagem genética desnecessária (veja Gregory, 1999). Esse tipo de conflito, não só entre elementos intragenômicos e seus genomas hospedeiros, ms em vários outros níveis podem ser um dos principais motores da evolução dos genomas e dos diversos níveis de individualidade.
Tanto a hipótese "DNA sucata" como a do "DNA egoísta" tem em comum o fato que o aumento dos tamanhos do genoma de uma espécie seriam um mero subproduto da acumulação persistente de DNA fenotipicamente neutros (pelo menos, em relação ao organismo) que passam a ser desvantajosos somente ao acumularem-se em demasia e começarem, assim, a interferir com a performance de seus hospedeiros. Neste caso sendo passíveis de serem negativamente selecionados, caso contrário poderiam continuar a existir sem maiores problemas (ver Gregory, 1999). Porém, existem vários estudos que apontam para uma forte correlação entre o tamanho do genoma e o volume celular que, caso seja causal, pode permitir que o conteúdo total de DNA, mas não necessariamente os detalhes de sua composição sejam modulados diretamente por seleção natural [3].
Recentemente, uma fonte adicional de confusão teve origem em grandes estudos de anotação funcional dos genomas, como o consórcio ENCODE do nosso genoma seria transcrito, estimulando alguns pesquisadores a assumirem (e declararem) que a maioria do genoma teria alguma função, mas como vimos antes, já bem conhecido que muitas das porções conhecidas - que não representam genes de proteínas ou RNAs (estruturais, catalíticos ou regulatório) e elementos estruturais essenciais – eram transcritas e, algumas delas até mesmo traduzidas, como, respectivamente, SINEs e LINEs. Sendo que os SINEs utilizam-se da enzima codificada pelos LINEs pegando carona no processo de transcrição reversa. Além disso, os baixos níveis de transcrição detectados podem sugerir que a maioria desses transcritos sejam “ruído”, não desempenhando um papel funcionalmente importante ao organismo que os carregam, sendo fruto apenas de “vazamentos” transcricionais, ou simples artefatos de uma metodologia mais nova.
Um papel evolutivo construtivo para "sucata" e "parasitas":
A evolução biológica é um processo tremendamente oportunista e o excesso de material genômico inerte ou móvel tem servido de matéria prima à evolução de novos genes, do aumento de complexidade da estrutura gênica dos eucariontes e das redes regulatórias característica dos genomas de linhagens multicelulares como as de animais e plantas. Apesar da citação anterior de Doolittle e Sapienza (1980) parecer consentir que não haveria a necessidade de postular-se explicações universais e centradas no organismo, mesmo evolutivas, elas sempre existiram[3], porém, ao mesmo tempo desde o começo parecia perfeitamente claro que, pelo menos, algumas, destas sequências "sucatas" e "parasitas" poderiam ao longo da evolução acabado por desempenhar alguma função. Orgel e Crick deixam isso bem claro, já em 1980:
"Seria surpreendente se o genoma do hospedeiro não encontrasse ocasionalmente algum uso para determinadas seqüências de DNA egoísta, especialmente se houverem muitas seqüências diferentes amplamente distribuídas ao longo dos cromossomos. Um uso óbvio ... seria para fins de controle em um nível ou outro." [Orgel e Crick, 1980, citado por Gregory aqui]
"Em nossa experiência recente a maioria das pessoas irá concordar, após a discussão, que o 'DNA ignorante', 'DNA parasitário','DNA simbiótico' (isto é, 'DNA parasita' que se tornou útil para o organismo) e 'DNA "morto"', de uma forma ou de outra, estão provavelmente todos presentes nos cromossomos de organismos superiores. Onde as pessoas diferem é nas estimativas dos seus montantes relativos. Nós sentimos que isso só pode ser decidido pelo experimento." [Orgel et al., 1980, citado por Gregory aqui]:
Hoje, parece claro, que algumas inovações evolutivas muito importantes provavelmente se devem ao recrutamento e reaproveitamento desses trechos de sucata ou dos parasitas em genomas de nossos ancestrais. Os elementos transponíveis autônomos, ou seja, aqueles que codificam suas próprias enzimas de transposição integração, como os LINEs, que são considerado sucata ou DNA egoísta, podem ligar-se, copiar-se, quebrar-se, juntar-se aos, ou degradar, ácidos nucléicos.Podendo, da mesma forma, processar ou interagir com outras proteínas (Volff, 2006). Esse repertório de atividades e, portanto, funções em potencial, de tempos em tempos, podem mostrar-se úteis às células hospedeiras. Neste caso ao conferir vantagens aos seus hospedeiros tenderiam aumentar seu sucesso reprodutivo. Os genes de elementos transponíveis que codificam enzimas como transposases, integrases, transcriptases reversas, bem como proteínas estruturais e do envelope viral parecem ter sido repetidamente recrutadas pelo genoma dos hospedeiros durante a evolução na maioria das linhagens de organismos eucariontes (Volff, 2006).
A variação no número de genes entre espécies é uma forte evidência que novos genes são gerados continuamente ao longo da evolução. Evidências têm se acumulado que esses elementos transponíveis, incluindo retrotransposons, sejam os principais mediadores de originação de novos genes. Os retrotransposons têm impulsionado a inovação genética inclusive em nossa espécie e na evolução dos primatas de maneira mais geral já que certos elementos móveis são típicos desse grupo de mamíferos. Esse processo vem ocorrendo de diversas maneiras, como (a) alteração da estrutura e/ou expressão de genes pré-existentes após a sua inserção, (b) "domesticação" de seqüências codificantes de transposons e retrotransposons pelo genoma do hospedeiro que co-opta estas proteínas para funções no próprio organismo; e, por fim, (c) através da capacidade que esses elementos têm em mediar a duplicação de genes via recombinação ectópica, transdução de seqüência e retro-transposição de genes, que inclusive pode eliminar os introns da sequência copiada (Cordaux & Batzer, 2008, Biémont, 2010 ).
Porém, um exemplo, ainda mais interessante é o possível papel de certos retrovírus endógenos que existem em nosso genoma. Em seres humanos cerca de 8% dos genomas são formados por retrovírus (retrovírus endógenos humanos, hERVs) que possivelmente se originaram a partir de infecções que teriam ocorrido mais de 25 milhões de anos atrás (Sugimoto, Schust, 2009) e outras formas de ERVs sendo originárias de infecções ainda mais ancestrais. Desde então, o hospedeiro (nossos ancestrais primatas) e os retrovírus, vem co-evoluindo com a maioria dessas sequências derivadas desses retrovírus passando a se propagar de forma mendeliana. Mas apesar da maioria das sequências hERVs estarem silenciadas, algumas delas são funcionais, com muitos dos produtos dessas sequências estando ligados a doenças humanas, enquanto outros (uma minoria, é verdade) parecem essenciais para o funcionamento de certos órgãos humanos (Sugimoto, Schust, 2009).
Há mais de 35 anos já é bem conhecida a presença desses chamados retrovírus endógenos (ERV) na placenta dos mamíferos, inclusive na dos seres humanos (hERV), apesar de ainda não compreendermos completamente o que isso significa (Harris, 1998), já temos uma razoável ideia de suas prováveis funções. As proteínas do envelope viral podem ser encontradas expressas nas membranas celulares dos citotrofoblastos o que sugere fortemente que tais proteínas virais exerçam um papel importante na fusão celular, formação dos sinciciotrofoblastos e dos demais tecidos placentário. Essas observações da presença de ERVs em tecidos placentários inicialmente feitas a partir da microscopia eletrônica, tem sido corroboradas por muitos dados moleculares obtidos na última década.
Os ERVs também estão presentes em outros tecidos animais além das placentas, em especial em células teratocarcinoma. Este fato que, em conjunto com outras observações, sugere que as capacidades de invasão de (e fusão a) outros tecidos e imunossupressão do organismo materno, possuídas pelo tecido placentário são completamente coerentes com o potencial imunossupressor dos retrovírus, desta maneira, reforçando essa ligação. Portanto, desde o começo dos anos 90 tem sido sugerido que uma infecção retroviral em linhagens germinativas de espécies de mamíferos primitivos possibilitou a evolução dos mamíferos placentários (Harris, 1991).
O fato mais importante, entretanto, é que a alegação criacionista de que a descoberta de funções naquilo que é conhecido como "DNA sucata" (que teriam sido consideradas como sem qualquer importância ou função pelos biólogos evolutivos) e que por isso refutariam a evolução biológica é simplesmente falsa. Primeiro, por que como vimos a orientação adaptacionista de muitos biólogos evolutivos fez com que esses mesmos cientistas apostassem que as regiões de função desconhecida desempenhariam papéis importantes para os organismos. Segundo, mesmo os que apostavam que a maioria desses trechos não teriam muita relevância para o funcionamento dos organismos, em um sentido mais restrito, propuseram mecanismos que produziriam, conservariam e até permitiriam o acúmulo e a amplificação dessas sequências. Terceiro, muitas das sequências não codificantes cujas funções têm sido descobertas e divulgadas (e alardeadas como refutação da evolução por criacionistas), nem envolviam regiões do “DNA sucata” e as poucas atribuíveis aos pseudogenes, transposons e retrotransposons, constituem-se apenas em uma fração do total desses elementos defeituosos ou ativos, cuja grande maioria não estão envolvidos com o controle de processos importantes ao organismo. Quarto, a suposta previsão criacionista (e seu falso contraste com a da biologia evolutiva) seria irrelevante, mesmo que real, pois não se originaram de deduções explícitas de um modelo sobre o modus operandi ou dos objetivos do suposto Designer, sendo apenas uma tentativa patética de parecer que os teóricos do DI enveredam-se em pesquisa científica real de seu modelo [5]. O que os criacionistas fizeram foi apenas um golpe de marketing, contando com a falta de memória de alguns cientistas e esperando que as pessoas não fossem investigar a história do "DNA sucata".
Infelizmente, a expressão "DNA sucata" parece trazer mais confusão do que esclarecimento e a certa displicência com que alguns pesquisadores e jornalistas a tratam, ignorando a história do termo e das porções do genoma consideradas como "sucata", acaba por tornar tal expressão presa fácil da retórica dos criacionistas que, diferentemente dos cientistas sérios, não têm qualquer compromisso com a verdade e a precisão dos fatos. T. Ryan Gregory, por exemplo, tem preferido usar o termo "DNA não codificante", mas esse termo, como já comentei, também não me parece muito preciso já que seria necessário acrescentar a expressão "de função desconhecida" ou "provavelmente sem função", já que vários trechos não codificantes, há muito tempo, tem seus papéis muito bem conhecidos. Ainda assim, a adoção dessa expressão, excluiria vários elementos como os LINE que de fato codificam suas próprias enzimas transcriptases reversas, por exemplo, sendo, portanto, genes em um sentido bem tradicional, ainda que não exerçam, na imensa maioria dos casos, qualquer função importante para o funcionamento dos organismos que os carregam.
Porém, o fato de boa parte dessas extensas regiões genômicas serem formadas de elementos genéticos móveis, isto é basicamente formas de “DNA egoísta” (ou [ex]parasitas intra-genômicos) defeituosos (essa é a palavra importante aqui) sugere fortemente que realmente muitas dessas sequências sejam simples sucata ou lixo na grande maioria das acepções dessas duas palavras, mas isso não quer dizer que ainda não possamos descobrir coisas muito interessantes sobre essas regiões ou que elas não possam desempenhar um papel na evolução dos seres vivos, como ocorreu com várias outras.
_______________________________________
Notas:
[1]Neste artigo adoto a expressão "DNA sucata" como tradução de "JunkDNA", mesmo reconhecendo que "DNA lixo" parece ser bem mais comum. Mas o termo sucata parece fazer mais jus aos objetivos originais de Ohno e são mais coerentes com o fato que mesmo sucata pode ser funcional e importante para quem a possui. Esta adoção é reflexo de certos pontos de vistas defendidos por Commins (1972, citado por Gregory, 2007) que afirmava, "Ser lixo não significa que seja totalmente inútil. O senso comum sugere que qualquer coisa que é completamente inútil seria descartado" parece ser o que o famoso biólogo molecular Sydney Brenner queria dizer com a distinção entre "lixo" ou "porcaria", que se joga fora, e "sucata", que se mantém (1998, parafraseado por Gregory, 2007). De qualquer forma considero que a expressão é ainda assim longe do ideal [Para uma opinião oposta veja o artigo de Moran aqui].
[2] É preciso enfatizar que ao me referir as sequências como sem função, faço isso no sentido de sem função para o organismo, o que não quer dizer que tais sequências mesmo as não expressas e sem função estrutural não possam ser importantes em contexto mais amplo, ao desempenharem um papel na evolução dos organismos, mas acentuando o fato que essas sequências não teria surgido para isso, sendo subprodutos de outros processos como o acumulo de material genético defeituoso por deriva genética de pseudogenes, replicação ativa de elementos genéticos móveis autônomos e não-autônomos e a inibição de sua amplificação como resposta secundária dos organismos. Além disso, como explicado em outra nota mesmo que cada tipo de sequência não tenha uma função organísmica direta, o conteúdo total dessas sequências pode realmente ter uma importância mais direta, mesmo que não universal, e só em algumas linhagens.
[3] É importante lembrarmos àqueles que se queixam da possibilidade de funções as vastas quantidades de DNA não codificante contidas no meio do “DNA sucata” haviam sido negligência , como enfatiza Gregory (2007), simplesmente, devem estar lendo a literatura científica errada, se é que a leram. Uma das possibilidades de função global para o DNA sucata sugeridas por alguns cientistas seria que essas extensas regiões do genoma teriam um papel na proteção contra mutações, Essas vastas regiões sem genes e sem sequências regulatórias importantes poderiam servir de alvo para mutações por agentes com radiação UV, Ionizante e outros mutagênicos, protegendo assim os genes dispersos e fragmentados típicos dos eucariontes. Isso faria com que a chance de um gene ou sequência funcionalmente importante fosse atingida diminuísse bastante, ao diluí-la em um mar de elementos não-funcionais ou de funções não-essenciais. Outra possibilidade seria que a grande maioria deste material genético "órfão" funcionasse como estofamento, preenchendo volume, podendo variar de sequência livremente e de tamanho dentro de certos limites, mas servindo como elementos de coesão do genoma. Ambas as alternativas são interessantes, mas não conseguem explicar a s gigantescas variações dos tamanhos de genoma em outras espécies como o 'Fugu' (baiacu) que possuem aproximadamente o mesmo número de genes que o nosso genoma, mas 10 vezes menos DNA, com introns super-pequenos, regiões intergênicas também muito reduzidas se comparadas as nossas, e muito menos sequências repetitivas e elementos genéticos móveis.
Entre outras funções postuladas por biólogos para os grandes trechos de DNA não codificantes, além das duas apresentadas acima, estariam a proteção contra retrovírus; tamponamento das flutuações nas concentrações intracelulares de solutos; servir como sítios de ligação para moléculas regulatórias (que hoje sabemos que corresponde a uma fração pequena dessas sequências), facilitação da recombinação; inibição da recombinação; influenciar a expressão gênica; aumentar a flexibilidade evolutiva; manutenção da estrutura e do comportamento dos cromossomos; coordenação da função do genoma; e fornecimento de várias cópias de genes que seriam recrutados quando necessário.
Essas explicações também não parecem ir muito bem no famoso "teste da cebola" [4] proposto por T. Ryan Gregory. O genoma do baiacu é um exemplo de genoma, bem enxuto, cuja redução talvez possa ser melhor explicada pelo aumento da eficiência da seleção natural por causa das grandes populações dessas criaturas que assim conseguiria purgar os genomas já que os genomas mais enxutos seriam menos debilitados pelo grande número de sequências parasitas.
________________________________________
[4] Segue a tradução do "Teste da Cebola":
O Teste da Cebola
Por T. Ryan Gregory, em 25 de Abril de 2007
[Traduzido por Rodrigo Véras]
Eu não sei por certo o quão oficial seria isso, mas aqui está um termo que eu gostaria de cunhar aqui no meu blog: “O teste da cebola”.
O teste da cebola é um simples ato de verificação de realidade para qualquer um que pense ter chegado a uma explicação funcional para o DNA não codificante1. Qualquer seja sua função proposta, pergunte a si mesmo: Posso eu explicar por que a cebola precisa de cinco vezes mais DNA não codificante para essa função dos um ser humano?
A cebola, Allium cepa, é uma planta diplóide (2n = 16) com um genoma haplóide com cerca de 17 bilhões de bases. Os seres humanos, Homo sapiens, é um animal diplóide (2n = 46) com um genoma haplóide com cerca de 3 bilhões de bases. Essa comparação foi escolhida de forma mais ou menos arbitrária (existem genomas maiores que o da cebola, e muito menores do que o de seres humanos), mas torna claro o problema da função universal2.
Além disso, se vc pensar que talvez a cebola seja especial de algum jeito, considere que entre os membros do gênero Allium variam em termos do tamanho dos genomas entre 7 a 31,5 bilhões de bases. Então, por que A. altyncolicum se mantém com um quinto da regulação, manutenção estrutural, proteção contra agentes mutagênicos, ou [insira sua função universal preferida] que A. ursinum?
Esquerda, A. altyncolicum (7 Gbases); centro, A. cepa (17 Gbases); direito, A. ursinum (31,5 Gbases).
Aí você tem. O teste da cebola. A ser aplicado a todas as reivindicações ambiciosas que uma função universal foi encontrada para DNA não codificante.
____________
1 Eu não endosso o uso do termo "DNA lixo", que eu penso ter desviado demasiado de seu significado original e agora é pouco mais do que um chavão carregado, o termo descritivo "DNA não codificantes" é o que eu uso para se referir à maioria das seqüências eucarióticas (de vários tipos) que não codificam produtos protéicos.
2 Alguns DNAs não codificantes certamente têm uma função ao nível do organismo, mas isso não justifica um salto enorme de "este pedacinho de DNA não codificante [geralmente menos de 5% do genoma] é funcional" para "ergo, todo o DNA não codificante é funcional ".
________________________________________
[5] Esse é outro problema com os adeptos do criacionismo do Design Inteligente, pois eles não podem simplesmente ampliar em demasiado o que eles podem considerar como "função". Por exemplo, aos criacionistas é vedada considerar como parte de sua previsão as funções de "replicação egoísta"dos elementos genéticos móveis, especialmente o seu papel ao gerarem certos tipos de mutações complexas, e servirem de material para a formação de novos genes e circuitos de regulação gênica, já que desempenhariam uma "função" evolutiva, em um sentido mais amplo. O papel desses elementos na evolução de novos genes é bem conhecido e vem sendo cada vez mais investigado como já discutimos em artigo anterior sobre a origem de nova informação genética. Essas explicações mesmo que não sejam universais e sirvam apenas para parte do material que é considerado parte do DNA sucata só estão disponíveis aos biólogos evolutivos, que por sinal, ainda contam em seu repertório com explicações baseadas em outros fatores evolutivos, como os efeitos da deriva genética aleatória, associada a diminuição dos tamanhos populacionais e maior possibilidade de acumulo de variações neutras e ligeiramente deletérias.
Literatura Recomendada:
Biémont C. A brief history of the status of transposable elements: from junk DNA to major players in evolution. Genetics. 2010 Dec;186(4):1085-93. PubMed PMID: 21156958; PubMed Central PMCID: PMC2998295.
Cordaux R. & Batzer M.A. (2008) Evolutionary emergence of genes through retrotransposition. In Encyclopedia of Life Sciences: Handbook of Human Molecular Evolution, Volume 2, D.N. Cooper & H. Kehrer-Sawatzki Eds. John Wiley & Sons Ltd., Chichester, UK, pp. 996-1003. [pdf]
Carnell AN, Goodman JI. The long (LINEs) and the short (SINEs) of it: altered methylation as a precursor to toxicity. Toxicol Sci. 2003 Oct;75(2):229-35. Epub 2003 May 28. Review. PubMed PMID: 12773759.
Doolittle WF, Sapienza C. Selfish genes, the phenotype paradigm and genome evolution. Nature. 1980 Apr 17;284(5757):601-3. PubMed PMID: 6245369.
Gerstein, M.B., Bruce, C., Rozowsky, J.S., Zheng, D., Du, J., Korbel, J.O., Emanuelsson, O., Zhang, Z.D., Weissman, S. and Snyder, M. (2007) What is a gene, post-ENCODE? History and updated definition. Genome Res. 17:669-681.
Gregory TR, Hebert PD. The modulation of DNA content: proximate causes and ultimate consequences. Genome Res. 1999 Apr;9(4):317-24. Review. PubMed PMID: 10207154.
Gregory, T. Ryan A word about "junk DNA" Genomicron publicado online em 11 de april, 2007.
Harris JR. The evolution of placental mammals. FEBS Lett. 1991 Dec 16;295(1-3):3-4. Review. PubMed PMID: 1765162.
Harris JR. Placental endogenous retrovirus (ERV): structural, functional, and evolutionary significance. Bioessays. 1998 Apr;20(4):307-16. Review. PubMed PMID: 9619102.
Myers, P.Z. (2008) Random Acts of Evolution SEEDMAGAZINE.COM May 30, 2008Acessado em 7 de Dezembro de 2011.
Orgel LE, Crick FH. Selfish DNA: the ultimate parasite. Nature. 1980 Apr 17;284(5757):604-7. PubMed PMID: 7366731.
Sugimoto J, Schust DJ. Review: human endogenous retroviruses and the placenta. Reprod Sci. 2009 Nov;16(11):1023-33. Epub 2009 May 27. PubMed PMID: 19474286.
Weiner AM. SINEs and LINEs: the art of biting the hand that feeds you. Curr Opin Cell Biol. 2002 Jun;14(3):343-50. Review. PubMed PMID: 12067657.
Werren JH. Selfish genetic elements, genetic conflict, and evolutionary innovation. Proc Natl Acad Sci U S A. 2011 Jun 28;108 Suppl 2:10863-70. Epub 2011 Jun 20. Review. PubMed PMID: 21690392; PubMed Central PMCID: PMC3131821.
Volff, Jean-Nicolas The compact pufferfish genome Genome Biology 2002, 3:reports0059 doi:10.1186/gb-2002-3-11-reports0059
Volff JN. Turning junk into gold: domestication of transposable elements and the creation of new genes in eukaryotes. Bioessays. 2006 Sep;28(9):913-22. Review. PubMed PMID: 16937363.
Créditos das Figuras:
Credit: GUNILLA ELAM/SCIENCE PHOTO LIBRARY
Credit: ART FOR SCIENCE/SCIENCE PHOTO LIBRARY
Credit: PASIEKA/SCIENCE PHOTO LIBRARY
Credit: FRANCIS LEROY, BIOCOSMOS/SCIENCE PHOTO LIBRARY
Credit: NICK SINCLAIR/SCIENCE PHOTO LIBRARY
Credit: LAGUNA DESIGN/SCIENCE PHOTO LIBRARY
Credit: EQUINOX GRAPHICS/SCIENCE PHOTO LIBRARY
Credit: LAGUNA DESIGN/SCIENCE PHOTO LIBRARY
Credit: EQUINOX GRAPHICS/SCIENCE PHOTO LIBRARY
Credit: STEVE GSCHMEISSNER/SCIENCE PHOTO LIBRARY
Credit:http://en.wikipedia.org/wiki/File:Susumu_Ohno.png - Fonte:http://whozoo.org/mac/Music/Ohno_Obit.pdf[Autor: M. A. Clark]