Genes novos do zero?
A origem de novo de novos genes codificadores de proteínas, isto é, a origem através de segmentos de DNA não-codificantes, é considerada uma ocorrência muito rara nos genomas. Caso perguntarmos “De onde a maioria dos novos genes surgem?”, ouvíramos da imensa maioria dos pesquisadores a resposta: “De outros genes, ué!”, como Guerzoni e McLysaght (2011) afirmam em edição recente da revista PLoS Genetics.
A duplicação gênica ainda é considerada a fonte principal de novos loci nos genomas dos eucariontes, com esse processo podendo ocorrer de diversas formas, como o embaralhamento de éxons ('exon shuffling'); duplicação em tandem - isto é, de segmento contíguos - ou de porções cromossômicas maiores, como resultado de crossing overs desiguais ou deslises da enzima DNA polimerase (e dos erros de reparo que se sucedem a isso); retro-cópia intermediada por ação de retrotransposons; além da duplicação de cromossomos e genomas inteiros e da fusão e fissão de genes. Nos últimos anos, contudo, os pesquisadores têm reconhecido que a possibilidade de origem de novo - em que os genes se originam “a partir do zero” (de novo) – , antes tida como desprezível, é, apesar de rara, completamente consistente como forma de evolução de novos genes nos genomas eucarióticos. Vários trabalhos recentes vêm identificando vários genes originados a partir do zero e não da duplicação de outros genes ou domínios de outros genes pré-existentes, em Drosophila, arroz, camundongos, primatas, seres humanos e em eucariontes unicelulares, como leveduras e parasitas do gênero Plasmodium, o que sugere que basta que haja um certo esforço de pesquisa, para que novos genes candidatos desse tipo seja encontrados.
Os comentários e a revisão de Guerzoni e McLysaght (2011), encontram-se na mesma edição da PLoS Genetics em que Wu e colaboradores (2011) relatam a identificação de 60 genes presumidamente “originados a partir do zero” (de novo) específicos de seres humanos, superando muito as estimativas anteriores, assumidamente conservadoras, de que haveriam apenas 18 genes deste tipo em nosso genoma.
Os autores do estudo identificaram esses 60 novos genes codificadores de proteínas que supostamente haveriam se originaram de novo na linhagem humana desde a divergência da nossa linhagem das dos chimpanzés, cuja funcionalidade é apoiada por evidências tanto transcricionais como proteômicas. Estudos de expressão dos RNAs mostram que que estes genes têm os seus níveis de maior expressão no córtex cerebral e nos testículos, sugerindo, assim, que pelo menos alguns deles contribuam para o desenvolvimento de certas características fenotípicas, possivelmente, únicas de nós, seres humanos, tais como nossa maior capacidade cognitiva.
Os autores, a partir desse estudo, defendem que seus resultados seriam inconsistentes com a visão tradicional de que o de origem de novo de genes novos seria muito rara, clamando que se dê maior atenção e importância para este tipo de processos de originação de novos genes.
Guerzoni e McLysaght (2011) enfatizam que os genes identificados compartilham características amplas com outros genes relatados como tendo se originado de novo, ou seja, são pequenos, e todos, como exceção de um, são compostos de um único exon, ou seja, apenas um segmento codificante. Esta simplicidade ajuda a concebermos sua evolução a partir do zero (isto é, de trechos não codificantes) como sendo plausível. Mas a evolução potencial de características mais complexas, tais como processamento de introns (o splicing) e a existência de múltiplos domínios codificantes de proteínas, a partir de processos de novo, permanecem ainda um tanto enigmáticos. Mas, os mesmo autores afirmam que, apesar disso, características como proto-processamento ('proto-splice') de sítios específicos podem pré-datar a origem de genes novos, bem como o aparecimento de domínios codificadores de proteínas por evolução convergente pode ser bem mais provável do que se pensava.
Cabe aqui a ressalva que os critérios operacionais para definir um gene originado de novo empregados por por Wu et al. (2011) são mais brandos do que os adotados em outros estudos, o que pode explicar, em parte, o número relativamente elevado de genes deste tipo identificados no novo estudo. De fato, alguns destes casos podem ser simplesmente extensões, específicas de seres humano, de genes pré-existentes, ao invés de genes inteiramente gerados de novo. Algo por isso só muito interessante, mas ainda assim um fenômeno distinto.
O problema da definição não é trivial e impõe limitações a identificação de novos genes que tenham se originado a partir do zero. O procedimento mais comum se dá através de uma busca por sequências similares, em organismos próximos, e caso não sejam encontrados quaisquer homólogos plausíveis, isso pode sugerir que a novo gene se originou de novo. Porém, antes que se possa afirmar isso com mais confiança, é preciso excluir a hipótese alternativa de que tenha ocorrido uma perda recente na linhagem irmã, assim como a possibilidade que o gene candidato tenha como homólogos genes em rápida evolução que tenham divergido tanto que sejam dificilmente reconhecidos como tais.
A estratégia utilizada por Wu e colaboradores (2011) foi similar a desenvolvida em um artigo de um dos autores da revisão/comentário (McLysaght) para pesquisa de novos loci candidatos dentro do genoma humano. Este método busca por evidências positivas da ausência do gene candidato em outras linhagens de primatas, de modo que possa ser mostrado que o candidato não é um gene que divergiu para além da nossa capacidade de reconhecimento de seus homólogos, e também que não é, simplesmente, um gene que tenha sido, recentemente, perdido em linhagens irmãs. Isso é feito ao ser inferir que a sequência supostamente ancestral possuía algum tipo de problema ou incapacitação, ou seja, são buscadas evidências que o segmento equivalente em outros organismos não pudesse codificar os genes sem algum tipo de mudança que pode ser apenas identificada na linhagem que possui o gene (veja o exemplo da figura abaixo).
Na figura acima encontra-se um exemplo hipotético em que uma nova ORF (open reading frame) humana foi criada por uma deleção humano-específica. A deleção de um nucleotídeo desloca um códon de parada a jusante (sequência abaixo) fora do quadro de leitura e como a deleção não é compartilhada por outros primatas, a sequência ancestral é inferida como carregando a parada no quadro leitura original, o que impediria a sua transcrição. A autenticidade do novo gene humano pode, então, ser confirmada pelas evidências de transcrição e tradução.
Porém este procedimento tem uma limitação importante já que ele se baseia em listas de genes existentes que foram anotados através de critérios que normalmente incluem a presença de um homólogo em outros genomas. Porém, novos genes, por definição, não cumprem este quesito e a anotação, ou seja as informações a eles atribuídas e registradas, não são geralmente confiáveis. Dos sessenta genes presumidamente originados de novo, apenas seis deles parecem ser razoavelmente anotados em bases de dados relevantes.
Novos estudos devem esclarecer esta questão e nos revelar um quadro mais completo do processo de origem e evolução de novos genes e do papel da origem de novo para os mesmos.
Literatura Recomendada:
Guerzoni D, & McLysaght A (2011). De novo origins of human genes. PLoS genetics, 7 (11) PMID: 22102832
Wu DD, Irwin DM, & Zhang YP (2011). De novo origin of human protein-coding genes. PLoS genetics, 7 (11) PMID: 22102831
Créditos das figuras:
LAGUNA DESIGN/SCIENCE PHOTO LIBRARY
POLYMINE ANIMATIONCO./SCIENCE PHOTO LIBRARY
LAGUNA DESIGN/SCIENCE PHOTO LIBRARY