Genes que fazem amizade fácil!

Certas pessoas parecem ser o centro em que orbitam muitos outros indivíduos, funcionando como hubs de uma vasta rede de conexões e contatos sociais (Não! Decidamente, não sou uma delas). Quem sabe, por sua abertura ao diálogo, gostos variados e uma incrível paciência como os outros, estas pessoas conseguem interagir com uma gama muito variada de personalidades. Alguns desses indivíduos talvez mesmo nem freqüentassem os mesmos locais, mas graças aos "hubs sociais" acabam por estarem indiretamente conectados. Um indivíduo assim, certamente, tem uma relevância grande para a compreensão das redes sociais e da própria dinâmica colaborativa humana. Nos ajudando mesmo a compreendermos a evolução cultural de nossa própria espécie.
Porém, não é sobre isso o assunto deste post. Aqui o interesse são os bons e velhos genes e seus produtos primários principais, as proteínas. A semelhança de pessoas, genes e proteínas também formam complicadas redes de interação que têm sido alvo de cada vez maior atenção dos cientistas.
Na cola dos projetos genoma, genoma funcional e transcriptoma (que buscavam já entender as funções do amplo repertório de genes ao estudar sua expressão diferencial em várias situações e a companhia em que seus produtos, como mRNAs, se encontravam) surgiram vários projetos que procuram elucidar a dinâmica de interação direta ou indireta dos produtos gênicos. Essas redes podem ter propriedades muito semelhantes as de redes sociais e é aí que está a analogia. Entender como estes complexos sistemas e subsistemas imbricados de organização modular funcionam, inclusive ao analisar as similaridades e diferenças que aproximam e diferenciam os vários tipos de redes, são muito importantes para o entendimento da evolução biológica em seu nível intra-celular*.
Por um lado complicando, mas por outro ajudando a elucidar a questão, além da origem in locu dos genes que compõem as redes e módulos de interação (por exemplo surgindo de duplicação gênica e por mutações em regiões cis-regulatórias), novos genes podem ser adquiridos completos através de um processo chamado de transferência lateral de genes (TLG), fenômeno particularmente importante em microorganismos unicelulares, principalmente, bactérias.
A aquisição lateral de genes é um fator importante na evolução dos genomas microbianos. Questões de amplo interesse escondem-se por trás deste processo, como a aquisição e transferência de resistência à antimicrobianos, o que serve como um lembrete sobre a importância da biologia evolutiva que nos força a reconhecer que a evolução biológica é algo que nos impacta diretamente e, portanto, deve ser sempre levada a sério. A evolução, portanto, não é apenas algo de (remoto) interesse acadêmico ou uma constatação da miríade de mecanismos e processos naturais que nos fascinam, mas é a base de toda a biologia moderna e precisa ser reconhecida como tal.
Porém como em qualquer campo científico saudável e em pleno desenvolvimento, existem muitas questões que ainda não compreendemos e até algumas que podemos ter compreendido da forma errada. Por exemplo, no caso de genes adquiridos por transferência lateral, para que possam ser fixados (e co-evoluir com resto do genes e do organismo como um todo), estes genes exógenos precisam ser integrados aos genomas dos organismos receptores. Os fragmentos de DNA que correspondem a estes genes e seus produtos precisam funcionar em concordância com os diferentes componentes que formam os módulos genéticos do organismo que passou a hospedá-los. Isso, a principio, representa um grande desafio evolutivo, principalmente, por que estes genes novos evoluíram sob restrições funcionais típicas de outras espécies, às vezes muito diferentes da atual espécie, ou seja, é como se eles tivessem caído de paraquedas neles.
Voltando à analogia com os indivíduos que funcionam como hubs sociais e comparando-os com pessoas mais “comuns”, o que poderíamos esperar de cada tipo de indivíduo caso este tivesse que se mudar para um ambiente completamente diferente sem aviso prévio. Claro, por causa das faculdades intelectuais humanas a analogia aqui parece um tanto forçada, já que esperaríamos tipos de obstáculos (e possibilidades de soluções) bem diferentes em cada caso. Porém, em um nível mais abstrato, podemos imaginar que essas mais pessoas populares teriam certas características e habilidade que as tornassem (em média) mais propensas a formar contatos e estabelecer relações. É aqui que a analogia parece se quebrar. O consenso em relação a situação análoga em evolução de redes genéticas e protéicas parece levar à conclusões diferentes. Genes que na espécie pré-transferência faziam parte de módulos complexos não deveriam ser capazes de manter a sua funcionalidade quando transferidos isoladamente para novas espécies. Desta maneira, é amplamente aceito que a transferência lateral de genes deve favorecer proteínas com apenas algumas interações proteína-proteína, o que parece (pelo menos na minha opinião) destoar da situação envolvendo seres humanos. Porém, talvez a analogia não seja tão inapropriada assim, ainda que deva sempre inspirar certos cuidados.
A propensão de proteínas para participar de interações protéicas pode ser avaliada através de métodos computacionais que identificam sítios de interação da proteína putativa. Os chamados interatomas são as grandes redes através das quais os produtos protéicos dos genes, as proteínas, se co-modulam ao interagir de forma direta através de seus domínios de contato. Interações fracas, como as forças de van der Waals, interações eletrostáticas, ligações de hidrogênio, interações hidrofóbicas e a complementaridade geométrica permitem que proteínas formem complexos temporários essenciais na sinalização e comunicação intra-celular e célula-célula.
Além do interatoma, o metaboloma - a rede de interação em que estão envolvidas pequenas moléculas (como metabólitos e segundos mensageiros, portanto que intermedeiam a interação indireta entre os produtos gênicos) - é a outra parte da rede de conexões responsável da miríade de processos biológicos por trás do funcionamento de uma célula.
Gophna e Ofran (2011) relatam que as proteínas adquiridas putativamente (i.e. consideradas como) por transferência lateral contém muito mais sítios de interação do que as proteínas nativas, o que indicaria que genes que codificam proteínas com múltiplas interações proteína-proteína poderiam, de fato, ser mais propensos a serem bem sucedidamente transferidos do que genes com poucas interações:
A sugestão por parte dos autores do artigo, portanto é que “... essas proteínas [as que interagiam com múltiplas proteínas na espécie nas quais se originou e que possuem muitos domínios de interação] têm uma maior chance de formar novas interações em novas espécies, assim, integrando-se aos módulos existentes". Como os próprios autores afirma em seu resumo, “Estes resultados revelam princípios básicos para a incorporação de novos genes em sistemas existentes."
“Lateral acquisition of genes is affected by the friendliness of their products” foi publicado no final de 2010 na conhecida e respeitada PNAS e, como o título deixa claro, reúne argumentos e apresenta resultados que sugerem que um excesso de conectividade, ao contrário do que se costuma imaginar, parece favorecer os genes lateralmente transferidos em seus novos lares aumentando a chance que se integrem em alguma das diversas redes de interação ali existentes, tornando-os mais bem sucedidos em integrar-se ao novo genoma.
Como vimos, a transferência de um único gene apresenta um enigma evolutivo. Desta forma, imagina-se que os genes com menos interações são mais susceptíveis de serem transferidos para (e mantidos) em uma espécie nova. Esse postulado é conhecido como a hipótese de complexidade. O que ocorre é que genes que pertencem a um módulo complexo podem não ser funcionais quando transferidos isoladamente para uma nova espécie.
Estudos sobre a importância da interação proteína-proteína (PPI - protein-protein interaction) oferecem realmente algum apoio para o racional usado como base da hipótese de complexidade . Os autores do artigo ressaltam que tem sido demonstrado que as proteínas codificadas por genes que têm sido mais freqüentemente transferidas durante a evolução tendem a fazer menos interações do que outras proteínas (5).
Contudo, como chamam a atenção Gophna e Ofran, as evidências utilizadas em suporte a hipótese da complexidade baseia-se na análise das PPIs dos genes transferidos dentro de suas espécies atuais, ou seja, pós-transferência, mas não a partir do número de PPI no organismo doador, pré-transferência. Poucas PPIs atualmente pode implicar, realmente, um número pequeno de PPI no hospedeiro original (o que corroboraria a hipótese de que proteínas com muitas interações são menos propensos a ser transferidos e acumuladas), mas, alternativamente, este mesmo resultado pode apenas sugerir que genes adquiridos por TLG tiveram menos tempo para desenvolver as interações com as proteínas em seu novo hospedeiro em comparação com aqueles verticalmente adquiridos, via descendência direta. Assim, essa análise pós-transferência não fornecem evidências conclusivas quanto à relação entre o PPI e TLG.
Avaliar sistematicamente as rede PPI pré-transferência não parece ser uma possibilidade factível, pelo menos, na imensa maioria dos casos, já que, em geral, não há registros claros de que espécie seria a hospedeira original, e muito menos dados realmente abrangentes para as redes PPI.
Porém é possível driblar esta situação, através do número de supostos sítios de ligação protéicos existentes na superfície de uma proteína. Proteínas com mais sítios de ligação tendem a interagir com mais proteínas (ou seja, têm um grau maior de nós nas redes PPI). Esta idéia baseia-se no fato que tem sido evidenciado de que os resíduos que fazem parte de supostas regiões de ligação às proteínas podem ser identificados a priori através da estrutura e até mesmo da seqüência. [Aqui a bioinformática, através da análise e alinhamento múltiplo e comparação de seqüencias e a bioinformática estrutural ocupam um papel central.] Desta forma, é possível avaliar o potencial de interação de uma proteína, ou melhor dizendo de “grudabilidade”, diretamente, através de sua seqüência de aminoácidos.
É exatamente isso que os autores deste trabalho fazem ao se utilizarem dos “potenciais de interação”, na tentativa de descobrir a capacidade de interação real, ou "amistosidade" ou “carisma”, de genes lateralmente adquiridos:
Estes resultados indicam que o ISIS-RIP previsto de uma proteína pode ser visto como uma medida de rigidez da proteína, ou simpatia. Esta medida é mais elevado para proteínas com um número maior de parceiros de interação.
A relação entre as previsões para o potencial de interação relativa (RIP) de uma proteína e do número de proteínas com o qual a proteína que interage podem ser vistos na figura acima e a direita. O RIP de uma proteína representa a porcentagem de seus resíduos que são previstas para ser sítios de interação, e é definida pela equação:

onde NPP é o número de resíduos previstos para ser parte de um sítio PPI e L é o comprimento da proteína.
O estudo das superfícies de interação das proteínas e de suas seqüencias através de uma série de ferramentas que analisam as propriedades comuns de complexos protéicos conhecidos e disponibilizados em grandes bancos de dados tem permitido prever generalizar os principais resíduos envolvidos nas PPIs. Muitos programas utilizando-se de redes neurais e sistemas de aprendizado de máquina, como o ISIS usado neste artigo permitem este tipo de estudo.
O ISIS é uma ferramenta que anota os resíduos que supostamente ligam outras proteínas para cada seqüência da proteína. O método foi desenvolvido usando-se interfaces de complexos temporários proteína-proteína conhecidas experimentalmente cujas estruturas 3D já haviam sido resolvidas pro métodos como difração de raio-X e NMR, mas, apesar disso, as informações 3D não são explicitamente utilizadas. As características estruturais previstas são combinadas com informações evolutivas.
Este programa compara para cada resíduo de aminoácido as características físico-químicas em seu ambiente, suas características estruturais preditas (acessibilidade ao solvente, estrutura secundária da proteína etc) e seu perfil evolutivo, com os de resíduos localizados em sítios PPI já bem conhecidos. Assim, o ISIS determina se um determinado resíduo é um sítio PPI em potencial. As melhores previsões utilizando-se deste método atingiu mais 90% de precisão em um experimento de validação cruzada. A partir desses resultados, os autores da suíte computacional concluem que apesar da grande diversidade na natureza das interações proteína-proteína, todos eles compartilham princípios básicos comuns e que esses princípios são identificáveis a partir da seqüência sozinho.
Em artigos publicados nos periódicos Bioinfomatics e Plos Computational biology o sistema foi testado e validado. A robustez estatística e a falta de viés (em relação as proteínas de uma determinada espécie, reino ou localização subcelular) do ISIS foi validada através de análise em grande escala. As figuras ao lado a direita e acima esquerda retiradas ilustram as superfícies de interação putativas e o funcionamento e eficácia do ISIS em resgatar os resíduos que são parte delas.
Após estabelecer que os RPIs são bons indicadores para os PPIs, Gophna e Ofran, passaram a investigar a correlação entre o genes mais comumente lateralmente transferidos e a RPI. Para tanto, os autores utilizaram-se do chamado PDS (philogenetic discordance sequence) um índice que a grosso modo mede o quão discordante é a proteína em relação ao resto das proteínas presentes no genoma. Esta métrica parte do princípio que quanto menor o número de proteínas homólogas, em uma dada proteína em um dado genoma, maior a chance dela ter se originado por transferência lateral de um outro genoma de um outro organismo. Os resultados são dispostos na figura logo abaixo.
A interpretação mais direta dos resultado parece, contudo, corroborar a hipótese da complexidade pois os genes que alcança m escores PDS mais altos parecem ser aqueles menos frequentemente transferidos. Isto é, proteínas que são menos afetadas por TLG possuem seqüencias com RPIs maiores, portanto, tem maior “amistosidade” ou “adesividade”. Maior do que as das seqüencias mais afetadas pela transferência lateral.
Contudo, devemos lembrar que estes resultados ainda dizem respeito às proteínas que possivelmente sofreram TLG e já estão em seus novos hospedeiros (pós-transferência). Ainda é preciso acessar este “potencial de amistosidade” em seqüencias antes delas serem transferidas. É importante termos este tipo de cuidado por que uma das possibilidades é que após a transferência, como nem todas as superfícies putativas de interação se ajustam ao novo interatoma, muitas delas acabam sucumbindo a "erosão mutacional". Sem as restrições evolutivas associadas Porém, como avaliar o RPI em proteínas antes que elas tenham sido transferidas?
Aqui entra a inventividade dos autores. Em ciência é importante saber o que comparar e quando essa comparação não for possível, descobrir algo que possa servir de substituto e possa ser alvo de contraste.
Duas foram as estratégias que os autores lançaram mão para resolver esse problema. A primeira envolveu organizar os dados e efetuar as comparações levando-se em conta o tempo que os eventos de transferência deveriam ter ocorrido. Ao dividir as seqüencias em adquiridas recentemente, mais antigamente e não adquiridas via TLG foi possível verificar que as seqüencias recentemente transferidas -àquelas que não teriam tido tempo de acumular mutações que erodiriam as superfícies putativas de interação proteína-proteína - apresentavam maiores valores de RPI.
As comparações obviamente tiveram que ser controladas para o tamanho das seqüencias já que, de um lado, a maioria dos genes que acreditamos terem sofrido TLG têm tamanho menor e, por outro lado, seqüencias muito curtas sucumbiriam rapidamente a erosão mutacional.
A outra estratégia foi procurar genes homólogos aos transferidos em outras bactérias distantemente aparentadas a Escherichia coli, a espécie utilizada no estudo, e comparar os RPIs destes outros microorganismos (do grupo de ortólogos) com os das proteínas equivalentes em E. coli.
O resultado mais interessante é que 9 entre 10 das proteínas testadas possuem superfícies PPIs significativamente menores em E. coli do que o esperado para aquela família de genes, como fica claro pela comparação com outras bactérias (veja a figura abaixo). Além disso, ao se alinharem as seqüencias, as regiões e o número de resíduos potencialmente associados as PPIs, ou seja que participam em interações entre proteínas, são menores (e contam com menos resíduos) em E. coli, o que fica evidente quando as mesmas porções em outras bactérias (veja a figura abaixo e a direita com as seqüencias de E. coli grafadas em vermelho).

Este tipo de análise nos permite, através de um substituto muito plausível, avaliar o estado dos genes que sofreram a TGL em sua condição pré-transferência.
As evidências apresentadas no estudo, portanto, sugerem que - quando controlamos para o tamanho das seqüencias, a idade dos supostos eventos de TGL e seu estado putativo pré-transferência- genes com RPIs altos são os mais propensos a integrarem-se em outros genomas por TGL, mesmo que ao longo do tempo percam muito de seu potencial de conectividade. Embora, genes possam ser transferidos em clusters (o que levaria vários dos parceiros de interação para o próximo genoma junto com eles, e que também existam genes que funcionam de forma autônoma, sem a necessidade de PPIs) uma grande parte deve ter que passar mesmo pelo "gargalo" da evolução da interação com outros parceiros protéicos, o que evindecia a grande importância de um parâmetro como a "amistosidade" de uma gene como fator de sucesso para sua transferência para outros microorganismos.
Análises revelaram, no entanto, que apesar de interações entre proteínas codificadas por genes distanciados entre 1 e 5 genes no genoma que ocorrerem cerca de 6 x com maior freqüência do que o esperado, apenas 2% das interações foram entre as proteínas codificadas por genes que exibem tal proximidade. A maioria das interações (96,9% ) ocorreram entre as proteínas separadas por mais de 21 genes, o que torna a co-transferência altamente improvável, exceto através de plasmídeos muito grandes. A alternativa seria que o sucesso da transferência lateral de uma proteína em um novo hospedeiro seja devida não a sua conectividade, mas a receptividade do novo genoma que ao abrigar uma maior nível de proteínas homólogas, constituiria-se em uma ambiente mais “familiar”. Porém, estudos mostram que apenas 10% de divergência nas seqüências já pode modificar bastante as redes PPI, tornando esta hipóteses menor plausível.
Estes resultados acentuam a relevância dos potenciais de interação e da "amistosidade" dos genes em seu ambiente pré-transferência.
Estudos futuros deverão se seguir, inclusive, efetuados por outros grupos de pesquisadores que apontarão as deficiências, erros e os pontos positivos dessa abordagem e colaborarão com o esclarecimento de como ocorre aquisição de genes por transferência lateral e quais os tipos de genes e proteínas mais propensas a sofrerem este tipo de processo.

Bem, pelo jeito, não são só certas pessoas que fazem amizade fácil, mas também os produtos de certos genes parecem ter as mesmas características, o que permitem a eles servirem-se dos benefícios de grandes “redes sociais” e dos “contatos” que permitem arranjar sempre uma boquinha em algum lugar e trazer novas vantagens as redes que passam a criar ou a integrar, e se essas pessoas ou genes são competentes então, aí, temos um combo invencível.
Aos poucos, conciliando o rigor e sistematicidade característicos do processo de indagação científica e a criatividade e inventividade humanas (que também são parte inseparável daquilo que chamamos "ciência"), vamos compreendendo melhor nossa própria história e a evolução da vida na terra, aprendendo a sondar os processos e mecanismos responsáveis por tais dinâmicas e a testar as diversas explicações para elas.
_____________________________________
Referrências:
Gophna, U., & Ofran, Y. (2010). Lateral acquisition of genes is affected by the friendliness of their products Proceedings of the National Academy of Sciences, 108 (1), 343-348 DOI: 10.1073/pnas.1009775108
Ofran, Y., & Rost, B. (2007). ISIS: interaction sites identified from sequence Bioinformatics, 23 (2) DOI: 10.1093/bioinformatics/btl303
Ofran Y, & Rost B (2007). Protein-protein interaction hotspots carved into sequences. PLoS computational biology, 3 (7) PMID: 17630824
Créditos das figuras:
http://commons.wikimedia.org/wiki/File:Human_interactome.jpg (autor: Keiono)
http://commons.wikimedia.org/wiki/File:Friendly_stickman.svg (autor: Lilyu)
http://commons.wikimedia.org/wiki/File:Horizontal_and_vertical_gene_transfer.png (autor: Gregorius Pilosus)
http://commons.wikimedia.org/wiki/File:Rede_hub.png (autor:Rodrigozanatta)
* Aqui desconsidero propositalmente outras redes moleculares que devem ter papéis muito importantes, como aquelas formadas por microRNAs e as interações entre elas, o DNA genômico e as redes protéicas e metabólicas que são mais discutidas na literatura científica.
<span style="float: left; padding: 5px;"><a href="http://www.researchblogging.org"><img alt="ResearchBlogging.org"
src="http://www.researchblogging.org/public/citation_icons/rb2_large_gray.png"
style="border:0;"/></a></span>