Genómica comparativa

uma simples comparação das características gerais dos genomas, tais como o tamanho do genoma, o número de genes e o número de cromossomas, apresenta um ponto de entrada na análise genómica comparativa. Os dados relativos a vários modelos de organismos completamente sequenciados são apresentados na Tabela 1. As comparações evidenciam algumas descobertas marcantes. Por exemplo, enquanto a pequena planta de flor Arabidopsis thaliana tem um genoma menor do que o da mosca da fruta Drosophila melanogaster (157 milhões de pares de base v. 165 milhões de pares de base, respectivamente) possui quase o dobro de genes (25.000 v. 13.000). Na verdade A. thaliana tem aproximadamente o mesmo número de genes que os humanos (~25.000). Assim, uma lição muito antiga aprendida na “era genômica” é que o tamanho do genoma não se correlaciona com o status evolutivo, nem é o número de genes proporcional ao tamanho do genoma.

Comparativo do genoma tamanhos de seres humanos e de outros organismos-modelo

Tabela 1: Comparativo do genoma tamanhos de seres humanos e de outros organismos-modelo

Conservada segmentos de humano e rato genoma

a Figura 1: Conservada segmentos de humano e rato genoma
cromossomos Humanos, com os segmentos que contêm pelo menos dois genes cuja ordem é conservado no mouse genoma como blocos de cor. Cada cor corresponde a um cromossomo particular do mouse. Centrómeros, heterocromatina subcentromérica dos cromossomas 1, 9 e 16, e os braços curtos repetitivos de 13, 14, 15, 21 e 22 estão em preto. (International Human Genome Sequencing Consortium; Lander, E. S. et al. 2001)

as comparações de resolução mais fina são possíveis através de comparações directas de sequências de ADN entre espécies. A figura 1 mostra uma comparação cromossômica dos genomas humano e mouse que mostra o nível de sintenia entre estes dois mamíferos. Sintenia é uma situação em que os genes são dispostos em blocos semelhantes em diferentes espécies. A natureza e extensão da conservação da sintenia difere substancialmente entre os cromossomas. Por exemplo, os cromossomas X são representados como blocos sintéticos únicos e recíprocos. O cromossoma 20 humano corresponde inteiramente a uma porção do cromossoma 2 do rato, com uma conservação quase perfeita da ordem ao longo de quase todo o comprimento, interrompida apenas por um pequeno segmento central. O cromossoma 17 humano corresponde inteiramente a uma porção do cromossoma 11 do rato. Outros cromossomas, no entanto, mostram evidências de um rearranjo mais extenso da permissomal. Resultados como estes fornecem um vislumbre extraordinário das mudanças cromossômicas que moldaram o rato e os genomas humanos desde a sua divergência de um ancestral comum 75-80 milhões de anos atrás.a comparação de segmentos discretos de genomas também é possível através do alinhamento de DNA homólogo de diferentes espécies. Um exemplo de tal alinhamento é mostrado na Figura 2, onde um gene humano (pyruvate kinase: PKLR) e os homólogos de PKLR correspondentes de macaca, cão, rato, galinha e peixe-zebra estão alinhados. Regiões de similaridade de alta sequência de DNA com humanos em uma região de 12 kilobase do gene PKLR são plotadas para cada organismo. Notem o alto grau de similaridade de sequência entre humanos e macacos (dois primatas) em ambos os PKLR exons (azul), bem como introns (vermelho) e regiões não traduzidas (azul claro) do gene. Em contraste, os alinhamentos de frango e peixe-zebra com humanos apenas mostram similaridade com sequências nos exons de codificação; o resto da sequência divergiu para um ponto onde não pode mais ser alinhado de forma confiável com a sequência de DNA humano. Usando o computador baseado em análise a zero em características genômicas, que foram preservados em vários organismos ao longo de milhões de anos, os pesquisadores são capazes de localizar os sinais que representam a localização de genes, bem como sequências que podem regular a expressão do gene. Com efeito, grande parte das partes funcionais do genoma humano foram descobertas ou verificadas por este tipo de comparação de sequências (Lander et al. 2001) e é agora um componente padrão da análise de cada nova sequência de genoma.

Humana região do gene PKLR comparado com o macaco, cão, rato, frango e peixe-zebra genomas

Figura 2: Human gene PKLR região comparado com o macaco, cão, rato, frango, e peixe-zebra genomas
os Números no eixo vertical representam a proporção de idênticas de nucleotídeos em uma de 100 bp janela para um ponto no gráfico. Números no eixo horizontal indicam a posição nucleótida desde o início da sequência genômica humana de 12 kilobase. Os picos sombreados a azul correspondem às regiões de codificação PKLR. Os picos sombreados em azul claro correspondem a regiões de mRNA não traduzidas PKLR. Os picos sombreados a vermelho correspondem a regiões conservadas sem codificação (CNSs), definidas como zonas em que a identidade média é > 75%. O alinhamento foi gerado usando a ferramenta de comparação de seqüências VISTA (http://pipeline.lbl.gov).

comparação de genomas em diferentes distâncias filogenéticas servir para abordar questões específicas.

Figura 3: comparações de genomas em diferentes distâncias filogenéticas servem para abordar questões específicas.

aprendemos com o alinhamento da sequência homóloga que a informação que pode ser obtida comparando dois genomas juntos é largamente dependente da distância filogenética entre eles. Distância filogenética é uma medida do grau de separação entre dois organismos ou seus genomas em uma escala evolutiva, geralmente expressa como o número de mudanças de sequência acumuladas, número de anos ou número de gerações. As distâncias são frequentemente colocadas em árvores filogenéticas, que mostram as relações deduzidas entre os organismos (Figura 3). Quanto mais distantes forem os dois organismos, menos similaridade de sequência ou características genômicas compartilhadas serão detectadas entre eles. Assim, apenas insights gerais sobre classes de genes compartilhados podem ser recolhidos por comparações genômicas a distâncias filogenéticas muito longas (por exemplo, mais de um bilhão de anos desde a sua separação). Em distâncias tão grandes, a ordem dos genes e as assinaturas das sequências que regulam a sua transcrição raramente são conservadas. a distâncias filogenéticas mais próximas (50-200 milhões de anos de divergência), o DNA funcional e não-funcional é encontrado dentro dos segmentos conservados. Nestes casos, as sequências funcionais apresentarão assinaturas de selecção em virtude de as suas sequências terem mudado menos ou mais lentamente do que o ADN não funcional. Além disso, para além da capacidade de discriminação funcional a partir de ADN não funcional, a genómica comparativa também está a contribuir para a identificação de classes gerais de elementos de ADN importantes, tais como a codificação de exões de genes, RNAs não codificantes e alguns sítios reguladores de genes. em contraste, genomas muito similares separados por cerca de 5 milhões de anos de evolução (como o humano e o chimpanzé) são particularmente úteis para encontrar as diferenças de seqüência que podem explicar diferenças sutis na forma biológica. Estas são mudanças de sequência sob seleção direcional, um processo pelo qual a seleção natural favorece um único fenótipo e continuamente muda a frequência do alelo em uma direção. A genômica comparativa é, portanto, uma abordagem poderosa e promissora para a descoberta biológica que se torna cada vez mais informativa à medida que os dados da sequência genômica se acumulam.

Deixe uma resposta

O seu endereço de email não será publicado.