Srovnávací Genomika

jednoduché srovnání obecné vlastnosti genů, jako je velikost genomu-počet genů a chromozomů číslo představuje vstupní bod do komparativní genomová analýza. Údaje pro několik plně sekvenovaných modelových organismů jsou uvedeny v tabulce 1. Srovnání zdůrazňují některá pozoruhodná zjištění. Například, zatímco malá kvetoucí rostlina Arabidopsis thaliana má menší genom než ovocná muška Drosophila melanogaster (157 milionů párů bází v. 165 milionů párů bází) má téměř dvakrát tolik genů (25 000 vs. 13 000). Ve skutečnosti má a. thaliana přibližně stejný počet genů jako lidé (~25 000). Tak, velmi brzy lekce se naučil v “genomické éry” je, že velikost genomu nekoreluje s evoluční postavení, ani je počet genů úměrná velikosti genomu.

Srovnávací velikost genomu člověka a dalších modelových organismů

Tabulka 1: Srovnávací velikost genomu člověka a dalších modelových organismů

Zachovaných segmentů v lidské a myší genom

Obrázek 1: Zachovaných segmentů v lidské a myší genom
Lidských chromozomů, s segmenty obsahující alespoň dva geny, jejichž cílem je zachovaná u myší genom jako barevné bloky. Každá barva odpovídá určitému chromozomu myši. Centromery, subcentromerní heterochromatin chromozomů 1, 9 a 16 a opakovaná krátká ramena 13, 14, 15, 21 a 22 jsou černá. (International Human Genome Sequencing Consortium; Lander, E. S. et al. 2001)

srovnání s jemnějším rozlišením je možné přímým porovnáním sekvencí DNA mezi druhy. Obrázek 1 znázorňuje srovnání lidských a myších genomů na úrovni chromozomů, které ukazuje úroveň synteny mezi těmito dvěma savci. Synteny je situace, kdy jsou geny uspořádány v podobných blocích u různých druhů. Povaha a rozsah zachování synteny se mezi chromozomy podstatně liší. Například chromozomy X jsou reprezentovány jako jednotlivé, reciproční syntenické bloky. Lidský chromozom 20 zcela odpovídá části myšího chromozomu 2, s téměř dokonalým zachováním řádu po téměř celé délce, narušený pouze malým centrálním segmentem. Lidský chromozom 17 zcela odpovídá části myšího chromozomu 11. Jiné chromozomy však vykazují důkazy o rozsáhlejším interchromozomálním přeskupení. Výsledky, jako jsou tyto, poskytují mimořádný pohled na chromozomální změny, které formovaly myší a lidské genomy od jejich odlišnosti od společného předka před 75-80 miliony let.
porovnání diskrétních segmentů genomů je také možné sladěním homologní DNA z různých druhů. Příklad takového zarovnání je znázorněn na obrázku 2, Kde je zarovnán lidský gen (pyruvát kináza: PKLR) a odpovídající HOMOLOGOVÉ PKLR z makaků, psů, myší, kuřat a zebrafish. Pro každý organismus jsou vyneseny oblasti s vysokou podobností sekvence DNA s člověkem v oblasti 12-kilobázy genu PKLR. Všimněte si vysoký stupeň sekvenční podobnosti mezi lidskou a makak (dva primáty) v obou PKLR exons (modrá), stejně jako introny (červená) a nepřeložené regionů (světle modrá) genu. V kontrastu, kuřecí a dania pruhovaného zarovnání s lidskými pouze ukázat podobnost se sekvencí v coding exons; zbytek sekvence se rozdělily do bodu, kdy to již nemůže být spolehlivě souladu s lidskou DNA sekvence. Pomocí počítačové analýzy založené na nulu v na genomické funkce, které byly zachovány v několika organismů v průběhu milionů let, vědci jsou schopni najít signály, které představují umístění genů, stejně jako sekvence, které mohou regulovat genovou expresi. Ve skutečnosti byla většina funkčních částí lidského genomu objevena nebo ověřena tímto typem porovnání sekvencí (Lander et al . 2001) a nyní je standardní součástí analýzy každé nové sekvence genomu.

Lidské PKLR genu v regionu ve srovnání s makak, pes, myš, kuře, a dania pruhovaného genomů

Obrázek 2: Lidské PKLR genu v regionu ve srovnání s makak, pes, myš, kuře, a dania pruhovaného genomů
Čísla na vertikální ose představují podíl stejných nukleotidů v 100-bp okna na místo na pozemku. Čísla na vodorovné ose označují polohu nukleotidů od začátku 12kilobázové lidské genomové sekvence. Vrcholy stínované modře odpovídají oblastem kódování PKLR. Vrcholy zastíněné světle modrou barvou odpovídají NEPŘELOŽENÝM oblastem PKLR mRNA. Vrcholy stínované červeně odpovídají konzervovaným nekódujícím oblastem (CNSs), definovaným jako oblasti, kde je průměrná identita > 75%. Zarovnání bylo vygenerováno pomocí nástroje pro porovnání sekvencí VISTA (http://pipeline.lbl.gov).

Srovnání genomů v různých fylogenetických vzdáleností sloužit k řešení konkrétních otázek.

obrázek 3: srovnání genomů v různých fylogenetických vzdálenostech slouží k řešení konkrétních otázek.

Jsme se naučili od homologní sekvence zarovnání, že informace, které mohou být získané porovnáním dvou genomů společně je do značné míry závislá na fylogenetické vzdálenosti mezi nimi. Fylogenetická vzdálenost je mírou separace mezi dvěma organismy nebo jejich genomů na evoluční stupnici, obvykle vyjádřena jako počet nahromaděné sekvence změn, počet let, nebo počet generací. Vzdálenosti jsou často umístěny na fylogenetických stromech, které ukazují odvozené vztahy mezi organismy (obrázek 3). Čím vzdálenější jsou dva organismy, tím menší podobnost sekvencí nebo sdílené genomické rysy budou mezi nimi detekovány. Genomickými srovnáními lze tedy získat pouze obecné poznatky o třídách sdílených genů na velmi dlouhých fylogenetických vzdálenostech (např. více než miliarda let od jejich oddělení). Na tak velkých vzdálenostech je zřídka zachováno pořadí genů a podpisy sekvencí, které regulují jejich transkripci.
Při bližších fylogenetických vzdálenostech (50-200 milionů let divergence) se v konzervovaných segmentech nachází funkční i nefunkční DNA. V těchto případech budou funkční sekvence vykazovat podpisy výběru na základě toho, že se jejich sekvence změnily méně nebo pomaleji než nefunkční DNA. Navíc, za schopnost rozlišovat funkční z nefunkční DNA, srovnávací genomika je rovněž přispět k identifikaci obecné třídy důležité prvky DNA, jako kódujících exonů genů, nekódující Rna, a některé genové regulační stránek.
V kontrastu, velmi podobné genomy odděleny asi 5 milionů let evoluce (například člověk a šimpanz) jsou zvláště užitečné pro nalezení sekvence rozdíly, které může účet pro jemné rozdíly v biologické formě. Tyto sekvence jsou změny pod směrové výběr, proces, při němž přírodní výběr upřednostňuje jeden fenotyp a neustále posouvá frekvenci alel v jednom směru. Srovnávací genomika je tedy silný a slibný přístup k biologickému objevu, který se stává stále více informativním, jak se hromadí data genomické sekvence.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.