sammenlignende genomik

en simpel sammenligning af de generelle træk ved genomer såsom genomstørrelse, antal gener og kromosomnummer præsenterer et indgangspunkt i sammenlignende genomisk analyse. Data for flere fuldt sekventerede modelorganismer er vist i tabel 1. Sammenligningerne fremhæver nogle slående fund. For eksempel, mens den lille blomstrende plante Arabidopsis thaliana har et mindre genom end frugtfluen Drosophila melanogaster (157 millioner basepar v. 165 millioner basepar, henholdsvis) det besidder næsten dobbelt så mange gener (25.000 v. 13.000). Faktisk har A. thaliana omtrent det samme antal gener som mennesker (~25.000). Således er en meget tidlig lektion lært i den “genomiske æra”, at genomstørrelse ikke korrelerer med evolutionær status, og antallet af gener er heller ikke proportionalt med genomstørrelsen.

sammenlignende genomstørrelser af mennesker og andre modelorganismer

tabel 1: Sammenlignende genomstørrelser af mennesker og andre modelorganismer

konserverede segmenter i det menneskelige og musegenom

Figur 1: konserverede segmenter i det menneskelige og musegenom

Figur 1: konserverede segmenter i det menneskelige og musegenom

humant og musegenom

humane kromosomer, med segmenter indeholdende mindst to gener, hvis rækkefølge er bevaret i musegenomet som farveblokke. Hver farve svarer til et bestemt musekromosom. Centromerer, subcentromerisk heterochromatin af kromosomer 1, 9 og 16 og de gentagne korte arme på 13, 14, 15, 21 og 22 er i sort. (International Human Genome sekventering Consortium; Lander, E. S. et al. 2001)

finere opløsnings sammenligninger er mulige ved direkte DNA-sekvenssammenligninger mellem arter. Figur 1 viser en kromosom-niveau sammenligning af humane og mus genomer, der viser niveauet af synteny mellem disse to pattedyr. Synteny er en situation, hvor gener er arrangeret i lignende blokke i forskellige arter. Arten og omfanget af bevarelse af synteny adskiller sig væsentligt blandt kromosomer. For eksempel er kromosomerne repræsenteret som enkelte, gensidige synteniske blokke. Humant kromosom 20 svarer helt til en del af musekromosom 2, med næsten perfekt bevarelse af orden langs næsten hele længden, kun forstyrret af et lille centralt segment. Humant kromosom 17 svarer helt til en del af musens kromosom 11. Andre kromosomer viser imidlertid tegn på mere omfattende interchromosomal omlejring. Resultater som disse giver et ekstraordinært indblik i de kromosomale ændringer, der har formet musen og menneskelige genomer siden deres divergens fra en fælles forfader for 75-80 millioner år siden.sammenligning af diskrete segmenter af genomer er også mulig ved at tilpasse homologt DNA fra forskellige arter. Et eksempel på en sådan justering er vist i figur 2, hvor et humant gen (pyruvatkinase: PKLR) og de tilsvarende PKLR-homologer fra makak, hund, mus, kylling og sebrafisk er justeret. Regioner med høj DNA-sekvenslighed med menneske på tværs af en 12-kilobase-region af PKLR-genet er afbildet for hver organisme. Bemærk den høje grad af sekvenslighed mellem menneske og makak (to primater) i både PKLR-eksoner (blå) såvel som introner (rød) og uoversatte regioner (Lyseblå) af genet. I modsætning hertil viser kylling-og sebrafiskjusteringerne med mennesker kun lighed med sekvenser i de kodende eksoner; resten af sekvensen er divergeret til et punkt, hvor den ikke længere kan justeres pålideligt med den humane DNA-sekvens. Brug af en sådan computerbaseret analyse til nul på de genomiske træk, der er bevaret i flere organismer gennem millioner af år, forskere er i stand til at lokalisere de signaler, der repræsenterer placeringen af gener, såvel som sekvenser, der kan regulere genekspression. Faktisk er meget af de funktionelle dele af det humane genom blevet opdaget eller verificeret ved denne type sekvenssammenligning (Lander et al. 2001), og det er nu en standardkomponent i analysen af hver ny genomsekvens.

Human PKLR genregion sammenlignet med makak, hund, mus, kylling og sebrafisk genomer

figur 2: Human PKLR genregion sammenlignet med makak, hund, mus, kylling og tal på den lodrette akse repræsenterer andelen af identiske nukleotider i et 100-BP vindue for et punkt på plottet. Tal på den vandrette akse angiver nukleotidpositionen fra begyndelsen af den humane genomiske sekvens på 12 kilobase. Toppe skraveret i blåt svarer til pklr-kodningsregionerne. Toppe skyggefulde i lyseblå svarer til pklr mRNA uoversatte regioner. Toppe skraveret i rødt svarer til konserverede ikke-kodende regioner (CNSs), defineret som områder, hvor den gennemsnitlige identitet er > 75%. Justering blev genereret ved hjælp af sekvenssammenligningsværktøjet VISTA (http://pipeline.lbl.gov).

sammenligninger af genomer på forskellige fylogenetiske afstande tjener til at løse specifikke spørgsmål.

figur 3: sammenligninger af genomer på forskellige fylogenetiske afstande tjener til at løse specifikke spørgsmål.

vi har lært af homolog sekvensjustering, at den information, der kan opnås ved at sammenligne to genomer sammen, stort set afhænger af den fylogenetiske afstand mellem dem. Fylogenetisk afstand er et mål for graden af adskillelse mellem to organismer eller deres genomer i en evolutionær skala, normalt udtrykt som antallet af akkumulerede sekvensændringer, antal år eller antal generationer. Afstandene placeres ofte på fylogenetiske træer, der viser de udledte forhold mellem organismerne (figur 3). Jo mere fjernt beslægtede to organismer er, jo mindre sekvenslighed eller delte genomiske træk vil blive detekteret mellem dem. Således kan kun generel indsigt om klasser af delte gener indsamles ved genomiske sammenligninger på meget lange fylogenetiske afstande (f.eks. Over så meget store afstande bevares rækkefølgen af gener og signaturerne af sekvenser, der regulerer deres transkription, sjældent.
ved tættere fylogenetiske afstande (50-200 millioner års divergens) findes både funktionelt og ikke-funktionelt DNA inden for de konserverede segmenter. I disse tilfælde vil de funktionelle sekvenser vise signaturer for udvælgelse i kraft af, at deres sekvenser har ændret sig mindre eller langsommere end ikke-funktionelt DNA. Desuden bidrager komparativ genomik ud over evnen til at diskriminere funktionelt fra ikke-funktionelt DNA også til identifikation af generelle klasser af vigtige DNA-elementer, såsom kodende eksoner af gener, ikke-kodende RNA ‘ er og nogle genregulerende steder. i modsætning hertil er meget lignende genomer adskilt af omkring 5 millioner års evolution (såsom menneske og chimpanse) særligt nyttige til at finde de sekvensforskelle, der kan tegne sig for subtile forskelle i biologisk form. Dette er sekvensændringer under retningsvalg, en proces, hvorved naturlig selektion favoriserer en enkelt fænotype og kontinuerligt skifter allelfrekvensen i en retning. Sammenlignende genomik er således en stærk og lovende tilgang til biologisk opdagelse, der bliver mere og mere informativ, når genomiske sekvensdata akkumuleres.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.