vertaileva genomiikka

yksinkertainen vertailu genomien yleispiirteistä, kuten genomien koosta, geenien määrästä ja kromosomiluvusta, on lähtökohta vertailevaan genomianalyysiin. Useiden täysin sekvensoitujen malliorganismien tiedot esitetään taulukossa 1. Vertailut tuovat esiin joitakin hätkähdyttäviä havaintoja. Esimerkiksi pienellä kukkivalla kasvilla Arabidopsis thalianalla on pienempi perimä kuin hedelmäkärpäsellä Drosophila melanogasterilla (157 miljoonaa emäsparia v. 165 miljoonaa emäsparia) sillä on lähes kaksi kertaa enemmän geenejä (25 000 v. 13 000). Itse asiassa A. thaliana on suunnilleen sama määrä geenejä kuin ihmisillä (~25000). Niinpä hyvin varhainen “genomiaikakaudella” opittu opetus on, että genomin koko ei korreloi evolutiivisen tilan kanssa, eikä geenien määrä ole suhteessa genomin kokoon.

ihmisen ja muiden malliorganismien vertaileva genomikoko

Taulukko 1: Ihmisen ja muiden malliorganismien vertailevat genomikoot

ihmisen ja hiiren genomin säilyneet segmentit

Kuva 1: säilyneet segmentit ihmisen ja hiiren genomi
ihmisen kromosomit, joiden segmentit sisältävät vähintään kaksi geeniä, joiden järjestys säilyy hiiren genomissa värilohkoina. Jokainen väri vastaa tiettyä hiiren kromosomia. Sentromeerit, kromosomien 1, 9 ja 16 subsentromeerinen heterokromatiini sekä toistuvat lyhyet käsivarret 13, 14, 15, 21 ja 22 ovat mustia. (International Human Genome Sequencing Consortium; Lander, E. S. et al. 2001)

Hienoresoluutiovertailut ovat mahdollisia lajien välisillä suorilla DNA-sekvenssivertailuilla. Kuvassa 1 esitetään ihmisen ja hiiren genomien kromosomitason vertailu, joka osoittaa näiden kahden nisäkkään välisen syntenian tason. Synteny on tilanne, jossa geenit on järjestetty samanlaisiin lohkoihin eri lajeilla. Syntenian säilymisen luonne ja laajuus vaihtelee huomattavasti kromosomien välillä. Esimerkiksi X-kromosomit esitetään yksittäisinä, vastavuoroisina synteenilohkoina. Ihmisen kromosomi 20 vastaa täysin osaa hiiren kromosomista 2, jossa järjestys säilyy lähes täydellisesti lähes koko pituudelta ja vain pieni keskijako häiritsee sitä. Ihmisen kromosomi 17 vastaa täysin osaa hiiren kromosomista 11. Toisissa kromosomeissa on kuitenkin merkkejä laajemmasta interkromosomaalisesta uudelleenjärjestelystä. Tällaiset tulokset tarjoavat poikkeuksellisen kurkistuksen kromosomimuutoksiin, jotka ovat muokanneet hiiren ja ihmisen genomeja sen jälkeen, kun ne erosivat yhteisestä esi-isästä 75-80 miljoonaa vuotta sitten.
erillisten genomisegmenttien vertailu on mahdollista myös yhdenmukaistamalla eri lajien homologista DNA: ta. Esimerkki tällaisesta linjauksesta on kuvassa 2, jossa ihmisen geeni (pyruvaattikinaasi: pklr) ja vastaavat makakin, koiran, hiiren, kanan ja seeprakalan pklr-homologit ovat linjassa. Pklr-geenin 12-kilobaasialueen DNA-sekvenssin samankaltaiset alueet ihmisen kanssa piirretään kullekin organismille. Huomaa, että ihmisen ja makakin (kahden kädellisen) sekvenssin samankaltaisuus on suuri geenin pklr-eksoneissa (sininen) sekä introneissa (punainen) ja transloitumattomissa alueilla (Vaaleansininen). Sen sijaan kana-ja seeprakalaliitokset ihmisen kanssa osoittavat vain samankaltaisuutta koodaavan eksonin sekvensseihin; muu sekvenssi on erkaantunut pisteeseen, jossa se ei enää ole luotettavasti linjassa ihmisen DNA-sekvenssin kanssa. Käyttämällä tällaista tietokonepohjaista analyysiä, jossa tarkastellaan useiden eliöiden miljoonien vuosien aikana säilyneitä genomisia ominaisuuksia, tutkijat pystyvät paikantamaan geenien sijaintia kuvaavat signaalit sekä sekvenssit, jotka voivat säädellä geenien ilmentymistä. Itse asiassa suuri osa ihmisen genomin toiminnallisista osista on löydetty tai vahvistettu tämän tyyppisellä sekvenssivertailulla (Lander et al. 2001) ja se on nykyään jokaisen uuden genomisekvenssin analyysin vakiokomponentti.

ihmisen pklr-geenialue verrattuna makakien, koiran, hiiren, kanan ja seeprakalan genomeihin

kuva 2: ihmisen Pklr-geenialue verrattuna makakeihin, koiriin, hiiriin, kanoihin ja seeprakalan genomit
numerot pystyakselilla kuvaavat identtisten nukleotidien osuutta 100 BP: n ikkunassa kuvaajan pisteessä. Vaaka-akselin numerot osoittavat nukleotidiasennon ihmisen 12-kilobaasin genomijakson alusta. Sinisellä varjostetut huiput vastaavat pklr-koodausalueita. Vaaleansinisellä varjostetut huiput vastaavat PKLR mRNA: n kääntämättömiä alueita. Punaisella varjostetut huiput vastaavat säilyneitä, koodaamattomia alueita (CNSs), jotka määritellään alueiksi, joiden keskimääräinen tunnistetiedot ovat > 75%. Tasaus luotiin sekvenssivertailutyökalulla VISTA (http://pipeline.lbl.gov).

genomien vertailut eri fylogeneettisillä etäisyyksillä auttavat käsittelemään erityisiä kysymyksiä.

kuva 3: genomien vertailu eri fylogeneettisillä etäisyyksillä auttaa käsittelemään erityisiä kysymyksiä.

olemme oppineet homologisesta sekvenssien linjauksesta, että informaatio, joka voidaan saada vertaamalla kahta genomia toisiinsa, riippuu suurelta osin niiden välisestä fylogeneettisestä etäisyydestä. Fylogeneettinen etäisyys on kahden eliön tai niiden genomien välisen erotusasteen mitta evoluution asteikolla, joka ilmaistaan yleensä kertyneiden sekvenssimuutosten lukumääränä, vuosien lukumääränä tai sukupolvien lukumääränä. Etäisyydet sijoitetaan usein fylogeneettisiin puihin, joista ilmenee päättelyt eliöiden väliset suhteet (kuva 3). Mitä etäämpää sukua kaksi eliötä ovat, sitä vähemmän niiden välillä havaitaan sekvenssien samankaltaisuutta tai yhteisiä genomisia piirteitä. Näin ollen vain yleisiä oivalluksia jaettujen geenien luokista voidaan kerätä genomivertailuilla hyvin pitkillä fylogeneettisillä etäisyyksillä (esim.yli miljardi vuotta niiden erosta). Näin suurilla etäisyyksillä geenien järjestys ja niiden transkriptiota säätelevien sekvenssien allekirjoitukset säilyvät harvoin.
läheisemmillä fylogeneettisillä etäisyyksillä (50-200 miljoonan vuoden divergenssi) sekä funktionaalista että ei-funktionaalista DNA: ta löytyy säilyneistä segmenteistä. Näissä tapauksissa funktionaaliset sekvenssit osoittavat valinnan allekirjoituksia sen perusteella, että niiden sekvenssit ovat muuttuneet vähemmän tai hitaammin kuin ei-funktionaalinen DNA. Sen lisäksi, että vertaileva genomiikka pystyy erottamaan funktionaalisen ei-funktionaalisen DNA: n toisistaan, se edistää myös tärkeiden DNA-elementtien yleisten luokkien, kuten geenien koodaavien eksonien, ei-koodaavien RNA: iden ja joidenkin geenien säätelypaikkojen tunnistamista.
sen sijaan hyvin samankaltaiset genomit, joita erottaa noin 5 miljoonan vuoden evoluutio (kuten ihminen ja simpanssi), ovat erityisen hyödyllisiä löydettäessä sekvenssieroja, jotka saattavat selittää hienovaraisia eroja biologisessa muodossa. Nämä ovat suuntavalinnan alaisia sekvenssimuutoksia, joissa luonnonvalinta suosii yhtä fenotyyppiä ja siirtää jatkuvasti alleelitaajuutta yhteen suuntaan. Vertaileva genomiikka onkin tehokas ja lupaava lähestymistapa biologiseen löytämiseen, joka tulee yhä informatiivisemmaksi genomisekvenssitietojen karttuessa.

Vastaa

Sähköpostiosoitettasi ei julkaista.