genomika porównawcza

proste porównanie ogólnych cech genomów, takich jak rozmiar genomu, liczba genów i liczba chromosomów stanowi punkt wejścia do porównawczej analizy genomowej . Dane dotyczące kilku w pełni zsekwencjonowanych organizmów modelowych przedstawiono w tabeli 1. Porównania podkreślają kilka uderzających wniosków. Na przykład, podczas gdy maleńka roślina kwitnąca Arabidopsis thaliana ma mniejszy Genom niż muszka owocowa Drosophila melanogaster (157 milionów par zasad v. 165 milionów par zasad) posiada prawie dwa razy więcej genów (25 000 V. 13 000). W rzeczywistości A. thaliana ma w przybliżeniu taką samą liczbę genów jak ludzie (~25 000). Tak więc, bardzo wczesna lekcja wyciągnięta w “erze genomowej” jest taka, że wielkość genomu nie koreluje ze statusem ewolucyjnym, ani też liczba genów nie jest proporcjonalna do wielkości genomu.

porównawcze rozmiary genomów ludzi i innych organizmów modelowych

Tabela 1: Porównawcze rozmiary genomów ludzi i innych organizmów modelowych

zachowane segmenty w genomie ludzkim i mysim

Rysunek 1: zachowane segmenty segmenty w genomie ludzkim i mysim
chromosomy ludzkie, z segmentami zawierającymi co najmniej dwa geny, których kolejność jest zachowana w genomie myszy jako bloki kolorów. Każdy kolor odpowiada konkretnemu chromosomowi myszy. Centromery, subcentromeryczna heterochromatyna chromosomów 1, 9 i 16 oraz powtarzalne krótkie ramiona 13, 14, 15, 21 i 22 są czarne. (International human Genome Sequencing Consortium; Lander, E. S. et al. 2001)

porównania o lepszej rozdzielczości są możliwe dzięki bezpośrednim porównaniom sekwencji DNA między gatunkami. Rysunek 1 przedstawia porównanie poziomu chromosomów genomu ludzkiego i mysiego, które pokazuje poziom synteny pomiędzy tymi dwoma ssakami. Synteza to sytuacja, w której geny są ułożone w podobne bloki u różnych gatunków. Charakter i zakres zachowania synteny różni się znacznie między chromosomami. Na przykład chromosomy X są reprezentowane jako pojedyncze, wzajemne bloki synteniczne. Ludzki chromosom 20 odpowiada w całości części chromosomu 2 myszy, z prawie perfekcyjnym zachowaniem porządku na prawie całej długości, zakłócony jedynie przez mały segment centralny. Ludzki chromosom 17 odpowiada w całości części chromosomu 11 myszy. Inne chromosomy wykazują jednak bardziej rozległe przegrupowanie międzychromosomalne. Wyniki takie jak te zapewniają niezwykły wgląd w zmiany chromosomowe, które ukształtowały genomy myszy i człowieka od czasu ich rozbieżności od wspólnego przodka 75-80 milionów lat temu.
porównanie dyskretnych segmentów genomów jest również możliwe poprzez wyrównanie homologicznego DNA różnych gatunków. Przykład takiego dopasowania pokazano na fig. 2, gdzie Gen ludzki (kinaza pirogronianowa: PKLR) i odpowiadające mu homologi PKLR od makaka, psa, myszy, kurczaka i danio pręgowanego są dopasowane. Regiony o wysokim podobieństwie sekwencji DNA do ludzkiej w całym 12-kilobazowym regionie genu PKLR są wykreślane dla każdego organizmu. Zauważ wysoki stopień podobieństwa sekwencji pomiędzy człowiekiem i makakiem (dwa naczelne) zarówno w eksonach PKLR (niebieski), jak i intronach (czerwony) i nieprzetłumaczonych regionach (Jasnoniebieski) genu. W przeciwieństwie do tego, dopasowanie kurczaka i danio pręgowanego do ludzkiego wykazuje jedynie podobieństwo do sekwencji kodujących eksonów; reszta sekwencji rozeszła się do punktu, w którym nie może być już wiarygodnie dopasowana do sekwencji ludzkiego DNA. Wykorzystując taką analizę komputerową do zerowania na cechy genomowe, które zostały zachowane w wielu organizmach przez miliony lat, naukowcy są w stanie zlokalizować sygnały, które reprezentują lokalizację genów, a także sekwencje, które mogą regulować ekspresję genów. Rzeczywiście, wiele funkcjonalnych części ludzkiego genomu zostały odkryte lub zweryfikowane przez tego typu porównanie sekwencji (Lander et al. 2001) i jest obecnie standardowym elementem analizy każdej nowej sekwencji genomu.

ludzki region genu PKLR w porównaniu do genomów makaka, psa, myszy, kurczaka i danio pręgowanego

Rysunek 2: ludzki region genu pklr w porównaniu do makaka, psa, myszy, kurczaka i danio pręgowanego liczby genomów danio pręgowanego
na osi pionowej reprezentują proporcję identycznych nukleotydów w oknie 100 BP dla punktu na wykresie. Liczby na osi poziomej wskazują pozycję nukleotydu od początku 12-kilobazowej sekwencji genomowej człowieka. Szczyty cieniowane na niebiesko odpowiadają regionom kodowania PKLR. Szczyty cieniowane w kolorze jasnoniebieskim odpowiadają nieprzetłumaczonym regionom mRNA PKLR. Piki zacienione na Czerwono odpowiadają zachowanym regionom niekodującym (CNSs), zdefiniowanym jako obszary, w których średnia tożsamość wynosi > 75%. Wyrównanie zostało wygenerowane przy użyciu narzędzia do porównywania sekwencji VISTA (http://pipeline.lbl.gov).

porównanie genomów w różnych odległościach filogenetycznych służy do rozwiązywania konkretnych pytań.

Rysunek 3: Porównanie genomów na różnych odległościach filogenetycznych służy do rozwiązania konkretnych pytań.

dowiedzieliśmy się z wyrównania sekwencji homologicznych, że informacje, które można uzyskać porównując dwa genomy razem, są w dużej mierze zależne od odległości filogenetycznej między nimi. Odległość filogenetyczna jest miarą stopnia separacji między dwoma organizmami lub ich genomami w skali ewolucyjnej, zwykle wyrażana jako liczba nagromadzonych zmian sekwencji, liczba lat lub liczba pokoleń. Odległości są często umieszczane na drzewach filogenetycznych, które pokazują dedukcyjne relacje między organizmami (ryc. 3). Im bardziej odległe są dwa organizmy, tym mniejsze podobieństwo sekwencji lub wspólne cechy genomowe będą wykrywane między nimi. Tak więc, tylko ogólne spostrzeżenia na temat klas wspólnych genów mogą być gromadzone przez porównań genomowych na bardzo długich odległościach filogenetycznych (na przykład, ponad miliard lat od ich rozdzielenia). Na tak dużych odległościach kolejność genów i sygnatury sekwencji regulujących ich transkrypcję są rzadko zachowywane.
przy bliższych odległościach filogenetycznych (50-200 milionów lat rozbieżności), zarówno funkcjonalne, jak i niefunkcjonalne DNA znajduje się w zachowanych segmentach. W takich przypadkach sekwencje funkcyjne będą wykazywały sygnatury selekcji, ponieważ ich sekwencje zmieniały się mniej lub wolniej niż niefunkcjonalne DNA. Co więcej, poza zdolnością do rozróżniania funkcjonalnego od niefunkcjonalnego DNA, genomika porównawcza przyczynia się również do identyfikacji ogólnych klas ważnych elementów DNA, takich jak kodujące eksony genów, niekodujące RNA i niektóre miejsca regulacji genów.
w przeciwieństwie do tego, bardzo podobne genomy oddzielone około 5 milionami lat ewolucji (takie jak człowiek i szympans) są szczególnie przydatne do znalezienia różnic sekwencji, które mogą odpowiadać za subtelne różnice w formie biologicznej. Są to zmiany sekwencji pod selekcją kierunkową, proces, w którym dobór naturalny sprzyja pojedynczemu fenotypowi i stale przesuwa częstotliwość alleli w jednym kierunku. Genomika porównawcza jest więc potężnym i obiecującym podejściem do odkryć biologicznych, które staje się coraz bardziej pouczające w miarę gromadzenia danych o sekwencji genomowej.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.