比較ゲノミクス

ゲノムサイズ、遺伝子数、染色体数などのゲノムの一般的な特徴を簡単に比較することで、比較ゲノム解析の入り口となります。 いくつかの完全に配列決定されたモデル生物のデータを表1に示す。 比較は、いくつかの印象的な発見を強調しています。 例えば、小さな開花植物シロイヌナズナthalianaはショウジョウバエmelanogasterのそれよりも小さいゲノムを持っていますが(157万塩基対v. 165万塩基対、それぞれ)それはほぼ倍の遺伝子(25,000対13,000)を所有しています。 実際、a.thalianaは、ヒトとほぼ同じ数の遺伝子を持っています(-25,000)。 したがって、”ゲノム時代”で学んだ非常に初期の教訓は、ゲノムサイズが進化の状態と相関せず、遺伝子の数もゲノムサイズに比例しないということでp>

ヒトおよび他のモデル生物の比較ゲノムサイズ

表1: ヒトおよび他のモデル生物の比較ゲノムサイズ

ヒトおよびマウスゲノムにおける保存セグメント

図1:ヒトおよびマウスゲノムにおける保存セグメント
ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体、ヒト染色体その順序は、カラーブロックとしてマウスゲノムに保存されている少なくとも二つの遺伝子を含むセグ 各色は、特定のマウス染色体に対応する。 動原体、染色体1、9および16のsubcentromericヘテロクロマチン、および13、14、15、21および22の反復的な短い腕は黒にあります。 ら(international H Uman Genome Sequencing Consortum;Lander,E. 2001)

種間の直接DNA配列比較により、より微細な解像度の比較が可能である。 図1は、ヒトとマウスのゲノムの染色体レベルの比較を示しており、これら二つの哺乳類の間のsyntenyのレベルを示しています。 Syntenyは、遺伝子が異なる種の同様のブロックに配置されている状況です。 Syntenyの保存の性質そして範囲は染色体間で大幅に異なります。 例えば、X染色体は、単一の相互シンテン性ブロックとして表される。 ヒト20番染色体はマウス2番染色体の一部に完全に対応しており、ほぼ全長に沿ってほぼ完全に秩序が保たれており、小さな中央セグメントによってのみ破壊されている。 ヒト17番染色体は、マウス11番染色体の一部に完全に対応する。 他の染色体は、しかし、より広範な染色体間再配列の証拠を示しています。 このような結果は、75-80万年前の共通の祖先からの分岐以来、マウスとヒトのゲノムを形作ってきた染色体の変化を異常に垣間見ることができます。
異なる種からの相同DNAを整列させることにより、ゲノムの離散セグメントの比較も可能です。 このようなアライメントの例は図2に示されており、ヒト遺伝子(ピルビン酸キナーゼ:PKLR)とマカク、イヌ、マウス、ニワトリ、ゼブラフィッシュからの対応するPKLR相同体が整列されている。 PKLR遺伝子の12キロベース領域にわたるヒトとの高いDNA配列類似性の領域は、各生物についてプロットされる。 遺伝子のPKLRエクソン(青)だけでなく、イントロン(赤)と非翻訳領域(水色)の両方でヒトとマカク(二つの霊長類)の間の配列類似性の高度に注意してください。 対照的に、ヒトとニワトリとゼブラフィッシュのアライメントは、コードエクソンの配列との類似性を示すだけであり、残りの配列は、もはやヒトDNA配列と確実に整列することができない点に分岐している。 このようなコンピュータベースの分析を使用して、数百万年にわたって複数の生物に保存されているゲノムの特徴をゼロにすることで、研究者は遺伝子の位置を表すシグナルと、遺伝子発現を調節する可能性のある配列を特定することができます。 実際に、ヒトゲノムの機能的部分の多くは、このタイプの配列比較によって発見または検証されている(Lander et al. 2001)そして、それは今、すべての新しいゲノム配列の分析の標準的なコンポーネントです。

マカク、犬、マウス、ニワトリ、およびゼブラフィッシュのゲノムと比較したヒトPKLR遺伝子領域

図2:マカク、犬、マウス、ニワトリ、およびゼブラフィッシュのゲノムと比較したヒトPKLR遺伝子領域

図2:マカク、犬、マウス、ニワトリ、およびゼブラフィッシュのゲノムと比較したヒトPKLR遺伝子領域
縦軸上の数値は、プロット上の点に対する100bpウィンドウ内の同一のヌクレオチドの割合を表します。 横軸の数字は、12-kilobaseヒトゲノム配列の先頭からのヌクレオチド位置を示しています。 青色で陰影付けされたピークは、PKLR符号化領域に対応する。 水色で陰影付けされたピークは、PKLRMRNA非翻訳領域に対応する。 赤で網掛けされたピークは、平均同一性が<></div>75%である領域として定義される保存された非コーディング領域(CNSs)に対応する。 整列は、シーケンス比較ツールVISTA(http://pipeline.lbl.gov)を使用して生成されました。

異なる系統発生距離でのゲノムの比較は、特定の質問に対処するのに役立ちます。

図3:異なる系統発生距離でのゲノムの比較は、特定の質問に対処するのに役立ちます。

我々は、2つのゲノムを一緒に比較することによって得られる情報がそれらの間の系統発生距離に大きく依存することを相同配列ア 系統発生距離は、通常、蓄積された配列変化の数、年の数、または世代の数として表される、進化的スケールでの二つの生物またはそのゲノム間の分離の程度の尺度である。 距離は系統樹上に置かれることが多く、生物間の推定された関係を示しています(図3)。 より遠くに関連する二つの生物があるほど、それらの間で検出される配列の類似性または共有されたゲノム特徴は少なくなります。 したがって、共有遺伝子のクラスに関する一般的な洞察のみが、非常に長い系統発生距離(例えば、それらの分離から10億年以上)でのゲノム比較によ このような非常に大きな距離にわたって、遺伝子の順序とその転写を調節する配列の署名はほとんど保存されていません。
より近い系統発生距離(分岐の50-200万年)では、機能的および非機能的なDNAの両方が保存されたセグメント内に見出される。 これらの場合、機能的配列は、それらの配列が非機能的DNAよりも変化していないか、またはよりゆっくりと変化しているため、選択の特徴を示すであ また、非機能性DNAから機能を識別する能力を超えて、比較ゲノミクスはまた、遺伝子のエクソン、非コードRna、およびいくつかの遺伝子調節部位をコードする
対照的に、約5万年の進化によって分離された非常に類似したゲノム(ヒトやチンパンジーなど)は、生物学的形態の微妙な違いを説明するかもしれな これらは、方向選択の下での配列変化であり、自然選択が単一の表現型を支持し、対立遺伝子の頻度を一方向に連続的にシフトさせるプロセスである。 このように、比較ゲノミクスは、ゲノム配列データが蓄積されるにつれてますます有益になる生物学的発見に対する強力で有望なアプローチである。

コメントを残す

メールアドレスが公開されることはありません。