遺伝子の機能アノテーション
• 遺伝子ごとにホモロジー検索,モチーフ検索• 比較ゲノムに基づくアプローチ
– 双方向ベストヒット– 生物種間で保存されている領域を探索
• ゲノム上で近い双方向ベストヒット– ロゼッタストーン– 系統プロファイル
• その他– 発現情報を利用:トランスクリプトーム– タンパク質相互作用の情報を利用:プロテオーム– 構造予測
単純なホモロジー検索では
• オーソログ遺伝子とパラログ遺伝子の区別が難しい場合がある.
• データベース中に間違ってアノテートされた遺伝子がある場合があり,それにヒットしてしまう.
• 非常によく保存された短いモチーフにヒットしてしまい,全体的に似ている遺伝子が取れない場合がある.
• 機能未知遺伝子とホモロジーがあっても,うれしくない.
オーソログとパラログ
• オーソログ(Ortholog)– 種分岐の際に同じ遺伝子だったもの– 通常同じ機能を持つ
• パラログ(Paralog)– 遺伝子重複によってできた類似遺伝子– 通常異なる機能を持つ
• ゼノログ(Xenolog)– 水平移動によって得られた類似遺伝子
パラログ遺伝子の例
• ATP Binding Cassetteトランスポーター– 各基質ごとに遺伝子のセットを持っている
Substrate binding proteins
Inner membrane
Permeases
ATP binding proteins
Substrates
ゲノムA
ゲノムBGlutamine transporter
双方向ベストヒットゲノムAから見るとベストヒット
双方向ベストヒット (BBH)
• Pair of close bidirectional best hits– Overbeek et al., Proc. Natl. Acad. Sci. USA, 96:2896 (1999)
ゲノムA
ゲノムB
Glutamine
close
ゲノム上で並んだ BBH
ロゼッタストーン
• Marcotte, et al., Science 285:751 (1999)• 他の生物種でフュージョンしている2つの遺伝子は相互作用している可能性が高い
• Pellegrini et al., Proc. Natl. Acad. Sci. USA, 96:4285 (1999)• オーソログ遺伝子のパターンを分類
同じパターンを持つ遺伝子は進化的・機能的に関連がある
系統プロファイル
E.coli S.cerevisiae B.subtilis H.influenzae
!"#$ % & %
!"#' % % &
!"#( & % %
!"#) % & &
!"#* & % %
!"#+ % % &
微生物ゲノム比較解析システム@基礎生物学研究所http://mbgd.genome.ad.jp/
MBGDで作成された系統プロファイル
全生物種で保存されている遺伝子:42
光合成細菌らん藻だけで保存されている遺伝子:355
比較ゲノム用のデータベース
• COG: Clusters of Orthologous Groups– http://www.ncbi.nlm.nih.gov/COG/
• MBGD: Microbial Genome Database– http://mbgd.genome.ad.jp/
• PEDANT: Protein, Extraction, Description and AnalysisTool– http://pedant.gsf.de/
• SSDB: Sequence Similarity Database– http://www.genome.jp/kegg/genes.html
SSDB
• Gene/Protein Universe– アミノ酸配列の類似性を全対全で計算した結果をデータベース化
• Smith-Waterman search• 120以上の生物種
各クラスターにオーソログIDを割り当てる
SSDB 隣接行列表現
http://www.genome.jp/kegg/catalog/org_list.html から ctr を選択しGenome map をクリックするとゲノム比較ツールへ飛ぶ
クラミジアゲノムの比較
ゲノム比較解析
ゲノム比較によるクラスター抽出