2012年度 機能ゲノム学Functional Genomics 2012
西田洋巳Hiromi Nishida
実習7月2日: ゲノム比較解析
Practice: Comparison of bacteria based on the whole-genome information
1. オルソログ遺伝子に基づく系統解析Orthologous protein sequence comparison-based phylogenetic analysis
(1) データダウンロードDownload the following data
このデータはMicrobial Genome Database for Comparative Analysisによる4種のバクテリアBacillus subtilis、Escherichia coli、Mycoplasma genitalium、Streptomyces griseusのオルソログ解析結果である
(2) データの69行目のS-adenosylmethionine synthase、130行目のSerine hydroxymethyltransferaseなどが各生物種に単一に存在していることがわかる
上記の2つの各酵素についてKyoto Encyclopedia of Genes and Genomes (KEGG)において検索し、そのアミノ酸配列を得る
(3) それぞれのアミノ酸シークエンスデータAmino acid sequencesをMulti-FASTA形式でまとめる
(4) Molecular Evolutionary Genetics Analysis (MEGA)を使用して(3)の各データセットの整列配列Multiple alignmentを作成する
なお、DNA配列の比較の場合は生物配列解析基礎(5月8日)[1-8]を参照
MEGAを開きAlign → Create a new alignment
Are you building a DNA or Protein sequence alignment? → Protein
Amino acid sequenceをCopy & Paste
Alignment → Align by MUSCLE → Compute
Data → Export Alignment → MEGA format → File name:Seq1 (or Seq2)
MEGAを一度閉じる
Seq1.meg (or Seq2.meg)を開く
Phylogeneyから系統樹を作成する
(5) Seq1とSeq2を結合させたデータを作成し、(4)を行う
実際にはすべてのオルソログ遺伝子についてデータを結合させたデータについて解析を行う
2. 遺伝子構成の比較に基づく系統解析Gene content comparison-based phylogenetic analysis
(1) 遺伝子構成行列の作成Construct a gene presence/absence data matrix
空欄セル → A、埋まっているセル → C
A列からD列を選択しCopy、別のSheetに行と列を入れ替えてPaste
その行列Copyをメモ帳にPasteし、Tab、Spaceを削除
Fasta形式で保存(Seq3.txtとして保存)
MEGAを開き、File → Convert File Format to MEGA
MEGAのformatで保存
(2) (1)で保存したファイルを開くOpen the file
(3) 近隣結合法を選択Select “Construct/Test Neighbor-joining tree” in “Phylogeny”
(4) ブートストラップ回数Select number of bootstrap replications (for example, 1000)
(5) モデルの選択、重要Select “No. of differences” in “Model/Method”
この解析の場合、これ以外の選択肢はない
(6) 系統樹作成Click “Compute”
(7) 系統樹保存Save the phylogenetic tree as PDF
3. ゲノムシグニチャー比較
バイオスタティスティクス基礎論(5月9日)の[3-7]を参照