2012年度 機能ゲノム学Functional Genomics 2012

 

西田洋巳Hiromi Nishida

 

実習72: ゲノム比較解析

Practice: Comparison of bacteria based on the whole-genome information

 

1. オルソログ遺伝子に基づく系統解析Orthologous protein sequence comparison-based phylogenetic analysis

(1) データダウンロードDownload the following data

cluster2.xlsx

このデータはMicrobial Genome Database for Comparative Analysisによる4種のバクテリアBacillus subtilisEscherichia coliMycoplasma genitaliumStreptomyces griseusのオルソログ解析結果である

(2) データの69行目のS-adenosylmethionine synthase130行目のSerine hydroxymethyltransferaseなどが各生物種に単一に存在していることがわかる

上記の2つの各酵素についてKyoto Encyclopedia of Genes and Genomes (KEGG)において検索し、そのアミノ酸配列を得る

(3) それぞれのアミノ酸シークエンスデータAmino acid sequencesMulti-FASTA形式でまとめる

(4) Molecular Evolutionary Genetics Analysis (MEGA)を使用して(3)の各データセットの整列配列Multiple alignmentを作成する

なお、DNA配列の比較の場合は生物配列解析基礎(58日)[1-8]を参照

MEGAを開きAlign Create a new alignment

Are you building a DNA or Protein sequence alignment?  Protein

Amino acid sequenceCopy & Paste

Alignment Align by MUSCLE Compute

Data Export Alignment MEGA format File name:Seq1 (or Seq2)

MEGAを一度閉じる

Seq1.meg (or Seq2.meg)を開く

Phylogeneyから系統樹を作成する

(5) Seq1Seq2を結合させたデータを作成し、(4)を行う

実際にはすべてのオルソログ遺伝子についてデータを結合させたデータについて解析を行う

 

2. 遺伝子構成の比較に基づく系統解析Gene content comparison-based phylogenetic analysis

(1) 遺伝子構成行列の作成Construct a gene presence/absence data matrix

空欄セル → A、埋まっているセル → C

A列からD列を選択しCopy、別のSheetに行と列を入れ替えてPaste

その行列Copyをメモ帳にPasteし、TabSpaceを削除

Fasta形式で保存(Seq3.txtとして保存)

MEGAを開き、File Convert File Format to MEGA

MEGAformatで保存

(2) (1)で保存したファイルを開くOpen the file

(3) 近隣結合法を選択Select “Construct/Test Neighbor-joining tree” in “Phylogeny”

(4) ブートストラップ回数Select number of bootstrap replications (for example, 1000)

(5) モデルの選択、重要Select “No. of differences” in “Model/Method”

この解析の場合、これ以外の選択肢はない

(6) 系統樹作成Click “Compute”

(7) 系統樹保存Save the phylogenetic tree as PDF

 

3. ゲノムシグニチャー比較

バイオスタティスティクス基礎論(59日)[3-7]を参照