バイオインフォマティクス実習資料(平成22年度、清水謙多郎)
タンパク質立体構造データベース
タンパク質立体構造データベースには、立体構造データそのものを登録した一次データベースと、構造を分類・比較した結果を登録した二次データベース
がある。前者については、PDB(Protein Data
Bank)がその役割を担っている。PDBには、タンパク質のX線結晶構造解析、NMRで得られた3次元座標データ、アミノ酸配列と二次構造の情報、文献
情報、そのほか、熱ゆらぎに関する情報や解像度などが記載されている。またDNA、RNAなどの核酸の立体構造や、複数の分子の複合体の立体構造なども登
録されている。
- PDB(http://www.rcsb.org/pdb/)
RCSB(Research Collaboratory for Structural
Bioinformatics)が公開しているタンパク質構造データベース。1971年、Brookhaven National
Laboratoryに設立された。1980年代に入り、X線結晶構造解析の技術の向上、情報公開の流れに伴い、データ数が急増。1990年代に入って、
主要雑誌がPDB登録番号の掲載を義務づけ、一部グラント取得にもPDBへの登録が義務づけられるようになる。1998年にRCSBに管理が移管される。
タンパク質だけでなく、核酸、糖鎖などの立体構造も登録されている。なお、日本では大阪大学蛋白研にミラーサイトがある。このサイトではさらに関連データ
ベースやPDBをXML化したデータベースなどを統合して、PDBj(http://www.pdbj.org/)
として公開している。2003年、RCSB、MSD-EBI、PDBjが、単一データベースの提供、データ形式の修正と統一を目的とする
Worldwide Protein Data Bank(wwPDB)(http://www.wwpdb.org/)を結成 した。
分子グラフィックスソフトウェア
分子の座標データを入力して可視化する(visualization, 人間の目で見えるようにする)ソフトウェア。
この実習に関係するツール、データベース
実習で、アラインメントファイルやModellerのスクリプトなどを作りますが、時間的に間に合わない場合は、上記のできあいのものを使って下さ い。
タンパク質3の構造予測
ターゲットのタンパク質1の配列は、protein3.fastaからダウンロードして下さい。
データ形式変換ツール
BLAST検索結果からFASTA形式への変換プログラム(btof.pl)
BLAST検索結果からBiosym Alignment file(Discovery Studio align)形式への変換プログラム(
btoa.pl)
FASTA形式からBiosym Alignment file(Discovery Studio align)形式への変換プログラム(
ftoa.pl)