page112

第4章 生体分子の構造解析と分子シミュレーション

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 触媒(catalyst)
    一般に、特定の化学反応の反応速度を速める物質で、自身は反応の前後で変化しないもののことです。
  • 遺伝子(gene)
    大まかには「ゲノム上のタンパク質配列に対応する領域」です。より正確には「生体中で機能する産物を作り出すのに必要なDNA中の配列領域」という理解でよいと思います。
  • 遺伝子発現(gene expression)
    遺伝子の情報が細胞における構造および機能に変換される過程のことです。
  • 生体分子(biomolecule)
    タンパク質や代謝産物などの生体内で働く様々な有機化合物の総称という理解でよいです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。

4.1 立体構造データベース

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • タンパク質データバンク(Protein Data Bank; PDB)Burley et al., Nucleic Acids Res., 2021
    タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • W4.1

    PDBのWebサーバです。

    国・地域 名称 URL
    世界 wwPDB https://www.wwpdb.org/
    米国 RCSB PDB https://www.rcsb.org/
    欧州 PDBe https://www.ebi.ac.uk/pdbe/
    日本 PDBj https://pdbj.org/

  • 図4.1
    RCSB PDBのトップページです。
  • フレーズ(phrase)
    文法上の単語の集まりのことです。「句(く)」ともいいます。
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • 1HVR
    HIV proteaseのエントリの1つです。
page113

4.2 立体構造ビューア

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 1HVR
    HIV proteaseのエントリの1つです。
  • オペレーティングシステム(operating system; OS)
    コンピュータのオペレーション(操作・運用・運転)を司るシステムソフトウェアです。
  • W4.2

    立体構造ビューアです。*PyMolは教育目的利用を除き有料、**UCSF Chimeraは非商用利用のみです。

    名称 URL
    CueMol http://www.cuemol.org/ja/
    PyMol* https://pymol.org/2/
    RasMol http://www.openrasmol.org/
    Swiss-PdbViewer https://spdbv.vital-it.ch/
    UCSF Chimera** https://www.cgl.ucsf.edu/chimera/

  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.2
    UCSF Chimeraで1hvr.pdbを開いた様子です。1hvr.pdbのファイルは1HVRから取得可能です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 主鎖(main chain)
    タンパク質は20種類のα-アミノ酸が鎖状に多数連結(重合)してできた高分子化合物ですが、この鎖を構成しているのは、α-アミノ酸のRCH(NH2)COOH という構造のうち、側鎖に相当するR以外の部分になります。このR以外の部分を主鎖といいます。
  • アミノ酸残基(amino acid residue)
    リンク先は「残基」です。タンパク質は構成単位であるモノマーが多数連結(重合)してできた高分子化合物であり、化学結合の構造部分とそれ以外の部分に分けられます。このうち後者の「化学結合以外の部分構造」のことを残基といいます。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造を意味します。また、タンパク質は、その残基部分の特性によって様々に変化するため、「アミノ酸残基」という表現がよくなされます。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。
  • コイル(coil)
    リンク先は「ランダムコイル」です。ポリマーを構成するモノマーが隣接したモノマーと結合しながらランダムに配向したものです。1つの決まった形というのはありませんが、分子全体の統計的な分布というものは考えられます。αヘリックスやβシートのような二次構造をとっていない領域がコイルだという理解でよいです。

page114
  • 図4.2
    UCSF Chimeraで1hvr.pdbを開いた様子です。1hvr.pdbのファイルは1HVRから取得可能です。

  • 静電ポテンシャル(electrostatic potential)
    リンク先は「電位」です。電荷に係る位置エネルギーのことです。

  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • サブユニット(subunit)
    他のタンパク質と会合して多量体タンパク質やオリゴマータンパク質を形成する単一のタンパク質分子のことです。
  • ホモ2量体(homodimer)
    2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまった分子または超分子のことです。
  • ペプチド(peptide)
    アミノ酸がペプチド結合により短い鎖状につながった分子の総称です。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。

page115
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • 1HVR
    HIV proteaseのエントリの1つです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。

4.3 立体構造データフォーマット

  • PDB Format
    タンパク質立体構造データベースであるPDBが利用しているファイル形式のことです。
  • W4.3
    PDBレコードの説明(簡易版)です。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
  • W4.4
    macromolecular Crystallographic Information Format(mmCIF)です。

4.4 立体構造決定法

  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • 表4.1

    2021年8月における立体構造決定法ごとのエントリ数と全体に対する割合です。

    立体構造決定法 エントリ数 割合
    X線結晶構造解析法 158,913 87.8%
    NMR法 13,451 7.4%
    電子顕微鏡法 8,290 4.6%
    その他 299 0.2%
    合計 180,953 100.0%

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 核磁気共鳴(nuclear magnetic resonance; NMR)
    外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • 低温電子顕微鏡法(Cryo-electron microscopy; cryo-EM)
    透過型電子顕微鏡法の一種で、試料を低温(多くの場合液体窒素の温度)において解析する手法です。「クライオ電子顕微鏡法」ともいいます。生物学におけるクライオ電子顕微鏡法では、試料を染色せず、凍結することで「固定」して試料を観察すします。このため、通常の染色や化学固定をして試料を作製する電子顕微鏡法と比べると、より生体内に近い試料の構造を観察出来ると考えられています。
  • 単粒子解析法(single particle analysis; SPA)
    3次元電子顕微鏡法の1つです。透過型電子顕微鏡(TEM)下で多数の均一な粒子を観察、撮影し、画像処理によって粒子の詳細な構造を得る手法です。単一の撮影像よりも分解能を向上させることができるほか、様々な方向を向いた粒子を撮影することで、3次元立体構造を把握することも可能となります。低温電子顕微鏡法(cryo-EM)の利用とともに主にタンパク質などの生体高分子やウイルスなどの解析に用いられ、近年各種解析手法や検出器の向上により分解能が原子分解能を達成しました。
page116
  • 表4.1

    2021年8月における立体構造決定法ごとのエントリ数と全体に対する割合です。

    立体構造決定法 エントリ数 割合
    X線結晶構造解析法 158,913 87.8%
    NMR法 13,451 7.4%
    電子顕微鏡法 8,290 4.6%
    その他 299 0.2%
    合計 180,953 100.0%

4.4.1 X線結晶構造解析法

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • X線(X-ray)
    波長が1pm - 10nm程度の電磁波です。発見者であるヴィルヘルム・レントゲンの名をとってレントゲン線とよばれることもあります。
  • 電子(electron)
    宇宙を構成するレプトンに分類される素粒子です。素粒子標準模型では、第一世代の荷電レプトンに位置付けられます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
  • 炭素(carbon)
    原子番号6の元素です。元素記号はC。原子量は12.01です。単体・化合物両方においてきわめて多様な形状をとることができます。融点や昇華を起こす温度は全元素の中でもっとも高いです。
  • 窒素(nitrogen)
    原子番号7の元素である。元素記号はN。原子量は14.007です。地球の大気中に安定した気体として存在するほか、生物に欠かせないアミノ酸、アンモニアなど様々な化合物を構成します。ハーバー・ボッシュ法によりアンモニアの量産が可能になって以降、人間により工業的に産生された窒素肥料や窒素酸化物が大量に投入・排出され、自然環境にも大きな影響を与えています。
  • 酸素(oxygen)
    原子番号8の元素です。元素記号はO。原子量は16.00です。この場合は酸素分子O2の文脈で用いています。これは、常温常圧では無色無臭で助燃性をもつ気体として存在します。
  • 硫黄(sulfur)
    原子番号16の元素です。元素記号はS。原子量は32.1です。酸素族元素の1つです。淡黄色で無味無臭であり、たびたび誤用される温泉街などで感じる「硫黄の臭い」は硫黄と水素の化合物である硫化水素によるものです。
  • リン(phosphorus)
    原子番号15の元素です。元素記号はP。原子量は30.97です。窒素族元素(15族)の1つです。生体内では、遺伝情報の要であるDNAやRNAのポリリン酸エステル鎖として存在するほか、生体エネルギー代謝に欠かせないATP、細胞膜の主要な構成要素であるリン脂質など、重要な働きを担う化合物中に存在しています。また、脊椎動物ではリン酸カルシウムが骨格の主要構成要素としての役割ももちます。このため、あらゆる生物にとっての必須元素であり、地球上におけるリンの存在量が、地球生態系のバイオマスの限界量を決定すると言われています。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • 非対称単位(asymmetric unit)
    結晶構造の最も小さな単位構造のことです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.3
    Chymotrypsin inhibitor 2 (PDB ID: 2CI2)の結晶中の並びです。
  • 2CI2
    chymotrypsin inhibitor 2のPDB IDです。
  • 分子間相互作用(intermolecular interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のことです。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。

  • biological assemblyまたはbiological unit
    生物学的に機能しうる最小限の分子構成のことです。
  • HIV protease
    リンク先は「HIV-1 protease」です。エイズ(AIDS)治療の標的タンパク質です。
  • ホモ2量体(homodimer)
    2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまった分子または超分子のことです。
  • サブユニット(subunit)
    他のタンパク質と会合して多量体タンパク質やオリゴマータンパク質を形成する単一のタンパク質分子のことです。
  • 会合
    この場合は、2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまっているさまのことです。
  • ホモ多量体(homopolymer)
    同種の分子やサブユニット(単量体)が物理的・化学的な力によって2個以上まとまった分子または超分子のことです。ホモ多量体は、ホモ2量体を含みます。
  • 3PHV
    HIV proteaseのエントリの1つです。
  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.3
    Chymotrypsin inhibitor 2 (PDB ID: 2CI2)の結晶中の並びです。

page117
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • X線回折(X-ray diffraction)
    X線が結晶格子で回折を示す現象のことです。X線の回折の結果を解析して結晶内部で原子がどのように配列しているかを決定する手法をX線結晶構造解析あるいはX線回折法といいます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • PDB Format
    タンパク質立体構造データベースであるPDBが利用しているファイル形式のことです。
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • 欠失残基(missing residue)
    残基全体の原子が欠失している場合に、その残基のことを欠失残基とよびます。

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 回折(diffraction)
    この場合は、X線回折(X-ray diffraction)で得られたデータのことを指します。つまり、X線が結晶格子で回折を示す現象を記録したデータのことです。
  • 分解能(optical resolution)
    装置などで対象を測定または識別できる能力。顕微鏡、望遠鏡、回折格子などにおける能力の指標の1つです。
  • 熱運動(thermal motion)
    タンパク質を構成する原子や分子の運動のことです。
  • 温度因子(temperature factor)
    リンク先は「デバイ‐ワラー因子」です。熱振動によるX線や中性子の散乱強度の減衰を表す因子のことです。結晶では原子の熱振動によってその電子は静止原子より広い空間に広がって分布します。X線回折などにおいて、回折角の大きい反射では同一の原子内でも各電子の散乱X線の位相のずれが大きくなり、回折強度が減少します。静止原子の構造因子\(f\)を用いると、実在の原子構造因子は\(f\)よりも小さくなり、\(f \cdot e^{-M}\)という形で表されます。この\(e^{-M}\)が温度因子です。温度因子\(B\)と座標のゆらぎ\(\overline{\Delta r}\)は、以下の式で関係づけられます。
    \[ B = \frac{8 \pi^2}{3}(\overline{\Delta r})^2 \]
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。

4.4.2 NMR法

  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 溶液(solution)
    2つ以上の物質から構成される液体状態の混合物です。一般的には主要な液体成分の溶媒(solvent)と、その他の気体、液体、固体の成分である溶質(solute)とから構成されます。
  • 水素(hydrogen)
    、原子番号1の元素です。元素記号はH。原子量は1.00794です。非金属元素の1つです。一般的に「水素」と言う場合、元素としての水素の他にも水素の単体である水素分子(水素ガス)H2、1個の陽子を含む原子核と1個の電子からなる水素原子、水素の原子核(ふつう1個の陽子、プロトン)などに言及している可能性があるため、文脈に基づいて判断する必要があります。
  • 原子核(atomic nucleus)
    単に核(かく、(英:nucleus)ともいい、電子と共に原子を構成している。原子の中心に位置する核子の塊であり、正の電荷を帯びています。原子核は原子と比べて非常に小さいです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
  • 核スピン(nuclear spin)
    原子核は正電荷をもち自転することで、磁場を発生させています。つまり各々の原子は小さな磁石のようなものです。このような原子核がもっている向きをもった物理量(角運動量)のことです。核磁気モーメントともいいます。
  • 励起エネルギー(excited energy)
    リンク先は「励起状態」です。原子をある状態(たとえば基底状態)からより高いエネルギー状態(励起状態)に移すのに要するエネルギーという理解でよいです。励起後、原子は特徴的なエネルギーを持つフォトンを放出することによって、基底状態あるいはより低い励起状態に戻ります。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。

  • 図4.4
    ヒトSrcのSH2ドメインのNMR構造です(PDB ID: 1HCT)。
  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
page118
  • 図4.4
    ヒトSrcのSH2ドメインのNMR構造です(PDB ID: 1HCT)。
  • 図4.5
    ヒトSrcのSH2ドメインの結晶構造(白色)へのNMR構造(灰色)の重ね合わせ結果です。

  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。
  • 根平均二乗変位(root mean square deviation; RMSD)
    リンク先は「原子位置の平均二乗偏差」です。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0 Å(オングストローム)です。
    \[ {\rm{RMSD}} = \sqrt{\frac{1}{n(A)} \sum_{i \in A} |\boldsymbol{\rm r}_i - \langle \boldsymbol{\rm r}_i \rangle|^2} \] 以下は記号の説明です:
    • \(A\)
      RMSDの計算に用いる原子の番号の集合です。
    • \(n(A)\)
      \(A\)に含まれる原子の個数です。
    • \(\boldsymbol{\rm r}_i\)
      \(i\)番目の原子の座標です。
    • \(\langle \boldsymbol{\rm r}_i \rangle\)
      \(i\)番目の原子の平均構造の座標です。以下の式で与えられます。
      \[ \langle \boldsymbol{\rm r}_i \rangle = \frac{1}{n(A)} \sum_{i \in A} \boldsymbol{\rm r}_i \]
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • SH2ドメイン
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • 図4.5
    ヒトSrcのSH2ドメインの結晶構造(白色)へのNMR構造(灰色)の重ね合わせ結果です。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
page119
  • 図4.6
    結晶構造(実線)とNMR構造(破線)におけるC\(\alpha\)原子のゆらぎの比較です。

  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • 欠失残基(missing residue)
    残基全体の原子が欠失している場合に、その残基のことを欠失残基とよびます。
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。
  • 図4.6
    結晶構造(実線)とNMR構造(破線)におけるC\(\alpha\)原子のゆらぎの比較結果です。
  • 温度因子(temperature factor)
    リンク先は「デバイ‐ワラー因子」です。熱振動によるX線や中性子の散乱強度の減衰を表す因子のことです。結晶では原子の熱振動によってその電子は静止原子より広い空間に広がって分布します。X線回折などにおいて、回折角の大きい反射では同一の原子内でも各電子の散乱X線の位相のずれが大きくなり、回折強度が減少します。静止原子の構造因子 f を用いると、実在の原子構造因子は f よりも小さくなりますが、この因子に相当するものが温度因子です。
  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。

4.4.3 電子顕微鏡法

  • 低温電子顕微鏡法(Cryo-electron microscopy; cryo-EM)
    透過型電子顕微鏡法の一種で、試料を低温(多くの場合液体窒素の温度)において解析する手法です。「クライオ電子顕微鏡法」ともいいます。生物学におけるクライオ電子顕微鏡法では、試料を染色せず、凍結することで「固定」して試料を観察すします。このため、通常の染色や化学固定をして試料を作製する電子顕微鏡法と比べると、より生体内に近い試料の構造を観察出来ると考えられています。
  • 単粒子解析法(single particle analysis; SPA)
    3次元電子顕微鏡法の1つです。透過型電子顕微鏡(TEM)下で多数の均一な粒子を観察、撮影し、画像処理によって粒子の詳細な構造を得る手法です。単一の撮影像よりも分解能を向上させることができるほか、様々な方向を向いた粒子を撮影することで、3次元立体構造を把握することも可能となります。低温電子顕微鏡法(cryo-EM)の利用とともに主にタンパク質などの生体高分子やウイルスなどの解析に用いられ、近年各種解析手法や検出器の向上により分解能が原子分解能を達成しました。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 溶液(solution)
    2つ以上の物質から構成される液体状態の混合物です。一般的には主要な液体成分の溶媒(solvent)と、その他の気体、液体、固体の成分である溶質(solute)とから構成されます。
  • 非晶質(non-crystalline)
    リンク先は「アモルファス(amorphous)」です。結晶のような長距離秩序はないが、短距離秩序はある物質の状態のことです。
  • 電子顕微鏡(electron microscope)
    通常の顕微鏡(光学顕微鏡)では、観察したい対象に光(可視光線)をあてて拡大するのに対し、光の代わりに電子(電子線)をあてて拡大する顕微鏡のことです。
  • 電子線
    リンク先は「陰極線(cathode ray)」です。真空管の中で観察される電子の流れのことです。電子線・陰極線・電子ビームともよばれます。
  • 電子(electron)
    宇宙を構成するレプトンに分類される素粒子です。素粒子標準模型では、第一世代の荷電レプトンに位置付けられます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • 射影(projection)
    物体に光を当ててその影を映すこと、またその影のことです。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 電子顕微鏡データバンク(Electron Microscopy Data Bank; EMDB)
    電子密度図のデータのリポジトリです。
  • 原子分解能(atomic resolution)
    タンパク質の個々の原子の位置を明確に識別できる程度の解像度だという意味です。
  • 複合体(complex)
    この場合は、複数のタンパク質単体が1つの塊となって(機能して)いる状態や、タンパク質と低分子化合物が1つの塊となって(機能して)いる状態の形(立体構造)のことを指します。
page120

4.5 配列データベースとの連携

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • UniProt Knowledgebase(UniProtKB)
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • P12931
    UniProtKBにあるヒトSrcのエントリです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • PDBe
    欧州のPDBです。
  • PDBj
    日本のPDBです。

  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • BLASTAltschul et al., J Mol Biol., 1990
    NCBI BLASTにリンクを張っています。BLASTは、Basic Local Alignment Search Toolの略です。「ぶらすと」と読みます。DNAの塩基配列あるいはタンパク質のアミノ酸配列のシーケンスアラインメントを行うためのアルゴリズム、またはそのアルゴリズムを実装したプログラムのことです。
  • 図4.7
    ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列を用いてBLAST検索を行った結果です。
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 配列一致度(sequence identity)
    比較する2本の配列が似ている度合いを表す指標の1つです。配列のアラインメントをとったとき、対応する文字が一致する割合を示すものです。分子(numerator)が「対応する文字が一致する数」、分母(denominator)が「アラインメントの長さ」です。
  • クエリ配列(query sequence)
    DBに問い合わせる配列のことです。この場合は、「ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列」です。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • 1A07
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • チェイン(chain)
    この場合は、「ポリペプチド鎖」のことです。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。

  • 図4.7
    ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列を用いてBLAST検索を行った結果です。
page121

4.6 立体構造比較

  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 並進(translation)
    この場合は、(比較したい2つの立体構造のうちの)一方を全体として平行移動させて、もう一方の立体構造に全体として近づけていくことです。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • 回転行列(rotation matrix)
    ユークリッド空間内における原点中心の回転変換の表現行列のことです。
  • 立体構造Bを回転行列\(\boldsymbol{\rm U}\)で回転させ、並進ベクトル\(\boldsymbol{\rm t}\)で並進させたときの立体構造AとのRMSDは以下で与えられます。
    \[ {\rm{RMSD}} = \sqrt{\frac{1}{N} \sum_{i = 1}^N |\boldsymbol{\rm r}_{{\rm A}, a(i)} - [\boldsymbol{\rm U} \boldsymbol{\rm r}_{{\rm B}, b(i)} + \boldsymbol{\rm t}]|^2} \] 以下は記号の説明です:
    • \(N\)
      重ね合わせに用いる原子ペアの数です。
    • \(\boldsymbol{\rm r}_{\rm A}\)
      立体構造Aの座標です。
    • \(a(i)\)
      \(i\)番目の原子ペアの立体構造Aにおける原子の通し番号です。
    • \(\boldsymbol{\rm U}\)
      回転行列のことです。
    • \(\boldsymbol{\rm r}_{\rm B}\)
      立体構造Bの座標です。
    • \(b(i)\)
      \(i\)番目の原子ペアの立体構造Bにおける原子の通し番号です。
    • \(\boldsymbol{\rm t}\)
      並進ベクトルのことです。
  • Kabsch W, Acta Cryst., 1976
    Kabschの方法の論文です。
  • Kabsch W, Acta Cryst., 1978
    Kabschの方法の論文です。

  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。

  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • 主鎖構造
    C\(\alpha\)原子座標に基づく構造のことです。C\(\alpha\)原子はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられていることを根拠としています。
  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • 立体構造の重ね合わせに用いる原子ペアを決めるツールのアルゴリズム
    • Flexible structure alignment by chaining aligned fragment pairs allowing twists (FATCAT)
    • Combinatorial extension (CE)
    • Template modeling score(TM-score)に基づくタンパク質立体構造アラインメント(TM-align)

  • 例題4.1
    1ページ目が問題、2ページ目以降が解答例です。
    • 1WW9
      カルバゾール1,9aジオキシゲナーゼの末端酸化酵素のPDBエントリです。
    • 1NDO
      ナフタレン1,2ジオキシゲナーゼのPDBエントリです。
    • blast2seq
      アミノ酸配列用のアラインメントツールです。

  • 配列一致度(sequence identity)
    比較する2本の配列が似ている度合いを表す指標の1つです。配列のアラインメントをとったとき、対応する文字が一致する割合を示すものです。分子(numerator)が「対応する文字が一致する数」、分母(denominator)が「アラインメントの長さ」です。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • Gan et al., Biophys J., 2002
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。
  • Guo et al., Proteins, 2007
page122

4.7 立体構造分類データベース

  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • blast2seq
    アミノ酸配列用のアラインメントツールです。
  • CE
    Combinatorial extensionという立体構造比較アルゴリズムのことです。
  • E-value
    バイオインフォマティクス分野で塩基またはアミノ酸配列をクエリとしてデータベース検索を行う際に指定する類似性指標のことです。「いーばりゅー」と読み、0に近い値ほどクエリ配列とヒットした配列の類似度が高いと判断します。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • TM-score
    Template modeling scoreという立体構造類似性の指標の1つです。RMSDはタンパク質のサイズが大きいほど大きい値になる傾向にありますが、TM-scoreはタンパク質のサイズによらないという特徴があります。0から1の値をとり、1に近いほど類似度が高いと判断します。よく用いられる閾値は0.5以上のようです。
  • Xu and Zhang, Bioinformatics, 2010
    TM-scoreが0.5以上であればその2つの立体構造は類似していると判断する根拠となる論文です。

  • 表4.2

    立体構造比較と配列比較の結果です。表の右上の領域に立体構造比較のRMSDとTM-scoreを、左下の領域に配列相同性解析の結果とE-valueを示しています。

    Raf-1のRas結合ドメイン ユビキチン Protein Gの免疫グロブリン結合ドメイン
    Raf-1のRas結合ドメイン 2.2 Å, 0.65 2.92 Å, 0.44
    ユビキチン 有意な類似性なし 3.13 Å, 0.38
    Protein Gの免疫グロブリン結合ドメイン 有意な類似性なし 0.011

  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 類縁関係
    互いに近い関係にあることです。
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。
  • タンパク質ファミリー(protein family)
    進化上の共通祖先に由来すると推定されるタンパク質をまとめたグループです。生物を進化系統により分類するように、タンパク質を進化の観点から分類する意味があります。同様の概念で遺伝子をまとめた「遺伝子ファミリー」(遺伝子族)もありますが、これもタンパク質ファミリーにほぼ対応します。「サブファミリー(subfamily)」や「スーパーファミリー(superfamily)」もこのリンク先になります。
    • ファミリー:配列類似性に基づいて明らかに進化的類縁関係にあるタンパク質が属する階層のことです。
    • スーパーファミリー:立体構造類似性などに基づいて、進化的類縁関係が推定されるタンパク質が属する階層のことです。
  • 1WW9
    カルバゾール1,9aジオキシゲナーゼの末端酸化酵素のPDBエントリです。
  • 1NDO
    ナフタレン1,2ジオキシゲナーゼのPDBエントリです。
  • blast2seq
    アミノ酸配列用のアラインメントツールです。
  • TM-score
    Template modeling scoreという立体構造類似性の指標の1つです。RMSDはタンパク質のサイズが大きいほど大きい値になる傾向にありますが、TM-scoreはタンパク質のサイズによらないという特徴があります。0から1の値をとり、1に近いほど類似度が高いと判断します。よく用いられる閾値は0.5以上のようです。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。
page123
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。

  • フォールド(fold)
    タンパク質の折りたたみ構造のことです。図4.8でも示されていますが、ファミリーやスーパーファミリーほど似てはいないものの、αヘリックスやβストランドの配置やつながり方といった部分としては似ているところがあります。それを表す階層がフォールドです。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • SCOPAndreeva et al., Nucleic Acids Res., 2020
    タンパク質ドメインの立体構造を、2次構造のみに基づく分類であるクラス(class)からスタートして、フォールド(fold)、スーパーファミリー(superfamily)、ファミリー(family)の順に階層的に分類したデータベース(DB)です。SCOPは、Structural Classification of Proteinsの略です。人手による分類と計算機による自動分類法を組み合わせているのが特徴です。
  • CATHSillitoe et al., Nucleic Acids Res., 2021
    タンパク質ドメインの立体構造を、クラス(class)、アーキテクチャ(architecture)、トポロジー(topology)、ホモロガススーパーファミリー(homologous superfamily)の順に分類しています。計算機による自動分類を行っています。CATHはこれらの頭文字をとったものです。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • SCOPAndreeva et al., Nucleic Acids Res., 2020
    タンパク質ドメインの立体構造を、2次構造のみに基づく分類であるクラス(class)からスタートして、フォールド(fold)、スーパーファミリー(superfamily)、ファミリー(family)の順に階層的に分類したデータベース(DB)です。SCOPは、Structural Classification of Proteinsの略です。人手による分類と計算機による自動分類法を組み合わせているのが特徴です。
  • CATHSillitoe et al., Nucleic Acids Res., 2021
    タンパク質ドメインの立体構造を、クラス(class)、アーキテクチャ(architecture)、トポロジー(topology)、ホモロガススーパーファミリー(homologous superfamily)の順に分類しています。計算機による自動分類を行っています。CATHはこれらの頭文字をとったものです。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Ubiquitin-like
    • ファミリー:Ras-binding domain, RBD
  • 1UBQ
    ユビキチンのPDBエントリです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Ubiquitin-like
    • ファミリー:Ubiquitin-related
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Immunoglobulin-binding domains
    • ファミリー:Immunoglobulin-binding domains
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:Phosphatidylinositol 3-kinase Catalytic Subunit
  • 1UBQ
    ユビキチンのPDBエントリです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:Phosphatidylinositol 3-kinase Catalytic Subunit
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:- (空欄)
  • 相同性検索(homology search)
    リンク先は「相同性」です。あるfeature(この場合は塩基配列)が共通の祖先に由来するかどうかを調べることです。ホモロジー検索ともよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
page124

4.8 分子力学法

  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。

4.8.1 ポテンシャルエネルギー関数

  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • シュレーディンガー方程式(Schrödinger equation)
    物理学の量子力学における基礎方程式です。シュレーディンガー方程式の解は一般的に波動関数とよばれます。波動関数はまた状態関数ともよばれ、量子系(電子など量子力学で取り扱う対象)の状態を表します。シュレーディンガー方程式は、ある状況の下で量子系が取り得る量子状態を決定し、また系の量子状態が時間的に変化していくかを記述します。
  • 解析的(analytic)
    方程式の解が、いろいろ式変形していけば得られるということです。
  • 原子核(atomic nucleus)
    単に核(かく、(英:nucleus)ともいい、電子と共に原子を構成している。原子の中心に位置する核子の塊であり、正の電荷を帯びています。原子核は原子と比べて非常に小さいです。
  • Born-Oppenheimer近似
    リンク先は「ボルン–オッペンハイマー近似」です。電子と原子核の運動を分離して、それぞれの運動を表す近似法です。この近似は、原子核の質量が電子の質量よりも遥かに大きいために可能となります。
  • 分子軌道法(Molecular Orbital method; MO法)
    原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • W4.5

    MO法のプログラムです。Gaussian*は有料です。GAMESSは、USバージョンとUKバージョンがあります。論文のMethodsでもどちらのバージョンかまで明記されることが多いので、ここではGAMESS(US)と記載しています。

    名称 URL
    Gaussian* http://gaussian.com/
    GAMESS(US) https://www.msg.chem.iastate.edu/gamess/

  • 小分子(small molecule)
    低分子量(900ダルトン未満)の有機化合物のことで、大きさは1 nm程度です。多くの医薬薬は小分子である。核酸やタンパク質などの大きな構造物や多糖の多くは小分子ではありませんが、それらを構成するモノマー(それぞれリボヌクレオチドまたはデオキシリボヌクレオチド、アミノ酸、単糖)は小分子とみなされることが多いです。
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 運動方程式(equation of motion)
    物理学において運動の従う法則を数式に表したものです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。
  • 典型的なポテンシャルエネルギー関数の例です。
    \[ \begin{align} E(\boldsymbol{\rm r}) &= \sum_b k_b (r_b - r_b^0)^2 + \sum_a k_a (\theta_a - \theta_a^0)^2 + \sum_d k_d [1 + \cos (n_d \phi_d - \delta_d^0)] \\ & + \sum_{i, j} \biggl\{ 4 \varepsilon_{ij} \biggl[\Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^{12} - \Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^6\biggr] \biggr\} + \sum_{i, j} \frac{q_i q_j e^2 N_{\rm A}}{4 \pi \varepsilon_0 r_{ij}} \end{align} \] 以下は記号の説明です:
    • \(k_b\)
      力の定数です。
    • \(r_b\)
      \(b\)番目の共有結合の長さです。
    • \(r_b^0\)
      平衡結合長です。
    • \(k_a\)
      力の定数です。
    • \(\theta_a\)
      \(a\)番目の共有結合角です。
    • \(\theta_a^0\)
      \(a\)番目の平衡結合角です。
    • \(k_d\)
      エネルギー極小状態の間の障壁の高さです。
    • \(n_d\)
      エネルギー極小状態の数です。
    • \(\phi_d\)
      \(d\)番目の二面角です。
    • \(\delta_d^0\)
      エネルギー極小状態の位相を決める定数です。
    • \(\varepsilon_{ij}\)
      \(i\)番目と\(j\)番目の原子の間のwell depthです。適当な日本語訳が見当たりませんが、page125でも書いているように、\(\varepsilon\)はエネルギー最小状態の深さを決めるパラメータです。
    • \(\sigma_{ij}\)
      \(i\)番目と\(j\)番目の原子の間の衝突半径です。
    • \(r_{ij}\)
      \(i\)番目と\(j\)番目の原子の間の距離を表しており、分子の座標\(\boldsymbol{\rm r}\)から計算されます。
    • \(q_i q_j e^2\)
      \(q_i e\)\(q_j e\)という風に分けて考えます。\(q_i e\)\(i\)番目の原子の位置にある点電荷、\(q_j e\)\(j\)番目の原子の位置にある点電荷です。
    • \(e\)
      電気素量です。
    • \(N_{\rm A}\)
      アボガドロ定数です。
    • \(\pi\)
      円周率(円の直径に対する円周の長さの比率)のことです。
    • \(\varepsilon_0\)
      真空の誘電率です。

  • 共有結合長(covalent bond length)
    リンク先は「結合長」です。共有結合している2つの原子間の平均距離のことです。上記ポテンシャルエネルギー関数例の第1項\(\sum_b k_b (r_b - r_b^0)^2\)のことです。
  • 共有結合角(covalent bond angle)
    リンク先は「結合角」です。分子構造の構造要素の1つで、それぞれの原子から伸びている2つの共有結合のなす角度のことです。上記ポテンシャルエネルギー関数例の第2項\(\sum_a k_a (\theta_a - \theta_a^0)^2\)のことです。
  • 二面角(dihedral angle)
    2つの平面(またはその部分集合)がなす角度である。たとえば、二面角が0なら2面は平行(同一の場合を含む)で、\(\pi/2\) (つまり90度)なら垂直です。上記ポテンシャルエネルギー関数例の第3項\(\sum_d k_d [1 + \cos (n_d \phi_d - \delta_d^0)]\)のことです。
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。上記ポテンシャルエネルギー関数例の第4項\(\sum_{i, j} \biggl\{ 4 \varepsilon_{ij} \biggl[\Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^{12} - \Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^6\biggr] \biggr\}\)のことです。
  • 静電相互作用(electrostatic interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な力(相互作用)のことです。上記ポテンシャルエネルギー関数例の第5項\(\sum_{i, j} \frac{q_i q_j e^2 N_{\rm A}}{4 \pi \varepsilon_0 r_{ij}}\)のことです。
  • 真空の誘電率(permittivity of vacuum)
    リンク先は「電気定数」です。電気的な場を関係づける構成方程式の係数として表される物理定数です。電気定数(electric constant)ともよばれます。
  • 電気素量(elementary charge)
    電気量の単位となる物理定数です。陽子あるいは陽電子1個の電荷に等しく、電子の電荷の符号を変えた量に等しいです。。素電荷(そでんか)、電荷素量ともよばれます。
  • アボガドロ定数(Avogadro constant)
    物質量1 molを構成する粒子(分子、原子、イオンなど)の個数を示す定数です。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • トポロジー(topology)
    この場合は、どの原子がどの原子と共有結合相互作用を形成しているかという情報のことです。
  • 周期関数(periodic function)
    一定の間隔あるいは周期ごとに取る値が繰り返す関数のことです。代表的な例としては、sinなどの三角関数があげられます。

  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • Lennard-Jonesポテンシャル(Lennard-Jones potential)
    リンク先は「レナード-ジョーンズ・ポテンシャル」です。2つの原子間の相互作用ポテンシャルエネルギーを表す経験的なモデルの1つです。ポテンシャル曲線を表す式が簡単で扱いやすいので、分子動力学計算など、様々な分野において使われます。

page125
  • 図4.9
    Lennard-Jonesポテンシャルの概形です。\(\sigma\) = 3、\(\varepsilon\) = 1としています。
  • 図4.10
    van der Waals引力の起源のイメージです。

  • Lennard-Jonesポテンシャルの一般形です。図4.9の横軸が\(r\)、縦軸が\(E_{\rm{LJ}} (r)\)であることからも納得できると思いますが、\(E_{\rm{LJ}} (r)\)は2つの粒子間の距離\(r\)によって定まります。左辺の添え字としてつけられている\(\rm{LJ}\)はLennard-Jonesのことです。
    \[ E_{\rm{LJ}} (r) = 4 \varepsilon \biggl[\Bigl(\frac{\sigma}{r}\Bigr)^{12} - \Bigl(\frac{\sigma}{r}\Bigr)^6\biggr] \]
  • 斥力(repulsion)
    リンク先は「引力と斥力」です。斥力(repulsion)または反発力とは、同様に2つの物体の間に働く相互作用であるが、反発し合う、すなわち互いを遠ざけようとする力のことです。
  • 引力(attraction)
    リンク先は「引力と斥力」です。引力(attraction)は、2つの物体の間に働く相互作用のうち、引き合う(互いを近付けようとする)力のことです。
  • 衝突直径(collision diameter)
    2つの分子が衝突したときの2つの分子の中心間距離のことです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。
  • 電気双極子(electric dipole)
    大きさの等しい正負の電荷が無限小の間隔で対となって存在する状態のことです。
  • メタン(methane)
    最も単純な構造のアルカンで、1個の炭素原子に4個の水素原子が結合してできた炭化水素です。分子式は CH4です。
  • 図4.10
    van der Waals引力の起源のイメージです。

  • 点電荷(point charge)
    電荷だけあって、大きさのない点状の物体のことです。正や負の電気を帯びた素粒子という理解でもよいです。
  • クーロンポテンシャル(Coulomb potential)
    リンク先は「クーロンの法則」です。クーロンの法則によって生じた力による位置エネルギーのことです。クーロンの法則とは、荷電粒子間に働く反発し、または引き合う力がそれぞれの電荷の積に比例し、距離の2乗に反比例すること(逆2乗の法則)を示した電磁気学の基本法則のことです。ややこしいので、クーロンポテンシャルとは「電気的な力によって生じる位置エネルギー」という理解でもよいです。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • アボガドロ定数(Avogadro constant)
    物質量1 molを構成する粒子(分子、原子、イオンなど)の個数を示す定数です。
  • 単原子イオン(monatomic ion)
    1種類の元素の1つまたはそれ以上の数の原子で構成されるイオンのことです。

4.8.2 力場パラメータの決定

  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 分子軌道法(Molecular Orbital method; MO法)
    原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 非経験的パラメータ(ab initio parameters)
    分子の構造を様々に変化させたときのエネルギーの値を、MO法を用いて計算し、ポテンシャルエネルギー関数がこれを再現するように調整することで決定したパラメータのことです。
  • 経験的パラメータ(empirical parameter)
    構造や熱力学量などの実験値を再現するように決定されたパラメータのことです。

  • 水素分子( hydrogen molecule)
    常温常圧では無色無臭の気体として存在する、分子式 H2で表される単体です。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
page126
  • 図4.11
    MO法によって計算した水素分子のポテンシャルエネルギーです。

  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 気体定数(gas constant)
    理想気体の状態方程式における定数として導入される物理定数です。理想気体だけでなく、実在気体や液体における量を表すときにも用いられます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • テーラー展開(Taylor expansion)
    リンク先は「テイラー展開」です。関数のある一点での導関数の値から計算される項の無限和として関数を表したものをテイラー級数といい、そのような級数を得ることをテイラー展開といいます。
  • ポテンシャルエネルギー関数\(E(r)\)\(r_0\)の周りでテーラー展開した式
    \[ E(r_0 + \Delta r) = E(r_0) + \left.\frac{\partial E(r)}{\partial r}\right|_{r_0} \Delta r + \left.\frac{1}{2} \frac{\partial^2 E(r)}{\partial r^2}\right|_{r_0} \Delta r^2 + O(\Delta r^3) \]
  • 上式の右辺第2項がゼロ、\(\Delta r^3\)に比例する項を無視すると、以下のようになります。
    \[ E(r_0 + \Delta r) - E(r_0) \approx \left.\frac{1}{2} \frac{\partial^2 E(r)}{\partial r^2}\right|_{r_0} \Delta r^2 = k (r - r_0)^2 \]
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。
  • 水分子のポテンシャルエネルギー関数の式
    エネルギーが最小となる結合長\(r_0 = 0.7274\) Å(オングストローム)という値は、このページの上から3行目あたりで言及されています。
    \[ E(r) = k (r - r_0)^2 = 948.6 \times (r - 0.7274)^2 \]
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。
  • 密度(density)
    単位体積あたりの質量のことです。
page127
  • 表4.3

    水分子の力場パラメータです。r(OH):水素原子と酸素原子の共有結合長。∠HOH:2つの水素原子と酸素原子の共有結合がなす角。r’:水分子の間のLennard-Jonesポテンシャルのパラメータσを用いて\(r' = \frac{\sqrt[6]{2}σ}{2}\)と表されます。酸素原子間の距離を相互作用距離とします。ε:水分子の間のLennard-Jonesポテンシャルのパラメータ。qH:水素原子の電荷。

    SPC TIP3P
    r(OH) [Å] 1.0 0.9572
    ∠HOH [degree] 109.47 104.52
    r’ [Å] 1.7766 1.7682
    ε [kcal mol−1] 0.1554 0.1520
    qH 0.41 0.417

  • 表4.4

    水分子のモデルを用いた熱力学量の計算値と実験値の比較です。

    SPC TIP3P 実験値
    密度 [g cm−3] 0.971 0.982 0.997
    蒸発熱 [kcal mol−1] 10.77 10.45 10.51
    定圧比熱 [cal mol−1 K−1] 23.4 16.8 17.99
    膨張率 [10-5 K-1] 58 41 25.7
    圧縮率 [10-6 atm] 27 18 45.8

  • Jorgensen et al., J Chem Phys., 1983

4.8.3 生体高分子の力場パラメータ

  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • 主鎖構造
    C\(\alpha\)原子座標に基づく構造のことです。C\(\alpha\)原子はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられていることを根拠としています。
  • 側鎖(side chain)
    主鎖(またはバックボーン)とよばれる分子の中心部分に結合している化学基(置換基)のことです。α-アミノ酸のRCH(NH2)COOH という構造のうち、Rに相当する部分が側鎖です。タンパク質の性質は側鎖によって決まります。
  • 炭化水素(hydrocarbon)
    炭素原子と水素原子だけでできた化合物の総称です。
  • ベンゼン環(benzene ring)
    リンク先は「ベンゼン」です。分子式 C6H6、分子量 78.11 の最も単純な芳香族炭化水素である。原油に含まれており、石油化学における基礎的化合物の1つです。6個の炭素原子が平面上に亀の甲(六角形)状に配置し、各炭素はsp2混成軌道をとっているのでベンゼン環とよばれます。したがって、ベンゼンとベンゼン環は実質的に同じものを指します。
  • 水酸基(hydroxy group)
    リンク先は「ヒドロキシ基」です。有機化学において構造式が「−OH」と表される1価の官能基です。
  • 置換基
    リンク先は「基」です。化合物の系統あるいは命名を考える際の部分構造であり、母体化合物(あるいは母核、親化合物)と対になって使用される概念です。化合物の系統を単純な構造の化合物から複雑な構造の化合物へと系統づけるため、共通する構造を母体と呼び、相異なる部分を置換基とよびます。母体化合物が単独で存在するときにはひとつの原子(実際には水素)で占められている箇所を、置換基が置き換えたと考えます。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 混成軌道(hybrid orbital)
    原子が化学結合を形成する際に、新たに作られる原子軌道のことです。
  • 原子種
    ここでは、「混成軌道の種類や、置換基の種類など、類似した化学的環境にある原子」をひとまとめにして取り扱うべく、「原子種」という言葉でグルーピングしています。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • 図4.12
    アミノ酸への原子種の割り当ての例(左)と、力場パラメータの決定のために用いられるモデル化合物の例(右)です。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • ヌクレオチド(nucleotide)
    ヌクレオドは、ヌクレオシド(塩基と糖が結合した化合物の一種)にリン酸基が結合したものです。ヌクレオドの糖として、リボースが結合したものがリボヌクレオド、デオキシリボースが結合したものがデオキシリボヌクレオドです。リボヌクレオドにリン酸基が結合したものがリボヌクレオド、デオキシリボヌクレオドにリン酸基が結合したものがデオキシリボヌクレオドです。
  • 塩基(base)
    リンク先は「核酸塩基」です。ヌクレオドを形成する窒素含有生体分子で、窒素塩基としても知られています。多くの場合、単に塩基(base)とよばれます。ヌクレオドはヌクレオドの構成要素であり、ヌクレオドは核酸の基本的な構成単位です。塩基対を形成し、互いに積み重なる(スタッキング)核酸塩基の性質は、リボ核酸(RNA)やデオキシリボ核酸(DNA)などの長鎖らせん構造をもたらします。DNAを構成する塩基は、プリン塩基であるアデニン(A)とグアニン(G)、ピリミジン塩基であるシトシン(C)とチミン(T)の4種類があります。
  • リボース(ribose)
    単糖の1種で、炭素鎖の長さが5つのアルドースのことです。リボースは地球生物に普遍的に見られる糖であり、核酸塩基と結合してヌクレオシドを形作っており、リボ核酸の構成糖として知られています。リボースは地球生物の体内では、グルコースを原料に合成されます。
  • リン酸(phosphoric acid)
    リンのオキソ酸の一種で、化学式H3PO4の無機酸です。オルトリン酸(orthophosphoric acid)ともよばれます。広義では、オルトリン酸・二リン酸(ピロリン酸)H4P2O7・メタリン酸HPO3など、五酸化二リンP2O5が水和してできる酸を総称してリン酸ということがあります。

page128
  • 図4.12
    アミノ酸への原子種の割り当ての例(左)と、力場パラメータの決定のために用いられるモデル化合物の例(右)です。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。
  • W4.6

    分子動力学シミュレーションに有用なサイトです。*1シミュレーションプログラムは一部有料です。*2学術利用は、シミュレーションプログラムの一部を除き無料です。商用利用は別ライセンスで有料です。*3商用利用は有料です。*4学術利用は無料です。商用利用は別ライセンスです。*5学術利用は無料です。商用利用は別ライセンスです。

    URL 内容
    http://ambermd.org/ Amber力場、Amber力場用セットアップ・シミュレーション・解析プログラム*1
    http://amber.manchester.ac.uk/ Amber parameter database
    http://mackerell.umaryland.edu/charmm_ff.shtml CAHRMM力場
    https://academiccharmm.org/ CHARMM力場用セットアップ・シミュレーション・解析プログラム*2
    https://charmm-gui.org/ CHARMM力場用セットアップWebサーバ*3
    https://www.ks.uiuc.edu/Research/namd/ シミュレーションプログラム(NAMD)*4
    https://www.ks.uiuc.edu/Research/vmd/ CHARMM力場用セットアップ・解析プログラム、トラジェクトリ可視化プログラム(VMD)*5
    http://www.gromacs.org/ シミュレーション・解析プログラム(GROMACS)
    https://www.r-ccs.riken.jp/labs/cbrt/ シミュレーション・解析プログラム(GENESIS)
    https://opm.phar.umich.edu/ OPMデータベース

  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • ヌクレオチド(nucleotide)
    ヌクレオドは、ヌクレオシド(塩基と糖が結合した化合物の一種)にリン酸基が結合したものです。ヌクレオドの糖として、リボースが結合したものがリボヌクレオド、デオキシリボースが結合したものがデオキシリボヌクレオドです。リボヌクレオドにリン酸基が結合したものがリボヌクレオド、デオキシリボヌクレオドにリン酸基が結合したものがデオキシリボヌクレオドです。
  • 糖(sugar)
    多価アルコールの最初の酸化生成物であり、ホルミル基(−CHO)またはカルボニル基(>C=O)を1つもちます。
  • 脂質(lipid)
    リンク先は「脂肪」です。炭水化物、タンパク質と共に「三大栄養素」と総称され、多くの生物種の栄養素です。脂肪のカロリーは9kcal/gであり、炭水化物、タンパク質の4kcal/gよりも単位重量あたりの熱量が大きく、哺乳類をはじめとして動物の栄養の摂取や貯蔵方法として多く利用されています。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 阻害剤(inhibitor)
    リンク先は「酵素阻害剤」です。酵素などの分子に結合してその活性を低下または消失させる物質のことです。
  • 薬剤(drug)
    リンク先は「薬物」です。生物が摂取することでその生理や心理に変化をもたらす物質のことです。薬理学の分野では、生体に投与されると生物学的な効果をもたらす化学物質を指し、一般にその構造はわかっています。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • general Amber force field(GAFF)
    Amber力場で、低分子化合物の力場パラメータを生成する際に用いるプログラム。
  • CHARMM general force field(CGenFF)
    CHARMM力場で、低分子化合物の力場パラメータを生成する際に用いるプログラム。

4.8.4 エネルギー最小化

  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 座標(coordinates)
    点の位置を指定するために与えられる数の組(coordinates)、あるいはその各数(coordinate)のことです。
  • 偏微分(partial derivative)
    多変数関数に対して1つの変数のみに関する微分のことです。
  • 原子\(i\)に働く力\(\boldsymbol{\rm F}_i\)の式
    \[ \boldsymbol{\rm F}_i = - \frac{\partial E(\boldsymbol{\rm r})}{\partial \boldsymbol{\rm r_i}} \]
  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。

  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 最急降下法(steepest descent method)
    関数(ポテンシャル面)の傾き(一階微分)のみから、関数の最小値を探索する連続最適化問題の勾配法のアルゴリズムの1つです。
  • 共役勾配法(conjugate gradient method)
    対称正定値行列を係数とする連立一次方程式を解くためのアルゴリズムです。反復法として利用され、コレスキー分解のような直接法では大きすぎて取り扱えない、大規模な疎行列を解くために利用されます。エネルギー最小化などの最適化問題を解くために用いることもできます。
  • Newton-Raphson法
    リンク先は「ニュートン法」です。方程式系を数値計算によって解くための反復法による求根アルゴリズムの1つです。
  • ヘッセ行列(Hessian matrix)
    多変数スカラー値関数の二階偏導関数全体が作る正方行列です。実数値関数の極値判定に用いられます。Hessianともよばれます。

page129
  • 例題4.2
    1ページ目が問題、2ページ目以降が解答例です。
    • 抗インフルエンザ薬oseltamivir
      リンク先は「オセルタミビル」です。オセルタミビル(oseltamivir)は、インフルエンザウイルスに効く抗ウイルス薬です。オセルタミビルリン酸塩として、スイスのロシュ社により商品名「タミフル」(tamiflu、登録商標第4376708号ほか)で販売されています。
    • 立体構造(tertiary structure)
      リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
    • PubChemSayers et al., Nucleic Acids Res., 2021
      化学分子データベースの1つです。
  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。

4.9 分子動力学法

  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。

4.9.1 運動方程式の数値解法

  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。
  • 4.9.1項の最初の文にについて
    初刷では「…原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は…」となっていましたが、正しくは「原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は」ですm(_ _)m。「を」を消し忘れていたということです。
  • 加速度(acceleration)
    単位時間当たりの速度の変化率(速度の時間微分)です。速度ベクトルの時間的な変化を示すベクトルとして、加速度が定義されます。
  • 原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は、この原子に働く力\(\boldsymbol{\rm F}_i\)と質量\(m_i\)を用いて以下の式で与えられます。
    \[ m_i \boldsymbol{\rm a}_i = \boldsymbol{\rm F}_i \]
  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。