「プログラムで実践する サンプルページ · 目次 参考文献 97 第6 章...

23

Upload: others

Post on 31-Oct-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

「プログラムで実践する

生体分子量子化学計算」

サンプルページ

この本の定価・判型などは,以下の URL からご覧いただけます.

http://www.morikita.co.jp/books/mid/087911

※このサンプルページの内容は,初版 1 刷発行当時のものです.

ダウンロードのご案内本書に掲載されているプログラムやサンプルデータは以下の URL から無料でダウンロードできます.■ http://www.ciss.iis.u-tokyo.ac.jp/rss21/(革新的シミュレーション研究センター)■ http://www.morikita.co.jp/soft/87911/(森北出版)

本書のサポート情報などをホームページに掲載する場合があります.下記のアドレスにアクセスしご確認下さい.

http://www.morikita.co.jp/support/

■本書の無断複写は,著作権上の例外を除き禁じられています.複写される場合は,その都度事前に (株)日本著作出版権管理システム(電話 03-3817-5670,FAX 03-3815-8199)の許諾を得てください.

序  文

本書は,東京大学生産技術研究所を拠点に 2002年度から行われてきた『戦略的基盤ソフトウェアの開発』プロジェクトと『革新的シミュレーションソフトウェアの開発』プロジェクト1)の中で,研究開発が進められてきた二つの純国産プログラム,ProteinDFと ABINIT-MPについてまとめるものである.量子化学は,Schrodinger

方程式を数値的に解いて分子の構造,反応性,あるいは物性量を理論的に調べる計算科学の一分野であり,現在では数十原子から成る分子系では実験値と比較し得る定量性を持った結果が得られる.しかし,数百~数千の原子を含む系,すなわちタンパク質や DNAといった生体分子の量子化学計算を実現するためには,定式化とアルゴリズムレベルからのさまざまな創意工夫が不可欠である.具体的なアプローチは異なるが,ProteinDFとABINIT-MPはともに生体分子の量子化学計算を実用レベルで可能としたプログラムである.本書の第Ⅰ部で記される ProteinDFは,固体物理分野で常用される平面波基底ではなく,各原子に中心を置く Gaussian基底によって密度汎関数理論(DFT:Density

Functional Theory)に基づくタンパク質の全電子計算を可能とするユニークなプログラムである.特に,鉄などの遷移金属中心を持つ酸化還元系酵素の扱いには好適である.また,バンド構造が直截に求まるため,伝導素子としても注目を集めつつあるDNAの物性値算定も可能である.アルゴリズム的には,並列化とともに電子間反発積分の高速評価に工夫が施されているが,最近,クラスター型計算機向けの改良が行われて利用性が大きく向上した.一方,第Ⅱ部で扱われる ABINIT-MPは,北浦らによって提案されたフラグメント分子軌道(FMO:Fragment Molecular Orbital)法 2)によって,タンパク質をアミノ酸残基単位でフラグメント分割し,環境ポテンシャルの存在下で各フラグメントの計算を並列処理することで,タンパク質の電子状態計算を精度と速度を両立させつつ行えるプログラムである.ファンデルワールス相互作用の記述で本質的な電子相関は 2

次摂動(MP2 :second-order Møller-Plesset )レベルで考慮するが,元の平均場近似であるHF(Hartree-Fock)とたかだか数倍の計算コストで処理できる.ABINIT-MP

は,特に創薬分野で重要な薬物-受容体間の相互作用の解析を得意としており,小規

1) 東京大学生産技術研究所 『革新的シミュレーションソフトウェアの研究開発』,  http://www.ciss.iis.u-tokyo.ac.jp/

2) K. Kitaura, E. Ikeo, T. Asada, T. Nakano, M. Uebayasi, Chem. Phys. Lett. 313 (1999) 701.

i

序  文

模のクラスター型計算機でも数百残基のタンパク質が扱える高い実用性があるため,製薬企業の研究現場での利用が進みつつある.本書には,ProteinDFとABINIT-MPの各々で用いられている量子化学の理論あるいはアルゴリズムの概説だけではなく,実際にプログラムパッケージを入手し,読者自身が手元の計算機を使って計算を試みられるような例題を通じた実践的な解説が豊富に含められている.すなわち,ハンドブック的な色彩を帯びているが,先導的な応用事例についても紹介されている.本書を通読していただければ,両プログラムのオリジナリティとともに,生体分子の大規模計算に関する実用性の高さを感じていただけるはずである.むろん,生体分子の量子化学計算が可能なプログラムは ProteinDFとABINIT-MP

ばかりではない3).米国では,ペタフロップス級の次世代の超並列計算機を活かす量子化学プログラムの開発が SciDAC4)などで推進されており,バイオテクノロジーとナノテクノロジーの分野が重視されている.欧州でも,EU多国間ネットワークによるプロジェクト5)で,巨大分子の量子化学計算が可能な高性能なソフトウェアの開発が進められている.また,国内では東京大学生産研究所以外の研究拠点でも,科学技術振興機構6)の戦略的創造研究推進事業 (CREST)などを通じて,大規模量子化学計算のための方法論・プログラム開発のプロジェクト研究が複数立ち上がってきている.こうした周辺状況を俯瞰し,ProteinDFとABINIT-MPの特徴と存在意義を浮き彫りにする補助的な資料を提供することも本書の役目と考えられる.当該の内容を第Ⅲ部にまとめておくので,適宜参考にしていただければ幸いである.

2008年 9月 編者一同

3) 望月祐志, 5.1.4節『21世紀の産業革命 コンピュータ・シミュレーション』, 戦略的基盤ソフトウェア 産業応用推進協議会 編 (アドバンスソフト, 2005).

4) SciDAC (Scientific Discovery through Advanced Computing), http:/www.scidac.gov/

5) スェーデン王立研究所の理論化学部門を統合拠点とするNANOQUANTなど,  http://www.theochem.kth.se/

6) 科学技術振興機構,http:/www.jst.go.jp/

ii

目 次

第 I部 タンパク質密度汎関数法パッケージ ProteinDFシステム 1

参考文献 3

第 1章 ProteinDFシステム .................................................................. 5

1.1 ProteinDFによるタンパク質密度汎関数計算 5

1.2 システム構成とインストールの仕方 11

参考文献 17

第 2章 ProteinEditorを使ってみよう .................................................. 19

2.1 基本操作 19

2.2 3次元構造・物理量表示 27

2.3 タンパク質構造編集と構造妥当性評価の機能 36

参考文献 44

第 3章 PCを用いたペプチド全電子計算 ................................................ 45

3.1 まずは計算してみよう 45

3.2 5残基ペプチドの計算と結果表示 59

参考文献 65

第 4章 (小規模)PCクラスターを用いたタンパク質全電子計算 ................... 67

4.1 計算条件 67

4.2 オキシトシン B鎖の全電子計算 68

4.3 エラブトキシン β構造の全電子計算 73

参考文献 82

第 5章 大型計算機を用いた大規模タンパク質全電子計算 .......................... 83

5.1 計算条件 83

5.2 インスリンの全電子計算 84

5.3 インターロイキン-4の全電子計算 91

iv

目 次

参考文献 97

第 6章 補足:結びに代えて ................................................................. 98

6.1 計算構造 98

6.2 おわりに 105

参考文献 106

索 引 (第 I部) ...................................................................................... 108

第 II部 フラグメント分子軌道法プログラムABINIT-MP 111

参考文献 113

第 7章 フラグメント分子軌道 (FMO)法とは ......................................... 118

7.1 FMO法の基礎 118

7.2 Møller-Plessetの摂動論 124

7.3 分子積分によるMP2相関エネルギーの表式 126

7.4 密度行列の評価 128

7.5 部分規格化による高次のエネルギー補正 129

7.6 フラグメント分子軌道法との関係 131

7.7 多層 FMO (MLFMO)法 131

参考文献 132

第 8章 ABINIT-MP / BioStation Viewerのインストール ......................... 134

8.1 ABINIT-MPのインストールWindows編 134

8.2 ABINIT-MPのインストール Linux編 139

8.3 可視化解析プログラム BioStation Viewerのインストール 144

参考文献 150

第 9章 まずは計算してみよう ............................................................. 151

9.1 水分子クラスターの FMO計算 151

9.2 ポリペプチドの FMO計算 163

9.3 フラグメント分割データを作成するには 173

9.4 付 録 178

参考文献 181

v

目 次

第 10章 タンパク質・DNAの FMO計算 .............................................. 182

10.1 エストロゲン受容体とリガンド分子の結合解析 182

10.2 cAMP受容体タンパク質と DNAの分子認識機構 189

10.3 タンパク質–リガンド相互作用の可視化クラスター解析 (VISCANA) 196

参考文献 203

第 11章 FMO法の今後の展開 ............................................................ 204

11.1 IFIEマップ 204

11.2 CAFI (Configuration Analysis for Fragment Interaction) 205

11.3 FILM (Fragment Interaction analysis based on Local MP2) 207

11.4 修正MP2法 207

11.5 MCP (Model Core Potential)法 208

11.6 多層 FMO法に基づいた励起状態計算 208

11.7 分極率などの物性値計算 210

11.8 FMO-MD法 210

11.9 FMO3法 211

11.10 今後の展望 211

参考文献 212

第 III部 理論的背景 215

第 12章 生体分子と量子化学計算 ........................................................ 216

12.1 量子化学計算の概論 216

12.2 生体分子の計算 221

参考文献 228

索 引 (第 II部・第 III部) ........................................................................ 234

vi

第1章

ProteinDFシステム

本章は ProteinDFシステムの概説である.1.1節では,ProteinDFシステムのエンジン

である ProteinDF/QCLOの特徴の説明を通して,タンパク質量子化学計算の基本的な考え

方と計算の流れを述べる.1.2節では,ProteinDFシステムの動作環境とインストール方法

を述べる.特に,この第Ⅰ部で行う演習に最適な基本パッケージと使用するデータに特化して

システム構成を説明する.

1.1 ProteinDFによるタンパク質密度汎関数計算

1.1.1 タンパク質のカノニカル計算規模と ProteinDFの構造

タンパク質をまるごと取り扱い,機能を定量的に予測できる計算方法は,電子相関を効果的に取り込むことができる Kohn-Sham方程式を解く密度汎関数法[1]が適している.ProteinDFは Kohn-Sham-Roothaan法に基づく,密度汎関数計算プログラムで,化学では標準的な基底関数にガウス型関数を使用するカノニカル分子軌道計算法である.大規模なカノニカル計算を達成するため,計算高速化の手法として RI

(Resolution of Identity)法[2∼ 4]を採用している.密度汎関数法の解説や,大規模計算技術の詳細は他書に譲り[5∼ 7],本節ではタンパク質の密度汎関数計算とはどの程度の規模の計算なのかを確認しつつ,ProteinDFの工夫と特長を解説しよう.

Roothaan法[8]では Kohn-Sham方程式の固有値を求める問題を行列方程式の固有値解法に置き換える.そのため,行列のサイズが計算の規模を表す指標となる.タンパク質ではアミノ酸残基の総数と分子量との間に次の経験則が知られている.

(タンパク質の分子量) = 110× (アミノ酸残基数) (1.1)

この関係式は,タンパク質が主にペプチド鎖でできていること,ペプチド鎖を構成するアミノ酸をつくる水素,炭素,窒素,酸素,硫黄といった原子の組成比率が巨大な分子で平均化されるためによく合う.この経験則を発展させて,タンパク質の総アミノ酸残基数と原子数,電子数,さらには行列の次元との間の関係を導くことができる[7].この関係は 100残基のタンパク質の場合を基準にすると次のようになる.

5

1 ProteinDFシステム

(アミノ酸残基数) : (原子数) : (電子数) : (行列次元数)

= 100 : 1 600 : 6 200 : 10 000 (1.2)

100残基中にある 1 600個の原子のうちおよそ 800個が水素原子,残りの 800個がその他の原子である.行列の次元数は基底関数の総数である.この値は各原子に割り当てる基底関数の種類によって大幅に増減する.式 (1.2)の 10 000という数は,大型分子によく使用されるスプリットバレンスやダブルゼータと呼ばれるタイプの基底関数の場合のおおよその目安の値である.式 (1.2)は,タンパク質の量子化学計算を行う際に役に立つ関係式である.100 残基のタンパク質であれば 1万次元,1 000残基のタンパク質ならば 10万次元の行列方程式を解くことになる.要素数は次元の 2乗となるため,100残基では 1 億要素,1 000残基では 100億要素にものぼる.このサイズの固有値問題を自己無撞着場 (SCF:

self-consistent field)計算によって何回も解かなければならない.ここで計算に必要なメモリサイズに注目する.上で見積もった行列一つを倍精度実数型で保持するためには,100残基の場合 1GiB (ギビバイト,230バイト),1 000残基では 100 GiBのメモリ空間が必要である.密度汎関数計算は,分子積分,交換相関積分,基本的な行列演算といった計算ルーチンを繰り返し呼び出して計算を達成する.個々の計算ルーチンはたかだか 3個の行列で実行できる.しかし,SCFの繰り返し計算で毎回変化する何種類かの行列を保持するためには,上記のおおよそ 100倍の記憶容量が必要になる.通常,分子軌道計算パッケージはこれらの行列をメインメモリに保持する.もし磁気ディスクを使うと,個々の計算ルーチンで発生する中間データをすべてディスクに書き出しては読み込むことになる.ディスクのアクセススピードはメインメモリよりも格段に遅いので,実行時間のロスを引き起こしてしまうからである.しかし,これでは巨大な行列をメモリに保持することは難しい.

ProteinDFプログラムはまったく異なる戦略で開発された.タンパク質のような大きな系の計算を行うために,動的メモリ管理機能を使用し,メモリに保持する行列の数に制限を設けた.メモリに保持しないならば当面の間はディスクしかない.小さな分子では処理速度が遅くなるが,その代わり大きな行列を扱うことができる.当初,ProteinDFは複数ある計算ルーチンの並列制御が容易なマスタ・ワーカモデルを採用していたが[9],ScaLAPACK (Scalable LAPACK)[10]などの汎用分散メモリ型行列計算ライブラリの整備が進んだことから,このメモリ構造を取り入れつつ並列処理プログラムを同一化して SPMD (single program multiple data)型のエンジンに生まれ変わった[11](図 1.1).利点は二つ.一つは完全分散化されたため,メモリに保持する行列の数が CPU 当

6

1.1 ProteinDFによるタンパク質密度汎関数計算

(a) 行 列 (b) 分散行列

図 1.1 分散メモリを用いた行列要素の保持例.ScaLAPACK[10]では図 (a)の密行列を図 (b)

のように各 CPUで分散保持する.

たりではなく,クラスター全体が保持するメモリ当たりとなったことである.これまで以上に大規模なタンパク質を計算することができ,小規模なクラスターでも 100残基を超えるタンパク質の計算を楽に実行できる.もう一つは,ディスク入出力やデータ転送を大幅に減らすことができたことである.100 CPUクラスのクラスターで高い並列化効率が得られる構造となった.

1.1.2 擬カノニカル局在化軌道と収束法

前項のような工夫により,ProteinDFは大次元行列を扱うのに適した分子軌道法プログラムとなったが,タンパク質の密度汎関数計算を達成するためには,もう一つ大きな問題を解決しなければならない.それは,SCF計算を収束に導く方法の開発である.

SCF計算は必ず収束解が得られるというわけではない.初期値が悪いと,収束するまでに何百回もの繰り返し計算を行わなければならないばかりか,発散したり振動したりして解が得られないこともしばしばある.これは基本的に計算機システムが高性能になれば解決する種類の問題ではない.小さな分子の場合でも難しい問題であり,ましてや巨大分子であるタンパク質ではさらに収束が難しい.その上,密度汎関数法では最高被占軌道 (HOMO: highest occupied molecular orbital)と最低空軌道(LUMO: lowest unoccupied molecular orbital)との間の軌道エネルギーが接近して,被占軌道と空軌道の成分の入替えが起こりやすく,収束を安全に導くためにいっそうの注意を要する.このように難しい性格の計算を成功させるために,計算シナリオと呼ぶ新しい手続きを導入した[12].初めからタンパク質全体を解こうとはしないで,アミノ酸を一つ一つ解くことから始め,計算する分子を徐々に大きくしていく方法である.図 1.2がその計算シナリオの概念図である.まずステップ 1では,タンパク質のペプチド鎖を形成している個々のアミノ酸残基をそのままの構造で取り出し,両端に水素と水酸基を補ってアミノ酸の解を求める.

7

1 ProteinDFシステム

図 1.2 タンパク質全電子計算シナリオ.タンパク質の SCF計算を滑らかに収束させるための計算手順を模式的に示している.図の最上部はアミノ酸の略号,H型の記号はそれぞれのステップで計算する分子を示す.ステップ 1では個々のアミノ酸を,ステップ 2では 3残基ペプチドをというように徐々に大きくしていき,最後に全タンパク質の計算を行う.

ステップ 2では,アミノ酸の解から 3残基ペプチドの初期値を作り,これらの解を求める.両側のアミノ酸残基の影響を取り込むため,2個のアミノ酸残基が重なるようにしておく.続くステップ 3では,3残基ペプチドの中央のアミノ酸残基の結果を組み合わせて,数残基ペプチドの初期値を作り,解を求める.この手順を,十数残基ペプチド,数十残基ペプチドと長くして,最後にタンパク質全体の SCF計算を行う.このとき,計算精度を落とさないようにペプチドを長くしていく方法が擬カノニカル局在化軌道 (QCLO: quasi-canonical localized orbital)法[13] である.ここで,図1.2のシナリオの各ステップで計算する分子のことをフレーム分子,分割した軌道空間のことをフラグメントと呼ぶ.QCLOは一種の局在化軌道であり,QCLO法とはフラグメントごとに QCLOを求め,これをつなぎ合わせて次のステップのより大きなフレーム分子の初期値を作る方法である.この方法を使用すると,初期値と収束値は数 kcal mol−1のエネルギー差で得られる.フレーム分子の定義やフラグメントの分割は任意であるが,本パッケージでは統一的に α炭素をフラグメントの境界位置にしている.フレーム分子を定義すれば,フラグメントは一意に決まる.基本的にユーザはフラグメントや QCLOの存在をあまり気にすることなく, フレーム分子を定義することで図 1.2のタンパク質全電子計算シナリオを決めることができる.タンパク質全体およびシナリオ中の各フレーム分子の SCF計算は安全運転で進め

8

1.1 ProteinDFによるタンパク質密度汎関数計算

る方がよい.その常套手段がシンプルミキシング法である.n回目の SCF計算で新たに求まった物理量を (n− 1)回目の SCF計算で使用した物理量で薄めたものと置き換えて,SCF計算を繰り返す方法である.これは本パッケージのデフォルト法である.安全に収束へと導くことができる反面,繰り返し回数は通常 40~60回ほどかかる.

QCLO法でこれほど良い初期値が得られるのだから,ある程度 SCF計算が安定になっていれば,これを加速して繰り返し回数をなるべく減らしたい.本パッケージでは Anderson法[14]も使用できる.シンプルミキシング法が同じ混ぜ合わせ率を使い続けるいわば静的なミキシング法であるのに対し,Anderson法は混ぜ合わせ率を状況に合わせて変化させる動的なミキシング法である.これにより,DIIS (Direct Inversion

of the Iterative Subspace) 法[15, 16]のように 2次収束が期待できる.

0 5 10 15

-2.0

-3.0

-4.0

-5.0

-6.0

-7.0

-8.0

SCF繰り返し回数

軌道エネルギー

[eV

]

図 1.3 306残基インスリン 6量体全電子計算 (最終ステップ)の SCF計算におけるKohn-Sham

軌道エネルギーの変遷[11].縦軸は軌道エネルギーで一つ一つの値を横線で描いており,HOMOは長い横線で描いている.横軸は SCF繰り返し回数である.

図 1.3は ProteinDFを用いて,インスリン 6量体の全電子計算を実行したときのSCF計算におけるKohn-Sham軌道エネルギーの変遷を示したものである.初期値作成には QCLO 法を,収束加速には Anderson法を用いている.計算規模は,残基数306,原子数 4 728,電子数 18 552,基底関数の数 26 790と現時点で世界最大規模である.これらの収束法により,26 790× 26 790次元の SCF計算を 17回の繰り返しで無事に収束させることに成功した[11, 17].本計算における初期値の良さと収束の速さを示すと同時に,この規模のタンパク質全電子計算が安全に達成できている様子がわかる.上記で解説した大規模タンパク質密度汎関数計算のための工夫により,PCクラスターから対称型マルチプロセッシング (SMP: Symmetric Multi Processing)クラスターに至るまで,さまざまな計算機を用いて効率よく安全に計算を実行できるプログラムとなった.実際に,図 1.3の計算は 64 CPU理論ピーク 333GFLOPSの中規模クラスターを使用して,3日で達成している[11].

9

2 ProteinEditorを使ってみよう

なお,本書ではグレースケールで図が印刷されているが,実際のグラフィックスはカラーで表示される.実際に ProteinEditorを立ち上げて演習を行っている方のために,本文中では適宜,画面で表示される色で補足説明を行っている.

図 2.16 3D Viewerの起動画面

2.2.1 タンパク質立体構造表示

読み込まれたタンパク質立体構造は,3D Viewer上で分子骨格や主鎖骨格に対してさまざまな表現形式で表示することができる.

(1 ) 分子骨格の表示

分子骨格の表示,および,その表示形式の変更は以下の手順で行う.

1. PDBデータを読み込む.2. データツリーウィンドウから 3D Viewerを開く.3. メニューバーの [表示]→ [Molecule]から,またはツールバーから表示したい形式を選択する (図 2.17).デフォルトではWireが選択されている.

( a ) メニューによる切り替え ( b ) ツール・バーによる切り替え

図 2.17 分子骨格表示の切り替え

28

2.2 3次元構造・物理量表示

選択された表示形式によって図 2.18のように表示が変更される.

( a ) Wire表示 ( b ) Stick表示

( c ) Ball表示 ( d ) Ball and Wire表示

( e ) Ball and Stick表示 ( f ) CPK表示

図 2.18 分子骨格の各表示形式による表示例

(2 ) 水素結合と原子間衝突の表示

水素の座標が登録されている分子構造,あるいは水素付加 (2.3.1項参照)された分子構造に対して水素結合と原子間衝突の様子を表示することができる.水素結合・原子間衝突の表示は次の手順で行う.

29

第7章

フラグメント分子軌道(FMO)法とは

FMO法は,分子系をフラグメントに分割し,フラグメント (モノマー)およびすべてのフラグメントペア (ダイマー)の電子状態を,周囲のモノマーからの静電ポテンシャル (環境静電ポテンシャル)を考慮して計算し,得られたモノマー,ダイマーのエネルギーや電子密度から,系全体のエネルギーや電子密度を計算する方法である.

7.1節では,FMO法およびMøller-Plesset摂動論の基礎となる閉殻系のHartree-Fock

(HF)法について簡単に紹介した後,FMO-HF法の概要について説明する.7.2~7.6節で

は,実用上重要な 2次のMøller-Plesset摂動 (MP2)について詳しく解説し,7.7節では,

計算時間の短縮のキーとなる多層 FMO (ML FMO)法について説明する.

7.1 FMO法の基礎

7.1.1 Hartree-Fock (HF)法

タンパク質や DNAといった分子は,原子から構成されており,原子は原子核と電子からできている.原子核の運動は,古典力学(ニュートンの運動方程式)で比較的精度よく記述することができ,実際に古典分子動力学計算が広く普及している.しかしながら,分子中の電子の運動を記述するには,古典力学ではなく量子力学(シュレーディンガー方程式)が必須である.量子力学では電子の運動は,シュレーディンガー方程式を解いて得られる波動関数の絶対値の二乗で計算される電子の存在確率(別の表現としては電子密度)として表される.シュレーディンガー方程式は,水素原子のような簡単な場合以外は解析的に解けないので,近似を導入して数値的に解く必要がある.分子のシュレーディンガー方程式の解法には,大きく分けて,分子軌道(Molecular Orbital: MO )法と密度汎関数 (Density Functional Theory; DFT)法の二つの流れがあるが,ここでは FMO法の基礎となっているMO法について簡略な説明を行う.この章では多少数式が出てくるが,最初は式の詳細には拘らずに読み進めて欲しい.

MO 法の描像では,電子が α スピンと β スピンを対にして,エネルギーが低い方の分子軌道から順に詰まった分子を閉殻分子とよぶ.分子軌道法の基本となるHartree-Fock (HF)法では,閉殻分子の波動関数を,分子軌道を要素とする単一 Slater

118

7.1 FMO法の基礎

行列式で表す.ここで,電子が入った軌道は占有軌道,またエネルギーが高い空の軌道は仮想軌道と呼ばれる.分子軌道は各原子の軌道から構成されるNBO個の基底関数 {χp}の線形結合:

ψm =NBO∑

p

Cpmχp (7.1)

として書かれ,展開係数の組 {Cpm}はいわゆる HF方程式 (7.2)を自己無撞着的に解くことで得られる.総数NBOの基底関数でHF方程式を解くと,M 個の占有軌道 (電子数は 2M とする)と NBO −M 個の仮想軌道が出てくる.

FC = SCε (7.2)

F = H + G (7.3)

Hpq =

⟨p

∣∣∣∣∣−12∇2 −

∑A

ZA

|r −A|

∣∣∣∣∣ q⟩

(7.4)

Gpq =NBO∑rs

prs

[(pq, rs)− 1

2(ps, rq)

](7.5)

Spq = 〈p | q〉 (7.6)

Ppq =M∑i

2CpiCqi (7.7)

F は Fock行列,C はMO係数行列,Sは重なり積分行列,εは軌道エネルギー εmを対角要素とする対角行列である.Ab initio MO法では,式 (7.5)の 2電子積分 (pq, rs)

の計算に O(N3−4BO )と最も計算コストがかかる.分子軌道が求まると,分子の全エネ

ルギー E は,

E =12

NBO∑pq

Ppq(Hpq + Fpq) +∑A>B

ZAZB

|B −A| (7.8)

で,電子密度 ρ(r)は,

ρ(r) =NBO∑

pq

Ppqχp(r)χq(r) (7.9)

で計算される.ここで各分子軌道 ψm は,Fock演算子 f の固有関数:

fψm = εmψm (7.10)

f = [h+ ν] (7.11)

119

7 フラグメント分子軌道 (FMO)法とは

となっている.式 (7.11)中,右辺の第一項の hが 1電子の運動エネルギーと核引力エネルギー,第二項の ν が電子間相互作用を表す Hartree-Fockポテンシャルであり,HFでは本来のハミルトニアン中の 2電子間の反発,∑

m>n

(1/rmn) (7.12)

が平均化により 1電子問題化して近似的に扱われていることを示している.平均化の内訳は,古典論的なクーロン項と量子論的な交換項から成っている.そして,この平均化からの “揺動”が HFでは考慮されない電子相関に対応する.エネルギーでいえば,HFでは系の電子エネルギーの約 95%が計算できるが,残り 5%のエネルギーが電子相関によるものとなり,化学反応や結合相互作用などを定量的に評価しようとすると相関の考慮が必要になってくる.

HF計算からはエネルギーだけでなく,電子密度 (あるいは分子内の分布)も同時に求められるが,平均化により結合のイオン性がやや過大評価された描像になっている点にも注意が必要で,相関を含めた電子密度を求め,HFと比較することも計算結果の検証としては有意義である.電子相関については,7.2節 Møller-Plessetの摂動論以降で詳しく解説する.

7.1.2 フラグメント分子軌道 (FMO)法

分子系をN 個のフラグメントに分割したとすると,モノマーを計算する際には,周囲のN − 1個のモノマーからの環境静電ポテンシャルを計算する必要がある.このため,すべてのモノマーについて電子密度が自己無撞着 (self-consistent)になるまで繰り返し計算 (monomer self-consistent charge計算;モノマー SCC計算)を行う.このようにすることで,モノマーの分極相互作用に関して,N 体までの高次項を取り込むことができる.ダイマー計算の際は,モノマー SCC計算で得られたモノマーの電子密度を用いてダイマーに対する環境静電ポテンシャルを計算する.ダイマーに対して,周囲のN − 1個のモノマーと電子密度が自己無撞着になるように繰り返し計算を行わないのは,計算時間を短縮するためではなく,FMO法ではモノマーとダイマー中の仮想的なモノマーが同じ分極エネルギーをもたないと,過剰な分極エネルギーが完全にキャンセルしなくなり,誤差が発生するためである.環境静電ポテンシャルに近似を導入する際には,この点について注意が必要となる.こうして求めたモノマー I のエネルギーをEI,ダイマー IJ のエネルギーをEIJ とすると,FMO法による系の全エネルギー E は,

E =∑I>J

EIJ − (N − 2)∑

I

EI (7.13)

で計算される.また系の全電子密度 ρ(r)についても同様に,モノマー I の電子密度ρI(r)を,ダイマー IJ の電子密度を ρIJ(r)とすると,

120

7.1 FMO法の基礎

分子をフラグメントに分割し,電子を割り当てる

モノマーの初期電子密度を計算する

与えられた電子密度を用いて,周囲のモノマーによる環境静電ポテンシャル下での,モノマーのエネルギーと電子密度を計算する

与えられた電子密度と得られた電子密度の差が閾値よりも小さい

収束したモノマーの電子密度(Self-Consistent Charge; SCC)を用いて,周囲のモノマーによる環境静電ポテンシャル下での,ダイマーのエネルギーと電子密度を計算する

分子の全エネルギーおよび全電子密度を計算

No

Yes

図 7.1 FMO計算のフローチャート

ρ(r) =∑I>J

ρIJ (r)− (N − 2)∑

I

ρI(r) (7.14)

となる.FMO計算の流れを図 7.1に示した.モノマー,ダイマーの計算に,Hartree-Fock法を用いた場合が FMO-HF法となり,

MP2計算まで行った場合が FMO-MP2法となる.FMO法については,現在精力的に方法論の拡張が行われているので,詳しくは最近の総説[1∼ 5]および参考文献を参照していただきたい.

7.1.3 生体高分子のフラグメント分割

タンパク質のような巨大分子系では,共有結合を切断して分子をフラグメントへ分割する必要がある.FMO法では,分割したフラグメントがラジカルにならないように,切断した共有結合の電子をフラグメントに割り当てる.フラグメント分割の境界にある,結合を切り離した原子 (bond detached atom; BDA)は,電子ができるだけ局在化している方がフラグメント分割の誤差が小さくなるため,sp3 炭素の位置で分割している.たとえばポリペプチドの場合,図 7.2に示したように α炭素の位置で分

H2N

R1HN

O R2

O

NH

HN

R3

O

NH

R4

O R5

O

OH

図 7.2 ポリペプチドのフラグメント分割

121

索 引 (第 II部・第 III部)

数字・欧文先頭π-CASCI 212

ABINIT-MP計算結果 184

B3LYP 219

BDA 121

BioStation Viewer 113, 144

bond detached atom 121

CAFI 205, 206

cAMP受容タンパク質 189

Car-Parrinello Molecular Dynamics 219

CASCI 212

CASPT2 218

CASSCF 218

CC:Coupled Cluster 217

CCSD(T) 217

CERF 205

CI:Configuration Interaction 217

CIS(D)法 208

CPMD 219

CSF 208

CT 205, 206

Density Fitting 217

Density Functional Theory 219

DFT 219

Direct-SCF 216

Effective Fragment Potential 226

EFP 226

FILM 207

FMM:Fast Multi-pole Moment 217

FMO i, 111, 120

FMO-DFT 211

FMO-MD法 210

FMO3 211

Fock行列 219

GAMESS 112

GIAO 210

Hartree-Fock(HF) 111, 118, 216

HF 111, 118

IFIE 111, 123, 206

IFIE map 204

Kohn-Sham方程式 219

LR 210

Møller-Plesset摂動 112, 217

Møller-Plessetの摂動論 124

MCP 208

MLFMO 131, 208

MO 118

MO:Molecular Orbital 216

MP2 i, 112, 125, 217

MP2相関エネルギー 126

MRCI: Multi-Reference CI 218

ONIOM 221

Our own N-layered Integrated molecular

Orbital and molecular Mechanics 221

PBC 212

PCM:Polarizable Continuum Model 221

Post-HF計算 217

QM/MM 221

QMC 212

Quantum Mechanics/Molecular Mechanics

221

Reference Site Interaction Model 221

Resolution of Identity 217

RISM 221

SAC/SAC-CI 227

SCF:Self-Consistent-Field 216

Schrodinger方程式 216

SCS-MP2 127

second-order Møller-Plesset i

size-consistency 125

234

索 引 (第 II 部・第 III 部)

size-consistent 218

size-extensive 218

Symmetry Adapted Cluster/CI 227

VLS 196

Watson-Crick水素結合 192

あ 行移動 194

ウォード (Ward)法 197

エストロゲン受容体 182

応答理論 220

大きさ無矛盾性 125

か 行解析的微分計算 220

階層性 225

階層的クラスター解析 197

可変 (flexible)法 197

環境静電ポテンシャル 120, 224

基底関数 216

局在MP2法 219

群平均 (group average)法 197

計算時間 183

計算ログ 157

結合クラスター 217

原子電荷 187, 193

交換・相関ポテンシャル 219

高速多重極 217

構築 219

恒等分解 217

さ 行最短距離 (nearest neighbor)法 197

最長距離 (furthestneighbor)法 197

差電荷分布 194

残基間相互作用エネルギー 224

自己無撞着場 216

重心 (centroid)法 197

樹形図 197

シュレーディンガー方程式 118

水素結合ネットワーク 183

スタッキング相互作用 192

積分変換 127

た 行多参照 CI 218

多層 FMO 131

多体摂動論 217

多配置 SCF 212

地球シミュレータ 124

直接 SCF 216

電荷 194

電荷移動 188

電荷分布 187, 194

電子相関 124, 217

特異的DNA結合 189

は 行配置間相互作用 217

バーチャルリガンドスクリーニング 196

非類似度 197

ファンデルワールス相互作用 131

ファンデルワールス力 124

部分規格化 129

フラグメント間相互作用エネルギー 111,

123, 184, 190

フラグメント間相互作用エネルギー解析 158

フラグメント分割 121, 184

フラグメント分子軌道 120

フラグメント分子軌道法 i, 111

分極率 210

分散力 131

分子軌道 118, 216

並列処理 217

ベクトル化 124

ま 行水分子クラスター 151

密度行列 128

メジアン (median)法 197

モデル内殻ポテンシャル 226

モノマー SCC 120

ら 行連続誘電体モデル 221

235

プログラムで実践する生体分子量子化学計算 © 佐藤文俊・中野達也・望月祐志 2008

2008 年 10 月 10 日 第 1 版第 1 刷発行 【本書の無断転載を禁ず】

編 著 者 佐藤文俊・中野達也・望月祐志発 行 者 森北博巳発 行 所 森北出版株式会社

東京都千代田区富士見 1-4-11(〒 102-0071)電話 03-3265-8341 / FAX 03-3264-8709http://www.morikita.co.jp/日本書籍出版協会・自然科学書協会・工学書協会 会員JCLS <(株)日本著作出版権管理システム委託出版物>

落丁・乱丁本はお取替えいたします 印刷 /モリモト印刷・製本 /ブックアート

Printed in Japan/ ISBN978-4-627-87911-9