protein-rna interaction prediction
TRANSCRIPT
Structural Prediction of Protein-RNA Interaction
by Computational Docking
with Propensity-based Statistical Potentials
2010/10/12 論文輪講
M2 大上 雅史
Laula Pérez-Cano, Albert Solernou, Carles Pons, Juan Fernández-Recio
BIOCOMPUTING 2010
Proceedings of the Pacific Symposium
Kamuela, Hawaii, USA, 4 - 8 January 2010
Pac Symp Biocomput. 2010, 293-301.
内容に入る前に
• ドッキングソフトPyDOCK開発チーム
– FTDockがベース
– CAPRIでも結構強い• FTDockが元
Fernandezらについて
3
Grosdidier, S., Pons, C., Solernou, A., & Fernández-Recio, J. (2007).
Prediction and scoring of docking poses with pyDock. Proteins, 69(4), 852-8.
doi: 10.1002/prot.21796.
Cheng, T. M., Blundell, T. L., & Fernandez-Recio, J. (2007).
pyDock: electrostatics and desolvation for effective scoring of rigid-body
protein-protein docking. Proteins, 68(2), 503-15.
doi: 10.1002/prot.21419.
Pons, C., Solernou, A., Perez-Cano, L., Grosdidier, S., & Fernandez-Recio, J. (2010).
Optimization of pyDock for the new CAPRI challenges: Docking of homology-
based models, domain-domain assembly and protein-RNA binding. Proteins, 1-7.
doi: 10.1002/prot.22773.
References
Introduction
• この研究のテーマ「タンパク質-RNA間相互作用」
• この研究でやったこと
→ドッキングのための新しい残基-リボ核酸ペアワイズスコアの開発
– FFT-based rigid body dockingを想定
• ドッキングで大量生成したデコイに対してこのスコアを用いて評価(フィルタリング)する
イントロダクション
5
• タンパク質-RNA間相互作用が重要
– だが利用可能な構造はまだまだ少ない
– 計算機による構造ベースの研究も少ない
• ドッキング研究
– Protein-ProteinやProtein-Ligandに比べて事例が圧倒的に少ない
– 最近のCAPRIのターゲットにRNAが出現
イントロダクション
6
• CAPRIにおけるPyDockチーム
– Protein-RNAドッキングで2位
• Ligand-RMSD = 3.8Å
– 課題・限界も見い出された
• フレキシブルさの考慮
• Protein-RNAのためにチューニングされたスコアリングパラメータが必要
イントロダクション
7
• Protein-RNA複合体の相互作用面の情報等から相互作用の特徴の理解を目指した研究
– 水素結合の全原子統計的ポテンシャル
• Rosetta(リガンドドッキングシステム)を使ってdecoy生成,near nativeとそうでないのを比較してチューニング
イントロダクション
[3] Chen, Y., Kortemme, T., Robertson, T., Baker, D., & Varani, G.
(2004). A new hydrogen-bonding potential for the design of
protein-RNA interactions predicts specific contacts and
discriminates decoys. Nucleic acids research, 32(17), 5147-62.
doi: 10.1093/nar/gkh785.
8
• 統計的ポテンシャルに関する研究(一部)
イントロダクション
[12] Lejeune, D., Delsaux, N., Charloteaux, B., Thomas, A., &
Brasseur, R. (2005). Protein-nucleic acid recognition: statistical
analysis of atomic interactions and influence of DNA structure.
Proteins, 61(2), 258-71. doi: 10.1002/prot.20607.
[9] Ellis, J. J., Broom, M., & Jones, S. (2007). Protein – RNA
Interactions : Structural Analysis and Functional Classes.
Bioinformatics, 911(December 2006), 903-911.
[13] Jeong, E., Kim, H., Lee, S., & Han, K. (2003). Discovering the
interaction propensities of amino acids and nucleotides from protein-
RNA complexes. Molecules and cells, 16(2), 161-7.
9
• 類似の論文
イントロダクション
[6] Pérez-Cano, L., & Fernández-Recio, J. (2010). Optimal protein-RNA
area, OPRA: a propensity-based method to identify RNA-binding sites
on proteins. Proteins, 78(1), 25-35. doi: 10.1002/prot.22527.
10
Methods
Pairwise residue-ribonucleotide interface propensities
提案手法
p :アミノ酸の種類(1~20)
q :RNAの種類(1~4)
NIpq :相互作用面の(p, q)ペアの数
(4Å以内に1個でも互いの原子があればカウント)
NSp/q :表面残基/RNAの数
(ASA>0.1Å2でカウント)
12282のnon-redundant protein-RNA interaction を利用
• 自由エネルギーの形に変換
Pairwise p-q interface propensities
※ RT=0.59 kcal/mol
13
• 手順
– FTDockで10000個のデコイ生成
• 静電的相互作用丌使用,1.2ÅGrid
– デコイiに対するfinal score
ドッキングへの利用
14
評価実験~使用データ
unbound proteinはboundと95%以上の配列類似性のもの,unbound RNAは85%
15
• RNAのRMSDで評価
– タンパク質のCαをフィッティング
– RNA全原子でRMSDを計算
– near-native solutionは10Å以下(CAPRI基準)
• 特定のdecoy中に含まれるNNS数の割合をランダム生成と比較
評価実験~評価方法
16
Results
– アルギニン(R),リジン(K),ヒスチジン(H)がよくいる
– RNA側では変化はあまり見られない→残基が重要
interface propensities
favorable pair disfavored
18
interface propensities
Protein-RNAの相互作用では静電的効果が重要
※Protein-Proteinではdesolvation/hydrophobic effectが重要
RNAの負電荷がタンパク質のRNA binding siteで重要な効果を発揮している
19
Protein-RNA rigid-body docking and scoring
・fnat is the fraction of RNA-protein contacts that is also found in the
native (target) structure
・fnon-nat is the fraction of RNA-protein contacts that is found, but that is
not present in the native (target) structure
・FTDock&Propensity はスコアの和(重み付けなし)
10,000個のFTDock生成decoy中にNNSがあったもの(12複合体中7複合体)
20
1
10
100
1000
10000
FTDock Propensity FTDock&Propensity
Best
near-
nati
ve r
an
k 1WSU
2PJP
1LNG
1E7K
1WPU
2QUX
2JEA
Protein-RNA rigid-body docking and scoring
21
1
10
100
1000
10000
FTDock FTDock&Propensity
Best
near-
nati
ve r
an
k 1WSU
2PJP
1LNG
1E7K
1WPU
2QUX
2JEA
Protein-RNA rigid-body docking and scoring
22
• 組合せて使うとよくなる
– FTDockと相補的に働いている?
– 3つの例ではFTDockとPropensityのどちらかに10位以下がいる
Protein-RNA rigid-body docking and scoring
23
Example of successful prediction
PDB id : 2QUX
(Propensityで1位が当たったやつ)
unbound protein vs. bound RNA
RMSD = 8.7Å
タンパク質表面での位置が結構近いから良いんじゃね
シアン:予測マゼンタ:X-ray
24
Discussion
• 関連研究と比較
– favored残基は全てにおいて共通→アルギニン(R)とリジン(K)
• この論文で見られたヒスチジン(H)は環境によっては正電荷として機能するので重要
– 相手RNAによって変化• R-UとK-Aが特に強い
• この論文では相手RNAによる変化は殆ど無いと結論
– トリプトファン(W)とチロシン(Y)も割と関係している• 特にRNA側がAかUのとき
他のpropensity score
26
母集団の大きさがでかい(282 nr PRIを使用)から,他よりも一般の複合体に適用するときでは良いはず
27
他のpropensity score
[16]Treger, M., & Westhof, E. (2001). Statistical analysis of atomic
contacts at RNA-protein interfaces. Journal of molecular recognition :
JMR, 14(4), 199-214. doi: 10.1002/jmr.534.
[9] Ellis, J. J., Broom, M., & Jones, S. (2007). Protein-RNA
interactions: structural analysis and functional classes. Proteins,
66(4), 903-11. John Wiley & Sons. doi: 10.1002/prot.21211.
28
他のpropensity score
[15]Jones, S., Daley, D. T., Luscombe,
N. M., Berman, H. M., & Thornton, J.
M. (2001). Protein-RNA interactions:
a structural analysis. Nucleic acids
research, 29(4), 943-54.
29
[13]Jeong, E., Kim, H., Lee, S., & Han, K. (2003). Discovering the
interaction propensities of amino acids and nucleotides from protein-
RNA complexes. Molecules and cells, 16(2), 161-7. Retrieved from
http://www.ncbi.nlm.nih.gov/pubmed/14651256.
他のpropensity score
30
性能比較
[16]
[9]
[15]
1/7
2/7
4/7
10,000decoyをテキトウに順位付け100回平均
• 2つのことが結論づけられた
– Protein-RNAの特異性の決定要因がほとんどProteinの残基にある
– 統計ポテンシャルの予測値はデータベースの大きさに依る
• ドッキング性能
– Protein-Proteinよりは悪い
– が,1E7Kと1WPUはProtein-Proteinより良い
31
まとめると
• Protein-RNAドッキング
– FTDockだけでもそこそこ良い結果のものが出る
• 「top10にNNSがいる率」が高い
• PPDではそんなに高くならない
→(Elecを使ってないことから)
Protein-RNAでは形状相補性が(PPDより)さらに重要なのでは
※ただし良くなったのはbound RNA
32
まとめると
1
10
100
1000
10000
FTDock Propensity FTDock&Propensity
Best
near-
nati
ve r
an
k 1WSU
2PJP
1LNG
1E7K
1WPU
2QUX
2JEA
Conclusions
• Protein-RNAドッキングのための新しい手法を提案
– 新しいpairwise propensity scoreを提案
– FTDockの形状相補性と組合せて良い結果を得た• RNAがbound構造ならかなり良い
• Protein-RNAドッキングの戦略
– 剛体ドッキングの実行
– 形状相補性とpropensityでranking,上位数100を抽出
– 制限距離(?)などの情報でrankingを改良
• bottleneck
– 利用可能なunbound構造の少なさ• homology-basedモデルのRNA構造の利用を
考える必要がある
34
Summary
• Protein-DNA pairwise propensityの開発
– Protein-RNAと似た結果になりそう
– DNA結合位置の予測やドッキングに応用したい
35
Future work