energy landscape of a random heteropolymer
DESCRIPTION
Energy Landscape of a Random Heteropolymer. Many aspects of the folding process can be understood from studying the energetic properties of a random heteropolymer (RHP). Helpful tool: lattice models of protein conformations - PowerPoint PPT PresentationTRANSCRIPT
3. Lecture SS 2006
GK 1276 1
Many aspects of the folding process can be understood from studying the
energetic properties of a random heteropolymer (RHP).
Helpful tool: lattice models of protein conformations
Simplest model uses two kinds of residues (i.e. hydrophobic and hydrophilic
amino acids) that are randomly distributed.
Simulations show
(1) small modest structural changes give rise to large changes in energy
(2) low energy states exist that are very different in structure but close in
energy.
Energy Landscape of a Random Heteropolymer
3. Lecture SS 2006
GK 1276 2
Foldable sequences
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
Within the space of random heteropolymers
based on the 20 naturally occurring amino
acids there would be 20N possible
sequences of length N.
Only a small subset of these sequences are
thermodynamically and kinetically foldable
on the appropriate biological timescale seen
in nature.
The kinetically allowed set is shown to lie
within the thermodynamic core.
3. Lecture SS 2006
GK 1276 3
In Peptiden und Proteinen sind Aminosäuren als lange Ketten
miteinander verbunden.
Paare von jeweils zwei werden durch eine „Peptidbindung“ verknüpft.
(Emil Fischer und Franz Hofmeister, 1902).
O
OR
H
H N
O
OR
H
H N
O
O
O
R
H
H N N
H
H
R
O
O
O
R
H
H N N
H
H
R
+
-3
+
-3+
+3
-+ H O2
2
2
1
1
+3
21
peptide bond
G>0
Einleitung: Aminosäuren
Emil Fischer, Nobelpreis 1902Zucker- undPurinsynthese
3. Lecture SS 2006
GK 1276 4
E.J. Corey und Linus Pauling studierten die Petidbindung in den
1940‘ern und 1950‘ern.
Sie fanden: die C-N Länge ist 1.33 Å.
Sie liegt damit zwischen 1.52 Å und 1.25 Å,
was die Werte für eine Einfach- bzw.
Doppelbindung sind.
Die benachbarte C=O Bindung hat eine Länge
Von 1.24 Å, was etwas länger als eine typische
Carbonyl- C=O Doppelbindung ist (1.215 Å).
die Peptidbindung hat einen teilweise
konjugierten Charakter und ist nicht frei drehbar.
Es bleiben damit pro Residue 2 frei drehbare
Diederwinkel des Proteinrückgrats übrig.
O
OR
H
H N
O
OR
H
H N
O
O
O
R
H
H N N
H
H
R
O
O
O
R
H
H N N
H
H
R
+
-3
+
-3+
+3
-+ H O2
2
2
1
1
+3
21
peptide bond
G>0
Eigenschaften der Peptidbindung
Linus PaulingNobelpreise fürChemie 1954 undFrieden 1963
3. Lecture SS 2006
GK 1276 5
Wie seit den 1950‘er Jahren bekannt,
können Aminosäure-Stränge
Sekundärstrukturelemente
bilden:(aus Stryer, Biochemistry)
-Helices
und -Stränge.
In diesen Konformationen
bilden sich jeweils
Wasserstoffbrückenbindungen
zwischen den C=O und N-H
Atomen des Rückgrats. Daher
sind diese Einheiten strukturell
stabil.
Einleitung: Sekundärstrukturelemente
3. Lecture SS 2006
GK 1276 6
Zu Zeiten des zweiten Weltkriegs glaubte man, die Eigenschaften von Proteinen
würden durch ihre Zusammensetzung aus Aminosäuren bestimmt.
Durch die Arbeiten von Frederick Sanger (1949-51) zur
Bestimmung der Aminosäuresequenz eines Proteins –
und schließlich der Entschlüsselung der Sequenz von
Insulin – wurde klar, dass die Eigenschaften eines Proteins
durch seine Aminosäuresequenz bestimmt werden.
Proteine bestehen aus einer linearen Polymerkette, die 20 verschiedene Amino-
säuren enthalten kann.
Alle Kopien eines Proteins haben eine identische Sequenz.
Durch die Bestimmung der kompletten Genomsequenzen von Organismen weiß
man, dass Prokaryonten ca. 2000 – 5000 Proteine (d.h. verschiedene Proteine)
enthalten und Eukaryonten ca. 10.000 – 50.000.
Was bestimmt die Proteineigenschaften?
Frederick Sanger, Nobelpreise für Chemie1958 und 1980
3. Lecture SS 2006
GK 1276 7
Studierte die Eigenschaften von Ribonuclease A,
einem kleinen Enzym mit 124 Aminosäuren, in dem
4 Disulfidbrücken verschiedene Abschnitte der
Polypeptidkette im gefalteten Zustand stabilisieren.
Disulfidbrücken eines Proteins denaturieren gewöhnlich (d.h. brechen auf), wenn
man reduzierende Substanzen wie Mercaptoethanol hinzugibt.
Wenn man dies mit Ribonuklease A macht
und das Urea/Mercaptoethanol später
wieder entfernt, entsteht ein Protein mit
gleicher Aktivität wie das ursprüngliche Protein!
Die Faltung geschieht selbst-assemblierend.
Die Struktur eines Proteins wird allein aus
seiner Sequenz bestimmt.(Nobelpreis 1972). [Karp]
Christian Anfinsen (1956)
3. Lecture SS 2006
GK 1276 8
Da es 20 verschiedene Aminosäuren gibt,
gibt es 20200 verschiedene Sequenzen der Länge 200!
Allerdings können sich nur eine sehr kleine Teilmenge davon zu
dreidimensionalen Strukturen falten, die gegenüber
Verdauenzymen stabil sind.
Wie groß ist ein Protein? Durchmesser 3-10 Nanometer
Wieviele Proteine gibt es?
3. Lecture SS 2006
GK 1276 9
Für ein Protein mit 100 AS und jeweils 2 Konformationen für jede Aminosäure
ergeben sich 2100 = 1.27 x 1030 mögliche Konformationen des Proteins.
Wenn das Protein 10-13 sec brauchen würde, jede einzelne Konformation
abzusuchen, zu „samplen“, dann würde es
10-13 x 1.27x1030 = 1.27 x 1017 s = 4 x 109 Jahre brauchen
bis es alle seine Konformationen abgesucht hätte und eventuell
die energetisch günstigste gefunden hätte.
Dies ist offensichtlich nicht möglich.
Daher muß es Faltungshilfen oder spezielle Faltungspfade geben, sodaß das
Protein nicht alle theoretisch mögliche Zustände absuchen braucht.
Levinthal-Paradoxon
3. Lecture SS 2006
GK 1276 10
Random energy model (REM)
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
The random energy model was originally developed by Derrida to describe
spin glasses, and was first applied to biopolymers by Bryngelson and
Wolynes (1987) as a 0-th order approximation.
The low-energy structures of a RHP, represented by a lattice with two kinds
of residues, are unrelated and the conformational changes are associated
with a fluctuation in the energy.
3. Lecture SS 2006
GK 1276 11
Energy landscape of a random heteropolymer
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
For a random sequence,
the sum of interactions is
expected to produce a
Gaussian probability
distribution for the energy
where and are the mean
and standard deviation of the
distribution, respectively.
2
2
2 2exp
2
1
E
EP
3. Lecture SS 2006
GK 1276 12
Energy landscape of a random heteropolymer
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
entr
opy
The system runs out of entropy
when the average energy falls
below E0, and this entropy crisis
is characterized by a glass
transition temperature TG,
which depends on the
corresponding conformational
entropy and fluctuations.
If is the total number of
configurational states the
entropy can be written as
EPkES ln
3. Lecture SS 2006
GK 1276 13
The system runs out of entropy when the average energy falls below a critical
value E E0 such that S(E) = 0, or P(E) = 1/.
This entropy crisis occurs at
a glass-transition temperature TG where
Properties of Random Heteropolymers
2
2
22
22
2
2
2
2
2
2
2
2
2
2ln2
2ln2
2ln
2
2ln
2
2
2exp
1
2exp
2
1
E
E
E
E
E
E
Two solutions, lower energy corresponds
to entropy crisis ...
(without derivation assuming a
microcanonical distribution)
22lnln2
k
Tg
3. Lecture SS 2006
GK 1276 14
Folding energy funnel
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
3. Lecture SS 2006
GK 1276 15
Foldable sequences
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
Phase diagram and folding scenarios according to the
minimally frustrated REM analysis.
(Top) The phase diagram along a line of some average
sequence hydrophobicity shows the possible thermodynamic
states of a protein modeled as a minimally frustrated
heteropolymer. Varying the hydrophobicity by changes in
solvent and temperature can modify the number of phases
observed in the folding process.
(Bottom) The free-energy curves consistent with the above
phase diagram exhibit various folding scenarios:
Type 0 and 1 are examples of fast folding, downhill with no
barrier and a small barrier in the latter. These are typical
scenarios for well-designed proteins at temperatures below
the folding temperatures and conditions such that the glass
transition is not encountered.
The Type II scenarios occur at the right-hand side of the
phase diagram under conditions that favor the formation of the
glassy state either after or before the thermodynamic
transition barrier.
3. Lecture SS 2006
GK 1276 16
Das Modell ist ein dreidimensionales Kopolymer.
Polymere werden als self-avoiding walks
auf einem kubischen Gitter dargestellt.
Das Wechselwirkungspotential soll kompakte
Zustände bevorzugen. Die Polymerkette soll
kollabieren und sich falten. Das heisst, man
braucht ein Potential, das den hydrophoben
Effekt nachahmt, der die dominierenden Kraft
für die Proteinfaltung ist.
Das Potential besteht aus Kontakt-Wechsel-
wirkungen zwischen nächsten Nachbarn.
Das Potential soll einen eindeutigen Grund-
zustand besitzen.
Simulationsmodell
3. Lecture SS 2006
GK 1276 17
Foldable sequences
Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)
A random configuration for a 27-mer
sequence encountered en route to
the native structure.
The maximally compacted
conformation for this sequence,
not shown here,
has the shape of a 3 3 3 cube.
3. Lecture SS 2006
GK 1276 18
Monte Carlo moves(1) A rotation by angle in the xy-plane can be achieved by application of the
rotation matrix
(det() = cos2 +sin2 = 1 rotation preserves distances)
while a rotation by angle in the xz-plane can be achieved by the rotation matrix
note that cos(-) = cos and sin(-) = -sin
100
0cossin
0sincos
cos0sin
010
sin0cos
3. Lecture SS 2006
GK 1276 19
Monte Carlo moves(2) A corner move.
(3) A crankshaft move.
3. Lecture SS 2006
GK 1276 20
[nach A.R. Dinner, M. Karplus, J. Phys. Chem. B, 103, 7976 (1999)]
* In früheren Monte Carlo-Simulationen mit 27-meren auf einem
kubischen Gitter (Anfang – Mitte der 90er Jahre) war die einzige Bedingung
(notwendig und hinreichend) für die Fähigkeit einer Sequenz, eindeutig zu
einem nativen Zustand zu falten, daß dieser ein globales Minimum der
freien Energie sein mußte und zugleich durch einen ausreichend großen
Energieabstand zu den übrigen Zuständen getrennt sein mußte.
* Es gab keine Korrelation zwischen der Faltungsrate und anderen
Eigenschaften der Sequenz, wie z.B. dem Anteil an Sekundärstruktur.
27-mer Proteinmodell
3. Lecture SS 2006
GK 1276 21
Kette H-H-H-P-P-H-P-H ….
attraktive WW zwischen H-H und P-P, neutrale WW zwischen H-P
Die Faltung solch eines 27-mers geschieht durch:
- einen schnellen Kollaps (ca. 104 MC-Schritte)
- gefolgt von einer langsamen, nicht-gerichteten Suche (ca. 107 MC-Schritte)
durch die ca. 1010 semi-kompakten Strukturen nach einem der ca. 103
Übergangszustände.
- Der anschließende Übergang in den nativen Zustand ist wiederum rasch (ca.
105 MC-Schritte)
Diese Einschränkung der Suche auf kompakten Unterraum des Konfigurations-
raums löste gewissermaßen das Levinthal-Paradoxon für solch ein 27-mer.
Jedoch scheint dieser Mechanismus nur für kleine Proteine gültig zu sein, da die
Faltungszeit exponentiell mit der Länge der Aminosäurekette ansteigt und
unrealistisch hoch wird für mehr als 80 Residuen.
27-mer HP-Proteinmodell
3. Lecture SS 2006
GK 1276 22
Faltung auf Oberfläche der freien Enthalpie
geringe Temperatur hohe Temperatur
Dobson, Karplus,Angew. ChemieInt. Ed. 37, 868 (1998)
3. Lecture SS 2006
GK 1276 23
* konstruiere also Modell, das Proteinfaltung für größere (und realistischere)
Proteine beschreibt
* 125-mere mit einem maximal kompakten 5 x 5 x 5 nativen Zustand haben
eine ähnliche Länge und Oberfläche-zu-Volumen-Verhältnis (22%) wie globuläre
Proteine.
Polymerkette soll sich gemäß self-avoiding-walk falten.
neue Energiefunktion für eine Konformation (modifiziertes Go-Modell)
B0 ist eine mittlere attraktive WW, entsprechend einer allgemeinen hydrophoben
WW
Bij ist die sequenzspezifische WW:
native Kontakte (Bij)mittlere WW e= -1.67, Standardabweichung 1.0
nicht-native Kontakte (Bij0)
mittlere WW e= 0, Standardabweichung 1.0
125-mer Proteinmodell
3. Lecture SS 2006
GK 1276 24
Proteinfaltung
Energie des Systems
Gesamtzahl der nativenKontakte N
Prozentsatz Q an gesamterZahl nativer Kontakte.
Dobson, Karplus,Angew. ChemieInt. Ed. 37, 868 (1998)
3. Lecture SS 2006
GK 1276 25
125-mer Proteinmodell
3. Lecture SS 2006
GK 1276 26
Analogie zu exp. Daten für richtige Proteine:NMR-Daten für Faltung von Lysozym
Man findetzwei Faltungs-pfade. Der gelbe ist schnell,der grüne langsam.
Dobson, Karplus,Angew. ChemieInt. Ed. 37, 868 (1998)
3. Lecture SS 2006
GK 1276 27
Proteinfaltung ist durch verschiedene Grade an Ordnung bestimmt!
Die meisten dynamischen Experimente untersuchen nur eine Sorte von Ordnung,z.B. die Kompaktheit, Anteil der Sekundärstruktur, spezifische tertiäre Kontakte..
Generell kann man den Faltungsprozess mit der Theorie von Energielandschaftenund dem Konzept eines Faltungstrichters beschreiben.
Um eine Anzahl von Faltungsexperimenten vollständig zu verstehen muss man dieEigenschaften dieses Trichters durch eine multidimensionale Sicht seiner Formund statistischen Eigenschaften verstehen.
Verschiedene Faltungsszenarien entstehen durch die Balance zwischen demKollaps-Ordnungs-Parameter Z und einem Ordnungsparameter, der für bestimmtetertiäre Kontakt empfindlich ist, Q.
neue Sicht der Proteinfaltung:Proteinfaltungstrichter,energy landscape model
3. Lecture SS 2006
GK 1276 28
Tf : die Faltungstemperatur, unter der sich das Protein spontan
in den nativen Zustand faltet.
Tg : die Temperatur des Glas-Übergangs.
Analogie zwischen Proteinen und Spingläsern.
Der Grad an Nicht-Exponentialität hängt mit der
Struktur der Energielandschaft zusammen.
2 wichtige Temperaturen
3. Lecture SS 2006
GK 1276 29
l l u uE N E N E
Nl ist die Anzahl an Kontakten zwischen
Monomeren desselben Typs (like contacts),
Nu ist die Anzahl der nicht-ähnlichen Kontakte.
Verwende entweder 2 oder 3 verschiedene Monomere.
Mit diesen beiden Parametern kann man die
Eigenschaften des Modells gut diskutieren:
1
2 l u
het u l
E E E
E E E
Dimensionsloser Kollaps-Parameter
bezeichnet Stärke der Kollabierungskraft:
het
E
E
= 1 ist das Limit grosser Hydrophobizität,
= 0 is das Limit geringer Hydrophobizität.
Wechselwirkungspotential
3. Lecture SS 2006
GK 1276 30
Z misst die Kompaktheit der Kette:
total number of contactsZ
maximum number of contacts
Q misst die Ähnlichkeit zum nativen Zustand:
Q = Anzahl der ausgebildeten nativen Kontakte
Faltungsszenarien unterschiedlicher Hydrophobizität
3. Lecture SS 2006
GK 1276 31
2 schematische Faltungsszenarien
Fall grosser Hydrophobizität
Prozess in zwei Schritten::
1 schneller Kollaps (durch Z getrieben)
+ 2 Umordnung in native Struktur
(getrieben durch Q)
Freie Enthalpie Barriere.
Fall geringer Hydrophobizität
Kollaps und Faltung geschehen gleichzeitig.
Downhill Faltung,
keine Freie Enthalpie Barriere.
Faltungstrichter
Socci, Onuchic, WolynesProteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276 32
Proteindynamik kann durch “Hopping” zwischen verschiedenen Konformationen
geringer Energie dominiert sein (Bryngelson & Wolynes, 1987; Kidera & Go, 1998).
Falls die Energielandschaft nicht rauh ist, kann die Bewegung als
Diffusion eines Teilchens auf einer Oberfläche der Freien Enthalpie als
Funktion des Faltungsordnungs-Parameters beschrieben werden.
Dies ist eine gute Beschreibung sollange die Rauhheit der Energieoberfläche
klein gegenüber der Temperatur ist
= solange Faltung durch eine Anzahl verschiedener Pfade geschieht..
Dies ist der Fall für T > Tg , der Temperatur des Glas-Übergangs.
Faltungskinetik
3. Lecture SS 2006
GK 1276 33
Es ist schwierig einen Phasenübergang für ein kleines, endliches System genau
zu definieren.
Grobes Kriterium: Faltungszeit.
Benutze Gittermodell um die Beziehung zwischen dynamischem slowing down
und nicht-exponentieller Kinetik zu testen.
Messe den Bruchteil der Population, der ungefaltet bleibt als Funktion der Zeit,
plotte als log-log Plot.
Einfach exponentieller Prozess besitzt charakteristische Signatur
Eine Power-law Abhängigkeit drückt sich durch eine breite Verteilung der
Lebensdauern aus und bewirkt lineare Kurven.
Quantifiziere den Glasübergang
3. Lecture SS 2006
GK 1276 34
Proteinfaltung: gute Sequenz, hohe Hydrophobizität
Socci, Onuchic, WolynesProteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276 35
Proteinfaltung: gute Sequenz, geringe Hydrophobizität
Socci, Onuchic, Wolynes, Proteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276 36
Geschieht Kollaps vor Faltung oder
geschehen beide gleichzeitig?
Es gibt exp. Hinweise auf beide
Szenarios in unterschiedlichen Systemen.
Freie-Enthalpie-Oberfläche für eine gute
Sequenz bei grosser Hydrophobizität:
Oben (Tf):
zwei Minima, kinetisch 2-Zustandsverhalten
Faltung = Diffusion über Barriere
exp. System: Protein G (all-atom MD)
Unten (geringe Temperatur):
beide Minima kollabieren, down-hill Faltung
Faltungszeit durch Diffusionskonstante bestimmt.
Kollaps vs. Faltung
Socci, Onuchic, WolynesProteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276 37
hohe Temperatur (A): nicht-gefaltetes
Minimum ist nicht kollabiert. Kollaps und
Faltung geschehen gleichzeitig.
Faltung entlang von Linie Q = Z.
exp. System: Faltung eines 3-Helix-
Bündels liegt in intermediärem
Regine zwischen den Bedingungen
grosser und geringer Hydrophobizität.
Gute Sequenz, geringer Hydrophobizität
Socci, Onuchic, WolynesProteins, 32, 136 (1998)
3. Lecture SS 2006
GK 1276 38
Die Darstellung als multidimensionaler Faltungstrichter (funnel) zeigt, dass man
die Faltung kleiner Proteine abhängig von den Eigenschaften der Energie-
Landschaft entweder als
(a) einen direkt aktivierten 2-Zustands-Prozess oder
(b) mit “Intermediaten” ansehen kann.
Die Art der Zwischenzustände hängt vom Zusammenwirken zwischen der
Rauhheit der Energielandschaft (durch Lage des Glas-Übergangs bestimmt) und
der allgemeinen Form des Faltungstrichters ab, die die thermodynamischen
Barrieren bestimmt.
Zusätzliche Dimensionen:
In richtigen Proteinen kann der Grad an lokaler Sekundärstruktur ein nahezu
unabhängige Rolle von Q and Z bei der Charakterisierung der Landschaft spielen.
Die Ordnung von Seitenketten kann ebenfalls eine bedeutsame und
möglicherweise separierbare Rolle spielen.
Zusammenfassung
3. Lecture SS 2006
GK 1276 39
Das energy landscape Modell für die Proteinfaltung zeigt, daß es Protein geben
kann, sogenannte fast folding proteins, bei denen die Faltung gewissermaßen
down-hill stattfindet. Nun mag man sich fragen:
* Wie schnell kann sich ein Protein überhaupt falten?
* Ist Proteinfaltung schlußendlich ein diffusiver Vorgang?
Dies wird bisher von Experimentalisten kontrovers diskutiert ...
Es ist schwierig, die Bedeutung der Diffusion experimentell zu belegen. Die
Zugabe eines Ko-Solvens (Glykol, ...), der die Viskosität verändert, beeinflußt
(erhöht) oft auch die Stabilität des Proteins gegenüber thermischer Denaturierung
(Entfaltung).
Um zu beweisen, daß eine Erhöhung der Viskosität zu einer verlangsamten
Faltung des Proteins führt, und damit Proteinfaltung ein diffusiver Prozeß ist,
benötigt man Systeme, bei denen Zugabe von Ko-Solvens die Stabilität des
Proteins NICHT verändert.
Ein Beispiel dafür ist:
Jacob, Geeves, Holtermann, Schmid, Nature Struct.Biol., 6, 923 (1999) Diffusional
barrier crossing in a two-state protein folding reaction.
Zusammenfassung II