energy landscape of a random heteropolymer

3. Lecture SS 2006

GK 1276 1

Many aspects of the folding process can be understood from studying the

energetic properties of a random heteropolymer (RHP).

Helpful tool: lattice models of protein conformations

Simplest model uses two kinds of residues (i.e. hydrophobic and hydrophilic

amino acids) that are randomly distributed.

Simulations show

(1) small modest structural changes give rise to large changes in energy

(2) low energy states exist that are very different in structure but close in

energy.

Energy Landscape of a Random Heteropolymer

3. Lecture SS 2006

GK 1276 2

Foldable sequences

Onuchic, Luthey-Schulten, Wolynes, Annu Rev Phys Chem 48, 545 (1997)

Within the space of random heteropolymers

based on the 20 naturally occurring amino

acids there would be 20N possible

sequences of length N.

Only a small subset of these sequences are

thermodynamically and kinetically foldable

on the appropriate biological timescale seen

in nature.

The kinetically allowed set is shown to lie

within the thermodynamic core.

3. Lecture SS 2006

GK 1276 3

In Peptiden und Proteinen sind Aminosäuren als lange Ketten

miteinander verbunden.

Paare von jeweils zwei werden durch eine „Peptidbindung“ verknüpft.

(Emil Fischer und Franz Hofmeister, 1902).

O

OR

H

H N

O

OR

H

H N

O

O

O

R

H

H N N

H

H

R

O

O

O

R

H

H N N

H

H

R

+

-3

+

-3+

+3

-+ H O2

2

2

1

1

+3

21

peptide bond

G>0

Einleitung: Aminosäuren

Emil Fischer, Nobelpreis 1902Zucker- undPurinsynthese

3. Lecture SS 2006

GK 1276 4

E.J. Corey und Linus Pauling studierten die Petidbindung in den

1940‘ern und 1950‘ern.

Sie fanden: die C-N Länge ist 1.33 Å.

Sie liegt damit zwischen 1.52 Å und 1.25 Å,

was die Werte für eine Einfach- bzw.

Doppelbindung sind.

Die benachbarte C=O Bindung hat eine Länge

Von 1.24 Å, was etwas länger als eine typische

Carbonyl- C=O Doppelbindung ist (1.215 Å).

die Peptidbindung hat einen teilweise

konjugierten Charakter und ist nicht frei drehbar.

Es bleiben damit pro Residue 2 frei drehbare

Diederwinkel des Proteinrückgrats übrig.

O

OR

H

H N

O

OR

H

H N

O

O

O

R

H

H N N

H

H

R

O

O

O

R

H

H N N

H

H

R

+

-3

+

-3+

+3

-+ H O2

2

2

1

1

+3

21

peptide bond

G>0

Eigenschaften der Peptidbindung

Linus PaulingNobelpreise fürChemie 1954 undFrieden 1963

3. Lecture SS 2006

GK 1276 5

Wie seit den 1950‘er Jahren bekannt,

können Aminosäure-Stränge

Sekundärstrukturelemente

bilden:(aus Stryer, Biochemistry)

-Helices

und -Stränge.

In diesen Konformationen

bilden sich jeweils

Wasserstoffbrückenbindungen

zwischen den C=O und N-H

Atomen des Rückgrats. Daher

sind diese Einheiten strukturell

stabil.

Einleitung: Sekundärstrukturelemente

3. Lecture SS 2006

GK 1276 6

Zu Zeiten des zweiten Weltkriegs glaubte man, die Eigenschaften von Proteinen

würden durch ihre Zusammensetzung aus Aminosäuren bestimmt.

Durch die Arbeiten von Frederick Sanger (1949-51) zur

Bestimmung der Aminosäuresequenz eines Proteins –

und schließlich der Entschlüsselung der Sequenz von

Insulin – wurde klar, dass die Eigenschaften eines Proteins

durch seine Aminosäuresequenz bestimmt werden.

Proteine bestehen aus einer linearen Polymerkette, die 20 verschiedene Amino-

säuren enthalten kann.

Alle Kopien eines Proteins haben eine identische Sequenz.

Durch die Bestimmung der kompletten Genomsequenzen von Organismen weiß

man, dass Prokaryonten ca. 2000 – 5000 Proteine (d.h. verschiedene Proteine)

enthalten und Eukaryonten ca. 10.000 – 50.000.

Was bestimmt die Proteineigenschaften?

Frederick Sanger, Nobelpreise für Chemie1958 und 1980

3. Lecture SS 2006

GK 1276 7

Studierte die Eigenschaften von Ribonuclease A,

einem kleinen Enzym mit 124 Aminosäuren, in dem

4 Disulfidbrücken verschiedene Abschnitte der

Polypeptidkette im gefalteten Zustand stabilisieren.

Disulfidbrücken eines Proteins denaturieren gewöhnlich (d.h. brechen auf), wenn

man reduzierende Substanzen wie Mercaptoethanol hinzugibt.

Wenn man dies mit Ribonuklease A macht

und das Urea/Mercaptoethanol später

wieder entfernt, entsteht ein Protein mit

gleicher Aktivität wie das ursprüngliche Protein!

Die Faltung geschieht selbst-assemblierend.

Die Struktur eines Proteins wird allein aus

seiner Sequenz bestimmt.(Nobelpreis 1972). [Karp]

Christian Anfinsen (1956)

3. Lecture SS 2006

GK 1276 8

Da es 20 verschiedene Aminosäuren gibt,

gibt es 20200 verschiedene Sequenzen der Länge 200!

Allerdings können sich nur eine sehr kleine Teilmenge davon zu

dreidimensionalen Strukturen falten, die gegenüber

Verdauenzymen stabil sind.

Wie groß ist ein Protein? Durchmesser 3-10 Nanometer

Wieviele Proteine gibt es?

3. Lecture SS 2006

GK 1276 9

Für ein Protein mit 100 AS und jeweils 2 Konformationen für jede Aminosäure

ergeben sich 2100 = 1.27 x 1030 mögliche Konformationen des Proteins.

Wenn das Protein 10-13 sec brauchen würde, jede einzelne Konformation

abzusuchen, zu „samplen“, dann würde es

10-13 x 1.27x1030 = 1.27 x 1017 s = 4 x 109 Jahre brauchen

bis es alle seine Konformationen abgesucht hätte und eventuell

die energetisch günstigste gefunden hätte.

Dies ist offensichtlich nicht möglich.

Daher muß es Faltungshilfen oder spezielle Faltungspfade geben, sodaß das

Protein nicht alle theoretisch mögliche Zustände absuchen braucht.

Levinthal-Paradoxon

3. Lecture SS 2006

GK 1276 10

Random energy model (REM)


The random energy model was originally developed by Derrida to describe

spin glasses, and was first applied to biopolymers by Bryngelson and

Wolynes (1987) as a 0-th order approximation.

The low-energy structures of a RHP, represented by a lattice with two kinds

of residues, are unrelated and the conformational changes are associated

with a fluctuation in the energy.

3. Lecture SS 2006

GK 1276 11

Energy landscape of a random heteropolymer


For a random sequence,

the sum of interactions is

expected to produce a

Gaussian probability

distribution for the energy

where and are the mean

and standard deviation of the

distribution, respectively.

2

2

2 2exp

2

1

E

EP

3. Lecture SS 2006

GK 1276 12

Energy landscape of a random heteropolymer


entr

opy

The system runs out of entropy

when the average energy falls

below E0, and this entropy crisis

is characterized by a glass

transition temperature TG,

which depends on the

corresponding conformational

entropy and fluctuations.

If is the total number of

configurational states the

entropy can be written as

EPkES ln

3. Lecture SS 2006

GK 1276 13

The system runs out of entropy when the average energy falls below a critical

value E E0 such that S(E) = 0, or P(E) = 1/.

This entropy crisis occurs at

a glass-transition temperature TG where

Properties of Random Heteropolymers

2

2

22

22

2

2

2

2

2

2

2

2

2

2ln2

2ln2

2ln

2

2ln

2

2

2exp

1

2exp

2

1

E

E

E

E

E

E

Two solutions, lower energy corresponds

to entropy crisis ...

(without derivation assuming a

microcanonical distribution)

22lnln2

k

Tg

3. Lecture SS 2006

GK 1276 14

Folding energy funnel


3. Lecture SS 2006

GK 1276 15

Foldable sequences


Phase diagram and folding scenarios according to the

minimally frustrated REM analysis.

(Top) The phase diagram along a line of some average

sequence hydrophobicity shows the possible thermodynamic

states of a protein modeled as a minimally frustrated

heteropolymer. Varying the hydrophobicity by changes in

solvent and temperature can modify the number of phases

observed in the folding process.

(Bottom) The free-energy curves consistent with the above

phase diagram exhibit various folding scenarios:

Type 0 and 1 are examples of fast folding, downhill with no

barrier and a small barrier in the latter. These are typical

scenarios for well-designed proteins at temperatures below

the folding temperatures and conditions such that the glass

transition is not encountered.

The Type II scenarios occur at the right-hand side of the

phase diagram under conditions that favor the formation of the

glassy state either after or before the thermodynamic

transition barrier.

3. Lecture SS 2006

GK 1276 16

Das Modell ist ein dreidimensionales Kopolymer.

Polymere werden als self-avoiding walks

auf einem kubischen Gitter dargestellt.

Das Wechselwirkungspotential soll kompakte

Zustände bevorzugen. Die Polymerkette soll

kollabieren und sich falten. Das heisst, man

braucht ein Potential, das den hydrophoben

Effekt nachahmt, der die dominierenden Kraft

für die Proteinfaltung ist.

Das Potential besteht aus Kontakt-Wechsel-

wirkungen zwischen nächsten Nachbarn.

Das Potential soll einen eindeutigen Grund-

zustand besitzen.

Simulationsmodell

3. Lecture SS 2006

GK 1276 17

Foldable sequences


A random configuration for a 27-mer

sequence encountered en route to

the native structure.

The maximally compacted

conformation for this sequence,

not shown here,

has the shape of a 3 3 3 cube.

3. Lecture SS 2006

GK 1276 18

Monte Carlo moves(1) A rotation by angle in the xy-plane can be achieved by application of the

rotation matrix

(det() = cos2 +sin2 = 1 rotation preserves distances)

while a rotation by angle in the xz-plane can be achieved by the rotation matrix

note that cos(-) = cos and sin(-) = -sin

100

0cossin

0sincos

cos0sin

010

sin0cos

3. Lecture SS 2006

GK 1276 19

Monte Carlo moves(2) A corner move.

(3) A crankshaft move.

3. Lecture SS 2006

GK 1276 20

[nach A.R. Dinner, M. Karplus, J. Phys. Chem. B, 103, 7976 (1999)]

* In früheren Monte Carlo-Simulationen mit 27-meren auf einem

kubischen Gitter (Anfang – Mitte der 90er Jahre) war die einzige Bedingung

(notwendig und hinreichend) für die Fähigkeit einer Sequenz, eindeutig zu

einem nativen Zustand zu falten, daß dieser ein globales Minimum der

freien Energie sein mußte und zugleich durch einen ausreichend großen

Energieabstand zu den übrigen Zuständen getrennt sein mußte.

* Es gab keine Korrelation zwischen der Faltungsrate und anderen

Eigenschaften der Sequenz, wie z.B. dem Anteil an Sekundärstruktur.

27-mer Proteinmodell

3. Lecture SS 2006

GK 1276 21

Kette H-H-H-P-P-H-P-H ….

attraktive WW zwischen H-H und P-P, neutrale WW zwischen H-P

Die Faltung solch eines 27-mers geschieht durch:

- einen schnellen Kollaps (ca. 104 MC-Schritte)

- gefolgt von einer langsamen, nicht-gerichteten Suche (ca. 107 MC-Schritte)

durch die ca. 1010 semi-kompakten Strukturen nach einem der ca. 103

Übergangszustände.

- Der anschließende Übergang in den nativen Zustand ist wiederum rasch (ca.

105 MC-Schritte)

Diese Einschränkung der Suche auf kompakten Unterraum des Konfigurations-

raums löste gewissermaßen das Levinthal-Paradoxon für solch ein 27-mer.

Jedoch scheint dieser Mechanismus nur für kleine Proteine gültig zu sein, da die

Faltungszeit exponentiell mit der Länge der Aminosäurekette ansteigt und

unrealistisch hoch wird für mehr als 80 Residuen.

27-mer HP-Proteinmodell

3. Lecture SS 2006

GK 1276 22

Faltung auf Oberfläche der freien Enthalpie

geringe Temperatur hohe Temperatur

Dobson, Karplus,Angew. ChemieInt. Ed. 37, 868 (1998)

3. Lecture SS 2006

GK 1276 23

* konstruiere also Modell, das Proteinfaltung für größere (und realistischere)

Proteine beschreibt

* 125-mere mit einem maximal kompakten 5 x 5 x 5 nativen Zustand haben

eine ähnliche Länge und Oberfläche-zu-Volumen-Verhältnis (22%) wie globuläre

Proteine.

Polymerkette soll sich gemäß self-avoiding-walk falten.

neue Energiefunktion für eine Konformation (modifiziertes Go-Modell)

B0 ist eine mittlere attraktive WW, entsprechend einer allgemeinen hydrophoben

WW

Bij ist die sequenzspezifische WW:

native Kontakte (Bij)mittlere WW e= -1.67, Standardabweichung 1.0

nicht-native Kontakte (Bij0)

mittlere WW e= 0, Standardabweichung 1.0


3. Lecture SS 2006

GK 1276 24

Proteinfaltung

Energie des Systems

Gesamtzahl der nativenKontakte N

Prozentsatz Q an gesamterZahl nativer Kontakte.


3. Lecture SS 2006

GK 1276 25


3. Lecture SS 2006

GK 1276 26

Analogie zu exp. Daten für richtige Proteine:NMR-Daten für Faltung von Lysozym

Man findetzwei Faltungs-pfade. Der gelbe ist schnell,der grüne langsam.


3. Lecture SS 2006

GK 1276 27

Proteinfaltung ist durch verschiedene Grade an Ordnung bestimmt!

Die meisten dynamischen Experimente untersuchen nur eine Sorte von Ordnung,z.B. die Kompaktheit, Anteil der Sekundärstruktur, spezifische tertiäre Kontakte..

Generell kann man den Faltungsprozess mit der Theorie von Energielandschaftenund dem Konzept eines Faltungstrichters beschreiben.

Um eine Anzahl von Faltungsexperimenten vollständig zu verstehen muss man dieEigenschaften dieses Trichters durch eine multidimensionale Sicht seiner Formund statistischen Eigenschaften verstehen.

Verschiedene Faltungsszenarien entstehen durch die Balance zwischen demKollaps-Ordnungs-Parameter Z und einem Ordnungsparameter, der für bestimmtetertiäre Kontakt empfindlich ist, Q.

neue Sicht der Proteinfaltung:Proteinfaltungstrichter,energy landscape model

3. Lecture SS 2006

GK 1276 28

Tf : die Faltungstemperatur, unter der sich das Protein spontan

in den nativen Zustand faltet.

Tg : die Temperatur des Glas-Übergangs.

Analogie zwischen Proteinen und Spingläsern.

Der Grad an Nicht-Exponentialität hängt mit der

Struktur der Energielandschaft zusammen.

2 wichtige Temperaturen

3. Lecture SS 2006

GK 1276 29

l l u uE N E N E

Nl ist die Anzahl an Kontakten zwischen

Monomeren desselben Typs (like contacts),

Nu ist die Anzahl der nicht-ähnlichen Kontakte.

Verwende entweder 2 oder 3 verschiedene Monomere.

Mit diesen beiden Parametern kann man die

Eigenschaften des Modells gut diskutieren:

1

2 l u

het u l

E E E

E E E

Dimensionsloser Kollaps-Parameter

bezeichnet Stärke der Kollabierungskraft:

het

E

E

= 1 ist das Limit grosser Hydrophobizität,

= 0 is das Limit geringer Hydrophobizität.

Wechselwirkungspotential

3. Lecture SS 2006

GK 1276 30

Z misst die Kompaktheit der Kette:

total number of contactsZ

maximum number of contacts

Q misst die Ähnlichkeit zum nativen Zustand:

Q = Anzahl der ausgebildeten nativen Kontakte

Faltungsszenarien unterschiedlicher Hydrophobizität

3. Lecture SS 2006

GK 1276 31

2 schematische Faltungsszenarien

Fall grosser Hydrophobizität

Prozess in zwei Schritten::

1 schneller Kollaps (durch Z getrieben)

+ 2 Umordnung in native Struktur

(getrieben durch Q)

Freie Enthalpie Barriere.

Fall geringer Hydrophobizität

Kollaps und Faltung geschehen gleichzeitig.

Downhill Faltung,

keine Freie Enthalpie Barriere.

Faltungstrichter

Socci, Onuchic, WolynesProteins, 32, 136 (1998)

3. Lecture SS 2006

GK 1276 32

Proteindynamik kann durch “Hopping” zwischen verschiedenen Konformationen

geringer Energie dominiert sein (Bryngelson & Wolynes, 1987; Kidera & Go, 1998).

Falls die Energielandschaft nicht rauh ist, kann die Bewegung als

Diffusion eines Teilchens auf einer Oberfläche der Freien Enthalpie als

Funktion des Faltungsordnungs-Parameters beschrieben werden.

Dies ist eine gute Beschreibung sollange die Rauhheit der Energieoberfläche

klein gegenüber der Temperatur ist

= solange Faltung durch eine Anzahl verschiedener Pfade geschieht..

Dies ist der Fall für T > Tg , der Temperatur des Glas-Übergangs.

Faltungskinetik

3. Lecture SS 2006

GK 1276 33

Es ist schwierig einen Phasenübergang für ein kleines, endliches System genau

zu definieren.

Grobes Kriterium: Faltungszeit.

Benutze Gittermodell um die Beziehung zwischen dynamischem slowing down

und nicht-exponentieller Kinetik zu testen.

Messe den Bruchteil der Population, der ungefaltet bleibt als Funktion der Zeit,

plotte als log-log Plot.

Einfach exponentieller Prozess besitzt charakteristische Signatur

Eine Power-law Abhängigkeit drückt sich durch eine breite Verteilung der

Lebensdauern aus und bewirkt lineare Kurven.

Quantifiziere den Glasübergang

3. Lecture SS 2006

GK 1276 34

Proteinfaltung: gute Sequenz, hohe Hydrophobizität


3. Lecture SS 2006

GK 1276 35

Proteinfaltung: gute Sequenz, geringe Hydrophobizität

Socci, Onuchic, Wolynes, Proteins, 32, 136 (1998)

3. Lecture SS 2006

GK 1276 36

Geschieht Kollaps vor Faltung oder

geschehen beide gleichzeitig?

Es gibt exp. Hinweise auf beide

Szenarios in unterschiedlichen Systemen.

Freie-Enthalpie-Oberfläche für eine gute

Sequenz bei grosser Hydrophobizität:

Oben (Tf):

zwei Minima, kinetisch 2-Zustandsverhalten

Faltung = Diffusion über Barriere

exp. System: Protein G (all-atom MD)

Unten (geringe Temperatur):

beide Minima kollabieren, down-hill Faltung

Faltungszeit durch Diffusionskonstante bestimmt.

Kollaps vs. Faltung


3. Lecture SS 2006

GK 1276 37

hohe Temperatur (A): nicht-gefaltetes

Minimum ist nicht kollabiert. Kollaps und

Faltung geschehen gleichzeitig.

Faltung entlang von Linie Q = Z.

exp. System: Faltung eines 3-Helix-

Bündels liegt in intermediärem

Regine zwischen den Bedingungen

grosser und geringer Hydrophobizität.

Gute Sequenz, geringer Hydrophobizität


3. Lecture SS 2006

GK 1276 38

Die Darstellung als multidimensionaler Faltungstrichter (funnel) zeigt, dass man

die Faltung kleiner Proteine abhängig von den Eigenschaften der Energie-

Landschaft entweder als

(a) einen direkt aktivierten 2-Zustands-Prozess oder

(b) mit “Intermediaten” ansehen kann.

Die Art der Zwischenzustände hängt vom Zusammenwirken zwischen der

Rauhheit der Energielandschaft (durch Lage des Glas-Übergangs bestimmt) und

der allgemeinen Form des Faltungstrichters ab, die die thermodynamischen

Barrieren bestimmt.

Zusätzliche Dimensionen:

In richtigen Proteinen kann der Grad an lokaler Sekundärstruktur ein nahezu

unabhängige Rolle von Q and Z bei der Charakterisierung der Landschaft spielen.

Die Ordnung von Seitenketten kann ebenfalls eine bedeutsame und

möglicherweise separierbare Rolle spielen.

Zusammenfassung

3. Lecture SS 2006

GK 1276 39

Das energy landscape Modell für die Proteinfaltung zeigt, daß es Protein geben

kann, sogenannte fast folding proteins, bei denen die Faltung gewissermaßen

down-hill stattfindet. Nun mag man sich fragen:

* Wie schnell kann sich ein Protein überhaupt falten?

* Ist Proteinfaltung schlußendlich ein diffusiver Vorgang?

Dies wird bisher von Experimentalisten kontrovers diskutiert ...

Es ist schwierig, die Bedeutung der Diffusion experimentell zu belegen. Die

Zugabe eines Ko-Solvens (Glykol, ...), der die Viskosität verändert, beeinflußt

(erhöht) oft auch die Stabilität des Proteins gegenüber thermischer Denaturierung

(Entfaltung).

Um zu beweisen, daß eine Erhöhung der Viskosität zu einer verlangsamten

Faltung des Proteins führt, und damit Proteinfaltung ein diffusiver Prozeß ist,

benötigt man Systeme, bei denen Zugabe von Ko-Solvens die Stabilität des

Proteins NICHT verändert.

Ein Beispiel dafür ist:

Jacob, Geeves, Holtermann, Schmid, Nature Struct.Biol., 6, 923 (1999) Diffusional

barrier crossing in a two-state protein folding reaction.

Zusammenfassung II

energy landscape of a random heteropolymer

Documents