bioinformatyka -...

46
2009-01-08 1 Bioinformatyka – wykład 8 2.XII.2008 białkowa bioinformatyka strukturalna [email protected]

Upload: letuong

Post on 15-Feb-2018

214 views

Category:

Documents


1 download

TRANSCRIPT

2009-01-08 1

Bioinformatyka – wykład 8

2.XII.2008

białkowa bioinformatyka

strukturalna

[email protected]

2009-01-08 2

Lecture outline, Dec. 6th

protein structures

why?•

protein structures

geometry and

physics

covalent

modifications•

globular

proteins

vs

transmembrane and

fibrous

proteins•

protein topology, disordered

regions, structural

domains

2009-01-08 3

Plan wykładu

struktury

białek

dlaczego?•

struktury

białek

geometria i fizyka

modyfikacje kowalencyjne•

białka globularne a białka transmembranowe i włókniste

regiony nieuporządkowane

2009-01-08 4

Struktury białek – dlaczego warto je znać i rozumieć

zrozumienie lub przewidywanie funkcji

planowanie modulowania funkcji – np. projektowanie leków (drug design)

projektowanie modyfikacji struktury bądź funkcji (inżynieria białkowa - protein engineering)

niektórzy uważają, że białka są ładne i ciekawe

2009-01-08 5

Thornton

Nat Struct

Biol. 2000; 7 Suppl:991-4.

2009-01-08 6

Plan wykładu

struktury

białek

dlaczego?•

struktury

białek

geometria i fizyka

modyfikacje kowalencyjne•

białka globularne a białka transmembranowe i włókniste

regiony nieuporządkowane

2009-01-08 7

Christian Anfinsen: w danym środowisku struktura

trójwymiarowa białka jest w pełni zdeterminowana przez jego sekwencję

aminokwasową

i odpowiada minimum energii swobodnejAnfinsen, C.B., Principles that govern the folding of protein chains.

Science, 1973. 181: p. 223-30.

2009-01-08 8

Łańcuch

białkowy:

Regularny

łańcuch główny (main

chain),

Kodowane przez geny łańcuchy boczne (side chains)

~ 20100 sekwencji~ 3 100 konformacji

2009-01-08 9

Protein chain

Covalent bond lengths:

0.9 –

1.8 Å

Covalent bond angles:

109o

– 120o

Atom radii:1 –

2 Å

Peptide bond

2009-01-08 10

Protein chain

Covalent bond lengths:

0.9 –

1.8 Å

Covalent bond angles:

109o

– 120o

Atom radii:1 –

2 Å

Amino-acid residue

2009-01-08 11

Wykres Ramachandrana dozwolone obszary kątów φ, ψ

2009-01-08 12

ALA, etc. GLYALA, etc. GLY

2009-01-08 13

Zapis struktury białka:Współrzędne wewnętrzne -

reszty

aminokwasoweφ1, ψ1

φ2, ψ2 φ3, ψ3 ...

Współrzędne kartezjańskie –

atomyx1, y1, z1

x2, y2, z2 …

2009-01-08 14

Wiązania wodorowe

„likelihood

of

finding

an

unsatisfied hydrogen

bond

in

a protein is

insignificant„

Protein Sci. 2005;14:1911

Problem definicji –

wykrywania wiązania wodorowego

w znanych strukturach

2009-01-08 15

cząsteczka wody

Wiązania wodorowe

Oddziaływanie dipol-dipolEnergia wiązania wodorowego w białku – rzędu 2

kcal/mol

(w wodzie 5 kcal/mol

)

wiązania białko-białko oraz białko-woda

2009-01-08 16

Wiązania wodorowe

Donor: H w grupach OH, NH, NH2 (NH -

łańcuch główny)

Akceptor: O, N (wolne pary elektronowe). (CO -

łańcuch główny)

Łańcuchy boczne –

np. Ser, Tyr

(często mogą

być

akceptorami oraz donorami

WODA

2009-01-08 17

2009-01-08 18

2009-01-08 19

Struktury

drugorzędowe:

α

helisa

helix) -

stabilizowana

wiązaniami

wodorowymi

w helisie

Struktury

drugorzędowe

β

struktura

sheet) -

stabilizowana

wiązaniami

wodorowymi

z inną

β

strukturą; układy

równoległe

i antyrównoległe

zwój

(coil, random coil) -

pozostałe struktury

zwrot

β

turn, reverse turn, harpin

bend)

pętla

(loop) -

łączy

inne

struktury

2009-01-08 20

Łańcuch białkowy

2009-01-08 21

Plan wykładu

struktury

białek

dlaczego?•

struktury

białek

geometria i fizyka

modyfikacje kowalencyjne•

białka globularne a białka transmembranowe i włókniste

regiony nieuporządkowane

2009-01-08 22

Modyfikacje posttranslacyjne

Cięcia łańcucha białkowego (proteoliza)•

Glikozylacja, ...

Modyfikacje końców (acetylacja, ...)•

Modyfikacje łańcuchów bocznych (wiązania dwusiarczkowe, fosforylacja, ...)

Wiązanie kofaktorów, jonów, …

Efektywnie alfabet aminokwasowy

się

powiększa 20 N

2009-01-08 23

Side Side chainschains

2009-01-08 24

Przewidywanie glikozylacji

sieci neuronowe, www.cbs.dtu.dk

2009-01-08 25

Przewidywanie fosforylacji

sieci neuronowe, www.cbs.dtu.dk

2009-01-08 26

Sieci

neuronowe

-

sekwencja

jest analizowana

zachodzącymi

oknami

(13-17 aminokwasów); na

wejściu

podawana

jest sekwencja

w oknie; przewidywana

jest

struktura

dla

aminokwasu

centralnego; uwzględniane

oddziaływania aminokwasów

na

siebie

przy

określaniu

struktury

-

analiza

w kontekście; sieć

jest

uczona

na

sekwencjach

o znanej

strukturze, podczas

uczenia

określane

wagi, które

później

nadawane

sygnałom; przewiduje

struktury

2D i regiony

hydrofobowe

LSWTKCYAVSGAP

000001000000000000000

α

β

coil

1

0

0

warstwa

ukryta

warstwa

wyjściowa

przewidywana

struktura

α

warstwa

wejściowa

-

1 jedn. wej. dla

każdego

aa

w oknie; informacje

o innych

aa, właściwości, profil

sekw

encj

aw

ejśc

iow

aw

okn

ie

2009-01-08 27

Istota działania sztucznego neuronu:

Sumowanie sygnałów wejściowych z odpowiednią

wagą

i poddanie sumy funkcji aktywacji

)(1

j

N

jiji xWfy ∑

=

=

Xj

sygnał

wejściowy

Wij –

współczynniki wagowe –

wagi synaptyczne przy

ujemnych wagach neuron przekazuje sygnał

gaszący,

przy dodatnich - pobudzający

2009-01-08 28

Modyfikacje lokalne a długozasięgowe

Przewidywanie oddziaływań długozasięgowych

znacznie trudniejsze

Parowanie struktur beta•

Parowanie cystein

w mostkach

dwusiarczkowych

2009-01-08 29

Modyfikacje sekwencyjnie specyficzne a niespecyficzne

Rzadsze modyfikacje, np. glutationylacja

bądź

nitrozylacja

cystein,

mogą

być

trudniejsze do przewidzenia na podstawie lokalnej sekwencji

2009-01-08 30

Plan wykładu

struktury

białek

dlaczego?•

struktury

białek

geometria i fizyka

modyfikacje kowalencyjne•

białka globularne a białka transmembranowe i włókniste

regiony nieuporządkowane

2009-01-08 31

Białka globularne

Białka włókniste

Białka transmembranowe

2009-01-08 32

Białka wielodomenowe

Znaczna część

białek u eukariontów to białka wielodomenowe, niekiedy zawierające regiony transmembranowe

oraz domeny globularne

2009-01-08 33

Białka transmembranowe

Kanały jonowe•

Transportery

Receptory (7TM, RTK, …)•

Proteazy

2009-01-08 34

Białka transmembranowe

2009-01-08 35

przewidywanie topologii transmembranowej

ludzki receptor dopaminy

HMM, www.cbs.dtu.dk

2009-01-08 36

przewidywanie topologii transmembranowej

ludzki receptor dopaminy

HMM, www.cbs.dtu.dk

2009-01-08 37

Pamiętajmy o błędach!

2009-01-08 38

Pamiętajmy o błędach!

2009-01-08 39

Plan wykładu

struktury

białek

dlaczego?•

struktury

białek

geometria i fizyka

modyfikacje kowalencyjne•

białka globularne a białka transmembranowe i włókniste

regiony nieuporządkowane

2009-01-08 40

Regiony nieuporządkowane – disordered

regions

trudna definicja•

trudne do przewidzenia

nie zawsze tożsame z pętlami•

nie zawsze tożsame z regionami o niskiej specyficzności

ważne biologicznie•

sprzężenie zwijania białka i wiązania

duże znaczenie praktyczne

2009-01-08 41

Regiony nieuporządkowane – gdzie?

pętle / zwoje•

”gorące pętle”

(wg czynników temperatury ze struktur krystalograficznych)

obszary o brakujących współrzędnych (w strukturach krystalograficznych i NMR)

przewidywanie –

np. sieci neuronowe

2009-01-08 42

Kalcyneuryna

• extremely sensitive to protease digestion:

a disordered ensemble; • confirmed in X-ray diffraction structure by missing coordinates•

disorder likely to be essential to provide calmodulin

(right) with space needed

to completely surround its target helix

...the existence and commonness of proteins with intrinsic disorder

call for a reassessment of the structure-function paradigm...

(Wright and Dyson )

2009-01-08 43

Nieporządek –

przewidywarka komercyjna

2009-01-08 44

Nieporządek –

przewidywarka http://dis.embl.de

2009-01-08 45

Nieporządek w kalmodulinie

2009-01-08 46

Granice dokładności przewidywań

strukturalnych

Ograniczone zestawy danych do „uczenia” algorytmów

Niejednoznaczność

definicji przedmiotu przewidywań

np. struktura II-rzędowa

Warto łączyć

różne przewidywania – pamiętać

o kontekście. Np. fosforylacja-

wewnątrz komórki; glikozylacja

na zewnątrz

Interpretacja