bioinformatyka -...
TRANSCRIPT
2009-01-08 1
Bioinformatyka – wykład 8
2.XII.2008
białkowa bioinformatyka
strukturalna
2009-01-08 2
Lecture outline, Dec. 6th
•
protein structures
–
why?•
protein structures
–
geometry and
physics
•
covalent
modifications•
globular
proteins
vs
transmembrane and
fibrous
proteins•
protein topology, disordered
regions, structural
domains
2009-01-08 3
Plan wykładu
•
struktury
białek
–
dlaczego?•
struktury
białek
–
geometria i fizyka
•
modyfikacje kowalencyjne•
białka globularne a białka transmembranowe i włókniste
•
regiony nieuporządkowane
2009-01-08 4
Struktury białek – dlaczego warto je znać i rozumieć
zrozumienie lub przewidywanie funkcji
planowanie modulowania funkcji – np. projektowanie leków (drug design)
projektowanie modyfikacji struktury bądź funkcji (inżynieria białkowa - protein engineering)
niektórzy uważają, że białka są ładne i ciekawe
2009-01-08 6
Plan wykładu
•
struktury
białek
–
dlaczego?•
struktury
białek
–
geometria i fizyka
•
modyfikacje kowalencyjne•
białka globularne a białka transmembranowe i włókniste
•
regiony nieuporządkowane
2009-01-08 7
Christian Anfinsen: w danym środowisku struktura
trójwymiarowa białka jest w pełni zdeterminowana przez jego sekwencję
aminokwasową
i odpowiada minimum energii swobodnejAnfinsen, C.B., Principles that govern the folding of protein chains.
Science, 1973. 181: p. 223-30.
2009-01-08 8
Łańcuch
białkowy:
Regularny
łańcuch główny (main
chain),
Kodowane przez geny łańcuchy boczne (side chains)
~ 20100 sekwencji~ 3 100 konformacji
2009-01-08 9
Protein chain
Covalent bond lengths:
0.9 –
1.8 Å
Covalent bond angles:
109o
– 120o
Atom radii:1 –
2 Å
Peptide bond
2009-01-08 10
Protein chain
Covalent bond lengths:
0.9 –
1.8 Å
Covalent bond angles:
109o
– 120o
Atom radii:1 –
2 Å
Amino-acid residue
2009-01-08 13
Zapis struktury białka:Współrzędne wewnętrzne -
reszty
aminokwasoweφ1, ψ1
φ2, ψ2 φ3, ψ3 ...
Współrzędne kartezjańskie –
atomyx1, y1, z1
x2, y2, z2 …
2009-01-08 14
Wiązania wodorowe
•
„likelihood
of
finding
an
unsatisfied hydrogen
bond
in
a protein is
insignificant„
Protein Sci. 2005;14:1911
•
Problem definicji –
wykrywania wiązania wodorowego
w znanych strukturach
2009-01-08 15
cząsteczka wody
Wiązania wodorowe
Oddziaływanie dipol-dipolEnergia wiązania wodorowego w białku – rzędu 2
kcal/mol
(w wodzie 5 kcal/mol
)
wiązania białko-białko oraz białko-woda
2009-01-08 16
Wiązania wodorowe
•
Donor: H w grupach OH, NH, NH2 (NH -
łańcuch główny)
•
Akceptor: O, N (wolne pary elektronowe). (CO -
łańcuch główny)
•
Łańcuchy boczne –
np. Ser, Tyr
(często mogą
być
akceptorami oraz donorami
•
WODA
2009-01-08 19
Struktury
drugorzędowe:
α
helisa
(α
helix) -
stabilizowana
wiązaniami
wodorowymi
w helisie
Struktury
drugorzędowe
β
struktura
(β
sheet) -
stabilizowana
wiązaniami
wodorowymi
z inną
β
strukturą; układy
równoległe
i antyrównoległe
zwój
(coil, random coil) -
pozostałe struktury
zwrot
β
(β
turn, reverse turn, harpin
bend)
pętla
(loop) -
łączy
inne
struktury
2009-01-08 21
Plan wykładu
•
struktury
białek
–
dlaczego?•
struktury
białek
–
geometria i fizyka
•
modyfikacje kowalencyjne•
białka globularne a białka transmembranowe i włókniste
•
regiony nieuporządkowane
2009-01-08 22
Modyfikacje posttranslacyjne
•
Cięcia łańcucha białkowego (proteoliza)•
Glikozylacja, ...
•
Modyfikacje końców (acetylacja, ...)•
Modyfikacje łańcuchów bocznych (wiązania dwusiarczkowe, fosforylacja, ...)
•
Wiązanie kofaktorów, jonów, …
•
Efektywnie alfabet aminokwasowy
się
powiększa 20 N
2009-01-08 26
Sieci
neuronowe
-
sekwencja
jest analizowana
zachodzącymi
oknami
(13-17 aminokwasów); na
wejściu
podawana
jest sekwencja
w oknie; przewidywana
jest
struktura
dla
aminokwasu
centralnego; uwzględniane
są
oddziaływania aminokwasów
na
siebie
przy
określaniu
struktury
-
analiza
w kontekście; sieć
jest
uczona
na
sekwencjach
o znanej
strukturze, podczas
uczenia
określane
są
wagi, które
są
później
nadawane
sygnałom; przewiduje
struktury
2D i regiony
hydrofobowe
LSWTKCYAVSGAP
000001000000000000000
α
β
coil
1
0
0
warstwa
ukryta
warstwa
wyjściowa
przewidywana
struktura
α
warstwa
wejściowa
-
1 jedn. wej. dla
każdego
aa
w oknie; informacje
o innych
aa, właściwości, profil
sekw
encj
aw
ejśc
iow
aw
okn
ie
2009-01-08 27
•
Istota działania sztucznego neuronu:
Sumowanie sygnałów wejściowych z odpowiednią
wagą
i poddanie sumy funkcji aktywacji
)(1
j
N
jiji xWfy ∑
=
=
Xj
–
sygnał
wejściowy
Wij –
współczynniki wagowe –
wagi synaptyczne przy
ujemnych wagach neuron przekazuje sygnał
gaszący,
przy dodatnich - pobudzający
2009-01-08 28
Modyfikacje lokalne a długozasięgowe
•
Przewidywanie oddziaływań długozasięgowych
znacznie trudniejsze
•
Parowanie struktur beta•
Parowanie cystein
w mostkach
dwusiarczkowych
2009-01-08 29
Modyfikacje sekwencyjnie specyficzne a niespecyficzne
•
Rzadsze modyfikacje, np. glutationylacja
bądź
nitrozylacja
cystein,
mogą
być
trudniejsze do przewidzenia na podstawie lokalnej sekwencji
2009-01-08 30
Plan wykładu
•
struktury
białek
–
dlaczego?•
struktury
białek
–
geometria i fizyka
•
modyfikacje kowalencyjne•
białka globularne a białka transmembranowe i włókniste
•
regiony nieuporządkowane
2009-01-08 32
Białka wielodomenowe
•
Znaczna część
białek u eukariontów to białka wielodomenowe, niekiedy zawierające regiony transmembranowe
oraz domeny globularne
2009-01-08 33
Białka transmembranowe
•
Kanały jonowe•
Transportery
•
Receptory (7TM, RTK, …)•
Proteazy
2009-01-08 35
przewidywanie topologii transmembranowej
ludzki receptor dopaminy
–
HMM, www.cbs.dtu.dk
2009-01-08 36
przewidywanie topologii transmembranowej
ludzki receptor dopaminy
–
HMM, www.cbs.dtu.dk
2009-01-08 39
Plan wykładu
•
struktury
białek
–
dlaczego?•
struktury
białek
–
geometria i fizyka
•
modyfikacje kowalencyjne•
białka globularne a białka transmembranowe i włókniste
•
regiony nieuporządkowane
2009-01-08 40
Regiony nieuporządkowane – disordered
regions
•
trudna definicja•
trudne do przewidzenia
•
nie zawsze tożsame z pętlami•
nie zawsze tożsame z regionami o niskiej specyficzności
•
ważne biologicznie•
sprzężenie zwijania białka i wiązania
•
duże znaczenie praktyczne
2009-01-08 41
Regiony nieuporządkowane – gdzie?
•
pętle / zwoje•
”gorące pętle”
(wg czynników temperatury ze struktur krystalograficznych)
•
obszary o brakujących współrzędnych (w strukturach krystalograficznych i NMR)
przewidywanie –
np. sieci neuronowe
2009-01-08 42
Kalcyneuryna
• extremely sensitive to protease digestion:
a disordered ensemble; • confirmed in X-ray diffraction structure by missing coordinates•
disorder likely to be essential to provide calmodulin
(right) with space needed
to completely surround its target helix
...the existence and commonness of proteins with intrinsic disorder
call for a reassessment of the structure-function paradigm...
(Wright and Dyson )
2009-01-08 46
Granice dokładności przewidywań
strukturalnych
•
Ograniczone zestawy danych do „uczenia” algorytmów
•
Niejednoznaczność
definicji przedmiotu przewidywań
–
np. struktura II-rzędowa
•
Warto łączyć
różne przewidywania – pamiętać
o kontekście. Np. fosforylacja-
wewnątrz komórki; glikozylacja
–
na zewnątrz
•
Interpretacja