gena- og gagnasöfn (geg1103) fyrirlestrar 7 & 8 einföld sjónræn pörun raða almennt um...
Post on 20-Dec-2015
232 views
TRANSCRIPT
![Page 1: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/1.jpg)
Gena- og gagnasöfn (GEG1103)
Fyrirlestrar 7 & 8
Einföld sjónræn pörun raðaAlmennt um pörunarskorun og skorunarfylki
PAM og BLOSUM líkindafylkin
![Page 2: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/2.jpg)
Lesefni
• Krane & Raymer: kafli 2
![Page 3: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/3.jpg)
• einsleitni (similarity) ≠ samsvörun (homology)• Orðin pera og gera eru similar, en ekki
homologous
![Page 4: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/4.jpg)
Skyldleiki raða
• Homolog (homologue) – einsleitar raðir í 2 lífverum, komnar af sama áa (ancestor)
• Ortholog - Homologar með sömu virkni
• Paralog – Homologar sem urðu til við gene duplication
• Xenolog – “aðskotagen”
http://www.ncbi.nlm.nih.gov/Education/
![Page 5: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/5.jpg)
D O R O T H Y C R O W F O O T H O D G K I N
D D D
O O O O O O O
R R R
O O O O O O O
T T T
H H H
Y Y
H H H
O O O O O O O
D D D
G G
K K
I I
N N
Sjónræn pörun (Sjónræn pörun (visual alignmentvisual alignment))
Pörum Dorothy Hodgkin við Dorothy Crowfoot Hodgkin:
• Drögum upp matrixu þ.s. önnur röðin er lárétti ásinn, hin sá lóðrétti
• Merkjum í matrixuna hvar sama stakið kemur fyrir í báðum röðum (par, match)
• Finnum runur para
Dorothy M. C. Hodgkin var einn af frumkvöðlum byggingargreiningar prótína. Nóbelsverðlaun 1964. Mynd frá http://www.pugwash.org
![Page 6: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/6.jpg)
Línuröðun (alignment) alltaf niður og/eða til hægri
D O R O T H Y C R O W F O O T H O D G K I N
D D D
O O O O O O O
R R R
O O O O O O O
T T T
H H H
Y Y
H H H
O O O O O O O
D D D
G G
K K
I I
N N
DOROTHY--------HODGKINDOROTHYCROWFOOTHODGKINPörunin gefur línuröðunina:
(alignment)
![Page 7: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/7.jpg)
A B R A C A D A B R A C A D A B R A
A A A A A A A A A
B B B B
R R R R
A A A A A A A A A
C C C
A A A A A A A A A
D D D
A A A A A A A A A
B B B B
R R R R
A A A A A A A A A
C C C
A A A A A A A A A
D D D
A A A A A A A A A
B B B B
R R R R
A A A A A A A A A
Sjáum einnig endurtekningar .....
![Page 8: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/8.jpg)
M A X I S T A Y A W A Y A T S I X A M
M M M
A A A A A A A
X X X
I I I
S S S
T T T
A A A A A A A
Y Y Y
A A A A A A A
W W
A A A A A A A
Y Y Y
A A A A A A A
T T T
S S S
I I I
X X X
A A A A A A A
M M M
... og samhverfur (palindromes)
![Page 9: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/9.jpg)
Depilgraf (Depilgraf (dot plotdot plot))• Eftirfarandi glærur eru unnur uppúr forritinu Dotlet (
http://www.isrec.isb-sib.ch/java/dotlet/Dotlet.html), en sambærilegt graf má gera í Staden Package (í Spin forritinu) – skoðum í verkl. tíma
ATPasar 6 úr steinsugu (Petromyzon marinus) og deplaháfi (Scyliorhinus canicula) paraðir í Dotlet
![Page 10: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/10.jpg)
SLIT prótínið í Drosophila melanogaster inniheldur endurtekin hneppi (repeated domains)
Depilgraf (Depilgraf (dot plotdot plot))
![Page 11: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/11.jpg)
Geymin hneppi (conserved domains) má einnig finna með depilgrafi. Hér er lárétta röðin Homo sapiens MS2 frumuyfirborðsmótefnið, sú lóðrétta er málmháði próteasinn adamalysin II úr eitri höggormsins Crotalus adamanteus. Bæði prótínin innihalda zink próteasa hneppi.
Depilgraf (Depilgraf (dot plotdot plot))
![Page 12: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/12.jpg)
Finna tjáraðir (exons) og innraðir (introns). Hér er cDNA calmodulin gens úr Aspergillus nidulans parað við genemengis-DNA sem inniheldur sömu röð
Depilgraf (Depilgraf (dot plotdot plot))
![Page 13: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/13.jpg)
Finna höggun á lesramma: Þegar kjarnsýruröð er pöruð við amínósýruröð, prófar Dotlet alla þrjá “áfram” lesrammana. Hér er Homo sapiens cDNA parað við sitt besta hitt úr BLASTx (Mus musculus viðtaki fyrir örva kornfrumukólonía)
Skálína í raun tvær línur höggun á lesramma, eins og sjá má í línuuppstillingunni
Depilgraf (Depilgraf (dot plotdot plot))
![Page 14: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/14.jpg)
Finna samhverfur (palindromes). Hér er Bacillus subtilis UTP-glúkósa-1-fosfat uridylýltransferasa genið parað við sjálft sig og sést þá greinilega samhverfa sem hér er þýðingartermínator.
Depilgraf (Depilgraf (dot plotdot plot))
![Page 15: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/15.jpg)
Einnar-amínósýru runur sjást sem svartir kassar.
Depilgraf (Depilgraf (dot plotdot plot))
![Page 16: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/16.jpg)
Hamming skorun (Hamming distance)
• Á hversu mörgum stöðum í línuröðuninni er ekki pörun (mismatch)? (þ.e., hve mörgum stökum þarf að breyta til að breyta annarri röðinni í hina?)
• Hamming distance milli GERA og PERA er 1
• ATH: raðirnar þurfa að vera jafn langar svo þetta virki!
GERA |||PERA
Richard W. Hamming. Mynd frá www.cse.psu.edu
![Page 17: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/17.jpg)
Að setja inn göt (Að setja inn göt (gapsgaps))
• DNA/RNA/prótín raðir eru mismunandi að lengd
• Bútar hafa klippst út / bæst inn í gegnum þróunarsöguna
Setjum inn göt (táknað með ‘’)
A L I G N M E N T | | | | | | |- L I G A M E N T
• Levenshtein skorun: hversu margar aðgerðir (basabreytingar + göt) þarf að framkvæma til að breyta röð 1 í röð 2?
Vladímír Levenshtein. Mynd frá http://teormin.ifmo.ru
![Page 18: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/18.jpg)
Línuröðun (alignment)
A – C – G G – A C T| | | | |A T C G G A T _ C T
A T C G G A T C T| | | | | | |A – C G G A - C T
Hvor er betri?
Levenshtein
5
2
Segir aðeins hvor röðunin er „minna slæm“!(bæði Hamming og Levenshtein algóriþmarnir eru hannaðir til að finna villur)
![Page 19: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/19.jpg)
Línuröðun (alignment)
A – C – G G – A C T| | | | |A T C G G A T _ C T
A T C G G A T C T| | | | | |A – C G G – A C T
A T C G G A T C T| | | | | | |A – C G G A - C T
• Segjum, t.d.:
pörun (match): +2
mispörun (mismatch): 1 gat (gap): –2
• Röðun 1: 5 * 2 – 1*1 – 4*2 = 10 – 1 – 8 = 1
• Röðun 2: 6 * 2 – 1*1 – 2*2 = 12 – 1 – 4 = 7
• Röðun 3: 7*2 - 2*2 = 10
En, eru allar misparanir jafn „slæmar“?
Búum til skorunarskema sem mælir bæði „góð“ og „slæm“ stök.
![Page 20: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/20.jpg)
Líkan Kimura
Tíðni kirna í seti n á tíma t.
A G T CA 1 G 1 T 1 C 1
Ættum etv. að nota mismunandi mispörunarskor fyrir transitions vs. transversions
![Page 21: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/21.jpg)
Líkindafylki f. DNA
A. Ef tíðni stökkbreytinga er alltaf eins (Jukes-Cantor módel). A G T C
A 0.99 G 0.00333 0.99 T 0.00333 0.00333 0.99 C 0.00333 0.00333 0.00333 0.99
B. Ef transitions eru þrefalt algengari en transversions (Kimura módel). A G T C
A 0.99 G 0.006 0.99 T 0.002 0.002 0.99 C 0.002 0.002 0.006 0.99
![Page 22: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/22.jpg)
PAM1 fylki f. DNAA. Ef tíðni stökkbreytinga er alltaf eins (Jukes-Cantor módel). A G T C
A 2G -6 2 T -6 -6 2 C -6 -6 -6 2
B. Ef transitions eru þrefalt algengari en transversions (Kimura módel). A G T C
A 2 G -5 2 T -7 -7 2 C -7 -7 -5 2
... en, set kirnis í röð (tákna) skipti líka miklu máli
• gætum leiðrétt fyrir því ef lesrammi er þekktur
• ... eða bara línuraðað amínósýruröðinni
![Page 23: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/23.jpg)
Líkindafylki (likelihood matrix)
• Gildi fundin útfrá líkum á stökkbreytingu
• Leitt út fyrir amínósýruraðir
• Point Accepted Mutation (PAM)-fylki = Dayhoff-fylki
Margaret Dayhoff
![Page 24: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/24.jpg)
PAM-1: líkindi á að 1 ttk. breyting sé leyfð pr. 100 AS. Fyrir fleiri leyfðar breytingar: margfalda PAM-1 með sjálfu sér. PAM-250 oft notað í praxís.
PAM250
![Page 25: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/25.jpg)
PAM fylki
• Margar svipaðar AS raðir margfalt paraðar og raðað í skyldleikatré
• Fjöldi AS breytinga talinn
• Líkindi ttk. stökkbreytinga reiknuð út
• 20 x 20 fylki stökkbreytinga-líkinda dregið upp
Skoðið:http://www.lmb.uni-muenchen.de/groups/bioinformatics/04/ch_04_3.html
![Page 26: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/26.jpg)
Blocks Amino Acid Substitution fylki (BLOSUM) = Henikoff fylki
• Raðir flokkaðar í blokkir (signature blocks) skv. þartilgerðum gagnagrunni (BLOCKS database)
• Consensus sequence búin til– 60% einsleitni: BLOSUM 60 hentar– 80% einsleitni: BLOSUM 80 hentar
![Page 27: Gena- og gagnasöfn (GEG1103) Fyrirlestrar 7 & 8 Einföld sjónræn pörun raða Almennt um pörunarskorun og skorunarfylki PAM og BLOSUM líkindafylkin](https://reader036.vdocuments.mx/reader036/viewer/2022081503/56649d445503460f94a21852/html5/thumbnails/27.jpg)
http://www.ncbi.nlm.nih.gov