ch17. proteomics and protein identification
DESCRIPTION
Ch17. Proteomics and Protein Identification. Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Third Edition. IDB Lab. Seoul National University. Contents. Introduction MS for Protein Analysis The Major Proteomic Approaches Data Preprocessing - PowerPoint PPT PresentationTRANSCRIPT
Ch17. Proteomicsand Protein
Identification
IDB Lab.Seoul National University
Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, Third Edition
Contents
Introduction
MS for Protein Analysis
The Major Proteomic Approaches
Data Preprocessing
The Major Protein Identification Programs
Summary
Introduction(1/3)
Proteomics 1994 ๋ Marc Wilkins ๊ฐ MS ๋ฅผ ์ด์ฉํ protein ์
functional study ๋ฅผ ๋งํ๋ฉด์ ์ต์ด๋ก ์ฉ์ด ์ฌ์ฉ
<Types of proteomics and their applications to biology>from: Graves and Haystead, 2002
Introduction(2/3)
๋ณต์กํ ๋จ๋ฐฑ์ง ๋ฐํ
Introduction(3/3)
Protein ๋ถ์์ ์ด๋ ค์ DNA, RNA ์ฐ๊ตฌ์์ ์์ด์ ๋ฌด์ ํ์ผ๋ก ๋ณต์ ํด ์ฃผ๋
PCR ๊ธฐ๋ฒ์ด ์๋ค Protein ์ ์์ฒด๋ด์ ์๋์ ์ผ๋ก ์๋์ธ ๋ถ์๋ฅผ ์ง์
๋ถ์ํด์ผํจ ํ๋์ ์ ์ ์์์ ์จ ๋จ๋ฐฑ์ง์ด ๋ค์ํ ํํ๋ฅผ ์ง๋
์ง๋ณ์ ํด์ํ๊ธฐ ์ํ ์ผ๋ฐ์ ์ ๊ทผ๋ฒ ์ง๋ณ์ด ๊ฑธ๋ฆฐ ์กฐ์ง๊ณผ ์ ์ ์กฐ์ง์ ๋น๊ต ์ค์ํ ์ฐจ์ด๋ฅผ ๋ณด์ด๋ ๋จ๋ฐฑ์ง์ ๋ถ์โถ Protein Identification
MS for Protein Analysis(1/17)
Mass Spectrometer( ์ง๋ ๋ถ์๋ฒ ) ์ง๋์ ๊ธฐ์ด๋ก ๋ถ์๋ฅผ ๋ถ์ํ๋ ๋ฐฉ๋ฒ
Ionizer
Sample
+_
Mass Analyzer Detectorโข MALDIโข Electro-Spray
Ionization (ESI)
โข Time-Of-Flight (TOF)โข Quadrapoleโข FT/MS
MS for Protein Analysis(2/17)
Time of Flight MS
Reflector
MS for Protein Analysis(3/17)
Mass Spectrum
mass-to-charge ratiom/z
the numberof ion
MS for Protein Analysis(4/17)
์ง๋ ๋ถ์๋ฒ์ ์ํ ๋จ๋ฐฑ์ง์ ๋ถํด Peptide Mass Fingerprinting(PMF) Tandem MS, or MS/MS
MS for Protein Analysis(5/17)
Peptide Mass Fingerprinting(PMF) MS ๋ฅผ ํ๊ธฐ ์ ํํ์ ๋ถ๋ฆฌ ์ํ
์ฌ๋ฌ ๋จ๋ฐฑ์ง์ด ๊ฐ์ด ์์ ๊ฒฝ์ฐ ์ด์จํ์ ๋ถ์์ ์ด๋ ค์ ๋ถ์ํ๊ณ ์ ํ๋ ํ๋์ ๋จ๋ฐฑ์ง๋ง ๋ถ๋ฆฌ
Two-dimensional electrophoretic gel separation Liquid chromatography
๋จ๋ฐฑ์ง์ ํจ์๋ฅผ ์ด์ฉํด ๋ ์์ ๋จ์๋ก ๋จํธํ ์ฌ๋ฌ ํฉํฐ๋๊ฐ ๊ฐ์ด ์์ ๊ฒฝ์ฐ ์ด์จํ์ ๋ถ์์ ์ด๋ ค์ Trypsin
P ๊ฐ ๋ค๋ฐ๋ฅด์ง ์๋ K, R ๋ค๋ฅผ ๋ถ๋ฆฌํด์ค ์ง๋ ๋น๊ต
๋จํธํ๋ ํฉํฐ๋์ ์คํํธ๋ผ์ ์ด์ฉํด ๋จ๋ฐฑ์ง์ ์ง๋ ๋ถ์ ๊ณ์ฐ๋ ์ง๋๊ณผ database ์ ์๋ ๋จ๋ฐฑ์ง์ ์ง๋๊ณผ ๋น๊ต
MS for Protein Analysis(6/17)
2D Gel-Electrophoresis( ์ ๊ธฐ์๋ ) Protein separation
Molecular weight (Mw) ๋ฑ์ ์
Isoelectric point (pI) ๋จ๋ฐฑ์ง์ ๋ถํฌ๋ฅผ
๋ณผ ์ ์๋ค .
pl
MS for Protein Analysis(7/17)
Peptide Mass Fingerprinting(PMF)
Cut out2D-GelSpot
MS for Protein Analysis(8/17)
Peptide Mass Fingerprinting(PMF)
Trypsin Digest(P ๊ฐ ๋ค๋ฐ๋ฅด์ง ์๋K, R ๋ค๋ฅผ ๋ถ๋ฆฌํด์ค )
MS for Protein Analysis(9/17)
Peptide Mass Fingerprinting(PMF)
N CR R PRKR K
N C
M1M2 M3
M4
M5
M1M2M3M4M5
< Trypsin Digest >
MS for Protein Analysis(10/17)
Tandem MS, or MS/MS
Enzymatic Digestand
Fractionation
MS for Protein Analysis(11/17)
Tandem MS, or MS/MS
MS
MS for Protein Analysis(12/17)
Tandem MS, or MS/MS
Precursor selection
MS for Protein Analysis(13/17)
Tandem MS, or MS/MS
Precursor selection + Collision-induced dissociation
(CID)
MS/MS
MS for Protein Analysis(14/17)
y3
b2
y2 y1
b3a2 a3
HO NH3+
| |
R1 O R2 O R3 O R4
| || | || | || |H -- N --- C --- C --- N --- C --- C --- N --- C --- C --- N --- C -- COOH | | | | | | | H H H H H H H
b2-H2O
y3 -H2O
b3- NH3
y2 - NH3
a1
Peptide Fragmentation with CID
G V D L K
mass0
57 Da = โGโ 99 Da = โVโLK D V G
The peaks in the mass spectrum: Prefix and Suffix Fragments Fragments with neutral losses (-H2O, -NH3) Noise and missing peaks.
D
H2O
MS for Protein Analysis(15/17)
Protein Identification with MS/MS
MS for Protein Analysis(16/17) Protein Identification with MS/MS
G V D L K
mass0
Inte
nsity
mass0
MS/MSPeptide Identification:
MS for Protein Analysis(17/17)
De Novo vs. Database Search
S#: 1708 RT: 54.47 AV: 1 NL: 5.27E6T: + c d Full ms2 638.00 [ 165.00 - 1925.00]
200 400 600 800 1000 1200 1400 1600 1800 2000m/z
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
Re
lative
Ab
un
da
nce
850.3
687.3
588.1
851.4425.0
949.4
326.0524.9
589.2
1048.6397.1226.9
1049.6489.1
629.0
WR
A
C
VG
E
K
DW
LP
T
L T
WR
A
C
VG
E
K
DW
LP
T
L T
De Novo
AVGELTK
Database Search
Database of all peptides = 20n
AAAAAAAA,AAAAAAAC,AAAAAAAD,AAAAAAAE,AAAAAAAG,AAAAAAAF,AAAAAAAH,AAAAAAI,
AVGELTI, AVGELTK , AVGELTL, AVGELTM,
YYYYYYYS,YYYYYYYT,YYYYYYYV,YYYYYYYY
Database ofknown peptides
MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT,
HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE,
ALKIIMNVRT, AVGELTK, HEWAILF, GHNLWAMNAC,
GVFGSVLRA, EKLNKAATYIN..
Database ofknown peptides
MDERHILNM, KLQWVCSDL, PTYWASDL, ENQIKRSACVM, TLACHGGEM, NGALPQWRT,
HLLERTKMNVV, GGPASSDA, GGLITGMQSD, MQPLMNWE,
ALKIIMNVRT, AVGELTK, HEWAILF, GHNLWAMNAC,
GVFGSVLRA, EKLNKAATYIN..
Mass, Score
The Major Proteomic Approaches
PMF, or Tandem MS ๋จ๋ฐฑ์ง ๋ถ์์ ์ผ๋ฐ์ ๋ฐฉ๋ฒ ์ ค์์ ๋ถ๋ฆฌ๋ ํ๋์ ๋จ๋ฐฑ์ง์ ํจ์์ ์ํด์
๋จํธํํ๊ณ ์ง๋ ๋ถ์์ ํตํ ๋จ๋ฐฑ์ง ๋ถ์ Bottom-up, or shotgun proteomics
์ํ์ ์๋ ๋จ๋ฐฑ์ง๋ค์ ํจ์์ ์ํด์ ๋จํธํ ๋จํธํ๋ ํฉํฐ๋๋ค์ ํฌ๋ก๋งํ ๊ทธ๋ํผ๋ฅผ ํตํ ๋ถ๋ฆฌ Tandem MS ๋ฅผ ํตํ ๋ถ์ ํฉํฐ๋ ๋ถ์์ด ๋ ์ ํํ๋ค๋ ์ด์ ๋๋ฌธ์ ๋ ๋ง์
๋จ๋ฐฑ์ง์ ๋ฐ๊ฒฌํ ์ ์์ ํด๋น ๋จ๋ฐฑ์ง์ ๊ณ์ฐ์ ์ด๋ ค์
Data Preprocessing
MS ๋ ์ด์จ์ ์ง๋์ด ์๋๋ผ Mass-to-Charge Ratio(m/z) ๋ฅผ ์ธก์ ์ด์จํ๊ธฐ๋ก MALDI ๋ฅผ ์ฌ์ฉ ๋๋ ESI ๋ฅผ ์ธ ๊ฒฝ์ฐ ๋ณ๋์ ์ฒ๋ฆฌ ์๊ณ ๋ฆฌ์ฆ ์ฌ์ฉ
๋์ ์์์ ์ฒ๋ฆฌ๋ฌธ์ ํ๊ท vs ๊ฐ์ฅ ๋ง์ ๋์์์
๋ฐ์ดํฐ ์ฒ๋ฆฌ์์ ์ด๋ ค์ ์ด์จํ๊ฐ ์ด๋ ค์ด ์์ Peptide ์ ํํ์ ๋ณํ ์ํ ์์ ์ฌ๋ฌ ๋จ๋ฐฑ์ง์ด ์กด์ฌ ๋จ๋ฐฑ์ง์ด ๋น๊ต๋๋ Database ์ ์์ง ์์ ์ ์์
The Major Protein Identification Programs
ํ๋ก๊ทธ๋จ์ ๊ณตํต๋ ๋จ๊ณ Database ๋ด์ ๊ฐ ์์ด๋ก๋ถํฐ ๊ฐ๋ฅํ ์ด์จ ์ฐ๋ฌผ ๊ณ์ฐ ๊ณ์ฐ๋ ์ด์จ๋ค๊ณผ MS ๋ก ๋ฐ๊ฒฌ๋ ์ด์จ๋ค๊ณผ ๋น๊ต , ์ ์ํ
ํ๋ก๊ทธ๋จ ๊ฐ์ ์ฐจ์ด์ ๊ฐ๋ฐ์ฌ ์ง์ DB
PMFMS/MS
Scoring
MASCOT Matrix Science
MSDBNCBInr
SwissProtdbEST
๋ ๋ค ์ง์ MOWSE
ALDENTE(PeptIdent)
SIB(ExPASy)
SwissProtTrEMBL
PMF Tunable
ProteinProspector UCSFNCBInr
SwissProtdbEST
๋ ๋ค ์ง์ Masses matchedMOWSE
GFSGiddings Lab.
UNC15 genomes ๋ ๋ค ์ง์
MASCOT(1/4)
764.21231.012841944.82020.22100.35
Or
764.2 20101231.0 23451284 4561944.8 10122020.2 232100.35 566
database
Fixed modifications :ํด๋น residue ์ ๋ํด์์ด๋ฏธ ์๋ ค์ง ๋ณํ๋๋ค๋ฅธ ์ง๋๊ฐ์ ์ฌ์ฉ
Variable modification :ํด๋น residue ์ ๋ํด์์ผ์ด๋๋ ๋ชจ๋ ๊ฒฝ์ฐ๋ณํ๋ ์ง๋๊ฐ์ ์กฐํฉํจ
MASCOT(2/4)
Significant matchesp < 0.05
Non-significantmatches
MASCOT(3/4)
~
์ผ์ ํ๋ฅ ์ด ๋์ด์๋ฏธ์๋ ๊ฐ ๋ง ๋นจ๊ฐ์
MASCOT(4/4)
ALDENTE(PeptIdent)(1/3)
ALDENTE(PeptIdent)(2/3)
ALDENTE(PeptIdent)(3/3)
์ ์ํ๋ฅผ ํ๋ํ ์ ์๋ค .
ProteinProspector(1/2)
ProteinProspector(2/2)
GFS(1/2)
GFS(2/2)
Summary
Proteomics ์ ์ฌ์ฉ๋๋ ํ๋ก๊ทธ๋จ๋ค์ ๋ฌธ์ ์ ํด๋ฆฌ์คํฑ์ ๊ธฐ๋ฐ ์ ํ๋ ํ๋ผ๋ฏธํฐ์ ์์กด ์ ๊ณต๋ ๋ฐ์ดํฐ์ ์์กด
์ผ๋ฐ์ ํด๊ฒฐ์ฑ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ ํ๊ฒ ์กฐ์ ํ๋ผ ์ฌ๋ฌ ํ๋ก๊ทธ๋จ๋ค์ ์ด์ฉํด๋ณด๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ๋ผ