Proteína 5Análise de uma sequência de aminoácidos
Glória Regina Franco / Marcelo Matos Santoro
Bernardo Sgarbi Reis
Agenor Valadares Santos
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Sítio de fosforilação para proteína cinase dependente de cAMP e cGMP
159-162 KKVT
Sítio de fosforilação para proteína cinase dependente de cAMP e cGMP
159-162 KKVT
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Sítio de fosforilação para proteína cinase C
365-367 SLK
Sítio de fosforilação para proteína cinase C
365-367 SLK
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Sítio de fosforilação para caseinacinase II
15-18 TSCE
16-19 SCEE
83-86 SNPE
88-91 TVFD
243-246 TNGD
301-304 TTVE
318-321 TLHE
Sítio de fosforilação para caseinacinase II
15-18 TSCE 16-19 SCEE 83-86 SNPE 88-91 TVFD 243-246 TNGD 301-304 TTVE
318-321 TLHE
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Sítio de miristilação
25-30 GTVIGI
29-34 GIDLGT
33-38 GTTYSC
40-45 GVFQGG
184-189 GTIAGL
Sítio de miristilação
25-30 GTVIGI 29-34 GIDLGT 33-38 GTTYSC 40-45 GVFQGG 184-189 GTIAGL
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Sítio de amidação
96-99 IGRK
157-160 LGKK
Sítio de amidação
96-99 IGRK 157-160 LGKK
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Assinatura 1 de proteínas da família hsp70 Heat shock
30-37 IDLGTTYS
Assinatura 1 de proteínas da família hsp70 Heat shock
30-37 IDLGTTYS
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Assinatura 2 de proteínas da família hsp70 Heat shock
218-231 IFDLGGGTFDVSLL
Assinatura 2 de proteínas da família hsp70 Heat shock
218-231 IFDLGGGTFDVSLL
•Peso Molecular: 41045.1•Número de aminoácidos: 369
•pI Teórico: 6.06
•Resíduos negativos (Asp+Glu): 54•Resíduos positivos (Arg+Lys): 50
•Meia-vida estimada:
• 30 h (mamíferos, in vitro).• >20 h (levedura, in vivo).
• >10 h (Escherichia coli, in vivo).
Propriedades Físico Químicas
Homologia
HSP70 [Schistosoma japonicum] 580 e-165GR78_XENLA 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... 512 e-144
BiP protein [Homo sapiens] 512 e-144glucose regulated protein [Echinococc... 512 e-144
GR78_CHICK 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... 511 e-144glucose regulated protein [Echinococc... 508 e-143
GR78_RAT 78 KD GLUCOSE-REGULATED PROTEIN PRECURSOR ... 505 e-142immunoglobulin binding protein [Xenop... 505 e-142
BiP [Mus musculus] 503 e-141dnaK-type molecular chaperone grp78 precursor - m... 503 e-141
GR78_MESAU 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... 503 e-141glucose-regulated protein [Homo sa... 503 e-141
GR78_HUMAN 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... 496 e-13978 kDa glucose-regulated protein [Mu... 495 e-139
dnaK-type molecular chaperone BiP precursor - Cal... 482 e-135heat shock 70 kD protein cognate [... 478 e-134
HS7C_DROME HEAT SHOCK 70 KD PROTEIN COGNATE 3 PRECU... 471 e-132dnaK-type molecular chaperone hsc3 precursor - fr... 471 e-132
Possível sítio de clivagem: a.a.17 – Parece possuir uma seq. sinal N-terminal clivável.
Composição de aminoácidos estimada da forma matura: calculada a partir do a.a.18
Região N-terminal
MIN: 2.68MAX: 3.07
HIDROFOBICIDADE DA PROTEÍNA
Localização celular
outside --- Certainty= 50,4% (Affirmative)
microbody (peroxisome) --- Certainty= 11,4% (Affirmative)
nucleus --- Certainty= 10,8% (Affirmative)
endoplasmic reticulum (membrane) --- Certainty= 10,0% (Affirmative)
Aminoácidos Hidrofóbicos
Aminoácidos Hidrofóbicos
Aminoácidos Hidrofóbicos
Segmentos transmembrânicos
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLLKSLKVK
Posição Transmembrânicas
1-19 MFSYLLLLSCILCLTSCEE216-234 ILIFDLGGGTFDVSLLTIE
Posição Transmenbrânicas
1-19 MFSYLLLLSCILCLTSCEE216-234 ILIFDLGGGTFDVSLLTIE
1 MFxxxxxxxx xxxxxxxEEK KEDYGTVIGI DLGTTYSCVG VFQGGRVEII
51 ANDQGNRITP SYVAFTPEGE RLIGDAAKNQ LTSNPENTVF DVKRLIGRKF
101 DESTVQNDIT HFPFSVVNKK NKPYVEVHVG SEVKTFAPEE ISAMVLGKMK
151 EFAEAYLGKK VTHAVVTVPA YFNDAQRQAT KDAGTIAGLN ILRIINEPTA
201 AAIAYGLDKK DGEKNILIFD LGGGTFDVSL LTIENGVFEV VATNGDTHLG
251 GEDFDQRVID HFAKLILEKK GKDIKVNKRA VQKLRREVEK AKRMLSKQPS
301 TTVEIDAPYD WEGFSRNTLH ERHFEKLNID LFLKTLEPVK KVLEDAGMKK
351 EDIDEIIxxx xxxxxxxxx
Resultado do Predict Protein
X = aminoácidos não condizentes com a estrutura da proteína. “defaut” a.a.
(AF044412) HSP70 [Schistosoma japonicum] Length = 648
Score = 587 bits (1498), Expect = e-167 Identities = 300/340 (88%), Positives = 314/340 (92%), Gaps = 1/340 (0%)
Query: 18 EEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAA 77 E+KK DYGTVIGIDLGTTYSCVGVFQGGRVEIIAN+QGNRITPSYVAFT EGERLIGDAASbjct: 18 EDKKVDYGTVIGIDLGTTYSCVGVFQGGRVEIIANEQGNRITPSYVAFTTEGERLIGDAA 77
Query: 78 KNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFA 137 KNQLTSNPENTVFDVKRLIGR FDESTVQ DI HFPFSVVNKKNKPYVEVHVGSEVK+FASbjct: 78 KNQLTSNPENTVFDVKRLIGRTFDESTVQEDIKHFPFSVVNKKNKPYVEVHVGSEVKSFA 137
Query: 138 PEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINE 197 PEEISAMVLGKMK AE+YLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGL++LRIINESbjct: 138 PEEISAMVLGKMKSSAESYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLDVLRIINE 197
Query: 198 PTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257 PTAAAIAYGLDKKDGEKNIL+FDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQRSbjct: 198 PTAAAIAYGLDKKDGEKNILVFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257
Query: 258 VIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRN 317 VID+FAK IL KKGKDI+ +KRAVQKLRREVEKAKRMLS + VEI++ D E FS Sbjct: 258 VIDYFAKQILTKKGKDIRSDKRAVQKLRREVEKAKRMLSTTQTARVEIESLIDGEDFS-E 316
Query: 318 TLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEII 357 TL FEKLN+DLFLKTLEPVKKVLEDA MKKEDIDEIISbjct: 317 TLTRALFEKLNMDLFLKTLEPVKKVLEDANMKKEDIDEII 356
Porcentagem de amino acidos: +--------------+--------+--------+--------+--------+--------+ | AA: | K | L | V | E | G | | % of AA: | 9.8 | 9.2 | 8.9 | 8.1 | 7.6 | +--------------+--------+--------+--------+--------+--------+ | AA: | I | T | D | A | F | | % of AA: | 7.0 | 6.5 | 6.5 | 6.5 | 4.9 | +--------------+--------+--------+--------+--------+--------+ | AA: | N | S | R | P | Y | | % of AA: | 4.6 | 4.1 | 3.8 | 3.0 | 2.4 | +--------------+--------+--------+--------+--------+--------+ | AA: | Q | H | M | C | W | | % of AA: | 2.4 | 1.9 | 1.4 | 1.1 | 0.3 | +--------------+--------+--------+--------+--------+--------+
Porcentagem de estruturas secundárias "predicted": +--------------+--------+--------+--------+ | SecStr: | H | E | L | | % Predicted: | 35.8 | 21.4 | 42.8 | +--------------+--------+--------+--------+
According to the following classes: all-alpha: %H>45 and %E< 5; all-beta : %H<5 and %E>45 alpha-beta : %H>30 and %E>20; mixed: rest, this means that the predicted class is: alpha-beta
Estrutura secundária
AA |MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITP| PHD sec | EEEEEEE EEEEE EEEEEEE EEEEE | AA |SYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKK| PHD sec | EEEE HHHHHHHHHHHH HHHHHHHHHH HHHHHHH EEEE | AA |NKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQAT| PHD sec | EEEEEE HHHHHHHHHHHHHHHHHHHHH EEEEEEE HHHHHHH| AA |KDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEV| PHD sec |HHHHHH EEEEEE HHHHHHHHH EEEEEE EEEEEE EEEE| AA |VATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPS| PHD sec |EE HHHHHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHHH | AA |TTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVG| PHD sec | EEEE HHHHHHHHHHHHHH HHHHHHHH EEEEEE | AA |VLLKSLKVK| PHD sec | |
Estrutura secundária
22 fitas betas, 13 alfa hélices e 32 loops
Identidade com outras proteínas
• 1HPM_.pdb: 65.97 % identity• 1NGI_.pdb: 65.97 % identity• 1NGJ_.pdb: 65.97 % identity• 3HSC_.pdb: 65.97 % identity• 1NGB_.pdb: 65.8 % identity• 1BUPA.pdb: 65.37 % identity• 1KAZ_.pdb: 65.8 % identity• 1ATR_.pdb: 65.72 % identity• 1NGA_.pdb: 65.8 % identity• 1NGD_.pdb: 65.72 % identity• 1NGF_.pdb: 65.72 % identity• 1NGH_.pdb: 65.37 % identity• 1NGC_.pdb: 65.72 % identity
• 1NGE_.pdb: 65.72 % identity• 1NGG_.pdb: 65.37 % identity• 1ATS_.pdb: 65.72 % identity• 1KAX_.pdb: 65.8 % identity• 1KAY_.pdb: 65.8 % identity• 1BA0_.pdb: 65.72 % identity• 2BUPA.pdb: 65.37 % identity• 1BA1_.pdb: 65.37 % identity• 1QQOA.pdb: 65.45 % identity• 1QQMA.pdb: 65.15 % identity• 1QQNA.pdb: 64.92 % identity• 1HJOA.pdb: 65.1 % identity• 1DKGD.pdb: 48.32 % identity
Estrutura tridimensional
2BUP A Proteína 5
Homologia estrutural
2BUP A Proteína 5
Homologia estrutural
2BUPA Proteína 5
1HJO1HPM
Agradecimentos
Ao Laboratório de Físico Química de Proteínas e Enzimologia, ao Thiago Mares Guia, ao Laboratório de Biologia Computacional, ao Professor Ari Siqueira, ao Laboratório de Biologia
Celular e Desenvolvimento, ao Laboratório de Imunologia Celular e Molecular e ao Jamil.
Agradecemos também aos nossos pais e avós, ao Albert Einsten, aos nossos professores Glória e Marcelo e especialmente ao copy paste.
Não poderiamos esquecer da Internet e dos nossos coleguinhas !!!