Множественное выравнивание
DESCRIPTION
Множественное выравнивание. Обобщение парного выравнивания. Выравнивание 2-х последовательностей – двумерная матрица 3-х последовательностей – 3-х мерная. A T _ G C G _ A _ C G T _ A A T C A C _ A Задача : больше консервативных столбцов, лучше выравнивание. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/1.jpg)
Множественное выравниваниеМножественное выравнивание
![Page 2: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/2.jpg)
Обобщение парного выравниванияОбобщение парного выравнивания
• Выравнивание 2-х последовательностей – двумерная матрица
• 3-х последовательностей – 3-х мерная.
A T _ G C G _ A _ C G T _ A A T C A C _ A
• Задача: больше консервативных столбцов, лучше выравнивание
![Page 3: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/3.jpg)
Глобальное выравнивание 3-х Глобальное выравнивание 3-х последовательностейпоследовательностей
начало
конец
![Page 4: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/4.jpg)
2-D versus 2-D 2-D versus 2-D
В 3-D - 7
В 2-D, 3 пути прихода в узел
![Page 5: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/5.jpg)
3-D3-D архитектура архитектура(i-1,j-1,k-1)
(i,j-1,k-1)
(i,j-1,k)
(i-1,j-1,k) (i-1,j,k)
(i,j,k)
(i-1,j,k-1)
(i,j,k-1)
![Page 6: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/6.jpg)
АлгоритмАлгоритм
• si,j,k = max
(x, y, z) – запись в трехмерной матрице весов
si-1,j-1,k-1 + (vi, wj, uk)si-1,j-1,k + (vi, wj, _ )si-1,j,k-1 + (vi, _, uk)si,j-1,k-1 + (_, wj, uk)si-1,j,k + (vi, _ , _)si,j-1,k + (_, wj, _)si,j,k-1 + (_, _, uk)
Нет гэпов
Один гэп
Два гэпа
![Page 7: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/7.jpg)
Время работы алгоритмаВремя работы алгоритма
• Для 3-х последовательностей длины n, время работы - 7n^3; O(n^3)
• Для k последовательностей - (2k-1)(n^k); O(2kn^k)
![Page 8: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/8.jpg)
Множественное выравнивание Множественное выравнивание порождает парные выравниванияпорождает парные выравнивания
x: AC-GCGG-C y: AC-GC-GAG z: GCCGC-GAG
Порождает:
x: ACGCGG-C; x: AC-GCGG-C; y: AC-GCGAGy: ACGC-GAC; z: GCCGC-GAG; z: GCCGCGAG
![Page 9: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/9.jpg)
Обратная проблемаОбратная проблема
Имея 3 субъективных парных варнивания:
x: ACGCGG-C; x: AC-GCGG-C; y: AC-GCGAGy: ACGC-GAC; z: GCCGC-GAG; z: GCCGCGAG
Можем ли мы вычислить множественное
выравнивание, их порождающее?
![Page 10: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/10.jpg)
Хороший вариант
Плохой вариант
Ответ – не всегда.Ответ – не всегда.
![Page 11: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/11.jpg)
Выравнивание выравниванийВыравнивание выравниваний
x GGGCACTGCATy GGTTACGTC-- Alignment 1 z GGGAACTGCAG
w GGACGTACC-- Alignment 2v GGACCT-----
![Page 12: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/12.jpg)
ПрофилиПрофили
x GGGCACTGCATy GGTTACGTC-- Combined Alignment z GGGAACTGCAG
w GGACGTACC-- v GGACCT-----
GTCTGAGTCAGC GTCt/aGa/cA
![Page 13: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/13.jpg)
Множественное выравнивание – Множественное выравнивание – жадный алгоритмжадный алгоритм
u1= ACGTACGTACGT…
u2 = TTAATTAATTAA…
u3 = ACTACTACTACT…
…
uk = CCGGCCGGCCGG
u1= ACg/tTACg/tTACg/cT…
u2 = TTAATTAATTAA…
…
uk = CCGGCCGGCCGG…
kk-1
![Page 14: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/14.jpg)
ClustalWClustalW
• Прогрессивное выравнивание –жадный алгоритм с более «умным» способом выбора пар.
• Три шага1.) Построить парные выравнивания2.) Построить дерево-подсказку3.) Прогрессивное выравнивание по
дереву-подсказке
Прогрессивное выравниваниеПрогрессивное выравнивание
![Page 15: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/15.jpg)
ШагШаг 1: 1: Парные ВыравниванияПарные Выравнивания
• Выравнивания пар порождают матрицу identity
v1 v2 v3 v4
v1 -v2 .17 -v3 .87 .28 -v4 .59 .33 .62 -
(.17 значит идентичны на 17 % )
![Page 16: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/16.jpg)
ШагШаг 2: 2: Дерево-подсказкаДерево-подсказкаv1
v3
v4 v2
Далее вычислить:v1,3 = выравнивание (v1, v3)v1,3,4 = выравнивание ((v1,3),v4)v1,2,3,4 = выравнивание ((v1,3,4),v2)
v1 v2 v3 v4
v1 -v2 .17 -v3 .87 .28 -v4 .59 .33 .62 -
![Page 17: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/17.jpg)
ШагШаг 3: 3: Прогрессивное Прогрессивное выравниваниевыравнивание
• Выравниванием 2 наиболее близких последовательности.
• Следуя дереву - подсказке, довыравниваем следующую последовательность к имеющемуся выравниванию
FOS_RAT PEEMSVTS-LDLTGGLPEATTPESEEAFTLPLLNDPEPK-PSLEPVKNISNMELKAEPFDFOS_MOUSE PEEMSVAS-LDLTGGLPEASTPESEEAFTLPLLNDPEPK-PSLEPVKSISNVELKAEPFDFOS_CHICK SEELAAATALDLG----APSPAAAEEAFALPLMTEAPPAVPPKEPSG--SGLELKAEPFDFOSB_MOUSE PGPGPLAEVRDLPG-----STSAKEDGFGWLLPPPPPPP-----------------LPFQFOSB_HUMAN PGPGPLAEVRDLPG-----SAPAKEDGFSWLLPPPPPPP-----------------LPFQ . . : ** . :.. *:.* * . * **:
Точки и звезды отображают насколько консервативны столбцы.
![Page 18: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/18.jpg)
Множественные ВыравниванияМножественные Выравнивания: : ВзвешиваниеВзвешивание
Количество полных совпадений
Энтропия
Сумма по парам (SP-Score)
![Page 19: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/19.jpg)
LCS ScoreLCS Score
• Хорошо только для очень близких последовательностей
AAAAAAAATATC
![Page 20: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/20.jpg)
ЭнтропияЭнтропия• Определим вероятности букв в столбцах
• pA = 1, pT=pG=pC=0 (1-ый столбец)• pA = 0.75, pT = 0.25, pG=pC=0 (2-ый столбец)• pA = 0.50, pT = 0.25, pC=0.25 pG=0 (3-ий столбец)
• Энтропия столбца будет равна
CGTAX
XX pp,,,
log AAAAAAAATATC
![Page 21: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/21.jpg)
ЭнтропияЭнтропия: : ПримерПример
0
AAAA
entropy
2)241(4
41log
41
CGTA
entropy
Лучший вариант
Худший вариант
![Page 22: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/22.jpg)
ЭнтропияЭнтропия: : ПримерПримерЭнтропия столбца:
-( pAlogpA + pClogpC + pGlogpG + pTlogpT)
•Столбец 1 = -[1*log(1) + 0*log0 + 0*log0 +0*log0] = 0
•Столбец 2 = -[(1/4)*log(1/4) + (3/4)*log(3/4) + 0*log0 + 0*log0] = -[ (1/4)*(-2) + (3/4)*(-.415) ] = +0.811
•Столбец 3 = -[(1/4)*log(1/4)+(1/4)*log(1/4)+(1/4)*log(1/4) +(1/4)*log(1/4)] = 4* -[(1/4)*(-2)] = +2.0
•Энтропия выравнивания = 0 + 0.811 + 2.0 = +2.811
A A A
A C C
A C G
A C T
![Page 23: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/23.jpg)
Сумма по парам Сумма по парам (SP-Score)(SP-Score)
• Построим парное выравнивание по множественному
• Посчитаем веса всех этих парных выравниваний - s*(ai, aj)
• Просуммируем:s(a1,…,ak) = Σi,j s*(ai, aj)
![Page 24: Множественное выравнивание](https://reader034.vdocuments.mx/reader034/viewer/2022052604/56814c47550346895db94b96/html5/thumbnails/24.jpg)
Проекции на плоскостиПроекции на плоскости
3-D выравнивание может быть спроецировано на 2-D плоскость чтобы получить порождаемое парное выравнивание.