Ультраметрика в биофизике
Владик Аветисов
Институт химической физики им. Н. Н. Семенова РАН
49-я Школа ПИЯФ
по Физике Конденсированного Состояния
16-21 марта 2015, Санкт-Петербург,
Зеленогорск
Институт химической
физики им. Н.Н. Семенова,
РАН
метрика и ультраметрика
),(),,(max),( .3
),(),( .2
)( 0),( ,0),( .1
yzdzxdyxd
xydyxd
yxyxdyxd
),(),(),( .3
),(),( .2
)( 0),( ,0),( .1
yzdzxdyxd
xydyxd
yxyxdyxd
метрика ультраметрика
сильное неравенство треугольника:
всякий треугольник либо равнобедренный (с меньшим основанием), либо равносторонний
неравенство треугольника
геометрия ультраметрического пространства
Следствия сильного неравенства
треугольника
• всякая точка шара является его
центром;
• радиус шара равен диаметру шара;
• всякие два ультраметрических шара
либо не имеют общих точек, либо
меньший шар целиком содержится в
большем;
• всякий шар можно полностью покрыть
конечным числом шаров меньшего
радиуса.
• ультраметрическое расстояние
принимает дискретные значения. • граница дерева – ультраметрическое пространство • само дерево - граф ультраметрических расстояний • каждое поддерево - ультраметрический шар
образом ультраметрического пространства является дерево: расстояние между двумя точками
определяется положением ближайшего "общего предка" . ),(),,(max),( yzdzxdyxd
ультраметрика и аксиома измерения
аксиома Архимеда ("аксиома измерения")
ABACn dd }{
B A
A C
в ультраметрическом пространстве нельзя малыми шагами пройти большое расстояние...
А С B
}{ ABACn dd
ультраметрическое пространство неархимедово.
…, т.е. нельзя понимать движение как последовательность малых смещений
метрика, числовая норма и числовые поля
метрика (расстояние d)
0; 0, AB AB
AB BA
AC AB BC
d d A B
d d
d d d
норма числа (|x|)
0; 0, 0x x x
xy x y
x y x y
архимедовы пространства и вещественные числа
B
аксиома Архимеда
ABACn dd )(
• • • • • A C
• • A
вещественная норма рационального числа:
xxx ,max||
|||2| xx
10,
mamax xx
вещественные числа:
сходимость по вещественной норме
неравенство треугольника:
| | | | | |x y x y
архимедовость
ультраметрические пространства и р-адические числа
A C B
BCABAC ddd ,max
ACACn dd )(
неархимедовость:
р-адическая норма рационального числа:
pxm
npx p||,
10,
pppax xx
р-адические числа:
сильное неравенство треугольника
ppp yxyx ||,||max||
| | | |p pnx xнеархимедовость
р-простое число
сходимость по р-адической норме
пример: 2 2
2 2
| 0,125 | 8, | 32 | 0,03125
| 0,125 | | 32 |
два способа описания природы
теорема Островского:
любая норма числа эквивалентна либо вещественной норме, либо р-адической норме.
архимедовы пространства
неархимедовы пространства
существует только 2 типа моделей реальности – "архимедовы" модели и "неархимедовы" модели.
когда удобно использовать "деревья"?
• Многомасштабность • Дискретность • Самоподобие
многомасштабность + дискретность иерархия
Основная проблема: как по кинетическим данным реконструировать характер флуктуационно-динамической подвижности белковой молекулы
примеры из биофизики: - реконструкция нелокальных характеристик сложной системы по локальным наблюдаемым
топология генома: макромолекула ДНК
длиной около 2 метров плотно упакована в ядре клетки микронного размера. При этом фрагмент ДНК любого масштаба остается доступным для быстрого считывания генетической информации.
ферментативный катализ и все то, что
относится к "молекулярным машинам" и их дизайну".
Основная проблема: как по матрице контактов реконструировать укладку полимерной цепи ДНК
Состояние белковой молекулы можно определить задав пространственное положение всех «элементарных единиц» макромолекулы. Если имеется N «элементарных единиц», каждая их которых имеет m степеней свободы, то состояние макромолекулы можно описывать точкой (Евклидова) пространства размерности M=Nm, RM.
При атомном представлении размерность пространства состояний белковой молекулы составляет несколько тысяч.
в чем заключается проблема описания динамики белка
protein conformations, rRM
pro
tein
en
erg
y
(r) Далее, следовало бы определить энергию
(r) в каждом состоянии (например, из межатомных взаимодействий) и построить
энергетический ландшафт белковой
молекулы (r).
проблема описания динамики белка
protein conformations, rRM
pro
tein
en
erg
y
(r)
Построить такие энергетические ландшафты, невозможно даже на самых мощных компьютерах. Энергетические ландшафты можно реконструировать только для существенно меньших молекулярных структур.
Типичные масштабы для белковых молекул: • число атомов ~ 103
• размерность пространства состояний ~ 103 • число локальных минимумов >> 10100 (этого никто явно не считал, но все так думают)
проблема описания динамики белка
конечные вершины графа представляют локальные минимумы энергетического ландшафта, а остальные вершины графа представляют «точки перевала» для путей переходов из одних состояний в другие.
po
ten
tia
l e
ne
rgy U
(x)
local minima
po
ten
tia
l e
ne
rgy U
(x)
conformational space
представление сложных энергетических ландшафтов древообразными графами
Ландшафты сложных систем слишком нерегулярны, чтобы быть описанными на языке традиционной (евклидовой) геометрии. Язык древообразных графов и "бассейнов минимумов" здесь более удобен.
S.V.Krivov, S. F.Chekmarev, M., Karplus. J. Struc. Chem. 42(6), 877 (2001).
энергетический ландшафт тетрапептида (4-Ala)
Часто (хотя и не всегда) структура "бассейнов" наводит на мысль об иерархии и самоподобии.
энергетический ландшафт гексапептида (6-Ala)
Энергетический ландшафт достаточно больших молекулярных структур содержит множество разномасштабных элементов от индивидуальных локальных минимумов до разнообразных "притягивающих бассейнов".
S.V.Krivov, M. Karplus. Proc. Nat. Acad. Sci. USA. 101(41) 14766 (2004)
Энергетические ландшафт полипептида (-hairpin, 16 аминокислотных остатков, Gly-Glu-
Trp-Thr-Tyr-Asp-Asp-Ala-Thr-Lys-Thr-Phe-Thr-Val-Thr-Gl)
В макромолекулярных системах
индивидуальные состояния обычно
сгруппированы в "бассейны", и наиболее
интересная кинетика включает переходы
бассейна в бассейн.
Если равновесие внутри бассейна
достигается существенно быстрее
характерного времени выхода из бассейна,
то поведение системы, в главном, будет
определяться переходами между бассейна
(basin-to-basin kinetics).
В приближении basin-to-basin kinetics,
константы переходов зависят от масштабов
бассейнов и разделяющих барьеров.
многомасштабное приближение
В приближении basin-to-basin-kinetics характерные времена переходов между индивидуальными состояниями подчиняются сильному неравенству треугольника, т.е. это приближение делает пространство состояний ультраметрическим.
1 2 3
basin-to-basin-kinetics и ультраметрика
1w
2w
3w
w1
w2
w3
Пространство состояний представляет граница дерева. Само дерево представляет (ультраметрические) расстояния между состояниями. Оно же представляет бассейны состояний и иерархию их вложений.
Узлы ветвлений можно понимать как "точки перевала" на барьерах, разделяющих состояния.
w1>w2>w3… - константы скоростей переходов
basin-to-basin kinetics как ультраметрический случайный процесс
параметризация констант переходов рациональными
числами и введение их зависимости от ультраметрического
расстояния.
континуальный предел
ультраметрическая диффузия
ij
i
ij
ji tfijwtfjiwdt
tdf)()|()()|(
)(
матрица переходов имеет характерный блочно-иерархический вид матрицы Паризи
N
i
i
i
N
i
i
i xpappapi11
11
.)()|(|)|(
wpwyxwjiw p Для регулярного дерева бассейнов матрицы переходов становится просто функций ультраметрического расстояния. Она и задает энергетический ландшафт системы
pQB
pp ydtxftyfyxwdt
txdf),(),()|(|
),(
р-адическое уравнение ультраметрической диффузии
приложения: флуктуационно-динамическая подвижность белка от 300 K до 4 K описывается одним и тем же р-адическим уравнением.
Эксперимент обнаружил необычную флуктуационно динамическую подвижность белковых молекул. Теория показала, что подвижность белковых молекул подобна ультраметрической диффузии и остается такой от 300 К до 4 К !
кинетика связывания СО миоглобином
спектральная диффузия в белках
В. А. Аветисов и др. Труды Математического ин-та им. В. А. Стеклова, 2014, 285, 3.
ультраметрические модели позволяют по-новому взглянуть на белки
белковых молекулы – это структуры, энергетические ландшафты которых обладают свойством
иерархического самоподобия. этим белковая глобула отличаются от обычной полимерной глобулы.
Может ли полимерная цепь, уложенная иерархическим образом в глобуляро-подобную структуру, быть "молекулярной машиной".
Моделирование показывает, что да, так вполне может быть.
еще один пример: складчатые глобулы и упаковка генома
genome-wide chromosome conformation capture method
усредненная вероятность контакта P(s) падает с расстоянием вдоль цепи как P(s) ~s-1
В "среднем", геном имеет структуру фрактальной глобулы.
E. Lieberman-Aiden, et al., Science, 2009, 326, 289.
Yu. Grosberg, S. K. Nechaev and E. I. Shakhnovich, J.
Phys. (France), 1988, 49, 2095.
обычная глобула
складчатая (фрактальная) глобула
складчатая глобула Yu. Grosberg, S. K. Nechaev and E. I. Shakhnovich, J. Phys. (France), 1988, 49, 2095.
g*
A
0 1
00 01 10 11
000 001 010 100011 101 111110
AA
(a) (b)
O
=1 =2 =3
=1
=2
=3
иерархия складок в складчатой глобуле ультраметрическое описание складчатой конформации:
• "состояние" звена задается набором складок (путь на дереве);
• пространство состояний звена становится ультраметрическим (граница дерева)
• складчатая конформация описывается траекторий ультраметрического случайного блуждания (блуждание на границе дерева)
складки в складках дерево складок
pQB
pp ydtxftyfyxwdt
txdf),(),()|(|
),(
Ультраметрическая упаковка генома L. I. Nazarov et al. Soft Matter. DOI: 10.1039/c4sm02519a
складчатость структуры
),(1 ~)),((~ jicrump
ij pjiVP
вероятность контакта обратно пропорциональна объему складки
гетерополимерность
B)-(A
B)-B A,-(A 1
uEij
() crump
ij
E
ij Pew ij
вероятность контакта, усредненная по всем укладкам случайной последовательности на дереве складок
1
0 )(1)(
)()(N
mcrump
ij
crump
ij
E
crump
ij
E
ijmPmPe
mPe
Z
mWP
ij
ij
гомоконтакт энергетически предпочтителен
похоже, что ультраметрика присуща не только белкам, но и ДНК.
реальные матрицы контактов модельные матрицы контактов
L. I. Nazarov et al. Soft Matter. DOI: 10.1039/c4sm02519a
заключительное замечание
Ультраметрика столь же естественна, как и обычная метрика. Она сильно все упрощает когда есть многомасштабность, дискретность и самоподобие. Не удивительно, что природа этим пользуется. Особенно там, где функциональность сопряжена с структурной сложностью. Надо еще иметь в виду, что наблюдаемые всегда вещественные, а ультраметрическое описание нет. Поэтому в ультраметрических моделях наблюдаемую нужно определять явно . В сложных системах наибольший интерес представляет описание нелокального поведения, но наблюдаемая чаще всего остается локальной. В таких случаях, эксперимент может отражать статистикеу редких событий, генерируемых нелокальным поведением системы. Например, статистику первых возвращений ультраметрического случайного блуждания.
спасибо за
внимание