Download - парадоксы геномной медицины 2015
Круглый стол: Парадоксы геномной медицины
Хромов-Борисов Н.Н.1, Рубанович А.В.2 1Российский НИИ травматологии и ортопедии имени Р.Р. Вредена,
Санкт-Петербург 2Институт общей генетики им. Н.И. Вавилова РАН, Москва, Россия
+7 952 204 8949 +7 921 449 2905
КОНГРЕСС МОЛЕКУЛЯРНЫЕ ОСНОВЫ КЛИНИЧЕСКОЙ МЕДИЦИНЫ –
ВОЗМОЖНОЕ И РЕАЛЬНОЕ 26 — 28 марта 2015, Санкт-Петербург, Россия
9th International Congress of Human Genetics 18-23 August 1996. Rio de Janeiro, Brazil
2
• Наука не всесильна, и ее прогресс обусловлен осознанием и признанием ее принципиальных запретов, иллюзий, скрытых ловушек и парадоксов.
3
Парадокс генетической уникальности
• Каждый человек генетически уникален - различаются даже монозиготные близнецы.
• Поэтому мечты об индивидуализированной геномной медицине разбиваются о методологию клинических исследований, потому что практически невозможно доказать, что конкретно данному пациенту с уникальным генотипом помогло именно данное персонально подобранное средство или способ лечения.
• Для этого требуется сравнивать большие выборки генотипически одинаковых субъектов («чистых линий») с данной болезнью и без нее.
4
Парадокс генетического разнообразия
• Типы генетического полиморфизма у человека разнообразны (SNP, CNV и проч.), и число вариантов последовательностей ДНК (аллелей) исчисляется миллионами, а число их возможных комбинаций (генотипов) явно превышает численность населения Земли (7,26 млрд. человек).
• В таком случае статистическая значимость выявляемых «генетических ассоциаций» слишком часто будет ложной.
• В статистике это явление известно как «парадокс Фридмана».
5
Парадокс размытости фенотипов
• Фенотипы с низко пенетрантным плейотропным полигенным наследованием плохо различимы.
• Если у человека в данный момент болезнь отсутствует, это не означает, что она никогда у него не проявится.
• Если человек ведет сидячий образ жизни, это не означает, что он потенциально не предрасположен к высоким спортивным достижениям.
6
Парадокс контрольной группы • Из-за размытости фенотипов в геномной медицине «контрольная
группа» часто является смесью (в неизвестных пропорциях) субъектов без болезни (или без склонности к талантам) и субъектов с еще не проявившейся болезнью (или талантом).
• Это означает, что выборки формируются не по схеме «случаи-контроли», а по схеме «случаи-когорта», и к ним нужно применять принципиально иные процедуры статистического моделирования и анализа.
• В качестве контрольной группы нередко отбирают доноров, и в их выборках часто наблюдается отклонение от равновесия Харди-Вайнберга (РХВ).
• В частности мы обнаружили такие отклонения в считавшихся бесспорными классических работах о связи групп крови системы АВ0 с болезнями, и именно из-за этого выявляемые связи на поверку оказываются иллюзорными.
7
Edgren G, Hjalgrim H., Rostgaard K., Norda R, Wikman A, Melbye M., Nyré O. Risk of gastric cancer and peptic ulcers in relation to AB0 blood type: a cohort study
Am. J. Epidemiol., 2010. – Vol. 72. – P. 1280–1285
Группа крови
Доноры Cрак желудка
N f с 99% ДИ Причина N f с 99% ДИ
A 478633 0,4380,4400,441 Дефицит 331 0,410,470,52
AB 57904 0,05260,05320,0539 Избыток 45 0,0410,0670,102
B 122819 0,1120,1130,114 Дефицит 66 0,070,100,14
0 428978 0,3930,3940,396 Избыток 246 0,310,370,43
РХВ, Pval 9∙10-83 0,12
Гомоген-ность
Pval 0,034
BF01 68,5
8
Авторы утверждают, что эти данные подтверждают «связь» между группой крови A и раком желудка. На самом деле в контрольной группе наблюдается отклонение от РХВ вследствие дефицита аллели A. Более того, различие статистически мало значимо и клинически ничтожно: OR = 1,15.
Нейтральная эволюция
• С точки зрения эволюционного учения одним из первейших вопросов, на который должна дать ответ генетика предрасположенностей, может звучать так:
• является ли генетический полиморфизм, выявляемый современной геномикой, результатом нейтральной эволюции или же он является отягчающим генетическим (мутационным) грузом, определяющим предрасположенность к распространенным болезням, и который почему-то естественный отбор вовремя не отбраковал?
9
Отношение шансов как мера нейтральности аллелей
• Статистическая значимость наблюдаемых в опыте эффектов вовсе не означает их практическую (клиническую) ценность.
• Эффект может быть статистически высоко значимым, но его размер может оказаться практически ничтожным.
• В частности мы показали, что когда нижняя граница 95%-го доверительного интервала для отношения шансов ORL < 2,2, тогда предсказательная ценность маркера клинически ничтожна.
• Маркер может быть хорошим классификатором, если ORL > 5,4 (при минимальной частоте маркера MAF > 0,3).
• Этому условию удовлетворяют лишь очень немногие генетические онко-маркеры (например, BRCA1, BRCA2, TP53, PTEN).
10
Парадокс суммирования баллов генетического риска
11
Математическое ожидание Z-статистики для сравнения средних GRS в группах «с болезнью» и «без болезни»
12
Примеры публикаций, заявленная статистически значимая «ассоциация» в которых может быть обусловлена «парадоксом
суммирования баллов генетического риска»
Disease k m p-value, given in
the research
p-value according to
formula (2)
Breast cancer 4 5 0.041 0.027
Incidence of coronary infarct 11 11 0.0014 0.0042
Asthma 6 41 0.001 1.7×10-6
Coronary artery disease 9 2200 2×10-16 1.3×10-21
Inflammatory bowel disease (IBD) 56 56 2.1×10-7
4.6×10-11 1.2×10-9
Prostate cancer 29 29 0.0001 8.8×10-6
Response to
Ranibizumab Treatment in AMD*
2
3
8
8
0.014
0.0001
0.0100
0.0065
Breast cancer in young women 2 3 0.15 0.062
Nasopharyngeal carcinoma 5 26 8.2×10-4 3.7×10-4
Vitamin D concentration 3 94 < 0.001 7.4×10-6
Neck and head squamous cell carcinoma 10 10 0.023 0.0058
13
• Важнейший вопрос в генетике предрасположенностей:
• Усиливаются ли, или хотя бы складываются, «вредные» эффекты предрасполагающих аллелей при их объединении в одном генотипе или же они взаимно нейтрализуются?
14
• Представим, что нам удастся собрать в одном геноме все известные аллели, предрасполагающие к занятиям определенным видом спорта.
• Очевидно, что в силу неаддитивности межгенных и средовых влияний спортивные способности субъекта с таким геномом не будут кратными числу предрасполагающих аллелей.
• 200 предрасполагающих аллелей в одном геноме вряд ли приведут к 200-кратному увеличению спортивных характеристик у их носителей.
• Поэтому заменять слово «аллель» словом «балл» и подсчитывать число баллов некорректно, поскольку их суммарный вклад не будет равен сумме вкладов каждой из аллелей по отдельности.
• А в силу разнонаправленной плейотропии этих аллелей не окажется ли наш супермен суперидиотом?
15
Ошибочность использования баллов для идентификации индивидуумов с повышенным риском гипертензии
16
Частотные распределения в двух выборках с крайними значениями кровяного давления для 35 предрасполагающих к его повышению аллелей почти полностью перекрываются.
Paynter N.P., Chasman D.I., Pare G., Buring J.E., Cook N.R., ScD, Miletich J.P., Ridker P.M. Association between a literature-based genetic risk score and cardiovascular
events in 19,313 women // JAMA, 2010. – Vol. 303. – No. 7. – P. 631–637.
Баллы генетического риска (GRS - genetic risk score) не улучшают предсказание риска сердечнососудистых заболеваний.
17
Парадокс множественных сравнений
• Если число категорий больше двух, то к ним нельзя применять обычные двухвыборочные критерии, и для попарных сравнений нужны поправки на их множественность.
18
Парадокс обратной вероятности («заблуждение обвинителя»)
• Вероятность наблюдать данный генотип G+ у субъекта с болезнью D+ не есть вероятность этой болезни у субъекта с данным генотипом:
• P(G+|D+) ≠ P(D+|G+).
• Иными словами, чувствительность, Se = P(G+|D+), и специфичность, Sp = P(G-|D-), генетического теста мало что говорят о диагностических ценностях (предсказательных вероятностях) его положительных, PPV = P(D+|G+), и отрицательных, NPV = P(D-|G-), результатов.
19
P-значение – величайшее статистическое заблуждение
20
. P-значение вычисляется при условии справедливости гипотезы Н0, и поэтому оно ничего не говорит непосредственно о ее вероятности: Pval = P(data|H0) ≠ P(H0|data). Рval < 0,05 нельзя считать веским свидетельством против H0, следует ориентироваться на Рval < 0,001.
21
“Цена” P-значений
Наблюдаемое P-значение
Верхняя граница 80%-го интервала
для Pval
Нижняя граница для вероятности
нулевой гипотезы P(H0)
Верхняя граница для вероятности
воспроизведения Рrepr
0,05 0,44 ≥ 29% < 50%
0,01 0,22 ≥ 11% < 73%
0,001 0,07 ≥ 1,8% < 90%
Sellke T., Bayarri M.J., Berger J.O. Calibration of p values for testing precise null hypotheses. The American Statistician, Vol. 55, No. 1. (2001), pp. 62-71. Goodman S.N. A comment on replication, p-values and evidence // Statistics in Medicine, 1992. – Vol. 11. – P. 875-879. Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Perspectives on Psychological Science, 2008. – Vol. 3. – No. 4. – P. 186-300.
21
Психологический журнал запретил P-значения
• Редакция журнала Basic and Applied Social Psychology (BASP) объявила, что журнал не будет больше публиковать статьи, содержащие P-значения, потому что эти значения слишком часто способствовали публикации низкокачественных исследований.
• Basic Appl. Soc. Psych. 37, 1–2 (2015)
• Nature, 2015, 519:9
22
Лучше один раз увидеть
• Результаты статистического контроля качества диагностических тестов полезно наглядно представлять в виде графиков предсказательностей.
• Примеры приведены на рисунках.
23
Lotufo P.A., Chae C.U., Ajani U.A., Hennekens C.H., Manson J.A.E., Male pattern baldness and coronary heart disease: The Physician's Health Study, Arch. Intern. Med. 2000; 160(2): 165-71. Simon A., Worthen D. M., Mitas J. A.1979. An evaluation of iridology // JAMA, V. 242, N 1, P.
1385-1389.
Алопеция и ИБС Иридодиагностика и почечная недостаточность
24
127/1224/548/7611 LR[+] = 1,01,41,8; LR[-] = 1,01,061,1
29/59/19/36 LR[+] = 0,71,01,4; LR[-] = 0,71,01,5
• Известно, что евнухи, когда они становятся евнухами в возрасте до 25 лет, не лысеют.
• Вряд ли найдется врач, который на основании этих данных будет рекомендовать молодым людям обзаводиться детьми до 25 лет, а потом становится евнухами для того, чтобы на 2% снизить риск развития у них ИБС.
• Однако это очень похоже на рекомендации медицинских генетиков, подавляющее большинство которых слишком часто бывают основаны на столь же клинически ничтожных значениях распознавательной и предсказательной способностей генетических маркеров.
• Редко значения отношения шансов в этих работах превышают значение OR > 5.
25
Druzhevskaya A.M, Ahmetov I.I., Astratenkova I.V., Rogozkin V.A. 2008. Association of the ACTN3 R577X polymorphism with power athlete status in Russians // Eur. J. Appl. Physiol., 2008. – Vol. 103. – P. 631–634.
Кундас Л.А., Жур К.В., Бышнев Н.И. и др. Анализ молекулярно-генетических маркеров, ответственных за устойчивость к физическим нагрузкам, у представителей академической гребли // Молекулярная и
прикладная генетика: сб. науч. тр. Институт генетики и цитологии НАН Беларуси; (гл. ред. А.В. Кильчевский). 2013. - Минск: ГНУ «Институт генетики и цитологии НАН Беларуси», Т. 14. – C. 101-105.
Ген ACTN3 и элитные атлеты Ген PPARG и элитные гребцы
26
455/1027/31/170 LR[+] = 1,01,11,1; LR[-] = 1,42,23,7
3/3/21/147 LR[+] = 0,95,840; LR[-] = 1,11,21,6
Mayeux R., Saunders A.M., Shea S., et al. 1998. Utility of the apolipoprotein E genotype in the diagnosis of Alzheimer’s disease // N. Engl. J. Med., 1998. – Vol. 338. – P. 506-511.
Mäki M., Mustalahti K., Kokkonen J., et al. 2003. Prevalence of celiac disease among children in Finland // N. Engl. J. Med, 2003. – Vol. 348. – P. 2517-2524.
Ген APOE и болезнь Альцгеймера Гаплотипы HLA и целиакия
27
1142/133/622/285
LR[+] = 1,72,02,5; LR[-] = 1,71,92,2
54/1357/2/2214 LR[+] = 2,72,52,7; LR[-] = 4,112103
Banks E., Reeves G., Beral V. et. al. Influence of personal characteristics of individual women on sensitivity and specificity of mammography in the Million Women Study: cohort study // BMJ, 2004. 329(7464): 477-479. Kevin P. Delaney K.P., Branson B.M., Apurva Uniyal A. et al. Performance of an oral fluid rapid HIV-1/2 test:
experience from four CDC studies // AIDS, 2006. – Vol. 20. – P. 1655–1660.
Маммография и рак молочной железы Экспресс-тест OralQuick на ВИЧ
28
629/3885/97/117744 LR[+] = 262729; LR[-] = 5,77,29,3
327/12/1/12010 LR[+] = 4959192141; LR[-] = 451653171
FDA предупреждает и обвиняет: генетическое тестирование научно не обосновано
• FDA разослало письма 17 компаниям (23andMe, Navigenics, deCODEme, EasyDNA и другим), которые занимаются генетическим тестированием, с предупреждением о прекращении их деятельности из-за отсутствия научных доказательств и неспособности точно предсказывать риск болезней.
• http://www.fda.gov/MedicalDevices/ProductsandMedicalProcedures/InVitroDiagnostics/default.htm
23.09.2015 29