การรู้จ าแบบเชิงสถิติเพื่อ...
TRANSCRIPT
การร ูจ้ าแบบเชิงสถิติเพ่ือตรวจจบัเครือ่งหมาย
พนัธกุรรมท่ีสมัพนัธก์บัโรคพนัธกุรรมซบัซอ้น
อาจารยท์ี่ปรึกษา รศ.ดร.ณชล ไชยรตันะ
นกัศึกษา คปก.นายวรญัญ ู วงษเ์สรี
ภาควิชาวิศวกรรมไฟฟ้า คณะวิศวกรรมศาสตร์
มหาวิทยาลยัเทคโนโลยีพระจอมเกลา้พระนครเหนอื
ความร่วมมือ
หนว่นอณพูนัธศุาสตร ์สถานส่งเสริมการวิจยั
คณะแพทยศาสตรศิ์ริราชพยาบาล
มหาวิทยาลยัมหิดล
เนือ้หา
• บทน า
• อิพิสเตซิสบริสทุธ์ิ
• วิธีการท่ีน าเสนอ
• การทดสอบกบัแบบจ าลองอิพิสเตซิสบริสทุธ์ิ
• การประยกุตใ์ชก้บัขอ้มลูโรคเบาหวานชนดิที่สอง
• สรปุผลการวิจยั
บทน า
โรคซับซอ้น หมายถึงโรคที่เกิดจากอันตรกิริยา (Interaction)
ระหว่างยีนกบัยีน หรือยีนกับสิ่งแวดลอ้มยกตวัอย่างเช่น หอบหืด
มะเร็ง เบาหวาน ความดนัสงูและโรคอว้น เป็นตน้
บทน า
ต าแหนง่พนัธกุรรม (Locus) ของยีนบนโครโมโซมคู่หนึง่ๆ จะมี
รปูแบบของยีนหรืออลัลีล (Allele) ที่แตกตา่งกนัได ้โดยทัว่ไปยีนแต่
ละต าแหนง่พนัธกุรรมจะม ี2 อลัลีล
อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)
หมายถึงอันตรกิริยาระหว่าง
เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่
สามารถตรวจจับด้วย วิธีการ
วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่
แต่การวิ เคราะห์แบบสอง
ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง
พันธกุรรมนั้นไดร้ับการพิสจูนว์่า
เป็นวิธีท่ีสามารถตรวจจับอันตร
กิริยาแบบนีไ้ด ้
อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)
หมายถึงอันตรกิริยาระหว่าง
เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่
สามารถตรวจจับด้วย วิธีการ
วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่
แต่การวิ เคราะห์แบบสอง
ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง
พันธกุรรมนั้นไดร้ับการพิสจูนว์่า
เป็นวิธีท่ีสามารถตรวจจับอันตร
กิริยาแบบนีไ้ด ้
อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)
หมายถึงอันตรกิริยาระหว่าง
เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่
สามารถตรวจจับด้วย วิธีการ
วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่
แต่การวิ เคราะห์แบบสอง
ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง
พันธกุรรมนั้นไดร้ับการพิสจูนว์่า
เป็นวิธีท่ีสามารถตรวจจับอันตร
กิริยาแบบนีไ้ด ้
อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)
หมายถึงอันตรกิริยาระหว่าง
เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่
สามารถตรวจจับด้วย วิธีการ
วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่
แต่การวิ เคราะห์แบบสอง
ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง
พันธกุรรมนั้นไดร้ับการพิสจูนว์่า
เป็นวิธีท่ีสามารถตรวจจับอันตร
กิริยาแบบนีไ้ด ้
อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)
หมายถึงอันตรกิริยาระหว่าง
เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่
สามารถตรวจจับด้วย วิธีการ
วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่
แต่การวิ เคราะห์แบบสอง
ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง
พันธกุรรมนั้นไดร้ับการพิสจูนว์่า
เป็นวิธีท่ีสามารถตรวจจับอันตร
กิริยาแบบนีไ้ด ้
ขอ้จ ากดัของการวิเคราะหแ์บบหลายต าแหนง่
คือ ตอ้งอาศัยการค านวณอย่างมาก
จึงมขีอ้จ ากดัส าหรบัปัญหาท่ีมขีอ้มลูจ านวนมาก ยกตวัอย่าง
ดงัตาราง สมมตใิหข้อ้มลูมจี านวนต าแหนง่พนัธกุรรมทัง้หมด
1000 ต าแหนง่
จ านวนต าแหน่งท่ีใชวิ้เคราะห์ จ านวนรปูแบบ
2 5 แสน
3 166 ลา้น
4 41 หมืน่ลา้น
การรวมผลการวิเคราะหแ์บบสองต าแหนง่
พนัธกุรรมเขา้ดว้ยกนัจะน าไปสูก่ารระบุ
อนัตรกิริยาระหว่างหลายต าแหนง่พนัธกุรรม
ที่ถกูตอ้งได้
วิธีการที่น าเสนอ
การตรวจจับอันตรกิริยาแบบอิพิสเตซิสบริสทุธ์ิระหว่างหลาย
ต าแหน่งพันธกุรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่
รวมผลการวิเคราะหอ์ันตรกิริยาระหว่างต าแหนง่พันธกุรรมสอง
ต าแหนง่
1. การวิเคราะหแ์บบสองต าแหนง่ (Two-Locus Analysis)
2. การรวมผลการวิเคราะหใ์นขอ้ 1 (Omnibus Permutation Test)
การทดสอบกบัแบบจ าลองอิพิสเตซิสบริสทุธ์ิ
เพ่ือทดสอบประสิทธิภาพกอ่นน าไปใชจ้ริง
• แบบจ าลองอิพิสเตซิสบริสทุธ์ิระหว่าง 2, 3 และ 4 ต าแหนง่
พนัธกุรรม ในกรณีศึกษาตา่งๆ
ผลการทดสอบ
• ตรวจจบัเคร่ืองหมายพนัธกุรรมทกุต าแหนง่ที่มอีนัตรกริิยาระหว่าง
กนั
• ผลบวกเท็จต า่ (Low False Positive)
การประยกุตใ์ชก้บัขอ้มลูโรคเบาหวานชนดิที่สอง
• ขอ้มลูรวบรวมโดย Wellcome Trust Case Control Consortium
(WTCCC) มขีอ้มลูทัง้หมด 500,568 เคร่ืองหมายพนัธกุรรม
• คัดเลือกเฉพาะยีนที่มีการศึกษามาก่อนหน้านี้ และยีนที่ ไม่มี
ความสมัพนัธก์บัโรคจากการวิเคราะหค์รัง้ละต าแหนง่ สดุทา้ยเหลือ
ขอ้มลูทัง้สิ้น 7,065 ต าแหนง่พนัธกุรรม
• แบ่งเป็นขอ้มลูผูป่้วย 1,999 คนและขอ้มลูคนปกต ิ3,004 คน
ตารางท่ี 1 ยีนและต าแหนง่พนัธกุรรมที่ตรวจจบั
ยนี ต าแหน่งพนัธกุรรม
PGM1 (phosphoglucomutase 1) (rs2269241,rs3790857)
(rs2269239,rs3790857)
(rs3790857,rs2269238)
LMX1A (LIM homeobox transcription factor
1, alpha)(rs2348250,rs6702087)
PARK2 (Parkinson disease (autosomal
recessive, juvenile)2, parkin)(rs1893551,rs6924502)
GYS2 (glycogen synthase 2 (liver)) (rs6487236,rs1871142)
(rs1871142,rs10770836)
ตารางท่ี 2 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ
รปูแบบพนัธกุรรมของยีน PGM1ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI
rs2269241 TT -- -- -- 0.9977 (0.9573–1.0399)
TC -- -- -- 1.0018 (0.9204–1.0905)
CC -- -- -- 1.0229 (0.7757–1.3488)
rs2269239 -- GG -- -- 0.9957 (0.9552–1.0379)
-- GC -- -- 1.0024 (0.9209–1.0910)
-- CC -- -- 1.0519 (0.8006–1.3822)
rs3790857 -- -- CC -- 0.9368 (0.8972–0.9782)
-- -- CT -- 1.1361 (1.0479–1.2316)
-- -- TT -- 0.9974 (0.7490–1.3281)
rs2269238 -- -- -- GG 0.9956 (0.9564–1.0364)
-- -- -- GT 1.0074 (0.9237–1.0988)
-- -- -- TT 1.0202 (0.7636–1.3631)
(rs2269241, rs3790857) TT -- CT -- 5.8858 (3.7730–9.1816)
(rs2269239, rs3790857) -- GG CT -- 6.2159 (3.9154–9.8681)
(rs3790857, rs2269238) -- -- CT GG 4.2936 (2.9340–6.2831)
ตารางท่ี 3 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ
รปูแบบพนัธกุรรมของยีน LMX1A
ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI
rs2348250 GG -- 0.9754 (0.9526–0.9987)
GA -- 1.1642 (1.0140–1.3366)
AA -- 0.9248 (0.3840–2.2271)
rs6702087 -- GG 1.0362 (1.0135–1.0594)
-- GC 0.7924 (0.6829–0.9193)
-- CC 0.9248 (0.3840–2.2271)
(rs2348250, rs6702087) GG GC 0.2918 (0.1814–0.4695)
GA GG 2.4355 (1.7644–3.3618)
ตารางท่ี 4 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ
รปูแบบพนัธกุรรมของยีน PARK2
ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI
rs1893551 GG -- 0.9398 (0.8873–0.9954)
GA -- 1.0695 (1.0008–1.1429)
AA -- 1.0313 (0.8581–1.2395)
rs6924502 -- TT 0.9937 (0.9380–1.0527)
-- TC 0.9917 (0.9267–1.0613)
-- CC 1.0682 (0.9009–1.2665)
(rs1893551, rs6924502) GA TT 5.0092 (3.1856–7.8767)
ตารางท่ี 5 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ
รปูแบบพนัธกุรรมของยีน GYS2
ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI
rs6487236 AA -- -- 0.9846 (0.9447–1.0262)
AG -- -- 1.0396 (0.9558–1.1308)
GG -- -- 0.9491 (0.7105–1.2679)
rs1871142 -- GG -- 0.9211 (0.8805–0.9634)
-- GA -- 1.1713 (1.0839–1.2657)
-- AA -- 0.9119 (0.6828–1.2180)
rs10770836 -- -- GG 0.9864 (0.9427–1.0321)
-- -- GA 1.0461 (0.9675–1.1310)
-- -- AA 0.8601 (0.6650–1.1126)
(rs6487236, rs1871142) AA GA -- 2.5463 (1.9135–3.3885)
(rs1871142, rs10770836) -- GA GG 2.7095 (2.0164–3.6408)
สรปุผลการวิจยั
• วิธีการที่น าเสนอสามารถตรวจจับอันตรกิริยาแบบอิพิสเตซิส
บริสทุธ์ิระหว่างหลายต าแหนง่พนัธกุรรม
• คน้พบหลักฐานเบ้ืองตน้เกี่ยวกับยีนที่อาจเกี่ยวขอ้งกับความเสี่ยง
ต่อการเกิดโรคเบาหวานชนิดที่สองของประชากรในสหราช
อาณาจกัร
ขอ้มลูเพิ่มเตมิ
กิตตกิรรมประกาศ
• นายวรัญญ ูวงษเ์สรี และนายธีระ พิรณุรัตน ์ไดร้ับทนุสนับสนนุ
จาก โครงการปริญญาเอกกาญจนาภเิษก
ส านกังานกองทนุสนบัสนนุการวิจยั
• นายแพทยช์นนิทร ์ลิ่มวงศ ์
ไดร้บัทนุสนบัสนนุจากมหาวิทยาลยัมหิดล
• รองศาสตราจารย ์ดร.ณชล ไชยรตันะ
ไดร้บัทนุสนบัสนนุจากส านกังานกองทนุสนบัสนนุการวิจยั