การรู้จ าแบบเชิงสถิติเพื่อ...

24
การร ู ้จาแบบเชิงสถิติเพื่อตรวจจับเครื่องหมาย พันธุกรรมที่สัมพันธ์กับโรคพันธุกรรมซับซ้อน อาจารย์ที่ปรึกษา รศ.ดร.ณชล ไชยรัตนะ นักศึกษา คปก.นายวรัญญู วงษ์เสรี ภาควิชาวิศวกรรมไฟฟ้ า คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ

Upload: others

Post on 14-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

การร ูจ้ าแบบเชิงสถิติเพ่ือตรวจจบัเครือ่งหมาย

พนัธกุรรมท่ีสมัพนัธก์บัโรคพนัธกุรรมซบัซอ้น

อาจารยท์ี่ปรึกษา รศ.ดร.ณชล ไชยรตันะ

นกัศึกษา คปก.นายวรญัญ ู วงษเ์สรี

ภาควิชาวิศวกรรมไฟฟ้า คณะวิศวกรรมศาสตร์

มหาวิทยาลยัเทคโนโลยีพระจอมเกลา้พระนครเหนอื

Page 2: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ความร่วมมือ

หนว่นอณพูนัธศุาสตร ์สถานส่งเสริมการวิจยั

คณะแพทยศาสตรศิ์ริราชพยาบาล

มหาวิทยาลยัมหิดล

Page 3: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

เนือ้หา

• บทน า

• อิพิสเตซิสบริสทุธ์ิ

• วิธีการท่ีน าเสนอ

• การทดสอบกบัแบบจ าลองอิพิสเตซิสบริสทุธ์ิ

• การประยกุตใ์ชก้บัขอ้มลูโรคเบาหวานชนดิที่สอง

• สรปุผลการวิจยั

Page 4: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

บทน า

โรคซับซอ้น หมายถึงโรคที่เกิดจากอันตรกิริยา (Interaction)

ระหว่างยีนกบัยีน หรือยีนกับสิ่งแวดลอ้มยกตวัอย่างเช่น หอบหืด

มะเร็ง เบาหวาน ความดนัสงูและโรคอว้น เป็นตน้

Page 5: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

บทน า

ต าแหนง่พนัธกุรรม (Locus) ของยีนบนโครโมโซมคู่หนึง่ๆ จะมี

รปูแบบของยีนหรืออลัลีล (Allele) ที่แตกตา่งกนัได ้โดยทัว่ไปยีนแต่

ละต าแหนง่พนัธกุรรมจะม ี2 อลัลีล

Page 6: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)

หมายถึงอันตรกิริยาระหว่าง

เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่

สามารถตรวจจับด้วย วิธีการ

วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่

แต่การวิ เคราะห์แบบสอง

ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง

พันธกุรรมนั้นไดร้ับการพิสจูนว์่า

เป็นวิธีท่ีสามารถตรวจจับอันตร

กิริยาแบบนีไ้ด ้

Page 7: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)

หมายถึงอันตรกิริยาระหว่าง

เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่

สามารถตรวจจับด้วย วิธีการ

วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่

แต่การวิ เคราะห์แบบสอง

ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง

พันธกุรรมนั้นไดร้ับการพิสจูนว์่า

เป็นวิธีท่ีสามารถตรวจจับอันตร

กิริยาแบบนีไ้ด ้

Page 8: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)

หมายถึงอันตรกิริยาระหว่าง

เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่

สามารถตรวจจับด้วย วิธีการ

วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่

แต่การวิ เคราะห์แบบสอง

ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง

พันธกุรรมนั้นไดร้ับการพิสจูนว์่า

เป็นวิธีท่ีสามารถตรวจจับอันตร

กิริยาแบบนีไ้ด ้

Page 9: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)

หมายถึงอันตรกิริยาระหว่าง

เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่

สามารถตรวจจับด้วย วิธีการ

วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่

แต่การวิ เคราะห์แบบสอง

ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง

พันธกุรรมนั้นไดร้ับการพิสจูนว์่า

เป็นวิธีท่ีสามารถตรวจจับอันตร

กิริยาแบบนีไ้ด ้

Page 10: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

อิพิสเตซิสบริสทุธ์ิ (Pure Epistasis)

หมายถึงอันตรกิริยาระหว่าง

เ ค ร่ื อ งหม ายพั นธุก ร รม ท่ี ไ ม่

สามารถตรวจจับด้วย วิธีการ

วิเคราะหแ์บบครัง้ละหนึง่ต าแหนง่

แต่การวิ เคราะห์แบบสอง

ต า แ ห น่ ง แ ล ะ ห ล า ยต า แ ห น่ ง

พันธกุรรมนั้นไดร้ับการพิสจูนว์่า

เป็นวิธีท่ีสามารถตรวจจับอันตร

กิริยาแบบนีไ้ด ้

Page 11: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ขอ้จ ากดัของการวิเคราะหแ์บบหลายต าแหนง่

คือ ตอ้งอาศัยการค านวณอย่างมาก

จึงมขีอ้จ ากดัส าหรบัปัญหาท่ีมขีอ้มลูจ านวนมาก ยกตวัอย่าง

ดงัตาราง สมมตใิหข้อ้มลูมจี านวนต าแหนง่พนัธกุรรมทัง้หมด

1000 ต าแหนง่

จ านวนต าแหน่งท่ีใชวิ้เคราะห์ จ านวนรปูแบบ

2 5 แสน

3 166 ลา้น

4 41 หมืน่ลา้น

Page 12: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

การรวมผลการวิเคราะหแ์บบสองต าแหนง่

พนัธกุรรมเขา้ดว้ยกนัจะน าไปสูก่ารระบุ

อนัตรกิริยาระหว่างหลายต าแหนง่พนัธกุรรม

ที่ถกูตอ้งได้

Page 13: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

วิธีการที่น าเสนอ

การตรวจจับอันตรกิริยาแบบอิพิสเตซิสบริสทุธ์ิระหว่างหลาย

ต าแหน่งพันธกุรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่

รวมผลการวิเคราะหอ์ันตรกิริยาระหว่างต าแหนง่พันธกุรรมสอง

ต าแหนง่

1. การวิเคราะหแ์บบสองต าแหนง่ (Two-Locus Analysis)

2. การรวมผลการวิเคราะหใ์นขอ้ 1 (Omnibus Permutation Test)

Page 14: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

การทดสอบกบัแบบจ าลองอิพิสเตซิสบริสทุธ์ิ

เพ่ือทดสอบประสิทธิภาพกอ่นน าไปใชจ้ริง

• แบบจ าลองอิพิสเตซิสบริสทุธ์ิระหว่าง 2, 3 และ 4 ต าแหนง่

พนัธกุรรม ในกรณีศึกษาตา่งๆ

ผลการทดสอบ

• ตรวจจบัเคร่ืองหมายพนัธกุรรมทกุต าแหนง่ที่มอีนัตรกริิยาระหว่าง

กนั

• ผลบวกเท็จต า่ (Low False Positive)

Page 15: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

การประยกุตใ์ชก้บัขอ้มลูโรคเบาหวานชนดิที่สอง

• ขอ้มลูรวบรวมโดย Wellcome Trust Case Control Consortium

(WTCCC) มขีอ้มลูทัง้หมด 500,568 เคร่ืองหมายพนัธกุรรม

• คัดเลือกเฉพาะยีนที่มีการศึกษามาก่อนหน้านี้ และยีนที่ ไม่มี

ความสมัพนัธก์บัโรคจากการวิเคราะหค์รัง้ละต าแหนง่ สดุทา้ยเหลือ

ขอ้มลูทัง้สิ้น 7,065 ต าแหนง่พนัธกุรรม

• แบ่งเป็นขอ้มลูผูป่้วย 1,999 คนและขอ้มลูคนปกต ิ3,004 คน

Page 16: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ตารางท่ี 1 ยีนและต าแหนง่พนัธกุรรมที่ตรวจจบั

ยนี ต าแหน่งพนัธกุรรม

PGM1 (phosphoglucomutase 1) (rs2269241,rs3790857)

(rs2269239,rs3790857)

(rs3790857,rs2269238)

LMX1A (LIM homeobox transcription factor

1, alpha)(rs2348250,rs6702087)

PARK2 (Parkinson disease (autosomal

recessive, juvenile)2, parkin)(rs1893551,rs6924502)

GYS2 (glycogen synthase 2 (liver)) (rs6487236,rs1871142)

(rs1871142,rs10770836)

Page 17: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ตารางท่ี 2 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ

รปูแบบพนัธกุรรมของยีน PGM1ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI

rs2269241 TT -- -- -- 0.9977 (0.9573–1.0399)

TC -- -- -- 1.0018 (0.9204–1.0905)

CC -- -- -- 1.0229 (0.7757–1.3488)

rs2269239 -- GG -- -- 0.9957 (0.9552–1.0379)

-- GC -- -- 1.0024 (0.9209–1.0910)

-- CC -- -- 1.0519 (0.8006–1.3822)

rs3790857 -- -- CC -- 0.9368 (0.8972–0.9782)

-- -- CT -- 1.1361 (1.0479–1.2316)

-- -- TT -- 0.9974 (0.7490–1.3281)

rs2269238 -- -- -- GG 0.9956 (0.9564–1.0364)

-- -- -- GT 1.0074 (0.9237–1.0988)

-- -- -- TT 1.0202 (0.7636–1.3631)

(rs2269241, rs3790857) TT -- CT -- 5.8858 (3.7730–9.1816)

(rs2269239, rs3790857) -- GG CT -- 6.2159 (3.9154–9.8681)

(rs3790857, rs2269238) -- -- CT GG 4.2936 (2.9340–6.2831)

Page 18: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ตารางท่ี 3 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ

รปูแบบพนัธกุรรมของยีน LMX1A

ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI

rs2348250 GG -- 0.9754 (0.9526–0.9987)

GA -- 1.1642 (1.0140–1.3366)

AA -- 0.9248 (0.3840–2.2271)

rs6702087 -- GG 1.0362 (1.0135–1.0594)

-- GC 0.7924 (0.6829–0.9193)

-- CC 0.9248 (0.3840–2.2271)

(rs2348250, rs6702087) GG GC 0.2918 (0.1814–0.4695)

GA GG 2.4355 (1.7644–3.3618)

Page 19: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ตารางท่ี 4 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ

รปูแบบพนัธกุรรมของยีน PARK2

ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI

rs1893551 GG -- 0.9398 (0.8873–0.9954)

GA -- 1.0695 (1.0008–1.1429)

AA -- 1.0313 (0.8581–1.2395)

rs6924502 -- TT 0.9937 (0.9380–1.0527)

-- TC 0.9917 (0.9267–1.0613)

-- CC 1.0682 (0.9009–1.2665)

(rs1893551, rs6924502) GA TT 5.0092 (3.1856–7.8767)

Page 20: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ตารางท่ี 5 ความเสี่ยงสมัพทัธเ์ชงิพนัธกุรรมของแตล่ะ

รปูแบบพนัธกุรรมของยีน GYS2

ต าแหน่งพนัธกุรรม รปูแบบพนัธกุรรม ความเส่ียงสมัพทัธ์ 95% CI

rs6487236 AA -- -- 0.9846 (0.9447–1.0262)

AG -- -- 1.0396 (0.9558–1.1308)

GG -- -- 0.9491 (0.7105–1.2679)

rs1871142 -- GG -- 0.9211 (0.8805–0.9634)

-- GA -- 1.1713 (1.0839–1.2657)

-- AA -- 0.9119 (0.6828–1.2180)

rs10770836 -- -- GG 0.9864 (0.9427–1.0321)

-- -- GA 1.0461 (0.9675–1.1310)

-- -- AA 0.8601 (0.6650–1.1126)

(rs6487236, rs1871142) AA GA -- 2.5463 (1.9135–3.3885)

(rs1871142, rs10770836) -- GA GG 2.7095 (2.0164–3.6408)

Page 21: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

สรปุผลการวิจยั

• วิธีการที่น าเสนอสามารถตรวจจับอันตรกิริยาแบบอิพิสเตซิส

บริสทุธ์ิระหว่างหลายต าแหนง่พนัธกุรรม

• คน้พบหลักฐานเบ้ืองตน้เกี่ยวกับยีนที่อาจเกี่ยวขอ้งกับความเสี่ยง

ต่อการเกิดโรคเบาหวานชนิดที่สองของประชากรในสหราช

อาณาจกัร

Page 22: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

ขอ้มลูเพิ่มเตมิ

Page 23: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ

กิตตกิรรมประกาศ

• นายวรัญญ ูวงษเ์สรี และนายธีระ พิรณุรัตน ์ไดร้ับทนุสนับสนนุ

จาก โครงการปริญญาเอกกาญจนาภเิษก

ส านกังานกองทนุสนบัสนนุการวิจยั

• นายแพทยช์นนิทร ์ลิ่มวงศ ์

ไดร้บัทนุสนบัสนนุจากมหาวิทยาลยัมหิดล

• รองศาสตราจารย ์ดร.ณชล ไชยรตันะ

ไดร้บัทนุสนบัสนนุจากส านกังานกองทนุสนบัสนนุการวิจยั

Page 24: การรู้จ าแบบเชิงสถิติเพื่อ ...rgj.trf.or.th/download/02-04-2010-Waranyu-Wongseree.pdfการร จ าแบบเช งสถ