序列分析工具 :mddlogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

11
序序序序序序 :MDDLogo 961506 序序序 961524 序序序 指指指指 : 指指指 指指

Post on 19-Dec-2015

241 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

序列分析工具 :MDDLogo

961506 謝勝任961524 林宗慶

指導教授 : 李宗夷 教授

Page 2: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

動機 現今生物序列不斷被解碼,我們可以在各

個生物資料庫中抓到序列資訊 , 但生物序列資料量龐大,我們應先將其做簡易分群,方便後續觀查。

Page 3: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

目的 使用一種統計方式來將序列分群,並以網

頁方式呈現,使用者亦可下載 source code 使用。

Page 4: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

使用工具

• 1.Weblogo

• 2.CHI-square

Page 5: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

使用工具 (1)

• Weblogo :一個將序列圖像化的網站, 用其呈現分類後的 樹狀圖,方便使用 者觀查分類後序列 群的特性。

Page 6: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

使用工具 (2)

CHI-square 公式 :

• fi= 觀察次數• ei= 期望次數

k

i

k

i i

ii

i

ii

E

EO

e

ef

1 1

222

Page 7: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

使用工具 (2)

Page 8: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

分析流程• Step1:選擇分類特性,將各特性做成集合。• Step2:輸入序列長度、Central Position、Cluster Size。• Step3:輸入計算特徵分數方法(1.出現次數2.CHI-square)。• Step4:讀入FASTA格式的序列資料。• Step5:將序列依特性做CHI-square 計算,並得到序列各個位置

的分數。• Step6:在最高分的位置上,依選擇的特徵計算方式找出特徵集合。• Step7:將找出的位置和特徵集合當作分類依據來分類。• Step8:將分類後的序列儲存。• Step9:重覆step4~Step8 直到序列數量小於Cluster Size。 • Step10:程式結束。

Page 9: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

分析流程圖

Page 10: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

研究結果•

序列分類樹狀圖

分群內容

Page 11: 序列分析工具 :MDDLogo 961506 謝勝任 961524 林宗慶 指導教授 : 李宗夷 教授

網址• http://140.138.150.149/~s961524/MDD/creat

e.php