drosophila solexa tag analysis 2/25
DESCRIPTION
Drosophila solexa Tag analysis 2/25. ahsan. 論点. 転写開始点の修正 転写開始点は1つでなく、分布する 分布の定量化とグループ分け 発現量の定量化 広いダイナミックレンジ Differential display young vs old, male vs female 進化的な保存度と発現量の関係. タグの統計 ゲノム上での位置. 前回は N が入っているタグを除いてアラインメントした。 今回は、 3 回まで N が含まれている 5endTag も入れて再びアラインメントした. 転写開始点. 正規分布に近い分布. - PowerPoint PPT PresentationTRANSCRIPT
Drosophila solexa Tag analysis 2/25
ahsan
論点
• 転写開始点の修正転写開始点は1つでなく、分布する分布の定量化とグループ分け
• 発現量の定量化 広いダイナミックレンジ
• Differential displayyoung vs old, male vs female
• 進化的な保存度と発現量の関係
タグの統計 ゲノム上での位置
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
fly1 fly2 fly3 fly4 fly5 fly6 fly7
loci expressionNumber flyゲノム上の位置で非冗長に分類した場合
冗長を許したタグ
数
YM 530,040 3,526,38
0
S2 322,442 3,895,95
5
OF 574,849 3,523,16
9
OM 488,094 3,661,54
2
YF 337,835 2,587,12
9
Em 286,983 3,123,72
3
Larva 249,438 3,148,53
2
前回は N が入っているタグを除いてアラインメントした。
今回は、 3 回まで N が含まれている 5endTag も入れて再びアラインメントした .
転写開始点
FBtr0078010 gene in Young Male
FBtr0077965 gene in Young Male
正規分布に近い分布
単一のピークをとる分布
FBtr0077965 gene in all stage
一様に分布して場合
転写開始点の転写の分布
正規分布 % 一様分布 %
YM 4471 32.7 2732 19.9
S2 3776 27.6 1665 12.1
OF 4321 31.6 2150 15.7
OM 4456 32.6 2568 18.7
YF 4689 34.3 1752 12.8
Em 4573 33.4 1801 13.1
La 4080 29.8 1768 12.9
代表的な転写開始点
• 5UTR 領域の上流 500bp 以下から翻訳開始点( TIS) の間に転写産物の中、最大の転写量を持つ点を代表的な転写開始点と定義する。
代表転写開始点従来の TSS と
一致する
一致しないが -500bp ~TIS に存在す
る
遺伝子の総数に占める カラム1+2の割合
(%)
1,133 7,784 65
508 6,268 50
761 7,118 58
1,033 7,664 64
804 7,325 60
863 7,112 58
844 6,698 55
遺伝子の総数 13 , 662
高い再現性 広いダイナミックレンジ
同じ Young Femaleデータを2回取ったときの再現性
Young Female( solexa Read1)
Young Female( solexa Read2)
Differential display の考え方
YM(1)
OF(3)YF(5)
OM(4)
YMvOM
OMvOF
YFvOF
YMvYF
YM: young MaleYF: young FemaleOM: old MaleOF: old Female
YoungFemale と Old Female の比較
ゲノム上の各位置で厳密にグループ分け
YMvOM
OMvOF
YFvOF
YMvYF
• ゲノム上の各位置にアラインメントされたタグ数を比較
• 最も厳密なタグの比較方法• 遺伝子領域でグルーピングはしていない• ちょっと厳しすぎるかもしれないので、次に遺伝
子領域でグルーピングした結果を示す
遺伝子領域の定義
Exon1 Exon2+500bp
Tag
Tag TagTag
5’End 3’End
Tag
Tag
Tag
代表的な転写開始点
Flybase の遺伝子の転写開始点より 500bp 以下の上流領域から終止コドンまでを遺伝子領域とする。
この領域に存在する遺伝子と同じ向きの 5endtag をその遺伝子の由来とする。
YoungFemale と Old Female の比較
遺伝子によるグルーピングYMvOM
OMvOF
YFvOF
YMvYF
• 遺伝子領域でグルーピングした結果• 相関は多少上昇している
タンパク質コード領域( CDS) の定義
Exon1 Exon2+500bp
Tag
Tag TagTag
5’End3’End
Tag
Flybase の遺伝子の翻訳開始点 (TIS) より終止コドンまでの翻訳領域を CDS 領域とする。
この領域に存在する遺伝子と同じ向きの 5endtag をその遺伝子の由来とする。
TIS
CDS region
YoungFemale と Old Female の比較
CDS によるグルーピングYMvOM
OMvOF
YFvOF
YMvYF
タンパク質コード領域( CDS) でのグルーピング
非翻訳領域( UTR) の定義
Exon1 Exon2+500bp
Tag
Tag TagTag
5’End3’End
Tag
Flybase の遺伝子の転写開始点 (TSS) より 500bp 以下の上流領域から翻訳開始点( TIS) までを UTR 領域とする。
この領域に存在する遺伝子と同じ向きの 5endtag をその遺伝子の由来とする。
TSS TIS
UTR region
YoungFemale と Old Female の比較
UTR によるグルーピングYMvOM
OMvOF
YFvOF
YMvYF
異なる組織での遺伝子発現量の統計的検定(比率検定)
1 2
1 2
1 11
p p
p p n n
Z
1 2 1 2p r r n n
比率検定によって、優位差がある遺伝子を選ぶ
r1: transcription number of gene “A” in Sample 1 n1: total transcripts in sample 1r2: transcription number of gene “A” in Sample 2n2: total transcripts in sample2
Young Female と Old Female で発現に顕著な違いのある遺伝子
FlybaseTrID YFexp OFexp
ショウジョウバエの 12 種に保存された遺伝子と発現量
FlybaseTrID CDS(bp) 12 種に保存 YM OMOF YF
Aigaki sensei
Sense – anti sense cluster
Internal Exon Vs Tag and codon usage
Monday: 13:00~15:00