数据来源: ddbj 统计截止日期: 2000 年 10 月 23 日

17
数数数数DDBJ 数数数数数2000 数 10 数 23 数 数数 •数数数数数数 数数数•数数数数数数数数“ CHINA” 数数数数 数数 数数数数数数数数数数数数 数数数 ,,, 数数数数数“ PROC”

Upload: chesmu

Post on 13-Jan-2016

79 views

Category:

Documents


3 download

DESCRIPTION

说明. 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日. 香港没有全部统计在内; 如果提交者没有写 “ CHINA ” ,则无法统计,但这种估计这种情况极少,只发现一条记录写了 “ PROC ” 。. 概况 ( 非 EST 部分 ). 序列总数: 6522 序列总长度: 37492880 平均序列长度: 5748 最长: 266941( 台湾 ) 209216( 上海 ). 序列数 --- 地区分布. 台湾. 云南. 18%. 8%. 广东. 5%. 其他. 上海. 16%. 25%. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

数据来源: DDBJ统计截止日期: 2000 年 10 月 23 日

说明

•香港没有全部统计在内;•如果提交者没有写“ CHINA”,则无法统计,但这种估计这种情况极少,只发现一条记录写了“ PROC”。

Page 2: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

序列总数: 6522序列总长度: 37492880

平均序列长度: 5748最长: 266941( 台湾 ) 209216( 上海 )

概况 (非 EST 部分 )

Page 3: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

北京28%

台湾18%

云南8%广东5%

其他16%

上海25%

地区 序列数 %北京 1815 27.83%上海 1601 24.55%台湾 1193 18.29%云南 536 8.22%广东 340 5.21%其他 1037 15.90%

总计 6522 100%

地区 序列数 %江苏 250 24.11%湖北 247 23.82%陕西 122 11.76%湖南 76 7.33%浙江 68 6.56%青海 58 5.59%山东 56 5.40%福建 45 4.34%四川 37 3.57%甘肃 21 2.03%吉林 11 1.06%黑龙江 10 0.96%安徽 8 0.77%辽宁 6 0.58%河北 5 0.48%河南 5 0.48%重庆 3 0.29%江西 2 0.19%海南 2 0.19%天津 2 0.19%广西 2 0.19%香港 1 0.10%

总计 1037 100%

序列数 --- 地区分布

Page 4: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

北京15%

上海35%

台湾45%

云南1%

广东1%

其他3%

地区 序列长度 %北京 5778285 15.41%上海 13030948 34.76%台湾 16952737 45.22%云南 336185 0.90%广东 291668 0.78%其他 1103057 2.94%

总计 37492880 100%

地区 序列长度 %江苏 152784 13.85%

湖北 285134 25.85%

陕西 79368 7.20%

湖南 117362 10.64%

浙江 99621 9.03%

青海 68137 6.18%

山东 30613 2.78%

福建 42430 3.85%

四川 52786 4.79%

甘肃 16765 1.52%

吉林 3356 0.30%

黑龙江 16630 1.51%

安徽 90217 8.18%

辽宁 9001 0.82%

河北 5981 0.54%

河南 3579 0.32%

重庆 2798 0.25%

江西 7823 0.71%

海南 2156 0.20%

天津 1777 0.16%

广西 897 0.08%

香港 13842 1.25%

总计 1103057 100%

序列长度 --- 地区分布

Page 5: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

最长的序列

AF165124 195909 bp human.Homo sapiens chromosome 5q31.1-q33.1 clone BAC djn082c10 containing GABRG2 gene, complete sequence.Jiang,S., Yu,J., He,L. and Yang,H.Submitted (02-JUL-1999) Human Genome Center, Institute of Genetics, Chinese Academy of Sciences, Datun Road, Beijing 100101, People's Republic of China

AF190464 209216 bp human.Homo sapiens hepatocytic transcription factor (B1F) gene, alternatively spliced products, complete cds, complete sequence.Lin,W., Fu,G., Dong,H. and Huang,G.M.Submitted (26-SEP-1999) Chinese Human Genome Center at Shanghai, 351 Guoshoujing Road, Zhangjiang Hi-Tech Park, Shanghai 201203, People's Republic of ChinaWang,Y., Zhang,C. and Cai,Y.Submitted (26-SEP-1999) Research Group of Hepatitis Viruses, Shanghai Institute of Biochemistry, Chinese Academy of Science, 320 Yueyang Road, Shanghai 200031, People's Republic of China

AF213884S2 266941 bp human. Homo sapiens mannosidase, beta A, lysosomal (MANBA) gene, and ubiquitin-conjugating enzyme E2D 3 (UBE2D3) genes, complete cds.Chang,H.-M. and Tsai,S.-F.Submitted (09-DEC-1999) Institute of Genetics, National Yang-Ming University, 155 Li-Rong St. Section 2, Peitou, Taipei, Taiwan 11221, Republic of China

Page 6: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

最长的序列

Page 7: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

0

2000

4000

6000

8000

10000

12000

14000

16000

台湾

香港

安徽

上海

江西

北京

黑龙江

湖南

辽宁

浙江

四川

河北

青海湖北

海南

福建

重庆

天津

广东

甘肃

河南

陕西

云南

江苏

山东

广西

吉林

地区 平均长度 嘴长 最短台湾 14210 266941 92

香港 13842 13842 13842

安徽 11277 80009 458

上海 8139 209216 50

江西 3912 7388 435

北京 3184 195909 60

黑龙江 1663 3188 467

湖南 1544 13615 96

辽宁 1500 2470 983

浙江 1465 6395 198

四川 1427 9832 321

河北 1196 1422 305

青海 1175 1383 611

湖北 1154 12310 94

海南 1078 1385 771

福建 943 4306 51

重庆 933 1763 218

天津 889 1561 216

广东 858 9435 46

甘肃 798 1162 378

河南 716 1449 440

陕西 651 5829 105

云南 627 1563 93

江苏 611 4539 123

山东 547 1890 288

广西 449 456 441

吉林 305 510 94

地区 平均长度 嘴长 最短台湾 14210 266941 92

香港 13842 13842 13842

安徽 11277 80009 458

上海 8139 209216 50

江西 3912 7388 435

北京 3184 195909 60

黑龙江 1663 3188 467

湖南 1544 13615 96

辽宁 1500 2470 983

浙江 1465 6395 198

四川 1427 9832 321

河北 1196 1422 305

青海 1175 1383 611

湖北 1154 12310 94

海南 1078 1385 771

福建 943 4306 51

重庆 933 1763 218

天津 889 1561 216

广东 858 9435 46

甘肃 798 1162 378

河南 716 1449 440

陕西 651 5829 105

云南 627 1563 93

江苏 611 4539 123

山东 547 1890 288

广西 449 456 441

吉林 305 510 94

序列平均长度 --- 地区分布

Page 8: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

0

100

200

300

400

500

600

700

0 | 100 | 200 | 300 | 400 | 500 | 600 | 700 | 800 | 900 | 1K

序列长度 --- 正态分布

0

20

40

60

80

100

120

10K | 50K | 100K | 150K | 200K | 250K | 300K

0

500

1000

1500

2000

2500

1K | 2K | 3K | 4K | 5K | 10K

0- 1K

10- 300K

1K- 10K

Page 9: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

序列数 --- 年代分布

0

500

1000

1500

2000

2500

3000

3500

90 91 92 93 94 95 96 97 98 99 00

Page 10: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

序列长度 --- 年代分布

0

5,000,000

10,000,000

15,000,000

20,000,000

25,000,000

30,000,000

35,000,000

40,000,000

90 91 92 93 94 95 96 97 98 99 00

Page 11: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

最早提交者

KPNIFJG 720 bp DNA BCT 11-MAY-1992K.pneumoniae nifJ gene promoter and partial sequence of nifJ gene.Submitted (28-AUG-1989) to the EMBL/GenBank/DDBJ databases. S.C. Shen, Y. Wu, G. Yu and J. Zhu, SHANGHAI INSTITUTE OF PLANT PHYSIOLOGY, ACCADEMICA SINICA, 300 FONGLIN ROAD, SHANGHAI 200032, P.R. CHINA

KPNIFJG 720 bp DNA BCT 11-MAY-1992K.pneumoniae nifJ gene promoter and partial sequence of nifJ gene.Submitted (28-AUG-1989) to the EMBL/GenBank/DDBJ databases. S.C. Shen, Y. Wu, G. Yu and J. Zhu, SHANGHAI INSTITUTE OF PLANT PHYSIOLOGY, ACCADEMICA SINICA, 300 FONGLIN ROAD, SHANGHAI 200032, P.R. CHINA

ZMACCR11 4150 bp DNA PLN 02-OCT-1990Maize DNA for cryptic Ac-11 sequence.Submitted (22-FEB-1990) to the EMBL/GenBank/DDBJ databases. Chen J., Institute of Molecular Biology, Academia Sinica Taiwan, Republic of China

ZMACCR11 4150 bp DNA PLN 02-OCT-1990Maize DNA for cryptic Ac-11 sequence.Submitted (22-FEB-1990) to the EMBL/GenBank/DDBJ databases. Chen J., Institute of Molecular Biology, Academia Sinica Taiwan, Republic of China

BSPGIB 1866 bp DNA BCT 20-APR-1995Bacillus stearothermophilus pgiB gene for phosphoglucose isomerase isoenzyme B (EC 5.3.1.9).Submitted (25-SEP-1989) to the EMBL/GenBank/DDBJ databases. Tao W., Institute of Genetics , Fu

dan University , Shanghai, People's Republic of China

BSPGIB 1866 bp DNA BCT 20-APR-1995Bacillus stearothermophilus pgiB gene for phosphoglucose isomerase isoenzyme B (EC 5.3.1.9).Submitted (25-SEP-1989) to the EMBL/GenBank/DDBJ databases. Tao W., Institute of Genetics , Fu

dan University , Shanghai, People's Republic of China

POVVHA 1458 bp DNA VRL 26-MAY-1995Vaccinia virus gene for viral hemagglutinin.Submitted (30-JUN-1989) to the EMBL/GenBank/DDBJ databases. D.Y.Jin, Institute of Virology, Chinese Academy of Preventive Medicine, 100 Yingxin Street, Beijing 1000 52, Peoples Republic of China

POVVHA 1458 bp DNA VRL 26-MAY-1995Vaccinia virus gene for viral hemagglutinin.Submitted (30-JUN-1989) to the EMBL/GenBank/DDBJ databases. D.Y.Jin, Institute of Virology, Chinese Academy of Preventive Medicine, 100 Yingxin Street, Beijing 1000 52, Peoples Republic of China

DMLAMB2 4482 bp RNA INV 29-APR-1991Drosophila mRNA for laminin B2 chain.Submitted (03-JUN-1988) to the EMBL/GenBank/DDBJ databases. Chi H.C., Institute of Molecular

Biology, Academia Sinica, Nankang, Taipei 11529, Republic of China

DMLAMB2 4482 bp RNA INV 29-APR-1991Drosophila mRNA for laminin B2 chain.Submitted (03-JUN-1988) to the EMBL/GenBank/DDBJ databases. Chi H.C., Institute of Molecular

Biology, Academia Sinica, Nankang, Taipei 11529, Republic of China

Page 12: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

序列数 --- 分类

30%

22%14%

8%

6%

5%4%4%3%

3%

HUM PLN VRL VRT BCT INV MAM PRI HTG

ROD SYN STS GSS UNA PHG

分类 序列数HUM 1894PLN 1452VRL 923VRT 501BCT 374INV 347MAM 282PRI 276HTG 207ROD 169SYN 35STS 31GSS 15UNA 14PHG 2

分类 序列数HUM 1894PLN 1452VRL 923VRT 501BCT 374INV 347MAM 282PRI 276HTG 207ROD 169SYN 35STS 31GSS 15UNA 14PHG 2

Page 13: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

序列长度 --- 分类

16%

6%3%1%2%1%1%

70%

HUM PLN VRL VRT BCT

INV MAM PRI HTG ROD

SYN STS GSS UNA PHG

分类 序列长度 平均长度HUM 5797511 3061PLN 2359111 1625VRL 1195657 1295VRT 552411 1103BCT 597527 1598INV 384550 1108MAM 251173 891PRI 132028 478HTG 25995943 125584ROD 173112 1024SYN 32919 941STS 5861 189GSS 8251 550UNA 2911 208PHG 3915 1958

分类 序列长度 平均长度HUM 5797511 3061PLN 2359111 1625VRL 1195657 1295VRT 552411 1103BCT 597527 1598INV 384550 1108MAM 251173 891PRI 132028 478HTG 25995943 125584ROD 173112 1024SYN 32919 941STS 5861 189GSS 8251 550UNA 2911 208PHG 3915 1958

Page 14: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日
Page 15: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日
Page 16: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

概况 (EST 部分 )

总数 : 103026总长度: 53363155

其中:南方中心于 2000 年 9月提交 EST 序列 100218 条,总长度: 52358070 bp 分别占 97.27% 和 98.12% 。 其平均长度为 522 bp

Page 17: 数据来源: DDBJ 统计截止日期: 2000 年 10 月 23 日

除南方中心的 103026 条 EST 外:

地区 序列数 % 序列总长度 %北京 1724 61.40% 541011 53.83%

上海 907 32.30% 392639 39.07%

陕西 78 2.78% 34654 3.45%

湖南 37 1.32% 7927 0.79%

广东 27 0.96% 13047 1.30%

浙江 13 0.46% 6619 0.66%

重庆 7 0.25% 4271 0.42%

天津 6 0.21% 2316 0.23%

海南 4 0.14% 1378 0.14%

黑龙江 3 0.11% 780 0.08%

吉林 2 0.07% 443 0.04%

平均长度: 358 bp