第九章 核酸序列的其他分析方法
DESCRIPTION
生物信息学. 第九章 核酸序列的其他分析方法. 1. 确定 DNA 序列的分子量和碱基组成. 分子量( molecular weight ). 单链 DNA ( single strand DNA , ssDNA ) 双链 DNA ( double strand DNA , dsDNA ). 碱基组成( composition ). 各种碱基数量 各种碱基比例. 分析举例. 下载 BioEdit 分析工具 http://www.mbio.ncsu.edu/BioEdit/bioedit.html. 在本地计算机上利用 BioEdit 工具进行分析. - PowerPoint PPT PresentationTRANSCRIPT
第九章
核酸序列的其他分析方法
生物信息学
1. 确定 DNA 序列的分子量和碱基组成
分子量( molecular weight ) 单链 DNA ( single strand DNA , ssDNA ) 双链 DNA ( double strand DNA , dsDNA )
碱基组成( composition ) 各种碱基数量 各种碱基比例
分析举例
下载 BioEdit 分析工具 http://www.mbio.ncsu.edu/BioEdit/bioedit.html
在本地计算机上利用 BioEdit工具进行分析
拷贝 fasta 格式的序列,在 BioEdit 分析工具的“ File”栏目选择“ New from Clipboard” 输入序列
选择被粘贴序列的名称,在“ Sequence” 栏目点击“ Nucleic Acid→Nucleotide Composition”
文字分析结果和图形结果
2. 序列变换
AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCAC 原始 DNA 序列
TTTTTACCGGTACCCAGGTGTGCGTCACTCTACTTACGATCTAGAGTG
互补序列( complement
)CACTCTAGATCGTAAGTAGAGTGACGCACACCTGGGTACCGGTAAAAA
反向序列( reverse
)
GTGAGATCTAGCATTCATCTCACTGCGTGTGGACCCATGGCCATTTTT
反向互补序列( reverse compleme
nt)
AAAAAUGGCCAUGGGUCCACACGCAGUGAGAUGAAUGCUAGAUCUCAC
RNA 序列
DNA - DNA 序列之间变换 DNA - RNA 序列之间变换
分析举例
在本地计算机上利用 BioEdit 工具进行分析
拷贝 fasta 格式的序列,在 BioEdit 分析工具的“ File”栏目选择“ New from Clipboard” 输入序列
选择被粘贴序列的名称,在“ Sequence” 栏目点击“ Nucleic Acid→Complement” 获得互补序列、“ Nucleic Acid→Reverse Complement” 获得反向互补序列、“ Nucleic Acid→DNA-RNA”获得 RNA 序列
在“ Edit” 栏目选择“ Copy Sequence to clipboard (Fasta Format)” 将获得的序列粘贴到另一个文件
DNA -蛋白质序列之间变换
AAAAATGGCCATGGGTCCACACGCAGTGAGATGAATGCTAGATCTCACGAG K N G H G S T R S E M N A R S H E
阅读框 1K M A M G P H A V R * M L D L T R阅读框 2K W P W V H T Q * D E C * I S R阅读框 3
http://www.ncbi.nlm.nih.gov/projects/gorf/
确定开放读码框( ORF )
ORF finder
输入序列或注册号,选择密码表
显示结果,进行选择
翻译为蛋白质
序列比对、更改显示格式
分析方法-翻译全长 DNA 序列(举例 1 )
在本地计算机上利用 BioEdit 工具进行分析
拷贝 fasta 格式的序列,在 BioEdit 分析工具的“ File”栏目选择“ New from Clipboard” 输入序列
选择被粘贴序列的名称,在“ Sequence” 栏目点击“ Nucleic Acid→Translate →Frame 1” 获得氨基酸序列
分析结果
分析方法-翻译选择的 DNA 序列区段(举例 2 )
在 SRS 检索主页( http://srs.ebi.ac.uk)点击“ Tools”
在 Tools网页选择“ Nucleic Tools→Nucleic Translati
on →ShowseqN” ,点击“ Launch”
在 ShowseqN网页粘贴序列,选择阅读框和密码表类型,确定翻译区域
分析结果
3. 分析限制性内切酶切割位点
展示 DNA 序列的酶切位点图 分离克隆基因或特定的 DNA 片段 分子标记,如 CAPS ( cleaved amplified polymorphis
m sequence )标记
可选择限制性内切酶
Restriction Map and MCS of pEGFP-N1 Vector
分析方法 1 (举例)
在本地计算机上利用 BioEdit 工具进行分析
拷贝 fasta 格式的序列,在 BioEdit 分析工具的“ File”栏目选择“ New from Clipboard” 输入序列
选择被粘贴序列的名称,在“ Sequence” 栏目点击“ Nucleic Acid→Restriction Map”
分析结果
在“ Create Restriction Map” 页面中选择限制性内切酶种类、选择阅读框等后点击“ Generate Map”
分析方法 2 (举例)
利用在线分析工具 NEBcutter进行分析
输入序列或注册号,或调取载体序列,选择酶和显示方式
显示结果
具体描述
其它分析限制性内切酶切割位点软件
EnzymeX
http://www.mekentosj.com/science/enzymex
RestrictionMapper
http://www.restrictionmapper.org/
DNAMAN
http://www.lynnon.com/pc/pcmain_new.html
4.设计 PCR 引物
确定 PCR 产物片段大小 确定引物所在区段 确定引物序列的长度范围 确定引物 Tm ( melting temperature )值范围
Forward primer
Reverse primer
分析方法(举例)
采用 Primer3( http://frodo.wi.mit.edu/primer3 )或校内 Primer3 服务器( http://redb.ncpgr.cn/modules/redbtools/primer3.php )进行分析
在 Primer3 的网页粘贴序列,修改参数
分析结果
Primer3 与 BLAST 结合——Primer-BLAST
分析方法(举例)
采用 Primer Premier 进行分析
在 Primer Premier 的软件, File--New--DNA Sequence
粘贴序列
点击 Primer ,出来引物结果
点击 Search ,修改参数
5. DNA 序列格式修饰
根据需要展示 DNA 序列
10 个碱基一列,每行n列,方便阅读和使用
用数字刻度显示每个碱基位置
用颜色显示不同碱基
在序列左侧标注序列名称在 BioEdit 中选择序列,在“ File” 栏目点击“ Graphic View”
在菜单工具中选择各种修饰类型
6.在染色体上定位 DNA 序列
涉及 GenBank 的 dbSTS 二级数据库和 NCBI 的UniSTS 数据库
Forward e-PCR :用待分析序列检索 dbSTS 数据库或UniSTS 数据库
Reverse e-PCR :用 STS 序列检索核苷酸数据库
采用 electronic PCR ( e-PCR)功能定位 DNA 序列( http://www.ncbi.nlm.nih.gov/projects/e-pcr/ )
已知序列在染色体上的位置 有 PCR引物序列的信息
Genome Res. 1997, 7: 541-550
Forward e-PCR 分析方法(举例)
在 e-PCR网页点击“ Forward e-PCR”
分析结果(检测到 3 个定位的 marker ),点击“ Mar
ker” 栏目中的 marker 名称,查看在染色体上的具体位置
选择的 marker在染色体上的物理或遗传位置
在 Forward e-PCR网页粘贴序列或输入序列注册号
Reverse e-PCR 分析方法(举例)
在 e-PCR网页点击“ Reverse e-PCR”
在 Reverse e-PCR网页选择数据库( Dataset )、点击“ UniSTS input” 、输入序列注册号
分析结果
7. Gene Ontology分析
sequence assembly
gene annotation
Gene Ontology classification
EST
EST annotation
CAP3...
BLASTX
批量自动分析
InterProScan...
1.在本地计算机进行
2.在线进行
如:
更多工具
如:
第九章
核酸序列的其他分析方法
( 上机操作 )
生物信息学
1.大麦 Mlo基因( Z83834 )编码区的 GC 含量是多少?
2.如何获得 Z83834 的反向互补序列?
3.推测 Z83834 的 ORF 和翻译产物。
4. BamHI 可将Mlo基因的编码区切割开吗?
5. 请查询序列 NM_018845 的相关信息回答下列问题:这条核苷酸序列的编码区由多少个碱基组成?它编码蛋白质可能的功能是什么?若用限制性内切酶 BamHI 消化这条序列,可以得到几个片段?