当前位置: 首页 » 食品专题 » 生物名词库 » 生物化学与分子生物学 » 正文

NCBI中的GenBank和RefSeq

发布日期：2006-07-01

RefSeq NM_xxxxxx和GenBank Afxxxxxx看起来是重复的，但RefSeq和GenBank是分开的数据库，而且两者都是可以通过在Entrez nucleotide中输入各自的ACCESSION获得。开始时临时的RefSeq记录与GenBank记录非常相似。但是，当RefSeq记录被专家review以后，新增的序列数据、生物学注解、和参考文献常被加入。那时，RefSeq条目（即序列）代表一个来自不同实验室的综合信息，这时二者可以非常不同。

GenBank是一个多种序列的存储池，对每个基因都含有许多序列。而RefSeq数据库被设计成每个人类位点挑出一个代表序列来减少重复，是NCBI提供的校正的序列数据和相关的信息。数据库包括构建的基因组contig、mRNA、蛋白和整个染色体。

RefSeq记录是有三种可以获得的状态：预测的，临时的和检查过的（reviewd）。检查过的记录代表了目前关于一个基因和它的转录子的知识的汇编。它们很多都来自于GenBank记录、人类基因组命名委员会、和OMIM。RefSeq标准为人类基因组的功能注解提供一个基础。
RefSeq记录通过以下步骤创建：
1、确定代表不同基因的序列
2、建立正确的基因名字到登录号的联系
3、确定完整范围的可以获得的序列数据
4、创建一个新的处于三种状态之一的参考序列(RefSeq)记录

为什么RefSeq记录中的基因符号（symbol）有时和相关的GenBank中的不一样？RefSeq全部使用官方基因符号。而GenBank是一个公共的序列备份库，由数据发现者提供。有的作者会向相关的物种命名委员会取得官方基因符号，但有的作者没有，所以有时会产生别名。GenBank与Pubmed相同，通过display可以选择显示格式，常用的有GenBank和FASTA两种格式。如果要对基因序列作进一步分析，FASTA格式是很好的选择。FASTA格式仅包括该序列的简要特征，并以ATGC4种碱基列出核苷酸序列，简单明了。而GenBank格式可显示较完整的基因序列记录，反映核苷酸序列的详细信息。

下一篇：Gene Ontology （GO）简介
上一篇：Blastn中的E值

[ 网刊订阅 ] [ 食品专题搜索 ] [ ] [ 告诉好友 ] [ 打印本文 ] [ 关闭窗口 ] [ 返回顶部 ]

• 基因突变的检测方法	• PCR技术基本原理
• 生化实验室常用技术参数资料	• PCR反应特点
• PCR污染与对策	• 实时定量PCR应用中的问题
• 实时定量PCR实验方案优化	• PCR常见问题
• 原位杂交（以斑马鱼为例）	• 实时定量PCR荧光材料新进展