推荐文档列表

基于RefSeq数据库的人类标准转录数据集的构建

时间:2021-12-09 14:50:47 生物医学论文 我要投稿

基于RefSeq数据库的人类标准转录数据集的构建

美国国家生物信息技术中心(NCBI)提供了具有生物意义上的非冗余的基因和蛋白质序列的RefSeq参考序列数据库.然而,由于基因普遍存在的多态性以及不同实验室对于序列测定的质量控制存在差异等原因,已发现RefSeq数据库可能存在部分质量问题.文章基于"中心法则"提出"标准转录数据集"的概念,以人类基因和基因组序列为例,利用BLAT、Sim4和自行设计的Elparser等基因结构解析程序分析了RefSeq人类基因转录数据(2005-4-18)与目前所公布的人类标准基因组(2005-4-20)的对应关系.对于有实验证据支持的标记为NM_和NR_的记录,多种程序分析结果表明,其与标准基因组完全相对应的记录为9 771个;符合多个程序修订标准的记录有10 943个;而与标准基因组有较大差异的记录为203个,多种程序分析结果不一致的记录为2 676个,提示研究人员在使用此非标准转录组数据时,必须考虑到其存在非标准转录的原因甚至存在错误的可能性.此文为基于标准、高质量转录数据集的生物信息学数据分析、分子生物学实验设计、基因多样性和遗传变异分析等提供了重要的参考标准.相关结果可通过http://biocompute bmi.ac.cn/transcriptome/访问.

作 者: 李稚锋 李玉鉴 赵东升 杭兴宜 王正志 骆志刚 张成岗 LI Zhi-Feng LI Yu-Jian ZHAO Dong-Sheng HANG Xing-Yi WANG Zheng-Zhi LUO Zhi-Gang ZHANG Cheng-Gang   作者单位: 李稚锋,LI Zhi-Feng(军事医学科学院放射与辐射医学研究所,北京,100850;国防科技大学机电工程与自动化学院,长沙,410073)

李玉鉴,LI Yu-Jian(北京工业大学计算机学院,北京,100822)

赵东升,ZHAO Dong-Sheng(军事医学科学院卫生勤务与医学情报研究所,北京,100850)

杭兴宜,张成岗,HANG Xing-Yi,ZHANG Cheng-Gang(军事医学科学院放射与辐射医学研究所,北京,100850)

王正志,WANG Zheng-Zhi(国防科技大学机电工程与自动化学院,长沙,410073)

骆志刚,LUO Zhi-Gang(国防科技大学并行与分布处理国防科技重点实验室,长沙,410073) 

刊 名: 遗传  ISTIC PKU 英文刊名: HEREDITAS(BEIJING)  年,卷(期): 2006 28(3)  分类号: Q754  关键词: RefSeq数据库   转录组   质量控制   人类标准转录数据集