推荐文档列表

基于分段伪氨基酸组成成分特征提取方法预测蛋白质亚细胞定位

时间:2021-12-13 20:55:25 数理化学论文 我要投稿

基于分段伪氨基酸组成成分特征提取方法预测蛋白质亚细胞定位

蛋白质的亚细胞定位与蛋白质的功能密切相关,其定位预测有助于人们了解蛋白质功能.文章提出一种分段伪氨基酸组成成分特征提取方法,采用支持向量机算法对Chou构建的两个蛋白质亚细胞定位数据集(C2129,CS2423)进行了分类研究,并采用总分类精度Q3、内容平衡精度指数Q9等参数评估预测分类系统性能.预测结果表明,基于分段伪氨基酸组成成分特征提取方法的预测性能,优于基于完整蛋白质序列的伪氨基酸组成成分特征提取方法.例如,基于分段矩描述子伪氨基酸组成成分特征提取方法,数据集C2129的Q3和Q9分别为84.7%和60.8%,比基于完整蛋白质序列的矩描述子伪氨基酸组成成分特征提取方法分别提高1.8和2.2个百分点,且Q3比现有Xiao等人的方法提高了9.1个百分点.基于分段伪氨基酸组成成分特征提取方法构成的特征向量不仅包含残基之间的位置信息,而且还包含蛋白质子序列之问的耦合信息,另外蛋白质分段子序列可能和蛋白质的功能域有一定的联系,从而使这一方法能够有效地预测蛋白质亚细胞定位.

作 者: 杨会芳 程咏梅 张绍武 潘泉 YANG Hui-fang CHENG Yong-mei ZhANG Shao-wu PAN Quan   作者单位: 西北工业大学自动化学院,西安,710072  刊 名: 生物物理学报  ISTIC PKU 英文刊名: ACTA BIOPHYSICA SINICA  年,卷(期): 2008 24(3)  分类号: O61  关键词: 分段伪氨基酸组成成分   支持向量机   特征提取   亚细胞定位