推荐文档列表

支持向量机和线性判别分析用于禽流感病毒编码蛋白识别

时间:2021-12-09 19:17:16 数理化学论文 我要投稿

支持向量机和线性判别分析用于禽流感病毒编码蛋白识别

以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和100条C型流感病毒蛋白共400条为训练集样本, 从表征序列的200个整体与局部变量中以逐步(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型, 病毒蛋白总识别率达 99.8%, 留一法交互检验总识别率为99.4%. 从原始200变量中经主成分分析得16个主成分作为SVM的输入, 以径向基核函数(RBF)SVM建立非线性识别模型, 病毒蛋白总识别率为99.8%, 留一法交互检验总识别率为99.2%. 以100条禽流感、50条B型流感和50条C型流感病毒编码蛋白质共200条为测试集样本, 得LDA模型, 对其总识别正确率为95.4%, SVM模型对其总识别正确率为96.5%. 识别结果表明, 两个模型都可较好识别禽流感病毒蛋白, 并且SVM对禽流感病毒蛋白的识别结果优于LDA.

支持向量机和线性判别分析用于禽流感病毒编码蛋白识别

作 者: 梁桂兆 陈泽聪 杨善彬 梅虎 周原 舒茂 杨力 杨胜喜 郑小林 陈国华 周鹏 田菲菲 廖春阳 吴世容 李根容 李德静 何留 甘孟瑜 高剑坤 陈国平 王贵学 龙莎 景举华 曾晖 张巧霞 张梦军 杨娟 仝建波 王娇娜 刘永红 李波 仇亮加 蔡绍皙 赵娜 杨艳 苏霞利 宋健 陈美霞 陈刚 张雪姣 孙家英 李经纬 邓婕 彭传友 李志 许罗南 廖立敏 吴玉乾 朱万平 苏勤亮 卢大军 李军 黄振虎 周萍 李志良   作者单位: 梁桂兆,高剑坤,张梦军,杨娟(重庆大学化学化工学院,生物医学工程重庆市重点实验室,重庆,400044;湖南大学化学生物传感与计量学国家重点实验室,长沙,410012;重庆大学生物工程学院,生物力学与组织工程教育部重点实验室,重庆,400030)

陈泽聪,舒茂,杨胜喜,陈国华,周鹏,田菲菲,廖春阳,吴世容,李根容,李德静,何留,甘孟瑜,龙莎,景举华,曾晖,张巧霞,仝建波,王娇娜,刘永红,赵娜,杨艳,苏霞利,张雪姣,孙家英,李经纬,邓婕,彭传友,李志,许罗南,廖立敏,吴玉乾,朱万平,黄振虎,周萍,李志良(重庆大学化学化工学院,生物医学工程重庆市重点实验室,重庆,400044;湖南大学化学生物传感与计量学国家重点实验室,长沙,410012)

杨善彬,梅虎,周原,郑小林,王贵学(湖南大学化学生物传感与计量学国家重点实验室,长沙,410012;重庆大学生物工程学院,生物力学与组织工程教育部重点实验室,重庆,400030)

杨力,陈国平,蔡绍皙(重庆大学化学化工学院,生物医学工程重庆市重点实验室,重庆,400044;重庆大学生物工程学院,生物力学与组织工程教育部重点实验室,重庆,400030)

李波,仇亮加,苏勤亮,卢大军,李军(重庆大学化学化工学院,生物医学工程重庆市重点实验室,重庆,400044)

宋健,陈美霞,陈刚(湖南大学化学生物传感与计量学国家重点实验室,长沙,410012) 

刊 名: 中国科学B辑  ISTIC PKU 英文刊名: SCIENCE IN CHINA(SERIES B)  年,卷(期): 2007 37(6)  分类号: O6  关键词: 禽流感病毒   编码蛋白   支持向量机(SVM)   线性判别分析(LDA)   径向基函数(RBF)