推荐文档列表

基于SVR和k-近邻群的组合预测在QSAR中的应用

时间:2021-12-11 10:49:58 数理化学论文 我要投稿

基于SVR和k-近邻群的组合预测在QSAR中的应用

为提高定量构效关系(QSAR)研究的预测精度,发展了一种新的基于支持向量机回归(SVR)非线性筛选分子结构描述符、基于k-近邻群的非线性组合预测方法.首先以均方误差(MSE)最小为原则,以留一法通过多轮末尾淘汰实施分子结构描述符的非线性SVR汰选并给出最优核函数和相应保留描述符;其次基于待测样本与训练样本保留描述符向量的欧氏距离,以不同k-近邻群子模型双重留一法预测值反映样本集的异质性;然后基于MSE最小,以留一法通过多轮末尾淘汰实施近邻群子模型的非线性SVR汰选并给出最优核函数和相应保留子模型;最后基于保留子模型以双重留一法实施组合预测.以取代苯胺和苯酚类化合物对大型溞的QSAR实例验证表明:新方法在所有参比模型中预测精度最高,且能更精细地反映描述符与化合物毒性间的非线性关系,具结构风险最小、非线性、适于小样本,能有效克服过拟合、维数灾和局极小,非线性筛选描述符和子模型,非线性组合预测,自动选择最优核函数及其相应参数,泛化推广能力优异、预测精度高等诸多优点,在QSAR研究中有广泛应用前景.

作 者: 袁哲明 熊洁仪 张永生 YUAN Zhe-ming XIONG Jie-yi ZHANG Yong-sheng   作者单位: 湖南农业大学生物安全科学技术学院,湖南,长沙,410128  刊 名: 分子科学学报  ISTIC PKU 英文刊名: JOURNAL OF MOLECULAR SCIENCE  年,卷(期): 2007 23(3)  分类号: O641  关键词: 支持向量机回归   定量构效关系   均方误差   非线性   -近邻群   组合预测