蛋白质序列中的关联规则发现及其应用
随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法.通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以万计的模式.结合实例演示了如何将这些模式应用于蛋白质序列分析中,如保守区域发现、二级结构预测等.同时根据这些结果构建了一个二级结构规则库和一种简单的二级结构预测算法,实验结果表明,约81%的二级结构可以由至少一条关联规则预测得到.
作 者: 作者单位: 刊 名: 生物物理学报 ISTIC PKU 英文刊名: ACTA BIOPHYSICA SINICA 年,卷(期): 2006 22(3) 分类号: Q5 关键词: 蛋白质序列 关联规则 二级结构预测 模式发现