推荐文档列表

网络信息挖掘系统评价初探

时间:2021-10-02 08:34:15 教育论文 我要投稿

网络信息挖掘系统评价初探

【  正  文】

  随着电子商务的蓬勃兴起,许多企业已经开始意识到其所拥有的丰富的信息资源在商业决策中具有潜在的巨大商业价值。更好的决策支持需求和企业电子商务的开展正推动着网络信息挖掘系统的研究与开发。

  鉴于网络信息挖掘是在数据挖掘的基础上发展起来的,因此对于网络信息挖掘系统的基本问题,本文仍将利用数据挖掘系统的基本理论来描述。

  目前,由于网络信息挖掘系统的发展正在起步阶段,因此它的分类还无法达到数据挖掘系统分类那样细致。具体而言,对网络信息挖掘系统分类可以从商业能力、挖掘数据类型、挖掘功能、数据分析方法和应用领域角度进行。其中商业能力角度的分类与数据挖掘系统的商业能力分类完全相同,即分为商业产品和研究原型。而从另外几个角度看,网络信息挖掘系统的类型具有自身一些特点,例如从应用领域角度看,网络信息挖掘系统可以分为面向电子商务型、面向远程教育(www.xfhttp.com-雪风网络xfhttp教育网)型、面向旅游型、面向广告业型等。随着网络信息挖掘技术的进一步发展,将出现更加丰富的网络信息挖掘系统类型。

      1 系统评价现状调查

  据调查,目前国内外还没有出现完全针对网络信息挖掘系统的评价成果,因而对网络信息挖掘系统的评价具有一定的创新性。笔者认为,对网络信息挖掘系统的评价可以充分地借鉴数据挖掘系统的评价方法。应该说这两类系统在很多评价指标上都有重合。

  从国外来讲,1998年前后已经有一些研究人员和机构对数据挖掘系统进行了一定的评价研究。他们所采用的评价体系各有特点,以下是一些简要介绍。

  1)J.F.Elder等人主要对17种数据挖掘系统进行了评价[1],其中包括了著名的Clementine、Intelligent  Miner系统。这些系统具有以下共同的特点:单平台(Stand  Alone)、多用途、支持多种模式和分类算法,并支持模式构建中的项目阶段。他们主要从6大方面对这些系统进行比较,除此之外,他们还单独从用户端角度对数据挖掘系统性能进行评价。他们认为并非支持的算法越多越好,各种算法面对不同的问题其解决能力也是不同的,它们具有自身的优点与缺点。在文章的最后,还对这17种产品的优势/劣势作了总体的描述性评价。

  2)M.A.  King等人针对14种桌面型数据挖掘系统[2],重点对各个系统的特征和性能进行比较。他们选用了20个评价指标,并设计了一个标准的评价过程——6分制评分标准来评价各种软件工具的优点和缺点。他们评价的特色在于针对4种算法的产品分别评价,并采用4类数据集测试系统的性能。他们认为网络法(Polynomial  and  Neural)要比分割法(Trees  and  Rules)更精确,另外也提出可以加入计算机环境、数据库连接性、提供商的稳定性等指标进一步评价。

  3)D.W.Abbott等人主要针对高端型(High-end)用于欺诈甄别的数据挖掘系统进行了评价[3]。尽管仅选择了5个系统(Clementine、Intelligent  Miner  for  Mata、Darwin、En-  terprise  Miner、Pattern  Recognition  Workbench)进行评价,但是他们针对这5个专门应用于欺诈甄别的系统进行了细致的

[1] [2] [3] [4] [5]