试论基于分布式数据仓库的远程教学系统模型研究论文

时间:2021-09-05 13:58:58 论文范文 我要投稿

试论基于分布式数据仓库的远程教学系统模型研究论文

  论文关键词:分布式数据仓库 数据挖掘 教学资源库

试论基于分布式数据仓库的远程教学系统模型研究论文

  论文摘要:本文阐述了如何将分布式多媒体技术与数据仓库技术相结合,搭建一套适用于远程教育的辅助管理系统,将最新的数据仓库及数据挖掘技术应用于远程教育领域中,使远程教育实现教学质量与学习效率科学的提高。

  一、数据仓库在远程教学应用中的发展现状

  随着远程教育技术的发展,教学数据不断膨胀,目前,多媒体信息在整个远程教育系统中,都是以文件形式存在,直接由操作系统管理,但是随着分布式计算技术的发展,对多媒体信息进行高效的管理、存取和查询已经成了迫切的需求。因此,研究、引用并建立新型的基于分布式数据仓库的远程教学系统模型,将有助于提高远程教育教学质量与学习的效率。

  二、数据仓库及其为何适用于远程教学系统

  1。数据仓库及其特点

  “数据仓库之父”W。H。Inmon在BuildingtheData}axehous。中提出:数据仓库是支持管理决策过程的、面向主题的、整合的、稳定的、随时间不断变化的数据集合。我们可以这样了解数据仓库的概念:数据仓库为支持海量存储和高层决策分析提供了一种解决方案。它抽取和净化来自不同应用系统的数据,从事物发展和历史的角度进行组织和存储,并通过对这种集成化数据的分析和挖掘,为最终用户提供综合性和分析性的深层次信息,是基于传统数据库技术的一种应用拓展。根据以上概念分析出数据仓库的四点精髓:

  (I)面向主题;

  (2)集成性;

  (3)不易失性;

  (4)时变性。[2]根据这四点精髓内容,本文构建了基于分布式多媒体数据仓库技术的远程教育的教学辅助平台。

  2。基于数据仓库远程教学系统实施的可行性

  远程教育中,教学是一个主要的活动,目前的教学模式主要分为同步型和异步型。无论是同步型还是异步型教学模式,为了更好地讲授某个课题或者知识点,需要使用文字说明或动画,甚至要配上音乐的解说,这时候就需要用到多媒体数据仓库和多媒体信息处理技术。在日益膨胀的教学数据背后隐藏了许多重要的信息,如果我们希望能对数据资料进行更高层次的分析,以便更好地利用这些数据,反馈到教学活动中,就需要建立一个高效的多媒体数据仓库模型。目前关系数据库系统可以高效率地实现数据操作的基本功能,但是无法发现数据中存在的关系与规则,无法根据现有的数据预测未来的发展趋势。

  同样在教学活动中,教师常常需要对学员的课堂学习反馈、理解能力、本身掌握的基础知识、掌握的知识点、考试结构等各种数据统计分析,以便在教学活动中改进。这种统计的数据很多,而且是多面性的,只做简单的分析很难得到所需要的指导性的教学改进。

  三、基于分布式数据仓库的远程教学系统解决方案

  通过数据仓库技术构建一套对文本、数字、文档、图像、声音和影像进行综合处理,并提供强大的数据管理和检索功能的远程教育辅助平台。系统主要包括教学信息的采编与整合、非结构化及多媒体信息管理与用户管理、信息资源服务与利用等几个模块组成,实现信息资源的采集、管理与服务一体化;多媒体技术是目前比较热门的课题,它允许信息以文字、图像、声音等多种形式表现,并能将这些多媒体信息保存、管理、加工和传输。多媒体数据仓库将多媒体信息保存在计算机数据库中,用统一的机制管理和控制数据,确保数据的安全和正确,并给数据的使用和维护带来极大的方便。

  1。系统的外部结构

  分布式多媒体数据仓库技术平台的外部结构体系可以分为四个部分:

  (1)数据采集处理部分;

  (2)数据存储加工部分;

  (3)数据输出部分;

  (4)数据反馈部分。

  其结构如图1所示。

  在数据采集处理部分,需要对各种异构数据资源进行标准化与规范化标引,采用基于XML数据交换处理方式;在数据存取加工方面,采用分布式海量非结构化的资源管理模式,整个数据加工过程中,要全面整合各种标准的信息资源,如MS—Office,S2,PS2,PS,PDF,HTML,TXT,XMI,,MARC,BMP,JPG,JPEG等;实现图像、文字、音频、视频等多媒体信息的关联管理,并根据远程学员的需要,实现智能地提取、检索需要的教学资源,实现各种异构资源的统一化管理,实现整个资源的完整不可分割性。

  2。系统的功能

  (1)多媒体数据的处理方式

  1)视频资源播放

  学员可以根据自己的需要选择某个教师、某个教育实验的录像或者自己感兴趣的资料来进行播放。播放时用户可以自由选择一定的播放速度。系统为用户提供了暂停、慢放、快放的功能。播放模块中,在用户面前主要有三类库:授课资源库(正常上课讲授,也可以选择教师)、课件资源库和习题讲授库。授课资源库存储了各科按照教学大纲的书本讲授资源,它以章节为单位存储在多媒体数据库中。课件资源库存储着各个科目对应的课件,同样这些课件资源也按照各个科目的章节存储在数据库中,学员从数据库中检索授课知识要点的时候,系统可以列出相关的课件供学员参考学习。习题讲授库以题为单位存储在数据库中,它与授课资源库同样是紧密结合的,学员可以根据自身的学习情况,查看相关的习题讲授资源,这样就实现了从学习到自身检验的一个过程。

  2)资源的检索

  学员可以根据课程的各类信息对多媒体数据库中的信息进行检索、播放。系统提供对基于信息内容与关键字段的逻辑组合查询、任意词查询、二次查询、多字段复合查询与距离查询等灵活简便的查询方式,满足不同层次用户的查询需要,提供关联检索功能,方便学员能快速搜索到自己需要的学习信息。

  课程资源库的检索主要包括:学校、科目、授课教师、授课内容及内容的深浅度;

  课件资源库的检索主要包括:学校、科目、制作教师、课件名称、课件大小、课件类型及格式;

  习题讲授课的检索主要包括:学校、科目、讲授教师、题目类型、难易度、相关的课程

  3)视频编辑

  通过对相关的录像资源进行编辑可以使之更加紧凑。整个平台的视频主要涉及到这三块:课程视频资源库的编辑、课件视频资源库的编辑和习题资源库的编辑。课程视频资源库的编辑将为学员提供大量的课堂讲授视频资料,它是以课程的章节为单位来分割编辑,然后通过格式转换及接口程序存储到多媒体数据库中;课件资源编辑同样也以章节为单位,通过平台的格式转换和接日程序存储到多媒体数据库中;习题讲授课可以编辑成以题为单位,存储到多媒体库中。

  4)存储接口处理

  目前在实际应用中,我们可以参照Oracle8i系统中的intermedia多媒体部件来处理统一的接口问题,然后所有资源数据由多媒体数据库来统一维护,统一备份,这样就可以简化管理。

  5)教案资料信息采集

  主要是将一些由Office办公系统编辑的电子教案文档通过格式转换后存储到多媒体数据库中。

  6)师资及课程管理

  提供课程介绍,包括课程的整体框架、内容要求及考试方法等;推荐课程学习进度表和指导性建议;发布教师授课要点,包括多媒体课件的组成框架及使用提示、教案提纲和补充材料索引等。师资管理:提供教师介绍,包括本院校各学科优秀教师和聘请的全国知名专家教授情况介绍;各学科任课教师的基本情况,包括职称学历、学识水平及教学能力等。

  (2)习题库统计、分析与反馈

  授课教师可以根据学员的考试情况来统计考试中的各类信息,从而了解学员对知识的掌握程度,并且根据学员的掌握情况,调整自己的教学方式或角度,让学员更易接受新的知识点,提高了远程教学的质量与效率。在远程教育中,由于学员的价值观、生存发展状况、兴趣爱好等存在着差异,以及学员的社会角色、所处的社会环境、本身的受教育程度、学习的能力各不相同,因此学员的学习存在着需求的多元化,如何能做到多元化的学习呢?

  第一是通过系统反馈,在同步教学中对各个层次的学员做到有针对性的讲授;

  第二是在异步教育中,根据知识的难易度制作不同的视频资源及各种扩充知识点;

  第三是在查询系统中,教学辅助系统平台根据学员查询条件自动把查询结果及相关联的`资源(如课后问题、测试题目)提供给学员,学员可以根据系统提供的资源有针对性地学习; 第四是类别分组,采用数据仓库技术可以对具有相似查询浏览记录的学员进行分组,系统还可以分析他们的共同特征,反馈给教师及平台管理者,以便提供更适合、更面向学员的讲学或者课件资源等;系统记录浏览者的身份,如果有相关资源更新后,系统自动将相关资源信息以电子邮件等多种形式发送给关注学员,以便能让学员学习和了解更多的知识。

  3。系统的内部处理流程

  系统内部处理流程如图2所示。

  用户在使用系统时,通过Web方式提出查询要求,系统通过外部接口程序生成查询条件,根据查询的条件自动检索相关库,并综合分类临时库(如教学安排库等)后确定数据挖掘目标与主题,系统根据目标主题建立挖掘模型,然后建立临时数据仓库,通过数据处理相关工具进行下一步的分析,建立与原始库的数据处理通道,如多线程查询知识库、系统库、视频库等,然后再通过建立的临时数据处理通道,将通过此查询条件的结果存储于大型分布式数据仓库,再通过OLAP处理服务器进一步处理由原始仓库得来的数据,可以使用联机分析及OLAP分析工具或者深层数据挖掘工具等进行分析,将处理好的一定范围内的结果以多种形式显示在用户界面上,用户可以打印结果、制作相关的报表或者获取各种统计分析数据。如果无法根据查询条件查询到匹配的内容,系统将根据查询结果自动反应给系统管理员或者决策分析者;还可以将分析结果反馈给系统分析库;管理者可以根据系统反馈的结果来相应地调整教学内容、教学安排等,并根据各种统计分析报表来增加或者调整原始资源库的内容。通过这样的手段,一方面,教学资源库不断完善;另一方面,在教学上,教师也能不断地调整自己的教学方式,以便能让更多的学生接受更多的知识。同样,考试处理模块也能形成这样的数据挖掘方式。使用系统强大的数据统计功能后,用OLAp数据挖掘工具加以分析,可以得出学员对各个知识点的掌握程度,便于在试题评测时,能有重点地加以分析,让学员将此知识点掌握得更牢固。

  4数据仓库在远程教学系统中的运用

  目前远程教育中的教学任务主要是以下几个方面:教学任务安排、教学讲义制作(课程安排)、多媒体课件制作、作业管理、考试管理和成绩考核等。在这些活动中产生了大量的数据并形成了各自的事务型数据仓库,如考试库、成绩库等。从这些数据库中获取有用的知识并用于相关的教学活动,是远程教育提高教学质量与学习效率的重要手段。数据挖掘和数据仓库在远程教育中的应用主要有以下几个步骤,如图3所示。

  (1)由事务型数据库作为源系统组成数据仓库与数据集市;

  (2)根据具体的业务需求确定数据挖掘目标,并由此采取相应的数据挖掘方法对数据仓库和数据集市中的数据进行分析以得到相关知识,并由此构成事件处理库,如考试中的错题分析、知识点的归纳等;

  (3)将获取的相关信息再应用到远程教学中,如提高课件质量、转变授课模式,对考试中犯同样错误的学员进行归类,做有针对性的讲解等;

  (4)评价应用结果再次反馈到数据挖掘过程以改进数据挖掘方法。

  练习和测试是远程教育中一项基本的教学活动,也是整个系统数据挖掘和分析的重要应用,是评测教学活动的成功标准之一。为了能了解学员的学习情况,练习和测试是必不可少的。目前对于统计考试情况(正确率、错误率、各种题型等)采用的分析方法常常是粗略的,往往也只是根据报表凭经验做出决策,这不仅是相当困难的,而且不够客观。数据挖掘提供了进行练习与测试组合数据库分析的环境,其多种方法可以为此进行测试分析通过数据挖掘技术,可以从错题量、错题类型、知识点出发,利用近邻算法寻找归类,从课程分析一直到试题分析,并把可能会影响正确结果的相关支持集中归类,如果数据库中没有,则补充,再讲解(视频资源),如果有问题,则由系统自动反馈给学员,让其充分掌握。

  四、系统的特点

  1。强大的数据处理能力

  系统与强大的分布式多媒体数据库相连,可以由多台机器分布式地联机操作处理数据,处理速度快,操作方便。

  2。统计准确

  手工统计除面临统计工作量大之外,还有一个重要的问题就在统计过程中容易出错;有时候可能因为统计的出错,导致分析决策的失误〕在几万甚至几十万的数据面前,要想完全精确是非常困难的但是运用计算机系统来统计便可完全克服这个困难。只需要制定相关的统计规则,系统便可以根据规则来统计出我们所需要的教学数据。

  3。快速、高效

  传统的统计方法需要人工去处理,所以从统计完毕到处理结果需要一段时间。而使用计算机系统统计后。就能很方便很快速地从数据库中得出各种教学统计结果,从而大大提高远程教学中对各种教学数据统计的工作效率。

  五、结束语

  系统的设计可以针对不同的情况选用不同的挖掘模型,如知识库查询挖掘模型,考试结果挖掘模型,教学资源反馈挖掘模型等,又如考试挖掘模型可以用不同的题型建立挖掘模型,系统将根据不同的情况,选用最合适的挖掘分析模型,以提高决策分析能力。系统的建立将为教师讲学、决策分析提供可靠的依据。通过此系统,学员也能迅速掌握自己需要的知识点,对提高远程教育教学质量与学习效率有非常大的帮助。

【试论基于分布式数据仓库的远程教学系统模型研究论文】相关文章:

基于多Agent的模型系统研究07-21

基于分布式层次模型的诊断技术研究与应用07-15

基于元模型的复杂系统建模方法研究07-12

基于互联网络的远程教学评价模型01-20

基于分布式伪卫星的双星定位系统定位方法研究07-15

基于系统动力学模型的库存控制机理研究01-20

简谈基于模型的系统工程概述论文06-18

基于空间分布式汇流时间方法的流域洪水模拟模型及应用研究08-27

基于SOA的知识管理模型研究07-03