推荐文档列表

基于图像的OMR技术的实现

时间:2021-10-01 09:51:06 计算机论文 我要投稿

基于图像的OMR技术的实现

摘要:在分析OMR与OCR的应用特点后,提出了基于图像的OMR方式。详细讨论了该方法的硬件设计和工作原理,并在软件处理方面着重介绍了倾斜校正和图像分割。它具有对纸张质量要求低和识别准确度高等特点。

    关键词:OMR OCR 信号处理 倾斜校正 图像分割

目前,许多文档是以纸质文档的形式存在,例如银行票据、税务报表、标准化考试中的机读卡、人口普查表、彩标投注单、选票、定货单等。而纸质文档不便于保存、检索、统计和修改。将这些信息录入计算机是一件非常繁琐的事情。长期以来人们通过键盘手工输入,不但费时费力且容易出错。在实时性要求较高的场合(如选举中的统计选票)自动、快速、准确地处理文档显得尤为重要。因此,对这些文档进行计算机自动录入具有重要的实现意义。

计算机自动录入是解决这个同瓶颈的关键所在。其中,光学字符识别OCR(Optical Character Recognition)和光学标记识别OMR(Optical Mark Recognition)是解决信号自动录入的有效方法。它们利用光学方法将信息录入到计算机并进行识别处理,能极大地提高数据信息的采集速度,便于计算机存储、管理与检索。

1 OCR与OMR

(1)OCR的工作原理

OCR首先将要识别的文字和图像扫描进计算机,然后进行图像的预处理,再抽取字符特片进行识别,转变为计算机能够识别的字符信息。图像预处理包括去除噪声、歪斜校画龙点睛、图像分割、平滑及规范化等。其中图像分割是一个重要的步骤,它的作用是将要识别的单个字符的图像找到并分割出来。OCR技术主要应用于文字图像识别及处理,例如用于印刷体和限制手写体字符的识别。OCR技术已成为大规模数据录入的首选方案,它将随着计算机技术的发展而更加成熟。

(2)OMR的工作原理

OMR识别“涂点”上有无标记两种状态。“涂点”就是信息卡上可以涂写标记的地址。“涂点”所代表的含义可以事先定义,可以代表一个阿拉伯数字,也可以表示一个英文字母或符号。OMR技术快速简单,识别率高且成本低,广泛应用于标准化考虑自动阅卷、各类调查问卷的统计、选举结果的统计等,是自动识别领域中应用较多的一种方法。

2 基于图像的OMR技术

目前OMR一般采用光电对管阅读技术。识别用的器件是半导体发光管及光敏管。发光管是光源器件,由它发出的光照射到“涂点”上。光敏管是接收器件,接收来自“涂点”位置的反射光。因为涂有标记的地方反光弱,未涂标记的地方反光强,所以光敏管接收到的光信号强度不同。不同强度的光信号可以代表

[1] [2] [3] [4]