无需OMR阅读机的答题卡识别技术

在教育领域，答题卡（Optical Mark Recognition, OMR）是一种常见的评估工具，用于标准化考试和问卷调查。传统的OMR系统需要专用的阅读机和扫描仪来识别答题卡上的信息。然而，随着技术的发展，现在可以通过智能手机相机和计算机软件来实现这一功能，从而节省了购买昂贵设备的需要。本文将介绍一种新的OMR引擎，它能够使用3MP及以上的自动对焦手机相机来读取答题卡。

在寻找一个合适的OMR引擎时，发现市场上现有的解决方案并不能满足需求。因此，决定自己开发一个。在传统的学校和大学中，通常会使用专业的机器来读取答题卡。目标是消除购买OMR阅读机的需要，甚至是扫描仪。通过使用3MP手机相机拍摄的照片，就可以通过这个引擎来读取答题卡。在初始阶段，已经创建了自己的答题卡类型，可以被读取。

图像处理技术

图像处理部分使用了AForge.Net的图像处理器（下载中包含的库）。这种方法的核心在于，它能够从扫描的图像中识别出答题卡的边界。这是通过寻找答题卡上的四个交叉圆形符号来实现的，这些符号定义了纸张的边界，从而估计出裁剪、缩放和倾斜纸张的信息。

Q1: 这个引擎可以与其他OMR答题卡一起使用吗？ 很多人反复提出了相同的问题：“可以使用其他OMR答题卡与这个引擎一起使用吗？”答案是“不可以”。原因是因为用于提取纸张图像的算法ExtractPaperFromFlattened()。它通过在扫描图像中找到四个交叉圆形符号来识别出纸张。如果没有这些符号，就无法检测到纸张。

Q2: 可以创建自己的OMR答题卡吗？ 在V1版本中，不能。至少在没有帮助的情况下，除非是一个超级极客。在V2版本中，可以。

使用代码

在添加了所有引用（AForge和OMR）之后，可以使用最简单的方法重载来从相机/扫描仪图像中提取OMR封装的答题卡。原始图像必须包含一个清晰的支持答题卡格式的视图（可打印的PDF包含在下载中）。例如：


        C#
        Bitmap unf = new Bitmap(panel1.BackgroundImage);
        OpticalReader reader = new OpticalReader();
        panel1.BackgroundImage = (System.Drawing.Image)reader.ExtractOMRSheet(unf, "sheets.xml", OMREnums.OMRSheet.A550);

一旦答题卡被提取出来，就可以使用以下方法进行处理：


        OpticalReader rr = new OpticalReader();
        MessageBox.Show(rr.getRegNumOfSheet(panel1.BackgroundImage, OMREnums.OMRSheet.A550, "sheets.xml", false).ToString());

从相机/扫描仪图像中检测答题卡

检测答题卡的过程涉及到检测答题卡的角。在打印的文档中，角被特定的二进制图像标记。检测它们，就检测到了答题卡。首先，需要使用正确的对比度、填充、阈值和反转过滤器来平整图片。作为起点，原始图像在没有对比度、亮度或填充校正的情况下被反转。给定一个阈值，图像然后被转换为二进制。这个图像被称为“平整图像”，是通过使用"OMR.OpticalReader.flatten"方法获得的。

一旦图像被平整出来，就开始进行块检测。在第一阶段，从最小块大小开始检测所有大小和类型的块（这确保移除了噪声颗粒块）。首先检测到左边，然后检测到答题卡的右边。在第一阶段过滤器中，通过检查它们的大小与相机/扫描仪图像的大小比例来过滤掉错误大小的块。在第二个过滤器中，过滤掉放置在图像错误一侧的块。在第三个过滤器中，过滤掉具有疯狂错误长宽比的块（确保检测并拒绝由答题卡上的弯曲/线条产生的块）。作为对块的最后一个过滤器，所有块都与镜像角图像进行比较（镜像是因为在第一步中反转了图像）。过滤掉的块再次被验证，它们确实是四个，并且放置在答题卡的正确位置上。同时，左右边缘的长度变化不大。

经过验证的块代表了图像坐标系统中答题卡角的真实位置。可以通过这些点从未平整的图像中裁剪出图像，并包装成一个完美的矩形图像，称为OMR答题卡。如果上述所有过滤器只产生四个角块，那么过程就会继续，否则将对同一个函数进行递归调用，使用相同的参数，但使用改变的对比度校正，可能会得到更好的结果值。

查看"OMR.OpticalReader.ExtractOMRSheet"方法中的代码，并逐行注释。

读取提取的答题卡

主要的图像处理在于图像提取部分。现在下一个阶段是读取OMR答题卡。通常OMR答题卡对一个问题有多个选择。所有相同问题的选项都打印在纸张的一侧，形成一个“块”。所有块的位置、大小和给出的选项数量都足够保存到XML文件中。位置是根据坐标系统记录的，通常是.NET中遵循的，即左上角为O(0,0)（x,y）+ive x轴向右，+ive y轴向下。

要读取答题卡中的特定块（在第一部分中提取的答题卡），可以调用OMR.OpticalReader.getScoreOfSheet。这个方法反复执行上述程序，读取答题卡上所有4个大答案块上的所有线条。

从给定的选择中读取选定的选项

当一个多项选择块从文档中切出来时，是时候读取选定的选择。对于读取，块被划分为与其中存在的选项数量相等的部分。然后，图像根据块的平均颜色被转换为二进制。这就是将白纸转换为纯白，将超过一半的墨水填充像素转换为纯黑的方式。记录每个块的黑色像素计数。

将最暗的块与其它块进行比较，如果两个子块之间存在显著差异，较暗的一个被记录为“标记”。根据标记选择的数量，可以决定哪个选项被选中。

使用DeepEnds和Doxygen进行代码分析

本文介绍了如何使用DeepEnds和Doxygen工具对C++代码进行分析，生成依赖图和统计数据。

jQuery Deferred对象和Promise接口的使用

本文介绍了如何使用jQuery的Deferred对象和Promise接口来处理多个Ajax请求，并在所有请求完成后执行回调函数。

无需OMR阅读机的答题卡识别技术

图像处理技术

使用代码

从相机/扫描仪图像中检测答题卡

读取提取的答题卡

从给定的选择中读取选定的选项

使用DeepEnds和Doxygen进行代码分析

jQuery Deferred对象和Promise接口的使用

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：15216758379

无需OMR阅读机的答题卡识别技术

图像处理技术

使用代码

从相机/扫描仪图像中检测答题卡

读取提取的答题卡

从给定的选择中读取选定的选项

使用DeepEnds和Doxygen进行代码分析

jQuery Deferred对象和Promise接口的使用

沪ICP备2024098111号-1

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢 联系电话：15216758379

上海秋旦网络科技中心：上海市奉贤区金大公路8218号1幢联系电话：15216758379