【Android论文栏目提醒】:网学会员为广大网友收集整理了,基于Android的手机OCR识别技术设计与实现 - 期刊论文,希望对大家有所帮助!
2012 年第 25 卷第 9 期 图像编码与软件Electronic Sci. & Tech. / Sep. 15,2012 基于
Android 的手机 OCR 识别技术设计与实现 朱怀中 ( 上海天华学院 计算机系,上海 201815) 摘 要 介绍了 OCR 文字处理和识别的工作原理,以及 OCR 运用在手机平台的优越性。
设计了基于
Android 的 OCR 中英文识别日程小秘书软件,重点对 OCR 识别软件的功能进行分析,并设计实现方案,最终完成了 OCR 日程提 醒功能。
经过对软件系统功能的测试,结果表明,OCR 识别软件在功能上能完成日常的文字识别与提取。
关键词
Android; OCR; 日程提醒; 文字识别 中图分类号 TP391. 41 文献标识码 A 文章编号 1007 - 7820( 2012) 09 - 045 - 04 Design and Implementation of an OCR Recognition Technology Based on the
Android Platform ZHU Huaizhong ( Department of Computer Science,Shanghai Tianhua College,Shanghai 201815,China) Abstract The working principles of OCR word processing and identification as well as the advantages of OCR when used on mobile platforms are introduced. A program of the Secretary software on the
Android-based phone is designed. This software uses OCR technology to indentify Chinese and English agenda. Emphasis is put on the anal- ysis of the functions of the OCR recognition software. A scheme is designed to achieve the program and finally the OCR schedule reminding function is realized. After testing the software system functions,the results show that the OCR recognition software can complete the daily character identification and extraction function. Keywords
Android; OCR; schedule reminder; character recognition 〔2〕 光 学 字 符 识 别 ( Optical Character Recognition, 的操作该软件 。
设计开发的日程提醒小秘书功能,OCR) ,其工作原理为通过扫描仪、 照相机等光学设备, 贴合实际需求, 对重要事件和重要时间的提醒有了更将整页文本图像输入计算机, 将文档资料转换成黑白 加完善的管理。
点阵的图像文件,然后通过 OCR 识别软件将图像中的 1 系统需求与设计文字转换成文本格式, 以便进一步信息处理。
Android是 Google 公司于 2007 年 l 1 月 5 日推出的一个手机平 1. 1 需求分析台,是一个真正意义上的开放并不依赖于设备的移动 目前市场上,可以搜索到相关 OCR 文字识别的应应用综合平台,它包括操作系统、用户界面和应用程 用软件,但基本都是运用在电脑上的,较少运用在手机序。
由于它的开放性, 任何人都可以编写自己的应用 上。
在日常生活中人们或多或少都会收到或看到纸质 〔1程序并在手机上使用 。
〕 通知、请柬等类似带有时间点的信息,不能快速地记录 设计开发的 OCR 日程提醒小秘书软件, 在实用性 下来。
为方便每次遇到此类情况,只需要通过对通知、方面体现 出 其 优 越 性、 捷 性、 统 性 和 易 操 作 性。
便 系 , 请柬等拍摄照片 就可快速 方便地存储于手机内, 、 并OCR 日 程 提 醒 软 件 的 优 越 性 在 于 该 软 件 运 行 在 将图片上的文字信息转化成文字内容 ,同时将通知、请
Android平台手机上,方便随身携带,可以随时随地使 柬等上面的时间日期直接添加至手机的日程提醒中用; 运用先进的 OCR 图片文字识别技术,利用手机便 去。
由于目前市场上几乎没有此类能把纸质的通知通捷的照相机功能, 获取文档资料的图像文件,方便用户 过照片拍摄并对内容进行文字处理,同时可以同步添能快速记录下各种纸质通知等重要信息 ,避免繁琐的 加至日程提醒中的软件,为此开发了基于
Android 手输入和存储相关内容操作; 用户使用该软件能够系统 机开发了 OCR 日程小秘书软件。
该软件根据用户日的管理图片以及日程信息, 按时按点地对已添加的信 常遇到的日程安排问题,如会议的时间、各类通知的时息进行提醒; 手机平台的可操作性使用户能明确 、简明 间、请柬的时间等,使用户能较快地把相关时间日期节 点记录于手机中,并且添加至日程提醒中,避免不必要收稿日期: 2012-06-05 的损失。
作者简介: 朱怀中( 1969—) ,男,硕士,工程师。
研究方向: 1. 2 功能模块设计计算机应用。
OCR 日程小秘书软件的设计主要从生成影像模 www. dianzikeji. org 45 图像编码与软件 朱怀中: 基于
Android 的手机 OCR 识别技术设计与实现块、 图像处理模块、 文字识别模块、文字编辑模块、日期 0 ~ 255 共 256 级 分 量 值, 个 像 素 可 以 表 示 为 RGB 每提醒模块这 5 方面来考虑的,具体如下: ( X, Z) 。
采集的数字图像中像素的取值范围是整个 Y, ( 1) 生成影像模块。
OCR 日程小秘书软件是运用 RGB 色 彩 空 间 从 ( 0, 0 ) 到 ( 255, 0, 255, ) 共 有 255打开手机上的摄像头, 通过用户对各种纸质通知、请柬 16 777 216 种颜色组合图像处理首先要做的就是在尽等有时间点的信息进行拍照, 获取需要处理的图片。
量不破坏图像中原始信息的前提下,压缩图像中像素或者通过手机中已有的图片,获取所需要处理的图片。
的取值范围,把真彩色图像转换成位图图像,这里采用 ( 2) 图像处理模块。
主要具有文稿扫描、图像缩 , 传统的 八叉树颜色量化算法 ” 把图像中最有代表性 “放、图像旋转等功能。
OCR 日程小秘书软件是通过对 的 256 个像素值选出来,利用这 256 个像素值重新填所获取的图片,通过拍摄后,形成图像文件,图像处理 充图像,这样既转换了图像格式又没有破坏图像中原 ,可以对获取的图像进行一般操作 如放大缩小等。
若 始显示信息。
所获取图像的位置不正,可以通过用户自行旋转或手 2. 2 图像的二值化工旋转图像,目的是为文字识别创造有力的条件 ,使识 根据灰度图像中每个像素的坐标值和灰度级值的别率更高。
对应关系,一幅灰度图像可表示成二维函数 f( x, , y) ( 3) 文字识别模块。
是本款软件文字识别的核心 其中, y 为像素坐标值; f( x, 为该像素灰度值。
x、 y)部分。
文字识 别 模 块 主 要 对 所 获 取 的 汉 字 进 行“阅 假定一幅灰度图像中像素的灰度级值的取值范围 ,读” 但不能一目多行, 必须对文字域进行逐行切割。
为 0 ~ Mf,希望能够更加突出图像中的文字部分,抑对于汉字也是逐字辨认,即单字识别,再进行归一化。
制那些并不感兴趣的灰度区域,通常图像中的文字都文字识别模块通过对不同样本汉字的特征进行提取 , 为黑色,在灰度图像中灰度值较小,这里 g 通过扩展灰完成识别, 动 查 找 可 疑 字, 有 前 后 联 想 等 功 能。
自 具 度值范围在( 0, 暗色区和 ( b, 的亮色区, a) Mf) 压缩灰OCR 日程小秘书软件通过对图片识别后, 进行特定关 度值( a, 区间的范围, b) 使图像中的文字区域更加突键字的搜索后, 提取与此关键字相关的信息。
出采用分 段 线 性 变 换 的 方 法, 数 学 原 理 表 达 式 如 其 ( 4) 文字编辑模块。
主要对 OCR 识别后的文字进 式( 1) 所示行修改和编辑。
如系统识别认为有误,则可通过用户 c f( x, ,≤f( x, ≤a y) 0 y)对所识别的文字进行编辑。
对文字的错误,则可提供 a d - c相似的文字供选择, 选择编辑器供输出等。
g( x, y) 〔 x, - a〕 c, ≤f( x, ≤b f( y) a y) b -a ( 5) 日期提醒模块。
主要是为用户提供时间的提 Mg - d〔 x, - b〕 d, f( x,醒,使用 户 能 够 对 日 程 的 安 排。
OCR 日 程 小 秘 书 软 Mf - b f( y) b≤ y) ≤Mf 将所获取的特定内容信息,件, 放入日程提醒的对应位 ( 1)置。
日程提醒中的时间设定即为所拍摄的通知等图片 设定适当的折线拐点位置即 ( a, c, 的值, b, d) 控上的时间和日期、内容等。
这些信息都已经预先设定, 制分段直线的斜率,对灰度空间 0 ~ a 和 b ~ Mf 进行扩用户只需设定些其他的项目即可添加至日程提醒中 , 展, a ~ b 的灰度空间进行压缩, 对 经过灰度调整后,以提醒用户避免错过重要事件。
, 设定某个门限值 灰度值大于门限值的像素点用 2552 OCR 文字识别技术实现的原理 来代替,表示为白色的点; 小于门限值的像素点用 0 代 〔4〕 替,表示为黑色,这样就得到了需要的二值图像 。
实现 OCR 识别系统, 需要转换拍摄的影像,将影像内的图像继续保存,将表格内的资料及影像内的文字一律变成计算机文字,减少影像资料的储存量。
对于识别出的文字可再次分析与使用,节省了因键盘输入的人力与时间。
从影像到结果输出, 需要经过图像文字转换、图像的二值化、单字切割、文字特征抽取、比 〔3〕对识别、以及人工校正,最后将识别结果输出 。
2. 1 图像文字转换 图1 二维坐标示意图 手机屏幕图像中的每一个像素在计算机中都是由24 位二进制数表示的,每个像素包含红、 、 3 个色 绿 蓝 2. 3 单字切割彩分量,每个分量由 8 位二进制数表示,取值范围从 如何在待识别图像中准确地切割出单个字的图46 www. dianzikeji. org朱怀中: 基于
Android 的手机 OCR 识别技术设计与实现 图像编码与软件 〔2〕像 ,是文字识别首先要考虑的问题。
通过对二值图像逐行扫描,分析每行图像中黑白像素交替变化数来判断图像中文字所处的起始行坐标 Y1 和结束行坐标Y2 ,这样切分出每一行文字图像,将得到的一行文字图像再次纵向逐列扫描,同样通过记录每一列上黑白像素交替变化数,可判断图像中每个文字所处的起始纵标 X1 和结束纵坐标 X2 ,知道了 ( X1 , 1 ) 和 ( X2 , 2 ) 就 Y Y 〔5〕可以得到单个字的图像,如图 2 和图 3 所示 。
图4 文字特征提取 2. 5 对比数据库 当用户把图片拍摄后,软件会把自动识别后的文 字放入一个编辑文本区,无论是统计还是结构得到的 特征,都必须存在一个与之对比的数据库或者特征数 据库进行比对识别。
数据库中的内容应该包含所有预 先识别的文字字集,并根据与所拍摄的文字内容进行 特征抽取,得到相应的特征群组。
由于 OCR 的文字识 别不可能达到百分之百正确率。
要加强对比的正确性 以及自信心, OCR 系统中则需要一些除错、 在 更正等 相关功能。
字词后处理技术就是一个利用源图片中识 别出的文字与其尽可能相似的选字群中进行比对 ,根 据前后的识别文字中,找出最合乎逻辑的字词,并作相 应的更正功能。
3 系统测试2. 4 文字特征抽取 3. 1测试环境 文字特征提取是 OCR 的核心,本文设计的日程提 系统的测试环境为 HTC 野火 S,具体参数如下:醒软件的核心技术是文字的特征抽取 。
用什么方法识 CPU 为高通 MSM7225 主频 528 MHz,内存 384 MB,系别文字的特征、如何抽取图片中的信息,直接影响到软 统为
Android 2. 3, 摄像头为 500 万像素, 支持自动对件的好与坏。
焦,主屏 3. 2 英寸( 1 英寸 2. 54 cm) ,分辨率为 240 ~ 对于文 字 特 征, 识 别 的 筹 码, 分 为 两 大 类: 是 可 320 像素。
将文中的应用程序进行签名分发, 利用 91( 1) 统计特征: 如文字的黑、白点数比。
当文字区分成 手机助手将本系统安装到
Android 手机上。
好几个区域时,这些区域黑、白点数比的集合,构成了 3. 2 功能测试空间中的一个数值向量。
在对比时,运用基本的数学 3. 2. 1 打开软件与获取图片理论就可以解决。
( 2) 结构特征: 譬如运用文字的影 ( 1) 打开 OCR 日程小秘书软件,用户可以拍摄图像细线化对比方法进行对比, 获取文字的笔画端点、 交 片,如图 5 所示。
叉点的数量和位置,或以笔画段座位识别文字的特征,再结合特殊的对比方法,进行对比。
通知日程提醒软件,即是通过拍摄通知、请柬等的文字信息,对图片内容的主要信息进行提取。
经过归一化处理后可以确保每次识别同一个字的图像都相同。
识别特征提取是通过对归一化后的单字图像进行 图5 打开摄像头拍摄照片多种方式的图片扫描,统计出多个特征值,这一组特征值即为该字图像的识别特征值组,在字典库中寻找与 拍摄完后,软件自动保存用户拍摄的图片。
当用该特征值组完全相同的特征值组, 并输出该特征值组 户选择拍摄图片时,选择后系统会内部调用手机照相所对应的汉字即为识别结果,如图 4 所示。
模式,只需按下拍照键,即可得到所需处理的图片,并 www. dianzikeji. org 47 图像编码与软.