代 表 ,于 1 0 的 置 为 1, 于 1 0 的 置 为 0, 值 化 后, 片 二 值 9 小 9 阈 图 现在所有点处在未判断的状态 ;化了。
0<= <n-1, 果 p(,) ② 对于 0<= <m-1, i j 如 ij =1. 3 长直线剔除 1. 0,则将 p(,) ij 加入到队列 Q 的尾部。
初 始 区 域 为(, ,, iji 因为聚类算法是将 距 离 较 近 和 颜 色 相 同 的 点 归 为 一 ) j;类,所以长线会影响本算法的正确率 。
需要长线剔除 的 原 ③ 如果 Q 不为空, 进入下一步, 否则跳入 ⑤ ;因有两个: 两个字之间会因为长线的存在导致在后 面 聚 ① 如 ④ 从 Q 的 前 端 取 出 一 个 点, 果 当 前 点 的 颜 色 和 上类算法在文本聚类 的 过 程 中 分 辨 不 出 是 两 个 文 字 还 是 一 下左右点的颜色相同并且状 态 为 0, 将 上 下 左 右 4 个 点 则个文字,所以要进行 长 线 剔 除 ; 长 直 线 的 存 在 会 影 响 聚 ② 加入到 Q 中, 置 并且 改 变 4 个 点 的 状 态, 其 为- 。
并 修 改 1类扫描算法作出判断 ,所以必须将长线剔除 。
lu r d 中上下左右的值 。
并且返回到 ③ ; 区域(, ,, ) 有关长直线的剔除有很多的方法 ,其中比较成熟 的 有 lu rb 是 ⑤ 利用成类的条件判定所 形 成 的 (, , , ) 否 可 以 但位运算的方 法, 是 位 运 算 对 比 较 短 的 直 线 也 进 行 了 剔 确定为背景类。
若满 足 条 件 则 添 加 该 类 到 最 终 的 聚 类 列除,因此采用位运算的算法会降低文字识别的正确 率 。
所 表中,若不满足,则将该类所有的点的状态置为- 。
1以采用以下算法 : 上文提到的成类条件对于不同的情况 ,设置的条 件 不 0 输 输入二值图像 I m, ) 正 整 数 a , 出 时 I ( , ) ( n, 0mn, 一样。
在本研究中, 0区 设置的条 件 为 区 域 宽 度 大 于 3 , 域其中 a 是阈值, 0 小 大于 a 的横 线 将 会 被 剔 除, 于 a 的 横 0 0 0区 高度大于 2 , 域 中 的 点 的 成 员 数 占 该 区 域 面 积 至 少 一线将会被保留。
半,或者该区域的大小为整个位图 。
对图片中的每一行做如下处理 : 1. 2 文字提取 2. 1 定义ij, u t它们分别为横坐标 、 () ,c n o 纵坐标和 计 算 只 只 经过背景剔除后 , 剩 下 少 量 的 点 需 要 检 查, 需 要值,分别初始化为 0, , 。
01 对状态点为- 的点 判 别。
因 此 背 景 剔 除 有 利 于 提 高 本 文 1 2 若当前点为 1, () 如 测试 下 个 点 是 否 为 1, 果 为 1,则 字识别技术的效率 。
c u t加 1,on 如果当前点不为 1 则判断 c u t与 a 的 大 小, on 0 输入为经过背景剔除后的图片 , 记为 I( , ) 输 出 为 mn ,同 时置 c u t为 1, on 如果大于或者等于 , 则将Ii 〔 -c u t 〔〕 j on 若干个由四元组(, ,, ) 代 表 的 文 字 区 域。
每 个 四 元 lu r d 所… .-1 置 为 0, 则 不 处 理, 中 纵 坐 标 变 化 时 还 需 判 j 〕 否 其 组所围成的区域组成一个文本区域类 。
断j 是否小于n, 果 大 于, 判 断 c .
上一篇:
基于Android系统的Camera模块
下一篇:
数控回转工作台设计 毕业设计word2003