IT产品热门报价
 手机 更多>>
 笔记本 更多>>
 数码产品 更多>>
 电脑硬件 更多>>
HOT: 泡泡堂 优化大师 FIFA 魔兽世界 人体摄影 劲乐团 汤加丽 刘亦菲
·北京 ·上海 ·广州
·杭州 ·深圳 ·合肥
·天津 ·西安 ·宁波
·南京 ·重庆 ·南宁

热门
  • NBA
  • 孙燕姿
  • 汽车
  • 黄家驹
  • 悍马
  • 宝马
  • 周杰伦
  • 李冰冰
  • 第8号当铺
  • 狼图腾
  • 齐秦
  • 狼的诱惑
  • 足球
  • 梦露遗照
  • 林志玲
  • 张曼玉
  • 徐若瑄
  • 张国荣
  • 浪漫满屋
  • 林俊杰
  • 游戏
  • RF Onlin
  • 航海世纪
  • 墨香
  • 英雄王座
  • A3
  • 仙境传说
  • 极品飞车
  • 魔力宝贝
  • 大话西游
  • 奇迹
  • 劲乐团
  • FIFA
  • 星际争霸
  • 魔兽争霸
  • 反恐精英
  • 天堂2
  • 热血传奇
  • 封神榜
  • 梦幻西游
  • 泡泡堂
  • 软件
  • kv2005
  • 木马克星
  • office
  • 优化大师
  • 天网防火
  • 金山毒霸
  • 金山快译
  • Winrar
  • ACDSee
  • 百宝
  • 超级解霸
  • 金山词霸
  • 变速齿轮
  • e话通
  • Ghost
  • Firefox
  • Photosho
  • PP点点通
  • 网际快车
  • QQ
  • IT类
  • 硬件
  • 手机
  • 耳机
  • 耳塞
  • CDMA
  • 手机定位
  • 彩铃
  • MP3厂商
  • 家用笔记
  • 百万像素
  • 智能手机
  • 滑盖手机
  • 笔记本
  • 数码相机
  • 手机促销
  • 水货手机
  • GPRS
  • 手机游戏
  • 手机铃声
  • 手机大全
  • 和弦
  • 四频
  • 三频
  • 三防手机
  • 首页 >> 办公产品 >> 办公产品应用指南
    [技巧]如何才能更加有效的提高OCR识别率? [办公产品应用指南]
    中国商情网
    2005-8-5 9:19:00 文/

      随着数字化时代的飞速发展,如今随机附带OCR识别软件的扫描仪也是越来越多了,当然这绝大多数都是基础版。由于存在此类OCR软件识别率太低,后期纠正处理过程过于麻烦的想法,很多用户都将其闲置一旁。但事实上,用户只需注意一些使用技巧,此类OCR软件的识别率完全可达实用化水平。

      原稿的质量直接影响到扫描出来的图像质量,更会直接影响最后OCR的正确率,因此我们首先要适当调整原稿。对于报纸一类的低质量稿件,可以考虑在扫描前用复印机先行复印并适当调节对比度和亮度,使背景变成白色,而文字色泽保持黑色即可。经过复印以后的报纸,OCR的识别率有明显的提高,完全可以和打印稿相比。

      扫描过程中原稿一定要放置正确,不能倾斜,否则扫描出来的字体也是倾斜的,OCR软件将无法正确识别。如果实在无法将原稿摆正,那就需要使用“自动倾斜校正”或者“手动纠斜”功能纠正字体的倾斜。当然选择适当的扫描参数也非常重要,一般OCR是原稿应扫描为“黑白二值”,扫描文字的亮度和对比度对文字的正确识别非常关键,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节,调节的工具是扫描仪工具内的“阀值”。

      而对于分辨率,用户选择的原则应为不求最“高”,只求最“佳”。如果分辨率太高,扫描的时间将会大大增加,图形所需的空间也会成倍地增长,无实际意义;如果分辨率太低,给OCR软件的信息量不足,识别率就不会很高。根据笔者的经验,普通五号印刷体采用250~300dpi比较合适;若字号比较大(四号以上),用150~200dpi就足够了;如果是六号或七号等小字体,就要考虑使用400~600dpi了。当然,这也不是绝对的,如果印刷字迹比较模糊,或者笔划较多的识别文本,应适当提高扫描的分辨率。这里额外再提供一个公式供大家参考:文件长度(字节)=(水平尺寸×垂直尺寸×扫描分辨率)/8。

      扫描后,我们还要观察图像是否有污点现象,如有则应使用图像处理软件将这些污点擦去。同时如果有图像存在,也会影响OCR的文字切分,可使用“图像的块擦拭”工具将文档中的图像去除。此外,还应采用适当的辨识方式,注意稿件是横排还是竖排,可选择合适的编排格式按钮,以保持对应。如有必要还可进行版面分析,因为没此步骤的话识别结果会有大量的空格,而OCR通常也将空白处作为识别对象。自动识别虽然可以很好地解决这一问题,但有时却常把不应分开的区域分开,造成识别结果的错误和颠倒。这时可以通过将自动分析与手工分析结合,将不恰当的版面分析删除。 现在大多数OCR都提供了简体、繁体、英文的识别方式,也应注意选择。最后,我们还可再次适当地调节对比度和亮度,因为这样可以增加文字和背景的对比度,从而最终均可达到95%以的OCR识别正确率,再略加校对一遍就万事OK了。

      另外提醒用户的是,应充分使用OCR识别软件的用户自学习功能。OCR识别软件内一般都含有用户自学习功能,如果个别字在扫描比较清楚的情况下,软件识别得不正确,就可以把这个字加到用户自定义库中,这样就可以逐渐地提高识别的正确性。要想获得较高的扫描识别率,用户应当不断进行尝试,找出一个适合OCR识别软件的扫描分辨率及扫描亮度以供参考。

    下一篇:[知识]解决点阵打印机故障的几个小技巧


    ·IT产品报价大全
    更多相关: 手机
    在百度中更多内容: 手机



    网 友 评 论(总共条评论)更多>>
    作者笔名简短内容发表时间
    姓名:
    内容:


    打印此页 投稿与建议 返回顶部

    相关文章
  • [知识]菜鸟入门课!最初级打印机使用指南(下) 2005年8月3日
  • [知识]菜鸟入门课!最初级打印机使用指南(上) 2005年8月2日
  • [维护]理光5627垂直黑条现象的分析与处理 2005年8月1日
  • [维修]理光FT4000系列复印机常见故障分析与维修 2005年7月29日
  • [技巧]懒人要有懒办法 共享打印如何快捷安装 2005年7月28日
  • [维修]EPSON打印机常见故障及维护解决方法 2005年7月27日
  • 图述墨水制作过程!访问日本墨水工厂 2005年7月25日
  • 投机取巧害自己!降成本注墨三大误区 2005年7月22日
  • 一般人我不告诉他!打印墨盒购买技巧 2005年7月21日
  • [维护]炎炎夏日 小心注意呵护好你的复印机 2005年7月20日
  • [知识]经验谈:怎么样使复印机耗材更耐用 2005年7月19日
  • [应用]复印机最常见五类故障的分析解决 2005年7月18日