打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
法律人,还在苦逼地手打录入吗?试试这些文本识别软件 | iCourt

iCourt 是一家与众不同的法学院,在这里学习12门律师执业必备课程,掌握超人一步的思维、强大的技能与高效的工具,联结5000名律界同行者。我们还为您配备最 新MacBook、专业数据库和不断更新的云课堂。长按二维码联系课程顾问诺诺多(inuonuoduo),成为iCourter。



投稿请联络微信:huangln5


法律人,还在苦逼地手打录入吗?试试这些文本识别软件


作者:上官明泓

单位:北京大成(宁波)律师事务所


把纸质版的内容转化为电子版,除了手打,还有更方便快捷的方法吗?已经是互联网+的时代了,想要更有效率的工作,GET新技能是必须的。
见过N多的律师助理,拿着刚收到的判决书,按照原样录入文字。几十页的判决书,这样敲键盘,真够苦逼的。裁判文书上网没那么快吧,让书记员给发判决书的word文档?其实这样的印刷体,OCR分分钟帮你实现,何苦码字。

根据维基百科的解释,光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。体验过谷歌、超星数字图书馆,反正我是相信标准印刷体文本的识别率已经达到99%以上。


扫描设备及格式转换。平板扫描仪;CamScanner(扫描全能王),将智能手机变成随身携带的扫描仪。PDF格式转换,推荐PDFPatcher(PDF 补丁丁)。图片格式转换,敬请Google。

分辨率设置技巧。分辨率的大小,决定了图像是否能够被清晰地扫描出来;而文稿内容是否能够被正确地识别,与扫描分辨率的设置有直接的关系。如果是扫描仪扫描的话,分辨率建议不低于300dpi;如果用相机或智能手机获取图像,分辨率要在500万像素以上。

老马说:OCR技术发展到现在,识别率差异已经很小了,差异都在图像上。分辨率太低,笔画粘连,识别结果太不令人放心。从人眼的角度来看,可能150dpi已经“足够清晰”,所以就以为150dpi和300dpi是一回事,但从机器的视角看,二者清晰度存在本质的差异,所以150dpi OCR的结果哭笑不得,300dpi则大不同。


若要诉讼档案数字化,请参阅推荐性国标《GB/T 31219.3-2014 图书馆馆藏资源数字化加工规范 第3部分:图像资源 》。


OCR软件与App推荐。

以下结合实例,展示各软件的效果。样张:




1.Abbyy FineReader




来自战斗民族,是世界排名第一的 OCR 文字识别工具,重量级的。只喷,在进行批量识别的时候消耗大量内存、CPU资源。


2.文通TH-OCR免费版



轻量级的,内存、CPU占用率小。北京文通科技有限公司是享誉国内外的OCR技术生产商、文档影像技术和应用解决方案提供商,软件产品及技术被微软、IBM、HP等公司所采用,文字识别的研究水平和成果在世界上得到了较普遍的认可。


官方下载:http://www.wintone.com.cn/a/service/downloads/entry108.aspx

3.汉王PDF OCR(免费)



轻量级的,内存、CPU占用率小。汉王科技股份有限公司,是全球文字识别技术与智能交互产品引领者,在手写识别、OCR、笔迹输入等领域拥有多项具有自主知识产权的核心技术, OCR获得国家科技进步二等奖。OCR领域市场占有率超过50%,处于绝对优势地位,微软、三星、LG、联想等厂商相继采用汉王技术。


官方下载:http://hw99.com/download/2799.htm

4.Office Lens



大公司微软出品,支持中文OCR文字识别的App,重点是完全免费,点赞。


以上软件或App,均可轻松上手。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【PDF】怎样将扫描的图片变成可编辑文件
OCR识别软件哪个好?
把扫描的文档转成电子版
提高扫描仪OCR识别率几个方法
扫描识别技巧
扫描的pdf图片转文字,并进行编辑!你是如何做到的?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服