- OCR文本识别,场景虽小,大有乾坤
- 来源:安全自动化
AI赋能千行百业的口号如今正在逐步落地实践,普罗大众在日常生活的衣食住行之中也越来越多的感受到AI带来的智能和快捷。
比如社区场景中出入口的人脸识别通道、社区智能垃圾分类、电瓶车禁入电梯系统;办公场景中人脸识别门禁考勤、票证识别;包裹收寄场景中图片转文本的一系列应用等等。
如此来看,不知不觉中,除了人脸识别的应用外,文本识别也已经深入渗透到大众生活当中,并为我们带来了诸多便利。
关于文本识别技术,其是计算机视觉和目标识别的基础研究之一,可以将图片、扫描件中的文字识别成可以编辑的文本,代替人工手动录入,近年在深度卷积神经网络的推波助澜下飞速进展。
文本识别技术 秒识万千字符
平安科技就曾表示,文本识别技术的研究价值巨大,对人工智能在地图导航、智能交通、信息检索、机器视觉等领域的发展有较强推动作用,具有广阔的应用空间和重要的研究意义。
随着各行各业信息化程度的提升,很多需要文字信息录入的场合如今也在实现业务流程的数智升级。传统的票据录入、单据录入、各种证件执照等文件信息的录入以往基本只能人工手动输入,不仅效率低下,还容易出错。如今在AI技术赋能之下,卡证票据文档识别技术的投入使用,可迅速提升文本信息的录入效率,并且识别准确率基本可达99%以上。
为了让这项技术能够更方便的为人所用,目前不少企业已经开发了相当成熟的票证识别应用程序,嵌在各种业务办理平台的辅助功能当中,方便随点随用。
比如平安科技专门研发的“平安票证识别通”,目前已接入平安产险、平安寿险、平安信托等企业中,广泛应用于移动开户、移动投保、银行票据录入、医疗单据录入等场景,可准确识别身份证、行驶证、驾驶证、营业执照、医疗发票等证件票据。
复杂且个性化的文字和各类字符丰富着我们的日常生活,不过,这也给文本识别带来挑战。
比如在城市治理场景中,城市街道沿街商铺各类个性化的招牌,招牌颜色各异、招牌大小不一、随意变更招牌以及小广告粘贴等问题,这不仅影响市容市貌也存在安全隐患。紫光华智推出的街面OCR识别算法可准确识别不同招牌的文本和语义信息,提升城市智能化管理能力和效率,助力城市精细化管理。
而在大华股份针对文本识别技术的应用案例中,我们还看到了文本识别在在钢铁、能源、交通等行业的应用。比如在钢铁、能源领域,通过编号识别算法自动获取车辆、集装箱、钢卷等目标上的编号信息,助力高效管理;在交通运输安全管理领域,运用自然场景文字识别算法自动读取车身文字信息,智能筛选出重点管理车辆,以便针对不同车型采取不同管理方案。
又或者在医疗领域,帮助公司识别药品说明书,帮助公司快速构建药品说明书的信息库;在物流领域,通过文本识别技术快速完成各类单据自动识别,提效降本效果显著……文本识别技术可适用场景相当广泛,有了文本识别算法,也藉由机器之“眼”,让我们从此告别繁琐的手动输入低效率方式。
文本识别技术的难点和挑战
扫描的单据往往存在虚线干扰、版面缺失、倾斜、暗光、扭曲、噪声等情况,定位难度大。
文字千变万化,例如字体、字号、颜色、笔画宽度等不固定,方向任意;小数点、近似英文数字、特殊符号、连接词、艺术字等,容易被漏检或误识别。
语言种类繁多,经常是中英文混合,多种语言混合等场景,识别难度加大。
表格单据经常存在盖章(印章覆盖文字)、错行(文字溢出表格单元,与表格线交叉)的情况,也造成文字识别干扰,极大影响识别准确率。
拍照上传的图片存在噪声、模糊、光线变化、形变、复杂背景干扰等问题,对文字定位和识别的准确度是巨大的挑战。
机器不同于人眼,尤其在现实场景中,字体设计、文本背板、语种以及外部的光线环境等各类因素都可能对机器识别造成干扰,而这也正是当前AI视觉企业在文本识别算法上需要攻破的技术方向。
当然,我们也看到了相关企业在算法研究上取得的进展。比如针对低质量图像、生僻字、艺术字的识别。
大华依托自研的“巨灵”人工智能平台,对识别算法进行深度改进,运用多尺度融合、跨层链接等先进技术,提高了算法对这类文本的识别效果;紫光华智则结合多尺度融合、注意力机制、多模型融合等先进技术及基础数据分析,对难例样本进行数据增强,实现了对图片像素低、质量差、艺术字体等识别效果的大幅提升;华为云采用了黑边处理、自动纠偏、去噪、图像自动旋转、多种二值化等方法处理图像,从而提高了扭曲、复杂背景、光照、模糊场景下的文字检测识别准确率。
在AI视觉企业的持续探索之下,文本识别算法也得以不断演进,而伴随着算法的日趋成熟,作为AI赋能千行百业的又一个典型,文本识别场景虽小,却大有乾坤!
往期回顾
科技
-
-
- 线下展会,市民畅享科技大餐
- 5月28日,是2021中国国际大数据产业博览会线下展最后一天,也是免费向市民开放的公众日。趁此机会,记者继续带您探秘国际综合馆(W1馆)、数字应用馆(W2馆)、前沿技术馆(E1馆)、智慧产业馆(E2馆)4...
- 贵阳晚报
-
-
-
- 为何新药研发、基因测序、卫星遥感的发展提速都需要它?
- 人类第一次完整全基因组的测序花了13年,在新技术的加持下,这个时间已经降低到1天以内;没有这项新技术加持,电影《阿凡达》的渲染可能需要上万年;这项新技术还让新药的研发周期大幅缩短,让卫星遥感定位精度...
- 华为
-
-
-
- 大型金属3D打印厂商钢研极光亮相TCT,展示强大的生产服务能力
- 2021亚洲3D打印、增材制造展览会 (TCT Asia)于2021年5月26日-28日在国家会展中心(上海)7.1馆隆重举办。作为官方战略合作媒体,南极熊将会全程现场报道(地址https://www.nanjixiong.com/foru
- 南极熊3D打印
-
-
-
- 美国国家情报委员会《全球趋势2040——竞争更激烈的世界》报告摘译
- 2021年3月,美国国家情报委员会(NIC)发布了每四年一度的全球趋势预测报告《全球趋势2040——竞争更激烈的世界》。NIC是美国最高层级的战略情报机构,该委员会的成员均为来自政府、学术界和私营部门的高级专家...
- 全球技术地图
-
-
-
- 数字让监管更加智慧 上交所成功举办首届全行业技术大会
- 5月28日,上交所成功举办主题为“数字赋能,守正创新”的首届全行业技术大会。中国证监会副主席赵争平出席大会并致辞指出,证监会高度重视资本市场科技化转型与发展,确定了“数字让监管更加智慧”的愿景。...
- 上海证券报
-
-
-
- 湾区智行||中科创达赵鸿飞:汽车“新物种”需要共通的操作系统|中国汽车报
- “我是谁?我来自哪里?我要到哪里去?”这是哲学史上永恒的三大命题,同样也是我们甚至是企业需要不断思考的问题。此次采访对象——中科创达软件股份有限公司就是一家勤于思考、擅于思考的企业。这家企业在不断...
- 中国汽车报
-
-
-
- 广电总局表彰虚拟现实视频、超高清视频等5类96个优秀项目!
- 广电总局共评选出互动视频、沉浸式视频、虚拟现实视频、云游戏、超高清视频等5类96个优秀项目,分获一、二、三等奖和优秀奖,包括《中央广播电视总台5G+VR融合制播系统——春节联欢晚会 (2017- 2021)节目VR制作...
- 广电头条
-
-
-
- 占据市场最新赛道,“中国制造”机器人迎来爆发期
- 【环球时报记者 邢晓婧 杨沙沙】配餐机器人、迎宾机器人、扫地机器人……不知不觉间,中国老百姓对出现在餐馆、医院、火车站、养老院等场景的机器人逐渐习以为常,甚至家中也出现扫地、娱乐等家用机器人。有统计...
- 环球网
-
-
-
- 最受关注展项出炉,2021年北京科技周闭幕不落幕!
- 5月28日下午,2021年北京科技周闭幕式在中关村国家自主创新示范区展示中心举行。北京市科委、中关村管委会相关负责人介绍了本届北京科技周举办情况以及最受关注的展项。市科委、中关村管委会二级巡视员王建新出...
- 科普北京
-
-
-
- 魔高一尺,道高一丈:上交所VPN攻防札记
- 本文选自《交易技术前沿》总第四十二期文章(2020年12月)谢毅 / 上海证券交易所 yxie@sse.com.cn相晓辉 / 上海证券交易所 xhxiang@sse.com.cn虚拟专用网络(以下简称“VPN”)系统、互联网业务系统、外网
- Android编程精选
-
-
-
- 绿色召集令——聚力创赢,共赴绿色能源新征程!
- 申耀的科技观察读懂科技,赢取未来!申耀的科技观察,由科技与汽车跨界自媒体人申斯基创办,18年企业级科技媒体工作经验,专注企业数字化、产业智能化、智慧城市、汽车科技内容的观察和思考。
- 申耀的科技观察
-
-
-
- 汉朔科技和微软(中国)联合推动 IoT+AI 赋能全球零售
- (本文阅读时间:4分钟)2021年5月20日,全球领先的零售数字化解决方案供应商汉朔与微软(中国)在北京举行战略合作备忘录签约仪式,以进一步推动其在零售行业的全球布局和数字化战略。根据战略合作备忘录,汉朔...
- 微软科技
-
-
-
- 关于安全访问服务边缘(SASE),你需要知道的事情
- 在企业纷纷拥抱数字业务的过程中,由于边缘计算、云服务、混合网络的逐渐兴起,使得本就漏洞百出的传统网络安全架构更加岌岌可危,而且远远无法满足企业数字业务的需要。为了应对这种情况,一个全新的模型——安...
- FreeBuf
-
-
-
- [报告]2021年中国新能源汽车行业洞察(附44页PDF文件下载)
- 新能源车大势将至,造车新势力差异化突围。以下为报告节选:......文│Mob研究院本报告共计:44页。如欲获取完整版PDF文件,请扫描下方二维码加入“车友圈”获取。#重磅推荐#需要批量下载和及时更新最新汽车行业...
- 汽车之地
-
