一、实施背景
当前,在用户注册、远程开户、商户入网、财务报销、金融信贷审批等场景中,存在海量的卡证、票据、表单凭证、合同需要数字化后审核,这些纸质资料易丢失、损坏,不易保存和传递,传统人工操作面临着耗时长、易出错、风险高、运营成本高等问题;另一方面,业务数据采用图片的形式存储,导致系统里都是非结构化文档,无法准确检索和流转,对后续流程造成诸多不便。
银联商务股份有限公司作为国内最大的银行卡专业化服务机构,在国内银行卡专业化服务领域占据了近50%的市场份额,业务量巨大。在处理银行卡证业务流程中,需要手动输入大量的文字和数据,这不仅降低了工作效率,还可能导致错误。基于现实的业务挑战,银联商务上线了译图智讯旗下的OCR文字识别平台,用于解决业务过程中大量卡证、票据、文档等材料手动上传与录入的难题。
二、实施目标
译图智讯作为专注研发图像识别、OCR文字识别的人工智能企业,核心技术包括图像OCR识别引擎、深度学习OCR引擎、自然语言理解(NLP)等技术,具备成熟稳定的OCR识别解决方案,致力于为客户构建数据自动化采集、业务自动化审核的业务流程,助力企业实现数智化转型,为用户降本增效。
银联商务上线译图智讯OCR文字识别平台,将极大提高信息录入效率和准确性,降低人工成本。通过引入OCR技术,实现对各类票据、证件等纸质文件的自动识别和数字化处理,减少人工干预,提高工作效率。同时,通过优化算法和模型,提高识别准确率,避免因人为错误导致的业务风险。
此外,译图智讯OCR文字识别平台还可以为银联商务提供更丰富的数据资源,支持精准营销、风险管理等业务发展,有助于提升企业核心竞争力,进而为其客户提供更优质的服务。
三、建设内容
(一)OCR文字识别平台工作模式
译图智讯OCR文字识别平台是集多种识别模块于一体、可自主进行模型管控的识别平台。银联商务OCR文字识别项目应用译图智讯OCR文字识别平台,集OCR识别、NLP自然语言处理、深度学习、智能文档处理等多项核心技术于一体,包含文字识别、表格识别、卡证识别、票据识别、房产证识别等全品类识别产品的技术体系,其识别服务具有多场景、多应用、多部署方式,高精度、高速度、高稳定性的特点与优势。
通过提供管控平台、模型推理端源码,企业可根据模型结构、推理过程及其它功能,实现OCR识别模型的自主可控,真正将OCR的能力赋能于企业,并共同进行技术创新,探索OCR识别的更多可能性。
(二)OCR识别平台技术底座
译图智讯OCR识别平台深度学习技术的应用,使OCR识别性能得到了跨越式的升级。深度学习OCR借助神经网络可模仿人脑机制对图像、文本等数据进行分析,可更加可靠、快速的完成海量样本的训练,得到近似专家能力的最优模型,同时在低质量图像、生僻字、非均匀背景、多语言混合等复杂场景中实现了高效精准的识别与分类。
NLP智能提取技术的研发,实现了文档图像的关键信息分析和提取,可自动从非结构化信息中提取目标数据,可满足所有文本的关键信息提取需求。通过模型管控,企业可通过少量样本,高效完成模型的标注训练,自定义创建提取模型。
通过不断技术创新,译图智讯OCR识别产品性能一直处于行业领先地位,识别率高于99%、识别平均耗时低于200ms,并可针对证件更新进行快速响应推出新产品。
银联商务部署OCR识别平台后,一方面可以整合资源,向各部门、各分支机构,以及外部合作单位提供公有云接口输出或者本地化部署服务;另一方面可以助力金融业务办理流程的降本增速,提升业务效率,提高客户体验感。
四、实施效果
引用OCR识别平台后,通过计算机代替人工操作,实现全票据、人证、车证、企业证件、各类文档的信息自动识别、自动分类、自动录入,可将纸质文件的数据信息转换成计算机可编辑的结构化数据,工作人员只需上传文件即可实现一键识别、一键录入、一键分类,节省95%以上的工作量。
针对关键字段审核难题,也可通过关键点的标注训练,进行关键词的提取审阅和系统录入,真正做到对文档凭证的高效管理,提高了业务办理流程的电子化、数据化能力,使得用户业务办理更便捷、更安全、更高效,节省的人力时间成本可创造更多价值。
银联商务上线译图智讯的OCR文字识别平台代替人工操作,一秒钟可完成三张卡证的识别审核,单页文档识别只需要2-3秒,业务办理审核效率提升几十倍,新商户入网达200多万家。
如今,银联商务布设的百万级海量终端已全面拥抱互联网,实体服务网络覆盖中国大陆所有地级以上城市及港澳地区,并拓展至96%的县域,在线上和线下的支付场景中形成了完整的服务能力。