近期,上海合合信息科技股份有限公司(以下简称“合合信息”)启动IPO引发了众多关注。说起合合信息,大家可能比较陌生,但谈起扫描全能王,相信很多人都比较熟悉,其母公司便是合合信息。作为一款智能扫描及文字识别APP,扫描全能王的用户可以说是遍布全球。
以扫描全能王“文件转换excel”相关功能为例,自推出以来已被调用百万次,“文件转换excel”功能的技术支撑是合合信息深耕多年的智能文字识别技术。
无论是工作还是学习中,表格处理的任务都不轻松,尤其是复杂场景下的表格识别,难上加难。洞悉于此,合合信息利用高精确度的表格识别技术帮助用户节省文件处理时间。这也是合合信息智能文字识别技术中,图像处理和复杂场景文字识别技术的重要应用。
近年来人工智能技术飞速发展,计算机视觉(CV)、自然语言处理(NLP)和图神经网络等深度学习方法被广泛引入表格识别任务中,例如语义分割、目标检测、序列预测等。在16年领域深耕中,合合信息智能文字识别技术覆盖了图片、PDF格式文档中多种类的表格识别需求,包括有线表,三线表,无线表等,并且支持合并单元格、多表格并存等复杂情况的识别。
基于分治思想,合合信息引入深度学习技术,将表格识别分为有线表识别和无线表识别两种方案。有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。
无线表缺少表格线,直接套用有线表识别方案无法得到理想的表格结构。合合信息无线表识别采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。
除了应用在扫描全能王APP中,合合信息的表格识别技术还已落地在保险、银行、证券等行业中,应用于合同、银行流水、物流单据识别等多个场景。曾助力全球知名汽车零配件供应商伟巴斯特实现票据智能扫描、识别、验真、合规自动检查、发票与订单数据匹配、数字化数据、影像留存等全流程财税管理,作业效率提升500%~1000%。
据悉,合合信息是一家人工智能及大数据科技企业,从2006年创立至今,坚持深耕智能文字识别应用及商业大数据核心技术领域,通过C端、B端产品以及行业解决方案,为全球百余个国家和地区的亿级用户及近30个行业的企业客户提供创新的数字化、智能化服务。
除了智能文字识别外,合合信息在商业大数据领域基于大数据挖掘、知识图谱、NLP技术开发了启信宝APP,以及可服务于多种行业、多类型企业客户的商业大数据服务,通过“数据-信息-知识-智能”4个层次,挖掘商业数据背后蕴藏的价值,赋能各行各业。
合合信息对于AI和大数据的布局,是基于对这两项技术和行业需求的深入理解。据称,这两项技术相辅相成,海量的大数据可以帮助深度学习算法模型的设计和优化,同时AI模型也可实现更高效、深层的数据挖掘。并且,AI与大数据业务的客户需求也具有一定程度的重叠,两者协同耦合可以实现更多应用,能更好的解决各行业数字化转型遇到的问题。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
关键词: