成果、专家、团队、院校、需求、企业在线对接

面向表单图像的文字识别与智能信息处理平台

成果编号:33123
价格:面议
完成单位:苏州大学
单位类别:211系统院所
完成时间:2022年
成熟程度:小批量生产阶段
服务产业领域: 电子信息
发布人:陈文亮 离线
苏州大学智能信息处理平台的目标是能处理多模态文字数据,精准分析语言内部结构,对人类语言进行深层理解,以支持各种应用需求。系统可以处理多种非结构化数据,比如说明书、技术标准、车间工单等纸质文档或电子文档。把图像识别技术(OCR)和自然语言理解技术(NLP)相结合,从表单图像中抽取关键要素信息。在此基础上,我们搭建了包括知识图谱问答 (KBQA)、常见问题检索 (FAQ)、对话 (Chatbot)在内的智能问答及对话系统、以及面向大数据的文档信息抽取系统。能够对给定的自然语言问题通过查询、推理提供精准满意的答案,和面向大规模文档提供信息抽取和舆情分析等服务。目前已经向多家公司提供各项相关服务。
140 次浏览 分享到

成果介绍

科技计划: 其他:
成果形式:新技术
合作方式:技术开发、技术服务
参与活动: 2022年高校院所走进镇江产学研合作对接活动
专利情况: 正在申请 ,其中:发明专利 0
已授权专利,其中:发明专利 3
成果简介
成果概况
苏州大学智能信息处理平台的目标是能处理多模态文字数据,精准分析语言内部结构,对人类语言进行深层理解,以支持各种应用需求。系统可以处理多种非结构化数据,比如说明书、技术标准、车间工单等纸质文档或电子文档。把图像识别技术(OCR)和自然语言理解技术(NLP)相结合,从表单图像中抽取关键要素信息。在此基础上,我们搭建了包括知识图谱问答 (KBQA)、常见问题检索 (FAQ)、对话 (Chatbot)在内的智能问答及对话系统、以及面向大数据的文档信息抽取系统。能够对给定的自然语言问题通过查询、推理提供精准满意的答案,和面向大规模文档提供信息抽取和舆情分析等服务。目前已经向多家公司提供各项相关服务。
创新要点
1) 可处理印刷体和手写体混合的图像文件,抽取关键要素信息。 2) 利用自然语言理解技术深层理解所抽取的要素信息,并建立它们之间的联系,构建知识图谱。 3) 能对给定自然问句进行理解,通过查询、推理提供精准满意的答案。 4) 实现基于知识图谱的问答系统和常见问题检索系统。 5) 提供面向大规模文档的信息抽取和舆情分析服务。
主要技术指标
1) 中文命名实体识别正确率95%以上。 2) 关系抽取正确率80%以上。 3) 事件抽取正确率80%以上。 4) 知识图谱问答正确率85%以上。
其他说明
1) CCKS2021面向金融领域的事件因果关系抽取 第四名(技术创新奖 2) 2021语言与智能技术竞赛(LIC):多形态信息抽取任务三等奖。 3) CCKS2020金融事件要素抽取任务(苏大-华为联合组队):第1名 4) CCKS2019中文知识图谱问答KBQA任务(苏大-华为联合组队):第2名&技术创新奖 5) 2019年搜狐内容识别算法大赛:亚军 6) CCL2018 中移在线客服领域用户意图分类:第一名 7) CCF-CIDB2017 情感分析任务:三等奖
完成人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
联系人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看

咨询与解答