|
苏州大学
  • 0 高校采购信息
  • 12 科技成果项目
  • 0 创新创业项目
  • 0 高校项目需求

面向表单图像的文字识别与智能信息处理平台

2022-08-15 16:13:07
云上高博会 https://heec.cahe.edu.cn
所属领域:
新一代信息技术
项目成果/简介:

苏州大学智能信息处理平台的目标是能处理多模态文字数据,精准分析语言内部结构,对人类语言进行深层理解,以支持各种应用需求。

一、项目分类

显著效益成果转化

二、技术分析

苏州大学智能信息处理平台的目标是能处理多模态文字数据,精准分析语言内部结构,对人类语言进行深层理解,以支持各种应用需求。系统可以处理多种非结构化数据,比如说明书、技术标准、车间工单等纸质文档或电子文档。把图像识别技术(OCR)和自然语言理解技术(NLP)相结合,从表单图像中抽取关键要素信息。在此基础上,我们搭建了包括知识图谱问答 (KBQA)、常见问题检索 (FAQ)、对话 (Chatbot)在内的智能问答及对话系统、以及面向大数据的文档信息抽取系统。能够对给定的自然语言问题通过查询、推理提供精准满意的答案,和面向大规模文档提供信息抽取和舆情分析等服务。目前已经向多家公司提供各项相关服务。

应用范围:

1)可处理印刷体和手写体混合的图像文件,抽取关键要素信息。

2)利用自然语言理解技术深层理解所抽取的要素信息,并建立它们之间的联系,构建知识图谱。

3)能对给定自然问句进行理解,通过查询、推理提供精准满意的答案。

4)实现基于知识图谱的问答系统和常见问题检索系统。

提供面向大规模文档的信息抽取和舆情分析服务。

效益分析:

1) 中文命名实体识别正确率95%以上。

2) 关系抽取正确率80%以上。

3) 事件抽取正确率80%以上。

4) 知识图谱问答正确率85%以上。

知识产权类型:
发明专利
技术成熟度:
可以量产
技术先进程度:
达到国内先进水平
成果获得方式:
独立研究
会员登录可查看 合作方式、专利情况及联系方式

扫码关注,查看更多科技成果

取消