基于本体的数字出版物语义标注优化方法
本专利系统所要解决的技术问题正是对上述存在的技术不足,提出了一种基于本体的数字岀版物语义标注优化方法。其公开了在语义分析与标注方法中,进行段落分词,其中,段落分词包括字符串匹配分词、最短路径分词和词义分词法等
一、项目分类
关键核心技术突破
二、成果简介
现阶段关于数字出版物内容提炼标注技术大多是根据基本词库及内容上下文进行抽取的,没有结合出版物的领域背景,从而降低了标注在特定领域的准确性,导致信息可达性降低、传播效率降低。
本专利系统所要解决的技术问题正是对上述存在的技术不足,提出了一种基于本体的数字岀版物语义标注优化方法。其公开了在语义分析与标注方法中,进行段落分词,其中,段落分词包括字符串匹配分词、最短路径分词和词义分词法等;然后进行语义标注,即为文本中的词分配词性信息(例如名词、动词等);最后,进行段落-维度结构化关联,将段落在语义空间上的点坐标表示出来。
因此,本发明相对于上述该文献实际解决的技术问题是:如何提高标注的准确性和检索的准确性。本专利系统对数字出版内容进行知识化加工,优化了现有的语义标注方法。
武汉理工大学
2022-08-12