基于本体的数字出版物语义标注优化方法
2022-08-12 16:32:31
云上高博会
https://heec.cahe.edu.cn
所属领域:
新一代信息技术
项目成果/简介:
本专利系统所要解决的技术问题正是对上述存在的技术不足,提出了一种基于本体的数字岀版物语义标注优化方法。其公开了在语义分析与标注方法中,进行段落分词,其中,段落分词包括字符串匹配分词、最短路径分词和词义分词法等
一、项目分类
关键核心技术突破
二、成果简介
现阶段关于数字出版物内容提炼标注技术大多是根据基本词库及内容上下文进行抽取的,没有结合出版物的领域背景,从而降低了标注在特定领域的准确性,导致信息可达性降低、传播效率降低。
本专利系统所要解决的技术问题正是对上述存在的技术不足,提出了一种基于本体的数字岀版物语义标注优化方法。其公开了在语义分析与标注方法中,进行段落分词,其中,段落分词包括字符串匹配分词、最短路径分词和词义分词法等;然后进行语义标注,即为文本中的词分配词性信息(例如名词、动词等);最后,进行段落-维度结构化关联,将段落在语义空间上的点坐标表示出来。
因此,本发明相对于上述该文献实际解决的技术问题是:如何提高标注的准确性和检索的准确性。本专利系统对数字出版内容进行知识化加工,优化了现有的语义标注方法。
应用范围:
随着计算机、通讯以及网络技术的发展,互联网数字内容资源爆炸式增长,传统出版业务与数字出版业务并重发展的格局逐步形成。数字出版强调内容数字化、生产模式和运作流程的数字化、传播载体的数字化阅读和消费形态的数字化。数字岀版业务中最为核心的工作就是内容资源的整合与利用。
武汉理工大学联合时代出版传媒股份有限公司,面向国家新闻出版行业发展的重大需求和普遍问题,立足自主创新,对知识资源统一组织、知识资源语义加工、知识资源精准推送等数字出版智能服务关键技术进行攻关与应用,形成专利:基于本体的数字出版物语义标注优化方法。
本专利已广泛应用于出版社、期刊社和互联网知识服务企业,覆盖全国20个省/直辖市,服务于全国1700多家出版机构,有效降低平台用户信息获取成本,缓解信息过载问题,提升用户的消费体验。目前,全国已有1570家期刊社加入到该计划中,有效提髙其传播力,加强科研诚信建设(见“附件2-1应用评价”)。
效益分析:
1、经济效益
数字出版智能服务平台在该专利的支撑下,提升了用户内容检索和标注信息主动服务的交互体验,用户知识服务的感知价值逐步提升,导致内容消费用户快速增加、内容消费金额不断增长,形成了知识服务增收和内容产品(即书报刊等出版物)增收两大收入来源。
其中,知识服务增收由专利权人(平台方)和出版机构分成,专利权人分成占40%,数字出版智能服务平台2019-2020两年产生的知识服务增收分别为87173.23万元、90607. 87万元,所以两年新增利润为34869. 29万元、36243. 15万元。内容产品(即书报刊等出版物)增收专利权人不分成,由出版机构独享。
2、社会效益
1)科技创新体系建设。在项目成果的基础上,武汉理工大学建设有国家数字传播创新人才培养示范基地、国家新闻出版署出版融合发展(武汉)重点实验室、国家出版融合数据共享研发基地、湖北省数字出版工程技术研究中心等科研机构,形成大数据知识服务和媒介融合领域产学研一体化的科研创新集群。时代出版传媒股份有限公司作为牵头单位建设的“教育资源动态数字出版重点实验室”成功入选原国家新闻岀版广电总局岀版融合发展重点实验室和安徽省重点实验室。
2)保障文化安全舆论安全。以此专利及相关专利技术构建起数字出版智能服务平台,为新闻出版机构的融合转型提供整体解决方案,壮大主流舆论阵地,坚守意识形态安全。其中,武汉•国家出版融合数据共享研发基地等数据中心的建设,实现了全国新闻出版行业大数据的共享存贮,为保障国家文化安全、网络信息安全、大数据安全奠定坚实基础。
3)提高公共文化服务水平。本专利的实施从新闻出版机构的供给侧出发,依托其专业生产、垂直细分和场景应用等优势,以纸质书报刊为介质,将优质、多形态的知识资源与受众的理想需求进行对接,拓展了服务端深度和广度。同时,项目的实施重点在教育领域多方整合教育资源,利用教辅参考教材等书刊的线上衍生知识服务,使得公众能够享受到更加公平、髙效、优质、便捷的公共文化服务,有效促进教育公平。
4)助力科技抗疫。基于本专利的技术支撑研发出的数字出版智能服务平台入选科技部“科学抗疫一一先进技术成果信息共享服务平台”、工信部《中国信息消费助力疫情防控案例入选名单》(中信推联盟发(2020)5号)和武汉市《东湖高新区首批科技企业抗疫创新应用案例与技术产品订单》。在本次新冠疫情防控期间,武汉理工数字传播工程有限公司联合天津出版集团、中文天地出版传媒集团股份有限公司、浙江出版集团、广东时代传媒、长江出版传媒等多家出版单位,将总价值为1600万元基于K12教材教辅的在线知识资源与服务全部以公益免费的方式发放给全国小学一年级至髙中三年级的学生与家长,保障全国中小学生“停课不停学”。
知识产权类型:
发明专利
知识产权编号:
ZL201510156576.1
技术成熟度:
可以量产
技术先进程度:
达到国内领先水平
成果获得方式:
与企业合作
扫码关注,查看更多科技成果