一种WEB挖掘系统的构造方法
一种Web挖掘系统的构造方法,其由中央处理器、存储器组成的数字计算机,所述的数字计算机与网络联接;所述的存储器存储有真实数据库和基础知识库,以及启发型协调器和维护型协调器;其通过特征抽取及特征变换,Web内容挖掘过程,模型质量评价,信息呈现及信息导航,双库协同机制等步骤;在Web挖掘方面其使得知识库能够动态的参与数据库的发掘过程,用户的先验知识及知识库中的固有知识可以产生“定向发掘”,以提高认知自主性和避免海量搜索的产生;在知识库的维护方面:其可在数据发掘过程中实时地修改和维护知识库中的内容,包括重复与冗余性检验、矛盾处理等。◆项目的应用范围及经济效益分析 在该系统中采用了一类创新性的用于复杂类型数据挖掘的结构模型——发现特征子空间模型 DFSSM,含盖了常用的向量空间模型VSM。 该系统包含了 Web文本挖掘、客户访问模式挖掘和智能搜索引擎。其中在Web文本分类和Web文本聚类等方面,采用了我们提出的新算法。国际著名无形资产评估机构“香港国际无形资产评估事务所”品过此专利无形资产价值72万美元。 基于内在机理的知识发现理论KDTIM是我们独立提出的原创性理论,基于该理论我们设计 该 并实现了具 有自主知识产权的大型软件系统——集成化组合构件式知识发现软件系统 ICCKDSS,而 Web挖掘系统是其 三个核心 部分之一。该系统具有通用性强、性能良好、使用方便、人机界面友好等特点,可以在不同的网络平台上进行快速移植和推广。一种 Web挖掘系统的构造方法(已获国家发明专利授权,申请号:03104960.5),是在现有的Web挖掘技术的基础上融入知识发现内在机理之一:双库协同机制,即构建数据库(文本库、日志库与结构信息库)与基础知识库的内在联系“通道”,使得知识库能够动态的参与数据库的发掘过程,用户的先验知识及知识库中的固有知识通过此机制可以产生“定向发掘”,以提高认知自主性和避免海量搜索的产生;在知识库的维护方面,通过双库协同机制可在数据发掘过程中实时地修改和维护知识库中的内容,包括重复与冗余性检验、矛盾处理等。从而用基础知识库去制约与驱动 Web挖掘系统的整个挖掘流程,改变Web挖掘系统固有的运行机制,在结构与功能上形成了相对于 Web挖掘系统而言的一个开放的、优化的扩体。总体上讲,将Web挖掘视为一个开放系统,在Web挖掘进程与基础知识库的广泛联系中,改进与优化了Web挖掘的结构、过程与运行机制。 本系统已成功地应用到现代远程教育网信息挖掘中,得到用户好评并通过国家软件评测中心的鉴定测评。它还可以广泛地应用到智能决策(预测)支持系统、 CRM系统、ERP系统、门户网站、电子商务和电子政务等领域中。该系统具有很大的应用推广价值和广阔的市场前景。
北京科技大学
2021-04-11