高速网络环境下流量监控与带宽管理系统
项目简介:目前,基于互联网的搜索系统,主要依赖于GOOGLE、BAIDU等搜索引擎,这类搜索引擎功能强大,但在同一关键词中,所搜索的结果往往多达几千条甚至几万条或更多,在如此多的结果面前去寻找自己想要的结果,其难度那是可想而知的。另外,由于这些搜索引擎反馈的信息以关键字为线索,导致反馈结果完全可能与用户希望查找的结果相关度不大,反馈大量无用信息。 本项目研究使用主题爬虫技术建立分布式爬虫,采用精准搜索技术对互联网上的包含特定信息的网页进行抓取和存储,并采用自然语言处理技术和文本挖掘技术对抓取的网页元素进行智能分析和智能抽取,然后将包含特定主题的精准信息呈现给用户。形成的项目产品内容如下: 1. 部署、研发基于主题的互联网精准搜索咨询服务系统平台。在互联网上部署精准搜索系统,由用户提交需要搜索的主题,帮助用户建立、完善基于主题的描述库,用户只需简单地提交搜索指令,则通过平台获取及时、全面、精准的搜索结果; 2. 开发互联网精准搜索软件系统。供一些特殊用户群自己部署系统,独立获取所需要的信息。协助用户自行部署,并为用户建立特定主题的描述语义库,用户可根据搜索主题扩展、定制主题描述库。 建设投产条件:本系统为软件系统,因此应用本系统的推广和维护条件非常简单,只需软件开发环境、4台服务器,以及10M以上的网络带宽。如果要提供信息搜索服务,则需要分布式部署服务器,该投入可以根据具体市场规划、预测进行预算。 主要技术指标:由于一些特殊的用户群体,他们所关注的主题信息较为敏感,这样,他们的系统往往要求单独部署(如军队、安全等行业)。此类用户以一套软件系统销售25万元计算,2011年市场拓展期,销售系统10套,销售收入250万元;2012年销售系统20套,销售收入500万元。另一类用户直接为其提供特定主题的信息搜索服务,以信息服务的方式为其提供产品。 应用范围覆盖国家各职能机关、金融、企业、军事、科研等不同行业,为相关行业提供特定主题的情报/信息获取,如:交通、环保、金融、水电、公安、安全、教育、国防等各行业及单位,以及与民生相关的各个行业。项目目前已进入产业化阶段,成果权属为我校独自拥有。
四川大学
2021-04-11