社会网络大数据分析系统
社会网络已经成为覆盖用户最广、传播影响最大、商业价值最高的 Web2.0 业务,在世界范围内,最著名的社会网络代表是 Facebook、Twitter,用户量分别达到 12 亿、5 亿;国 内使用人数最多的社会网络工具是新浪微博和腾讯微博,其中新浪微博用户达到 5 亿,腾讯 微博用户超过 8 亿。社会网络中的巨大用户群每天产生海量的用户数据、关系数据和信息数 据,若能够对海量数据进行准确、及时的分析,则会在精确营销、舆情探测以及网络安全等方面创造巨大价值。然而由于社会网络的大数据特性以及分析方面要求准确、及时,目前缺 乏融合多项社会网络分析技术的、成熟的社会网络大数据分析系统。社会网络分析技术是一项关键技术,也是一项热门的研究,涵盖了社会学、人类学、社 会语言学、地理、社会心理学、通信研究、资讯科学、社会网络分析与探勘、组织研究、经 济学以及生物学等多个领域,是一项多学科交叉技术。社会网络大数据分析系统要求具有坚 实的数据支撑,即数据获取全面、更新及时、获取数量大,也强调多维度、多粒度的分析手 段相结合,并对分析速度、可视化以及人机交互等方面都提出很高的要求。基于上述现状和挑战,在国家科技支撑项目的资助下,实现基于新浪微博、Twitter 等 主要社会网络交流工具的大数据分析系统,系统完成从数据获取、数据预处理、数据存储、 消息中心、数据分析、结果可视化展示的闭环处理流程,支持多种社会网络(Twitter、新浪 微博等)的数据实时、不间断获取,获取数据量在国内外同研究领域处于领先地位;实现整 体、个体、群体以及事件的多层次、多粒度分析模式;同时具备良好的人机交互操作界面以 及优秀的分析展示效果。
清华大学
2021-04-11