本发明公开了一种基于签到数据的用户行为轨迹聚类方法,所述方法包括:步骤1,获取用户签到数据;步骤2,对用户签到数据进行预处理;步骤3:在综合考虑了用户签到日期的边际效应和签到次数差异的影响的基础上,计算用户在签到位置上的签到值;步骤4,初始化聚类中心,采用余弦相似性方法分簇;步骤5,重新计算聚类中心,采用余弦相似性方法重新分簇;步骤6,重复步骤5,直到满足预设聚类精度的要求。
与现有技术相比,本发明具有以下优点: (1)本发明采用了一种基于签到数据的用户行为轨迹聚类方法,与K均值聚类算法比较,我们考虑了时间维度,将K均值聚类算法中点状对象的相似性度量扩展到线状对象即用户行为轨迹的比较。同时,在定义用户之间的余弦相似性时,我们把签到时间、日期因素引入到传统的“用户-签到位置”矩阵,变成了“用户-签到时间(日期)-签到位置”立方体。除此之外,在更新聚类中心时,我们选择了相似度和最大的用户作为该簇新的聚类中心。 (2)为了体现用户在不同位置上签到次数存在差异的特点以及用户行为轨迹的演化趋势,我们在定义用户的签到值时充分考虑了用户签到日期的边际效应和签到次数差异的影响,在同一位置上签到次数越多,表示该位置在用户行为轨迹中的重要程度越高,同时,用户的时空行为随时间在不断变化,签到日期越接近当前,越能反映用户当前的行为轨迹。通过综合考虑以上因素,我们能够更准确地刻画公众出行的行为特征,从而为构建基于智能手机的交通信息服务平台奠定坚实的基础。
随着我国国民经济的高速发展和城市化进程的加快,交通拥堵已经成为影响城市可持续发展的一个全局性问题。为了解决交通拥堵,国家对城市道路交通基础设施和交通管理相当重视,投入了大量的人力、物力、财力,经过多年建设,城市交通基础设施已取得了很大的成就。但是,随着汽车保有量的激增,交通基础设施的建设已经满足不了交通发展的需要,城市道路拥堵和交通安全已成为迫切需要解决的难题。交通信息服务系统作为智能交通的重要组成部分,可以通过提供快捷、有效的道路交通流信息,方便公众出行,缓解交通阻塞,提高道路通过能力,减少交通事故,降低能源消耗和减轻环境污染,满足城市和谐与持续发展的需要。 公众出行交通信息服务系统的本质包括以下几个方面:第一,在路网条件下,通过先进的技术手段采集交通信息;第二,对采集到的动态交通信息进行处理并为公众出行提供准确、及时的道路交通流信息。资料表明,已经建成的交通信息服务系统有电台、可变情报板、网站、手机短信等多种渠道,交通信息的内容也比较丰富和准确,但对于交通管理者和出行者来说,目前的交通信息服务水平远远没有达到交通参与者的需求。为了进一步提高出行者的出行效率,降低交通拥堵,学术界和工业界近期提出了构建基于智能手机的交通信息服务平台的思想,希望通过对采集到的数据(如手机用户签到历史数据)进行分析,准确刻画公众出行的行为特征,从而为用户提供合适的出行线路,其关键技术之一在于设计合适的基于用户行为轨迹的聚类算法。