《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 融合惩罚因子和时间权重的协同过滤推荐算法
融合惩罚因子和时间权重的协同过滤推荐算法
《信息技术与网络安全》2020年第5期
刘超慧,韩传福,陈天成,孔先进
郑州航空工业管理学院 智能工程学院,河南 郑州 450046
摘要: 协同过滤算法是一种经典的推荐算法,思想是依据近邻用户或者相似物品对目标进行推荐,常被应用在各类推荐系统中。但传统算法过分考虑热门物品对评分的影响,而忽略了冷门物品对用户兴趣特征度量的贡献,也未考虑用户兴趣动态变化的问题。对此,提出一种新的相似度改进算法,改进后的协同过滤算法将物品热门惩罚因子和时间数据权重进行加权计算,优化了用户相似度计算方法,形成了一种新的相似性度量模型。利用MovieLens电影推荐数据集验证改进后的算法,实验结果表明,该算法将推荐平均绝对误差(MAE)与传统算法相比降低了13.2%,推荐质量有了明显提升。
中图分类号:TP311文献标识码:A DOI: 10.19358/j.issn.20965133.2020.05.004
引用格式:刘超慧,韩传福,陈天成,等.融合惩罚因子和时间权重的协同过滤推荐算法[J].信息技术与网络安全,2020,39(5):17-21.
Abstract:
Key words :

随着互联网技术的发展和移动终端设备的普及,以用户为核心的信息生产模型造成了信息的爆炸式增长,公众很难在海量信息中迅速、准确地找到所需的信息,面临着严峻的“信息过载”问题。以推荐系统为代表的信息过滤技术,是解决“信息过载”问题的常用方法。推荐系统依据用户的历史行为和数据,通过建立模型来挖掘用户需求和潜在兴趣,进而从海量信息中为用户筛选所需的信息[1]。

协同过滤算法是众多推荐算法中使用最广泛、最有效的算法之一,已成功应用于许多商业推荐系统,但其仍存在着一些亟待解决的问题,例如冷启动、数据稀疏和马太效应。对此许多学者进行了卓有成效的研究工作。于洪等人提出基于时间窗口的时间数据权重,将用户兴趣分为长期和短期两类,更好地反映出了用户兴趣变化规律,提高了推荐精度[2];赵文涛等人提出基于时间的Logistic权重函数与用户特征属性进行加权的新的相似度度量模型[3];兰艳等人利用衰减因子建立非线性时间加权函数,赋予评分不同的时间权重,提高了推荐的准确性[4]。上述文献虽然考虑了用户兴趣随时间的变化,却未注意到热门物品对用户评分的影响,对推荐精度有一定的影响。

谢修娟等人引入物品流行度与位置信息,提高了推荐结果的多样性[5];孙红等人通过添加物品热门惩罚因子,优化了皮尔逊相似度计算,提高了推荐质量[6];AHM H J等人通过研究物品热门程度的影响,使用启发式算法对用户相似性度量进行优化,缓解了传统协同过滤算法的冷启动问题[7];焦富森等人考虑物品质量和用户评分倾向性对用户打分的影响,提高推荐效果[8]。这些算法虽弥补了传统算法过分考虑热门物品对评分的影响,却未考虑用户兴趣随时间迁移的情况,无法动态追踪用户的兴趣变化。

本文在基于皮尔逊相似度的基础上进行改进实验,提出了一种融合物品热门惩罚因子和时间权重的相似度计算方法,弥补了传统算法的缺陷。在Movies100k数据集上进行实验,实验结果显示融合后的算法可以有效追踪用户兴趣的变化和降低热门物品对用户评分的影响,提高推荐精度。


本文详细内容请下载http://www.chinaaet.com/resource/share/2000003098


作者信息:刘超慧,韩传福,陈天成,孔先进(郑州航空工业管理学院 智能工程学院,河南 郑州 450046)

此内容为AET网站原创,未经授权禁止转载。