第35卷第2期 2018年2月 计算机应用研究 Application Research of Computers Vo1.35 No.2 Feb.2018 一种改进专家信任的协同过滤推荐算法术 王建芳,刘冉东,谷振鹏,刘永利 (河南理工大学计算机科学与技术学院,河南焦作454000) 摘要:针对传统基于用户的协同过滤算法较少考虑信任对象所处环境的实时变化,提出一种结合社交网络的 专家信任推荐算法。为更好地量化对象之间的信任度,首先利用专家的评价可信度、活跃度、评价偏差度等量化 因子计算得到专家的信任值;其次在评分形成的过程中与近邻算法相融合,明确用户与“专家”和“近邻”的偏 好,当可选专家人数小于预先设定的阈值时,利用协调因子动态调整近邻算法与改进专家算法的权重,以便获得 更加客观的项目评分。最终实验结果表明,在不同大小的MovieLens数据集上相比于传统的算法,提出的推荐算 法在实时推荐预测准确度方面有显著提高。 关键词:专家算法;专家信任;信任指标;预测精度 中图分类号:TP301.6 文献标志码:A 文章编号:1001—3695(2018)02.0354—04 doi:10.3969/j.issn.1001-3695.2018.02.008 Improved expert trust collaborative filtering recommendation algorithm Wang Jianfang,Liu Randong,Gu Zhenpeng,Liu Yongli (College of Computer Science&Technology,Henan Polytechnic University,Jiaozuo ttenan 454000,China) Abstract:To solve the tradition collaborative ifltering recommendation based on the user object with little consideration O trust real—time change,this paper proposed an expe ̄’S algorithm combined with social network trust to make good quantitative tusrt among objects.Firstly,the algorithm computed evaluation credibility,the active degree and the deviation degree to acquire the expert’S trust value.Then,it integrated the scores and neighbor algorithm,and determined the preference of the users and the experts,the users and the neighbor.When the numbers of the selected experts were less than the threshold,it used COOrdi. nation factor to adjust dynamically the weight between the neighbor algorithm and the expe ̄’S algorithm to get more objective score.Experimental results show that proposed algorithm achieves better result on the accuracy of recommendation. Key words:expert algorithm;expe ̄trust;trust indicator;prediction accuracy 随着互联息的急剧增长,“信息过载…”现象越来越 针对传统专家算法在评分形成的过程中同等看待专家评 分这一现象,本文提出了一种结合社交网络的专家信任推荐算 法IETA(improved expert tusrt algorithm),该算法利用相似度计 算公式得到用户问的相似度矩阵,同时利用项目类别矩阵确定 待评分项目类别,进而选出该类别的专家,通过专家信任指标 严重,推荐系统 作为解决信息过载的有效方案,目前无论工 业界还是学术界,对如何完善协同过滤推荐算法都展开了深入 的研究。近邻模型 作为协同过滤推荐系统的关键算法,因 其原理简洁且具有较低的时间复杂度,逐渐成为当今推荐系统 中被广泛使用的算法之一。 计算专家信任度。通过赋予与用户相似的专家不同的信任值, 利用专家的项目评分及信任值形成最终的推荐。 专家模型作为近邻模型的可选方案之一,自2009年被 Amatriain等人 提出之后受到广泛关注。2013年,Ka ̄ta等 人 提出了“明星用户”算法,该算法在推荐过程中仅使用“明 1 标注与相关工作 1.1 标注 星用户”的偏好,并没有加入项目的相似性,当可选明星用户 数达不到预先设定的阈值时,单一考虑“明星用户”评分会导 致该算法的推荐准确度不高。2015年Kardan等人 在利用 专家算法形成推荐的过程中,同时兼顾专家与近邻的项目评 分,提高了专家算法推荐的准确性及合理性。2015年Hwang 等人 为了使推荐准确性进一步提高,提出了专家算法与协 为下文表述方便,在此对文中使用的标注作统一说明,用m 个用户和n个项目的评分矩阵R来标示所有用户对所有项目 的评分,范围是[1,5]。用户一项目评分矩阵示例如表1所示。 R={rⅡ.f}(1≤“≤m,1≤i≤n),其中 . 表示用户H对项 目i的评分,如果用户u未对项目i评分,那么值为0,如式(1) 所示。 = 同过滤技术的结合。Kardan和Hwang等人提出的算法,虽然 在一定程度上缓解了可选专家人数达不到预先设定阈值时的 推荐问题,但在形成推荐的过程中,把专家对项目的评分同等 看待有失偏颇,因为专家的专业水平有高低,可信度有大有小。 收稿13期:2016.10—14;修回13期:2016.11-29 ㈩ 基金项目:国家自然科学基金资助项目(61202286);河南省高等学校青年骨干教师资助 计划项目(2015GGJS.068);河南省高等学校重点_科研项目(15A520074) 作者简介:王建芳(1979一),男,副教授,博士,主要研究方向为数据挖掘、推荐算法(wangjianfang@hpu.edu.cn);刘冉东(1990一),男,硕士研究 生,主要研究方向为信息处理与模式识别;谷振鹏(1991.),男,硕士研究生,主要研究方向为信息处理与模式识别;刘永利(1980一),男,副教授,博 士.主要研究方向为数据挖掘. 第2期 王建芳,等:一种改进专家信任的协同过滤推荐算法 ·355· 表1用户一项目评分矩阵 7_={t j(1≤i≤n,1≤C≤19),其中,f沁表示项目i是否 属于类别c,如果项目i属于类别C,那么值为1,如式(2)所示。 {『o1 b 0el【o-nbg二, (2) 。 g 1.2近邻模型 . 近邻模型的基本原理是寻找k个近邻近似替代当前用户, 在协同过滤算法中,近邻模型分为基于用户的近邻模型和基于 项目的近邻模型。用户近邻模型分为寻找近邻和形成推荐两 部分,为了解决寻找近邻的问题,首先需要找到一种方式来表 示用户之间的距离关系,通常用户之间的邻近程度有以下两种 计算方式。 1)余弦相似度 (3) 其中:r 与r 分别表示用户u与用户 对项目i的评分;f 表示 用户U与 的共同评分集合。当用户共同评分项目数量较少 时,该公式计算用户之间相似性偏差会比较大;当用户评分项 目数量达到一定值时,即使用户对每个项目的评分值差别较 大,该算法也能输出较高的相似值。 2)改进余弦相似度 : !兰 : (4) . ( — ) ,,( ) 其中:r 与r 分别表示用户U与用户 评分的均值;, 表示用 户 与用户 共同评分项目集合。改进余弦相似度 同样没 有解决, 量较少时相似度计算偏差较大的问题,但是, 的值在 可接受范围内时,改进余弦相似性体现出了较好的性能。 1.3专家算法 定义1对于A类项目,专家E 被定义为 lLI≤ILI(V“∈U—E ,V ∈E。) (5) 其中:L是指用户“评价过的所有项目集合;L是指专家 评 价的项目集合;U是所有用户集合。统计每个用户评价A类项 目数量,当用户评价项目的数量使式(5)成立时,该用户被定 义为专家。 专家算法在形成之初由寻找专家与生成推荐值两部分构 成,但是在实际操作中这种结构推荐效果不理想,随着越来越 多的专业人员参与研究和改进,专家算法目前由寻找专家、计 算专家与用户的相似值以及生成推荐值三部分组成。 1.3.1 寻找专家 根据待评分项目和项目一类别矩阵,确定该项目所属类 别,对所有的用户计算评价该类别所有项目的次数,从大到小 依次排列,由专家的定义及预先设定阈值确定专家人数。 1.3.2生成推荐值 文献[9]的专家算法中,在计算预测评分时,只考虑与当 前用户相似度比较高的专家建议,采用无条件相信专家的策 略——EA(expert algorithm)。在度量专家与用户的相似度时 采用式(4),最终评分预测采用式(6)。 P , =r 了1 ( 一, r ) (6) 其中:p , 是当前用户对属于c类电影i的预测评分; 代表 用户 对c类电影评分的平均值;r分; 表示专家 对c类项目评分的,v表示专家 对项目ii的评 平均值;E。表示c类项目 专家集合。 需要预测的项目属于多个类别时,采用式(7)计算评分值。 p : 可色 ,, c ( ’7) 其中:c;是项目所属的类数;p .。是每一类预测的值。 以上预测评分算法的运行时间比较短,但是它在预测准确 性方面表现一般,此算法在项目确定的情况下,对于不同用户 的预测分数几乎是一样的,因为专家的选择没有考虑当前用 户,只考虑了当前用户需要预测的项目。 2改进专家算法 从专家算法提出至今,许多研究人员都围绕着利用专家与 用户、项目的关系提升推荐准确度。但是现实生活中人们在参 考权威人士的意见时,必然要考虑权威人士的可信度、专业度、 偏差度等影响因子。到目前为止推荐系统没有对“信任”给出 一个具体的概念。在可查资料中,信任是指接受推荐者对提供 推荐者特定行为的主观可能性预测。在社交网络中信任需要 考虑的因素更多,完整地考虑各个方面难度很大且通常没有太 大必要,在面对同一个用户时,只需要对该用户所处的情形进 行相应的加强和减弱,以便于对对象之间的信任程度进行较好 的量化。 2.1 改进专家算法 在推荐系统中存在着各种各样的数据,其中包括了评分数 据、项目属性数据、用户属性数据等,这些数据基本构成了本文 需要的信任度量情景。充分考虑专家及用户所在环境,本文用 以下定义量化专家信任中涉及的重要概念。 定义2专家评价可信度。 一个专家评价的项目数量越多,可从一定程度上反映出其 评价项目的质量、可信度,度量专家评价可信度表示如式(8) 所示。 。 = ㈩ 其中:Q 811是指所有用户;Q 代表专家“评价过的所有项目的 集合;max(Q )是指所有专家中评价项目最多的数量。 定义3专家专业度。 咨询专家意见之前,人们通常会考虑专家的专业度。专家 并不是对所有种类的项目都具有全面的专业知识,在某种情况 ·356· 计算机应用研究 ∑(r 一r )×s( , ) .p ( — 第35卷 下,一名专家显然只会对一种或者很少种类的项目投入比较多 的精力,具体表现为在某一类项目上评价比较多的项目,因此 专家专业度表示如式(9)所示。 Ru=了Tui (9) (1"z 一 )×TR: (卜 )× “ 厂) (14) 其中: 表示专家已评价且属于某一种类的所有项目集合;T 其中:r 是用户 对项目i的评分; 是当前用户 对所有项目 为系统中获得过用户评价且属于这一主题的所有项目集合。 定义4专家评价偏差度。 专家计算的预测评分与真实评分之间的差值为专家评价 偏差度,如式(10)所示。 【10) 其中:z 代表最小偏差项目的集合。在计算z 时,利用项目 评分的平均值6表示项目的真实质量,专家评价的偏差如果小 于6,则把此评分项目加入到z 中。对专家 及项目i,如果 lrⅡ. 一rlI≤6成立,则i∈6,通过实验验证6如果太小,则Z 趋 于零,计算就没有太大意义;太大则会使占趋于1,计算效果不 理想,本实验6取为0.37。 基于以上表述专家的D 、P 、R 及权重系数W 、W。、 计 算专家信任值,如式(11)所示。 豫 = l×D + 2×P + 3×R (11) 为更直观地体现专家信任对评分预测的影响,利用原始专 家算法与信任相结合进行参数值调整。本文所涉及的三种信 任指标相互,权重系数的最优值选取采用固定两个调整另 外一个的策略(如设置一个适当的RMSE值,初始化Z0 、 、 ,把专家信任值与式(6)(7)结合产生预测,计算此时RMSE 值,如果当前RMSE值大于设定RMSE值,固定W 、 更新一 次加 ,记录 。达到最优RMSE时的值;同理,可得最优 :、 ),最后归~化处理三个参数得到最终权重系数值。 2.2评分形成 2015年Hwang等人 提出了专家与相似度结合的算 法——ESA(expe ̄similarity algorithm),在预测项目评分时 ESA算法运用经典的评分预测式(6)与(12)相结合,进一步提 升了算法的推荐准确度。 ∑P × . , c E ci ,.一、 p — ‘ ) 其中: 表示该项目的专家专业度,式(12)与(7)相比其进步 在于专家对每一类项目的评分在最终预测评分时权重不同。 本文在预测评分时改进了ESA算法中的预测公式,采用式 (13)来求解。 , (r 一 , )×s(u, ) P 1。, 瓦 ( — ) TRu(13) £EL L *E Ec 其中:TR 表示专家可信度;C 表示当前项目所属类别总数。 此类算法对于每个类别的专家评分,根据专家在此类别评价项 目中的信任值加权计算预测评分,有效避免出现不同类别专家 对项目的评分同等对待的现象,充分考虑用户与专家之间的相 似度及专家信任值,根据专家信任值赋予不同专家不同的权 重,在一定程度上降低了预测误差。 当专家人数达不到设定的阈值时,近邻算法作为补充,充 分发挥两种算法的优点,用式(14)表示。 的平均评分;s(u, )是用户/Z与用户 的相似度;s 是近邻集 合;s 表示专家集合。当专家人数达不到预先设定的阈值时, 专家对项目的评分预测具有一定的偶然性,此时的专家集合不 能全面代表整体对项目的评分。本文将此时的专家视为是某 种意义上的近邻,采用 作为协调因子,协调专家与近邻预测 评分,当专家人数为零时,此时式(14)退化为近邻算法评分预 测公式,如式(15)所示。 s 2.3算法描述 基于社交网络中改进专家信任的协同过滤推荐算法(IE— TA) 输入:评分矩阵R及项目类别矩阵7-,RMSE阈值为0.98。 输出:预测矩阵 d。 a)数据预处理——随机产生 、 :、 。 b)利用式(3)计算训练集中用户之间的相似度,形成相似度矩阵。 c)根据欲评分项目i和项目类别矩阵来确定项目i所属类别的 专家。 d)根据评分偏差修正一次W1、W 、 3,直至出现最优RMSE值。 fori=1:/Z 根据式(12)计算预测值并计算RMSE值。 if(当前RMSE值>设定RMSE值) 修正一次 l、 2、 的值; else 记录当前RMSE值及对应的可调参数; end i++: end return(对应最优RMSE值的可调参数并归~化); e)根据步骤c)寻找到的专家及式(11),当可选专家人数不少于设 定专家闽值30时,利用式(13)转到步骤g),否则转到步骤f)。 f)根据O/的值及式(14)转到步骤g)。 g)产生预测矩阵 d。 3 实验结果与分析 3,’ 数据集 实验数据集采用GroupLens Research实验室提供的 MovieLens数据集,该数据集包含匿名用户对电影的评分,其中 每个用户至少评价了其中20部电影。评分值的范围是1~5,1 表示最低评分,5表示最高评分,0表示用户没有评价该电影。 除了评分数据外,该数据集中还包含用户、项目的属性,例如用 户的性别、年龄、职业以及项目的名称、上映年份、风格流派等, 其中用户电影的风格流派、评分数据是本文实验所需要的。 3.2评估标准 评估推荐系统预测准确性的标准分为决策精度标准和统 计精度标准两类。本文采取了对特大或特小误差反映敏感的 均方根误差(RMSE)。在推荐系统中RMSE作为一种常用度 量误差标准被广泛使用,其原理是通过计算用户关于项目的预 测值与真实值之间的偏差平方和与用户个数n比值的平方根, 第2期 如式(16)所示。 王建芳,等:一种改进专家信任的协同过滤推荐算法 ·357· 比如图4所示。未融合专家与近邻算法的下降速度较慢,原因 是在开始阶段每个类别的专家可选人数在达不到预先设定的 RMSE= (16) 阈值时,专家评价项目的准确性有待进一步提高,在计算此类 项目的评分时把近邻算法与专家算法结合,一方面发挥了近邻 算法的快速收敛性能,另一方面把没有达到符合人数要求的专 其中: 代表预测值; 代表与预测值对应的真实值。 3.3实验结果与分析 3.3.1 相似度实验对比 家与近邻融合补充了近邻算法的不确定性(近邻可能从来没 有评价过此类项目),因此本文在专家人数达不到预先设定的 阈值时选择了近邻算法与专家算法的融合。 为了得到更好的实验结果,本文分别用第2章中余弦相似 度和改进的余弦相似度计算方法计算项目之间的相似度,相似 值的分布如图1所示。从图1可看出,余弦相似度分布较为均 匀,改进的余弦相似度分布更具个性化。在[0,1]内,运用余 坦 弦相似度得到的相似度值分布在[0,厚 0.6],平均达到89.10%, 分布过于分散;而改进的余弦相似度得到的相似度值主要分布 在[0,0.4],平均达到80.15%。因为通过项目的评分值减去 用户评分的平均值,均衡了用户的评分尺度不一的问题,能更 真实地反映出项目的差异特征,即用户的个性化选择,所以,根 据改进的余弦相似度计算方法可以得到较高质量的推荐。 基于以上分析,本文采用改进的余弦相似度计算方法进行 度量。 3.3.2用户可信度指标分布与分析 用户评价可信度、用户专业度及专家评价偏差度的分布情 况如图2所示。在MovieLens 100 k数据集中,用户可信度主 要分布在[0,0.4],其中56.4%的用户评价可信度分布在[0, 0.1],剩余的用户评价可信度在其他区间都有分布,说明了少 数用户评价可信度能在全体的用户评价可信度中体现个性化 的特质,同时用户专业度主要分布在[0,0.3],其中58.21%的 专家分布在[0,0.2],再次说明了只有少数用户对某些类别的 项目比较专业。从图2可以看出,用户的评价偏差度分布几乎 成正态分布,评价偏差度分布在[0.2,0.6]的用户所占比例为 77.6%,说明大多数用户的评价偏差度就比较高(评价比较接 近真实评分)。以上足以说明选定专业用户(专家)以后,该专 家对项目的评分信任度可以由评价可信度、专业度和评价偏差 度等三种指标体现。 相似值 所占比例 图1两种相似度分布对比 图2评价指标分布 3.3.3专家可信度分布与分析 MovieLens 100 k数据集由19种流派的电影组成,图3中 选择其中一种流派的电影并计算该流派专家的信任值。在实 验开始阶段,I-O 、W:、W,是初始化值,所以专家可信度值比较 低;随着调整次数的增加,专家信任值从100 000次调整的 0.12提升到0.63共经过了400 000次的调整,从400 000次开 始专家信任值稳定在[0.63,0.69],此时归一化后得出W 、W 、 1/),的值分别为0.31、0.46、0.23。在后续计算专家对此类别项 目评分时,可以直接利用此训练后的系数值,但是对于不同类 别的专家信任因子系数值不同,可使用同样方法训练得到。 3.3.4专家近邻融合 专家人数达不到预先设定的阈值时,专家近邻算法融合对 4 3.4专家信任算法对比 本节选取对比EA、ESA与本文提出的IETA算法在专家 数量不同情况下的推荐精确度,实验以RMSE为评估标准,并 分别基于MovieLens 100 k数据集和MovieLens 1 M数据集 进行。 图5是在MovieLens 100 k数据集下所绘曲线。可以明显 地看出,在实验开始阶段随着专家人数的增加,IETA算法的 RMSE下降速度最快,随着专家人数的增加,ESA算法的RMSE 值在0.88左右浮动,与EA算法相比,随着专家专业度与用户 相似度的加入,不再直接使用专家推荐值,而是根据专家专业 度与专家与用户的相似度计算推荐结果,进一步提升了推荐结 果的合理性。IETA算法把专家信任与用户相似性加入到ESA 算法中,RMSE的值在专家人数达到50人时达到最小值 0.875,在专家人数进一步增加时该算法的RMSE值趋于稳定, 从以上实验对比表明IETA算法在推荐准确性及合理性上均 有提高。基于MovieLens 1 M数据集如图6所示。图6表明在 实验数据集为1M时,IETA算法在训练集内、的训练会更加充 分,EA与ESA算法的计算结果没有随着数据量的增加而有所 改变,说明其扩展性表现不佳;但本文提出的IETA算法的 RMSE提升了5%,对比结果进一步说明了本文提出的算法具 有更好的适应性和扩展性。 专家人数 专家人数 图5基于MovieLens 100 k数据集 图6基于MovieLens 1 M数据集 4结束语 本文研究了专家算法的产生与改进,IETA算法在ESA和 EA算法的基础上加入专家信任度。实验表明,改进后的专家 信任协同过滤推荐算法不仅有效地提高了推荐系统的推荐精 度,而且随着实验数据集的增加展现出了良好的扩展性。但 是,在算法的改进过程中专家信任指标的融合还不够完善,所 以,下一步工作的重心将放在信任的动态调整及建立有效的信 任传递机制上,使信任度量更加合理。 (下转第385页) 第2期 朱树才,等:基于SBWS—GPR预测模型的不确定性多数据流异常检测方法 ·385· 5.4与其他算法性能比较 决了实际中不确定输入、输出多数据流异常点难以正确检测的 问题。 本实验将一般的基于高斯过程回归多数据流异常检测方 法(GPR)H2]和滑动窗口多数据流异常检测方法(high sliding widows stream,HSWStream) 作为对比算法,给出了包含sB— WS—参考文献: [1]Babcock B,Babu S,Datar M,et a1.Models and issues in data stream GPR在内的三种算法的异常点检测的性能比较结果。实 systems[C]//Proc of ACM Sigact-Sigmod—Sigart Symposium on Prin— ciples of Database Systems.2002:1—16. 验中三种方法均采用相同的实验数据、滑动窗口宽度,且完成 同一班组的数据检测与异常点修正,实验所有结果数据均为多 次重复实验所得均值,如表2所示。 表2其他异常点检测算法的性能比较 [2]张晨,金澈清,周傲英.一种不确定数据流聚类算法[J].软件学 报,2010,21(9):2173-2182. [3]邢长征,张国凯.基于自适应网格划分的数据流聚类算法[J].计 算机工程与科学,2011,33(10):149—153. [4]王永利,徐宏炳,董逸生,等.基于低阶近似的数据流相关性 分析[J].电子学报,2006,34(2):293—300. [5]杨杰,胡德秀,吴中如.大坝安全监控模型因子相关性及不确定性 从RMSE数值来看,GPR与HSWStream算法是SBWS— 研究[J].水利学报,2004,35(12):99—105. GPR的2倍左右,远远大于SBWS—GPR。即经过SBWS—GPR [6]Bullard J E,Mctainsh G H,Martin P.Estbalishing stage—discharge re— lationships in multiple-channelled,ephemeral 13vers:a ease study of 修正后的数据流具有更小的波动性,克服了数据流的不确定 性。考察TPR性能,可以发现SBWS—GPR均优于GPR和 the Diamantina River,Australia[J].Geographical Research,2007, 45(3):233—245. HSWStream,具有更加准确的异常数据检测率。从运行时间 [7]Lankhina A,Crovella M,Doit C.Mining anomalies using trafife feature 来看,GPR和SBWS—GPR由于算法的复杂度高,运行时间较 distirbutions[C]//Pmc of ACM Conference of the Specila Interest 长,均超过30 s,但考虑到现场工艺要求,每次滑动窗口匹配检 Group on Data Communication.2005:217-228. 测时间不超过数据采集的时间60 s,尚在工艺可接受的范围 [8]Kifer D,Ben—David S,Gehrke J.Detecting change in data s ̄eams 内。因此,SBWS_GPR具有更有效的异常数据检测与修正的 [C]//Proc of the 30th International Conference on Very Large Data 效果。 Bases.2004:180-191. [9]、庞景月.滑动窗口模型下的数据流自适应异常检测方法研究 6结束语 [D].哈尔滨:哈尔滨工业大学,20i3. [10]何志昆,刘光斌,赵曦晶,等.高斯过程回归方法综述[J].控制与 实际系统中,数据流的不确定性会导致异常点检验的精度 决策,2013,28(8):1121—1129. 大幅降低,因此提出基于SBWS—GPR预测模型的不确定性多 [11]李大和.浓香型白酒生产工艺与质量关系的思考[J].酿酒科技, 数据流异常检测方法。利用聚类分析与滑动窗口匹配模式,实 2001(5):28-31. 现了单输人数据流的异常点检测与修正。引入高斯过程回归 [12]Xia Zhanguo,Wan Ling,Cai Shiyu,et a1.Research progress of Gaus- 模型,建立输入、输出数据流的预测模型,通过实时观察数据流 sian process[J].International Journal of Digital Content Technol· ogy&Its Applications,2012,6(14):369-378. 与预测模型的输出进行窗口比较,解决了输出数据流中的异常 [13]Liu Weiguo,Ouyang Jia.Clustering algorithm for high dimensional da— 数据检测与修正。不确定输入、输出数据流的异常点检测与修 ta stream over sliding windows[C]//Proc of International Conference 正,提升了发酵的质量与品质。实验及评估结果表明,该方法 on Trust,Security and Privacy in Computing and Communications. 不仅考虑了数据流的一般特征,还利用数据流间的相关性,解 201 1:1537.1542. (上接第357页) [5]Kagita V R,Padmanabhan V,Pujari A K.Precedence mining in group 参考文献: recommender systems[M].Berlin:Springer,2013:701-707. [1]Piao Chunhui,Zhao Jing,Zheng Lijuan.Research on entropy-based [6]Kardan A,Aziz M,Shahpasand M.Adaptive systems:a content analy— collaborative filtering algorithm and personalized recommendation in sis on technical side for e'learning environments[J].Artificial Intelli- gence Review,2015,44(3):365—391. ecommerce[J].Service Oriented Computing&Applications, [7]Hwang W S,Lee H J,Kim S W,et a1.Efifcient recommendation met— 2009,3(2):147-157. hods using category experts for a lrage dataset[J].Information Fu· [2]Adomavicius G,Tuzhilin A.A survey of the state-of-the—art and possi- sion,2015,28(C):75-82. hie extensions[J].IEEE Trans ol3 Knowledge and Data Engi— [8]Zamanzad G F,Claesen J,Burzykowski T,et a1.Comparison of the Ma— neering,2005,17(6):734-749. halanobis distance and Pearson s x statistic as measures of similarity [3]Keller J M,Gray M R,Givens J A.A fuzzy K nearest neJ ghbor algo— of isotope patterns[J].Journal of the American Society for Mass rithm[J].IEEE Trans on Systems Man&Cybernetics,1985, Spectrometry,2014,25(2):293·296. SMC-15(4):580-585. [9]Cho J,Kwon K,Park Y.Collaborative fihering using dual ifnormation [4]Amatriain X,Lathia N,Pojol J M,et a1.The wisdom of the few:a col— sources[J].IEEE Intelligent Systems,2007,22(3):30.38. laborative filtering approach based on expe ̄opinions from the Web [10]Hwang W S,Lee H J,Kim S w,et a1.Efifcient recommendation met— [C]//Proe of International ACM SIGIR Conference on Research& hods using category experts for a large dataset[J].1nf0rmation Fu- Development in Infonnation Retrieva1.2009:532—539. sion,2015,28(C):75—82.