论文总字数:22970字
摘 要
在移动互联网迅速发展的今天,移动终端的应用层出不穷 。如何选择这些能帮助我们有效解决生活中的问题或是消磨碎片时间的应用,成为用户关心的问题。
本文中,通过对历史数据和相关信息的有效处理,得到相关属性的映射关系,从而能够对接下来的推荐算法设计与实现提供有力的数据支持。综合考虑应用的流行度、查询字段的匹配、关键词的匹配、消费者历史信息、时间因素等各种影响应用软件的搜索排名的原因,发现各种因素对于推荐结果都有比较明显的影响。
在进行了一系列修正、优化之后,得到了一个针对当前数据的一个比较合理的推荐算法: 以匹配为中心,建立了查询字段匹配、关键词匹配两个模型,这其中用到了KNN、TF-IDF模型;然后加入用户历史信息,以基于物品的协同过滤实现;接着,再考虑辅助信息:流行度、用户最近的消费记录;再然后,对信息进行整合;最后,考虑一些细节问题:如删除客户购买过的商品,将查询字段为sku的sku分数提的很高。最终得到一个搜索推荐排名的有效算法。接着,为了提高准确性,又设计了一个基于关键词匹配的算法。更加准确的应用推荐,不仅可以提升用户体验,而且可以解决应用的长尾问题。
关键词:搜索排名推荐算法,KNN,TF-IDF,ItemCF
Research on application software recommendation algorithm
Abstract
Because of the rapid development of mobileInternet today, mobile terminal applications come out in an unending flow.How to choose these applications which can effectively solve the problems of killing time pieces in life, becomes a problem of concern to the user.
In this paper,based on the effective data processing of the historical data and related information,we have got the mapping relationship of the relevant attributions,so that we can get a powerful data support to finish the design and implementation of recommendation algorithm.Take a comprehensive consideration on various factors which can influence search rankings such as the popularity of the application,the match of the query string, the match of the keyword,costumer history information,time factors .etc ,I find that various factors have a obvious influence on the ecommendation result.
After a series of modification and optimization,I have got a reasonable recommendation algorithm according to the current data : centering on the match,modeling the query match and keywords match,which used KNN, TF-IDF model; then add customer history information, based on item collaborative filtering to achieve; then, consider the auxiliary information: popularity, user recent consumptiom entries;and then,we merge the information;finally, considering some details: such as deleting goods that customer have bought,improving the score of sku that contain in the query string. At last,we get an efficient algorithm for search ranking recommendation. Then, in order to improve the accuracy, a keyword matching algorithm is designed.Accurate recommendation of applications can not only enhance the user experience, but also can solve the long tail problem of applications.
Keywords: search ranking recommendation algorithm, KNN, TF-IDF, ItemCF
目录
应用软件推荐算法研究 I
Research on application software recommendation algorithm II
第1章 绪 论 5
1.1 应用软件推荐算法研究的背景 5
1.1.1 个性化推荐算法的研究意义 5
1.1.2 个性化推荐算法研究的难点 6
1.2 个性化推荐算法的研究现状及发展趋势 6
1.2.1 个性化推荐算法的研究现状 6
1.2.2 个性化推荐算法的发展趋势 7
1.3 推荐算法设计的主要工作 7
1.4 论文的结构安排 8
第2章 项目介绍 9
2.1 项目背景 9
2.1.1 项目来源 9
2.1.2 项目数据 9
2.2 项目需求分析 10
2.2.1 功能需求 10
2.2.2 非功能需求 10
2.3 本章小结 10
第3章 基于特征建模算法 11
3.1 算法设计 11
3.1.1推荐算法总体模型 12
3.1.2 各个模型的算法描述 12
3.1.3 推荐算法流程 15
3.2 算法结果分析 16
3.2.1 结果分析的方式 16
3.2.2 结果展示 18
3.2.3 推荐结果分析 19
3.3 本章小结 20
第4章 基于关键词匹配算法 21
4.1 算法设计 21
4.1.1系统数据类型 22
4.1.2 推荐算法的总体模型 22
4.1.3 各个模型的算法描述 22
4.1.4 推荐算法流程 24
4.2 算法结果分析 24
4.2.1 结果分析的方式 24
4.2.2 结果展示 24
4.2.3 推荐结果分析 25
4.3 本章小结 26
第5章 项目的小结与优化 27
5.1 关于本次项目的总结 27
5.1.1 项目总结 27
5.1.2 项目存在的不足与缺陷 27
5.2 项目的优化 28
5.2.1 综合算法的结果 28
5.2.2 综合算法最好情况的匹配信息 28
5.3 项目的收获与思考 29
5.3.1 项目中的收获 29
5.3.2 项目的进一步思考 29
5.4 应用软件推荐搜索引擎的理解 29
5.5 本章小结 29
参考文献 30
致谢 31
绪 论
应用软件推荐算法研究的背景
伴随着移动互联网的发展,移动设备的发展与普及成为趋势,相应的,各种应用软件层出不穷。面对着琳琅满目的应用程序,用户选择难免无所适从。这种情况下,一个有效地推荐算法不仅能够提高用户的搜索满意度,也能解决应用的长尾问题。面对着兴趣、背景各不相同的用户,如果想要为他们提供用户满意、预测准确、覆盖率高且具有创新性的应用推荐搜索结果,就必须要对他们的搜索信息、历史信息进行充分的了解研究,从而实现个性化的推荐。
目前,用的比较多的算法是协同过滤:基于项目推荐、基于用户推荐。但是,这些算法自然是有局限性的。基于项目推荐:只能基于用户历史信息中选择的资源相似的资源,虽然增加了信任度,但是缺乏创新性。基于用户推荐:发现与用户兴趣相似的用户群从而帮助用户发掘出潜在资源,但是,当系统历史数据过少,难以进行精确的物品查找匹配推荐,而且当用户物品增多时数据量将会很大。
所以,研究出一个好的算法:能够满足用户所有的个性化需求,方便用户的搜索,具有很好的研究意义。同时,具有良好的搜索排名推荐算法的应用推荐平台,也可以在提升用户体验的同时,获得良好的评价和商业利益。
个性化推荐算法的研究意义
推荐算法很好的解决了人们对大量的应用软件无法抉择的问题,但是,由于用户无法了解所有的应用,所以对一些不热门的应用就很难有机会选择,也造成了一种趋势:
用户活跃度与选择物品的热门度之间的关系
即:新用户更倾向于选择那些热门的应用,而老用户会逐渐浏览那些冷门的物品。个性化推荐系统根据用户的信息需求及兴趣,将用户感兴趣的产品推荐给用户。它通过研究用户的兴趣,来进行个性化的计算,来帮助用户发现自己的兴趣点。 个性化推荐算法更注重于发掘用户个人的兴趣特点,所以会有机会推荐到那些不热门但是可能与用户兴趣相符合的应用。
个性化推荐的研究意义总结为以下几点:
1)根据用户个性化要求,提高推荐的准确度
2)帮助用户发现自己的兴趣点,从而对提升用户对推荐系统的满意度
3)提高优秀应用的下载量,有效的做到信息的筛选和过滤
4)为一些冷门的优质应用提供被发掘的机会。
5)具有良好个性化推荐算法的系统,能够在提高用户满意度的同时,获得用户的依赖,从而
可以获得商业利益。
个性化推荐算法研究的难点
(一)实验数据的准备。
本文的实验数据需要是xbox游戏应用的历史数据。数据中包含了大量信息,如何对数据进行选择和筛选,如何对信息进行整合处理,是首先要做的事情。为了得到有意义并且有效的数据集,还需要我们数据抽象成合理的数据模型。在一定程度上,我们对数据的判断能力,决定了实验结果的可靠性。为此,我们首先要以严肃认真的态度,通过数据挖掘中数据预处理的方法,最大程度上保证数据的有效性。
(二)算法的设计。
算法是软件的核心。如何设计出一套完整的软件系统,在保证它的正确性、健壮性的同时,做推荐结果的个性化、精确化、用户体验良好,需要进行大量的学习和研究。
(三)实验结果分析。
在本次项目中,实验结果直观反映了推荐算法的有效性。进行实验结果的分析,可以及时观察出对算法的改动对结果产生的影响,从而能够找出问题做出调整。但是可能,在算法改进过程中,可能会有结果没有优化反而出现倒退的情况。所以,以什么指标去衡量结果的好坏,以什么标准去定义算法的优劣,很重要。所以,我们既需要制定出结果分析的标准,又要对进行一系列分析。但是,由于我们的项目数据较少,所以结果分析的准确性可能不够准确。
个性化推荐算法的研究现状及发展趋势
个性化推荐算法的研究现状
1995年3月,众多学者先后在国际人工智能协会提出个性化推荐LIRA、个性化导航的想法,意味着个性化推荐系统的产生。这以后,个性化推荐逐渐的到了广泛关注。又伴随着1997年,Resnick,Varian在ACM通讯上首次提出了电子商务推荐系统的定义,标志着推荐系统与电子商务相结合的开始,而后,又出现了协同过滤系统,关于个性化推荐算法的研究开始被列为研究主题,而受到高度重视。从1999年开始,ACM设立推荐系统年会,个性化推荐研究成为关注的焦点。接下来,Web挖掘与个性化推荐系统的结合、协同过滤导航系统Let’s browse、电子商务个性化系统TELLIM、个性化搜索引擎系统CiteSeer的实现,标志着对于个性化推荐系统的研究,从理论层面走到了应用层面。
在国内,个性化推荐技术的研究热潮兴起于2011年。很多高校和科研组加入了这个课题的研究,所有相关论文不断增多、项目成果也不断涌现。总体来说,在国内个性化推荐系统的研究兴起较晚,所以无论是在理论层面,还是在应用层面,研究还是处于初步阶段,离目标化的:个性化推荐服务还有一定距离。这主要是由于,推荐算法的选择比较少,导致需要实现个性化推荐服务缺乏有力的技术方案,所以不能完全满足用户们的需求。为了改变现状,需要进行大量的学习和研究。但是总体说来,国内对个性化推荐的研究有了初步成果。
个性化推荐算法的发展趋势
在总结了一些资料之后,得到了个性化推荐算法发展的几个趋势:
1)当前做的研究,多数是对现有的经典推荐模型进行改进。如Xbox的推荐系统,就是将推荐模型基于SVD,即将稀疏的0-1矩阵分解为M=U'V,加上了一步bayesian推导过程。
2)可以考虑的思路是将比较好的模型相结合。如,将基于预测评分的模型和基于兴趣的模型相结合。
3)在对数据的处理上,在数据量膨胀发展的情况下,会进行数据的有效筛选,过滤掉一部分信息含量不高或是信息有效性差的数据。同时,提取数据中信息所考虑的因素也越来越多,使得数据所反映的情况更加贴近用户,从而可以更一步接近个性化推荐和服务的最终目的。
推荐算法设计的主要工作
通过了解,个性化推荐系统大体可以抽象成以下的模型:
用户
剩余内容已隐藏,请支付后下载全文,论文总字数:22970字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;