论文总字数:35171字
摘 要
随着互联网的快速发展,电子商务进入大数据时代,粗糙集在数据挖掘方面有着重要应用,分辨矩阵是粗糙集的有机构成,本文通过分析现有几种典型分辨矩阵的不足,在重新界定属性重要性求法后,通过自主设定属性重要性阈值,提出了基于属性重要性的分辨矩阵的算法,并讨论了其相关性质,最后辅以案例,针对淘宝提供的统计数据,选择典型品牌“国行iPhone 5s”排名前20的入驻店铺作为样本,以粗糙集理论为基础,获取不可分辨类和各属性重要性,在此基础上提取分辨矩阵,获得约简,挖掘规则,并利用MATLAB软件实现,探寻淘宝入驻店铺成功的潜在规则,用以指导店家制定营销策略,提高销售业绩,提升经营成效。同时,另外用10条不同时期的同类数据验证规则的有效性。
关键字:变精度容差关系;粗糙集;个性化推荐
A Personalized Recommendation Method Based on Variable Precision Tolerance Relation of Extended Rough Set
Abstract
With the rapid development of Internet, e-commerce into the age of big data, rough set is very important application about data mining and artificial intelligence. Discernible matrix is an organic part of rough set. This paper analyzes the deficiencies of some discernible matrixes first, and then identifies how the importance of a condition is, after this proposes a new algorithm of discernible matrix which is based on the importance of conditions, and discusses theorems about this algorithm. At last, example is given. Aiming at the Taobao provide statistical data, select the typical brand "of China for iPhone 5s" top 20 in store as the sample, based on rough set theory, the importance of obtaining indiscernibility classes and attributes, based on the extraction of discernibility matrix, gain reduction, mining rules, the realization of data mining by using MATLAB software, explore in Taobao potential rules shop successful, to guide the stores the formulation of marketing strategy, increase sales, enhance management effectiveness. At the same time, in addition, using 10 different periods of similar data to check the effectiveness of the rules.
Keywords: Variable Precision Tolerance Relation; Rough Set; Personalized Recommendation
目 录
摘 要 I
Abstract II
第一章 绪 论 2
1.1 研究背景 2
1.2 研究目的及意义 2
1.3 研究现状 2
1.3.1 个性化推荐方法 2
1.3.2 粗糙集理论 2
1.4 本章小结 3
第二章 文献综述 4
2.1 理论背景 4
2.1.1 认识的不确定性 4
2.1.2 研究发展历程 4
2.2 个性化推荐方法 5
2.3 粗糙集理论 6
2.3.1 已有的典型扩展粗糙集 6
2.3.2 已有的粗糙集应用 7
第三章 基于变精度修正容差关系扩展粗糙集 11
3.1 已有几种扩展粗糙集模型 11
3.1.1 相似关系 11
3.1.2 限制容差关系 11
3.1.3 修正容差关系 12
3.2 基于变精度修正容差关系的扩展粗糙集模型 12
3.3 算例分析 13
第四章 分辨矩阵算法改进概述 15
4.1 建模预备知识 15
4.1.1 基础定义 15
4.1.2 几种典型分辨矩阵求法及其局限性分析 15
4.2 改进分辨矩阵求法 16
4.3 算例分析 19
第五章 基于VT扩展粗糙集约简集的计算 23
5.1 模型建立 23
5.2 约简集计算 23
第六章 案例应用 25
6.1 数据来源及研究方法 25
6.1.1 数据来源 25
6.1.2 研究方法 26
6.2 数据预处理 27
6.3 数据分析 29
6.4 规则检验 32
第七章 总 结 34
致 谢 35
参考文献(References) 36
第一章 绪 论
1.1 研究背景
2014年8月,中国互联网络信息中心(China Internet Network Information Center,以下简称CNNIC)发布的最新一期《互联网发展信息与动态》指出,截止2014年6月,我国网民规模达6.32 亿,互联网普及率为46.9%,与2013年年底相比,增长了1442万人,普及率提高了1.1个百分点。报告还指出中国人均每周上网时长达到了25.9小时,比2013年增加了0.9小时。互联网的普及使用,使得电子商务、门户网站以及社交网络呈现一片繁荣,产生并积累了大量数据,大数据时代已然到来。数据的爆炸,大大提升了数据的应用价值,其中一个热门议题就是挖掘数据规则,进行个性化推荐。
1.2 研究目的及意义
大数据具有Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)等特点,数据的出现,使得具有潜在价值的数据大大增加,同时无形间也增加了处理利用这些数据的难度,信息超载由此产生。数据挖掘技术可以发现大数据的潜在规律,获取大数据价值,应对信息超载[7]。针对完备大数据集的处理相对简单,但是,众多大数据集中往往难以达到各相关属性值都是确定完备的要求。如电子商务方面对用户的了解,单从购物习惯来讲,可以看用户的购物记录、搜索记录、用户在意的是价格、质量、信誉度还是其他?可这些条件,并不都是完整的,通常情况下用户可能只提供了其中的一个或几个方面。面对繁杂、冗余且不具有完整性和确定性的数据,需要探寻新的解决方法。而粗糙集可根据数据自身特点,找出数据之间的关联性,挖掘隐含规则,辅助广大网络使用者尽快获取合适目标信息,使问题处理更加客观实际,是处理大数据的一种有效手段[2][6]。并且个性化推荐亦是基于相应规则的,但粗糙集在个性化推荐方面的应用研究较少,本文拟对此展开探讨,有其相应实质意义。
1.3 研究现状
1.3.1 个性化推荐方法
大数据时代促进个性化推荐(Recommend System,简称RS)的产生和发展,目前主流的个性化推荐方法主要有:协同过滤推荐系统、基于内容的推荐系统、基于网络结构的推荐算法、混合推荐算法等等。在此基础之上,也有的学者提出了其他个性化推荐方法,例如:基于人口统计的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。在信息爆炸性增长的今天,个性化推荐仍是目前研究的热点之一。
(1)协同过滤系统
剩余内容已隐藏,请支付后下载全文,论文总字数:35171字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;