论文总字数:14482字
摘 要
随着计算机技术的飞速发展,快速增长的数据量与匮乏的信息量形成了鲜明的对比,要想从中挖掘出有价值的信息,就要对数据进行专业化处理。本文简单介绍了数据挖掘与关联规则,并采用关联规则算法对超市商品间的销售进行了分析,同时对关联规则算法(Apriori算法)进行了改进,并将基本算法与改进后的算法——AprioriTid算法、DHP算法、Partition算法进行了比较,改善了关联规则算法的缺陷,得到了一些有用的信息,将有利于提高超市的销售额,增强市场竞争力。关键词:数据挖掘,关联规则,关联规则算法,AprioriTid算法,DHP算法,Partition算法
Abstract: With the rapid development of computer technology, the rapidly rising amount of data is contrary to the deficient information quantity. It’s necessary to process the data to dig out some valuable information. This article is introduced data mining association rules briefly and analyzed the sales of supermarket goods by adopting association rules algorithm. Meanwhile, the association rules algorithm( Apriori Algorithm)were improved, then a comparison is given which between basic algorithm and an improved one—AprioriTid Algorithm, DHP Algorithm, Partition Algorithm. The association rules algorithm was improved, and we get some valuable information, which is beneficial to raise the turnover of supermarket and strengthen the market competitive force.
Keywords: data mining, association rules, Apriori Algorithm, AprioriTid Algorithm, DHP Algorithm, Partition Algorithm
目 录
1 引言………………………………………………………………… 5
1.1 研究的背景与现状……………………………………………… 5
1.2 研究的必要性…………………………………………………… 5
1.3 论文的研究内容与结构………………………………………… 6
2 关联规则挖掘算法——Apriori算法…………………………… 6
2.1 数据挖掘………………………………………………………… 6
2.2 关联规则………………………………………………………… 7
2.3 在超市消费关联性中的研究……………………………………… 8
3 对Apriori算法的改进……………………………………………14
3.1 AprioriTid算法…………………………………………………14
3.2 DHP算法…………………………………………………………20
3.3 Partition算法…………………………………………………23
4 算法对比……………………………………………………………23
5 总结与展期…………………………………………………………24
参考文献 ………………………………………………………………25
致谢 ……………………………………………………………………26
1 引言
1.1 研究的背景与现状
随着计算机技术的飞速发展,人们在各行各业都利用到了计算机,它给咱们的生活带来了许多的便利。然而,计算机带给我们的越来越多的数据量和越来越少的信息量却形成了鲜明的对比。比如,超市里通过对条形码的扫描,生成了超市的销售数据,这些数据包含了客户的购买需要。但是,由于现在存储的数据越来越多,并且不断地积累成了以前的办法所不能处理的大数据,我们又没有能够对这些数据进行专业化的处理,所以不能从这些数据中获得更加有用的信息,导致人们一边陷入了“数据的海洋”,一边却在感叹着“知识的匮乏”。如果我们能从这些数据中挖掘出潜在的关系、有用的信息,那么便能为人们带来便利,为商家自己带来最大的利益,其中最经典的就是“尿布与啤酒”的案例。这个营销界的神话讲的是美国的沃尔玛超市,高层们发现每到周末,尿布和啤酒的销量就会一起上升,于是就对这一奇怪的现象进行了调查分析,发现了其中的奥秘,原来,美国的妇女们经常会吩咐她们的丈夫下班以后为孩子买尿布,而丈夫在买完尿布以后会顺便为自己买喜欢喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的,于是商家对商品的摆放进行了相应的调整,所以,尿布与啤酒的销量更多了,商家也获得了更大的利润。这都得益于商家对购物单中冗杂的数据进行了深度挖掘,对客户的消费进行了关联规则的研究。
目前,无论是国内还是国外,对数据关联规则挖掘的研究都已经变得非常时髦,但是国外很多计算机公司很注重数据挖掘的开发运用,并能够将研究结果很好地投入到应用中,并且得益;但是国内的研究却稍晚,它们仅仅存在于学术上、纸面上,而且没有形成整体力量,没有运用到实际生活中。近来,商家逐渐意识到通过对超市的消费来研究顾客的购买行为的重要性,迫切地希望有可信的规则来指导他们摆放商品,如果我们将超市运用中普遍关注的关联规则挖掘与消费清单间潜藏的关系这一问题解决,那么帮助商家获利,提升国家GDP将指日可待。
1.2 研究的必要性
改革开放以来,居民的人均收入不断提高,购买能力呈正比上涨,我国的消费基础结构正发生着变化,这种转变带来了数据的膨胀与杂乱,人们急需在这些繁杂的数据中找到有用的信息,来获得最大的利益。首先,现有的关联规则挖掘方法都要很长的时间来生成规则,因此,在经典算法基础上要创建一些新的算法来提高数据挖掘的效率,进一步推进关联规则算法在行业中的运用;其次,从大量的零售记录中找到潜在的关联规则能够帮助商家制定决策,如分类设计、促销分析等。那么,怎样才能在超市大量的数据和不确定的因素中挖掘出对商家有用的信息,即消费者潜在的消费规律,来指导生产与消费的良性运营呢?本文将用与关联规则有关的算法——Apriori算法及其的改进算法来挖掘超市消费之间的关联性,从而帮助商家制定决策,发现客户的购买习惯,找到各个商品的合理位置,来达到增加销售量,获得最大利润,使企业拥有更强大竞争力的目标。
1.3 论文的研究内容与结构
剩余内容已隐藏,请支付后下载全文,论文总字数:14482字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;