论文总字数:19420字
目 录
1.绪论 1
1.1 数据挖掘技术的由来 1
1.2 问题的提出背景及意义 1
1.3 国内外研究现状 1
1.4 本章小结 2
2.数据挖掘技术 2
2.1 数据挖掘的概念 2
2.2 数据挖掘的任务和过程 2
2.3 本章小结 3
3.关联规则挖掘 3
3.1 关联规则概念 3
3.2 关联规则挖掘的定义和步骤 4
3.3 Apriori算法 4
3.4 本章小结 5
4.基于网购业务相关数据的关联规则算法 5
4.1 网络销售业务概念 6
4.2 Apriori算法分析 6
4.3 Apriori算法使用实例 6
4.4 生成关联规则 9
4.5 Apriori算法的缺陷 10
4.6 Apriori算法的改进策略 10
4.7 综合改进算法与原Apriori算法的比较 13
4.8 策略应用 13
4.8.1 哈希技术使用 13
4.8.2 算法性质使用 14
4.9 本章小结 15
5.数据挖掘在网购平台销售数据的分析 15
5.1 网络购物数据的分类 15
5.1.1 对客户的挖掘 15
5.1.2 对商品的挖掘 17
5.2 网购相关数据的独特性 19
5.3 数据挖掘对网络商户的优势能力 19
5.4 本章小结 21
6.结论与讨论 21
6.1 论文成果 21
6.2 成果讨论 21
参考文献: 22
致谢 …………………………………………………………………23
附录 …………………………………………………………………24
基于数据挖掘的网购平台销售数据分析
龚天阳
,China
Abstract: Demand is the mother of invention. With the rapid development of the network, data mining technology has attracted the attention of many industrialists. The main reason is the complex data processing troubles caused by traditional businesses, but not all data have no value. These information hidden in the data can help companies gain greater market competitiveness in the face of future market competition.
This article will introduce data mining technology, and in-depth analysis of Apriori algorithm, one of the most influential algorithms in association rules mining, The concept of online shopping platform business and operating strategy. According to the inadequacies of Apriori algorithm, the combination of hashing and Apriori is proposed. The improvement plan analyzes the improved ideas and basic processes and applies them to real cases.
Keywords: data mining; online shopping; Apriori algorithm and improvement; Operational strategy
- 绪论
数据挖掘技术的由来
近些年来,人们对数据库的使用日益频繁,储存以及要处理的数据呈爆炸式增长,积累的数据也越来越多,但从数据中得到的信息却并没有太多的增长,于是就出现了所谓的“数据爆炸但知识贫乏”现象。
需求成就了数据挖掘的发展,面对繁杂的资料数据,数据挖掘技术中的知识发现很好的缓解了这种现象,在“数据矿山”中找到隐藏的“知识金块”,丢弃庞杂的数据而直指其中的关联规则,这可以帮助商家更好的运营公司业务,减少不必要的投资的同时,挽留更多的用户。我们把该技术称之为数据挖掘,而它就是为了满足当前时代的需求所快速成长的一种数据处理方面的工具。
问题的提出背景及意义
网购平台的主要业务毋庸置疑——网络购物,而它又是电商整体的关键成员之一,伴随着网络的高密度覆盖所成长起来的电子商务,对比于在一定程度上的传统商务,电子商务拥有信息化效率高,低成本,服务个性化,不限制地域、时空等等优势,这些优势帮助电子商务逐渐取代传统商务成为国际经济领域的主流。但也正因为网络购物平台的快速发展,商户所要处理的销售数据信息也在飞速的膨胀,各类的信息参杂在一起使信息的处理遇到了非常大的挑战。所以,在网络购物平台产业界急需有一种新的技术、新的处理方式去对这些数据进行分类,并进行更加深度的挖掘,将其中的包含的深层关系发掘出来。同时简化数据的存储方式,探索数据中所隐藏的知识,帮助商户发现有利于自身企业的信息,更好的制定符合自己网店的运营策略,来摸索寻找到更适合自身的发展目标。
数据挖掘技术的提出,让网络购物平台的商户看到了新的曙光。
国内外研究现状
近年来,国内学者对电子商务方面的数据挖掘也做过诸多研究。乌文波将Apriori算法运用到电子商务,设计出潜在用户分析系统,挖掘分析得出哪些客户能成为潜在客户;陆垂伟分析了电子商务方面的安全性,并得出了应用数据挖掘可有效的促进电子商务的健康快速发展;苏林萍在web访问信息方向上做了深层次的研究,并得出了一种挖掘新的频繁路径和完成协作聚类以及它的思想的算法,这些算法可以帮助网购平台的运营者及销售商户改进网站的设计,实现网络购物的个性化服务;
1989年,在美国举行的国际人工智能联合会议的专题讨论会上,KDD一词被首次提出,KDD(Knowledge Discovery in Database),意为知识发现,并且在1993年后,每年都会举行KDD会议,不过这里的“KDD”意为“Knowledge Discovery and Data Mining”。会议研究要点也逐渐向实际应用靠近,并渐渐渗透进各个不同的领域。
本章小结
本章大致介绍了数据挖掘技术的发展进程及研究状况,并说明了本文论题来源背景及意义。
- 数据挖掘技术
数据挖掘的概念
数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它可视为另一流行语“数据中的知识发现(KDD)”的同义词,这种观点把数据挖掘看作是知识发现过程中的一个最重要步骤,不过我们可以采用一个它的广义的功能的看法:数据挖掘是从大量数据中挖掘有趣模式和知识的过程。数据源包括数据库(结构化),文本、图形、图像数据(半结构化),或者是分布在网络上的异构型数据。
剩余内容已隐藏,请支付后下载全文,论文总字数:19420字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;