论文总字数:15622字
摘 要
随着互联网技术不断发展,电子商务平台提供的服务不断完善,网上购物因其便利快捷的特点受到越来越多人的青睐。大量商家进驻电子商务网站,商品数量种类激增,交易额也不断攀升,网上购物给消费者提供了一种全新的购物方式。这种新型的购物理念已被大多数人接受。
目前在我国国内的电商平台众多,例如淘宝网、京东网、当当网、亚马逊中国等等,每个平台都有海量的交易数据,这些数据背后都隐含着更深层的信息,对商务战略和政府决策都有重要作用。但正由于这些数据含有的信息量大,各大企业将这些数据当成商业机密,并不对外公开。是以目前也还没有对各个电子商务网站交易数据进行统计分析的研究。
在此背景下,本文的研究目标即是选取一个典型的电子商务交易平台,从这个电子商务交易平台上提取交易数据,分析计算某商品在某一地区,每月的销售数量、销售金额,分析销售趋势。
关键词:电子商务,数据分析
Abstract
With the continuous development of Internet technology, e-commerce platform to provide services and constantly improve the online shopping because of its convenient and efficient features are subject to more and more people of all ages. A large number of businessmen stationed e-commerce sites, the number of species surge in commodity trading volume is also rising, online shopping provides consumers a new way to shop. The new shopping concept has been accepted by the majority.
Currently in our country's many electronic business platform, such as Taobao, Jingdong network, Dangdang, Amazon China and so on, each platform has a massive trade data, which are implicit behind the more in-depth information on business strategy and have an important role in government decision-making. But precisely because of the amount of information contained in these data, major companies such data as trade secrets, not publicly. Is currently not yet studied the statistical analysis of the various e-commerce site transactions.
In this context, this graduate design research goal that is to select a typical e-commerce trading platform, to extract transaction data from e-commerce transactions on this platform, analysis and calculation of a commodity in a particular area, the monthly sales volume, sales amount analyze sales trends.
Keywords: E-commerce, Data analysis
目录
摘要 I
Abstract III
目录 V
第一章 绪论 1
1.1 研究背景 1
1.2 论文研究目标及内容 1
1.3 论文组织结构 2
第二章 电子商务与数据分析 3
2.1 电子商务兴起 3
2.2 数据分析在电子商务中的应用 3
2.3 Pig Latin语言 4
2.4 本章小结 5
第三章 电子商务平台数据抓取 7
3.1 需求分析 7
3.2 原理及相关技术 7
3.2.1 实现原理与思路 7
3.2.2 利用jsoup解析html文档 8
3.3 实现抓取 9
3.4 本章小结 13
第四章 数据的处理分析 15
4.1 用Pig Latin处理数据 15
4.2 数据分析 16
4.3 本章小结 17
第五章 总结与展望 19
5.1 总结 19
5.2 展望 19
致谢 21
参考文献 23
绪论
研究背景
近年来,随着互联网技术不断发展,上网的人数也日益增加。两者互相作用,如今的互联网拥有不计其数的网站、用户、衍生产品等。在互联网大潮的影响下,传统商业模式也随之发生了深远的变革,面对面的交易因为费时费力而逐渐被网上购物取代。与传统零售业相比,电子交易平台更加方便、快捷,所以越来越多的人喜欢在网上购物。
现如今网上购物已成为了一种十分流行的消费方式,以淘宝(C2C)、京东商城(B2C)、阿里巴巴(B2B)等为代表的购物网站发展迅猛。随着电子商务的蓬勃发展,数据的生成速度也在不断提高,越来越多的数据在不断生成,越来越多的数据需要处理,大数据的时代已经到来。在商务领域,网络商品交易活动诚然已进入主流社会,为千家万户熟知,伴随惊人交易额而来的是海量的交易数据记录,其数据规模太过巨大很难通过传统数据库进行处理。如此庞大的数据对数据存储、查询、分析技术提出了新的挑战。
在数据爆炸的形势下,云计算这一概念被提了出来,提供了一种新的方案来解决海量数据的存储和处理问题。2004年,谷歌(Google)公司发表了一系列论文,Map-Reduce、GFS(Google File System)、BigTable都已开源实现,基于此的Hadoop成为了实用的分布式系统基础架构。随后的几年,IBM、微软、谷歌等企业都对云计算投入了大量研究资源。今日我们所说的云计算,基石是“虚拟化”。“云”并非固定的实体,而是一个提供资源的网络。早期的云数据管理系统,如BigTable、Hbase和Cassandra仅支持一些基本的数据插入和获取接口。随后很多公司和研究机构在丰富查询语句上展开了工作并提出了一些“类-SQL语言”,例如雅虎公司(Yahoo!)的Pig Latin,Facebook的HQL等等。
综上所述,数据的获取与分析在如今显得尤为重要,不管是商务战略还是政府决策都要依赖数据显示的信息,国内外都有基于数据挖掘、分析的研究,例如云计算技术。
剩余内容已隐藏,请支付后下载全文,论文总字数:15622字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;