电子商务环境下虚假评论者识别研究毕业论文
2020-08-13 20:48:27
摘 要
互联网的发展日新月异,特别是电子商务技术的发展更是迅猛无比,与此同时,对于电子商务这一块大蛋糕商家们都想来分一杯羹,网络水军也应运而生,他们的存在使得网上出现了越来越多的虚假评论,这些评论可能会错误引导消费者对于产品的判断,使得消费者做出错误的购买决策,损害消费者的利益,同时卖家和电商平台的名誉问题也会遭到质疑,从而使得电子商务的发展受到严重打击。因此,快速有效地识别出虚假评论者并剔除他们所发表的虚假评论存在着很重要的现实意义。
本文主要根据用户的基本特征对虚假评论者进行识别研究,首先,根据用户的基本特征来构建空间向量模型以便于计算,然后根据卖家用户的基本特征找出淘宝网上有着异常数据的商家,再根据买家用户的基本特征对异常商品下的评论者进行用户相似度计算,得到具有相似关系的小集合,再利用共同评论商品数来判断其是否为虚假评论者。最后对识别方法进行实证分析,结果表明本文提出的识别方法具有较高的识别效果。
关键词:电子商务;虚假评论者;用户特征;水军识别
Abstract
The development of the Internet is changing, especially the development of e-commerce technology is extremely fast, at the same time, for e-commerce this big cake everyone wants to share a slice, the network navy also came into being, their presence makes the online appear more and more false comments, these comments may mislead consumers' judgments about the product, making them make the wrong buying decisions that harm the interests of consumers, while the reputation of the seller and the business platform will be questioned, making the development of e-commerce has been a serious blow. Therefore, it is of great practical significance to quickly and effectively identify false commentaries and remove the false comments they publish.
This article is mainly based on the basic characteristics of the user to identify the false commentator, The first step is to build the spatial vector model based on the user's basic characteristics to facilitate the calculation,and then based on the basic characteristics of the seller to find Taobao business with abnormal data, and then according to the basic characteristics of the buyer's user to calculate the user's similarity of the reviewers of abnormal goods, getting a small set of similar relationships.And then use the number of commonly commented goods to determine whether it is a false commentator, Finally, the empirical method of the identification method is analyzed, the results show that the recognition method proposed in this paper has high recognition effect
Key words: E-commerce,False commentator,User characteristic,Naval identification
目 录
摘要 I
Abstract II
第一章 绪论 1
1.1 研究背景 1
1.2 研究意义 1
1.3 国内外研究现状 2
1.3.1 虚假评论识别研究 2
1.3.2 虚假评论者识别研究 3
1.4 研究内容 5
1.5 研究框架 5
第二章 相关概念分析 7
2.1 虚假评论 7
2.2 虚假评论者 7
2.3 用户相似度度量方法 8
第三章 电商用户的基本特征分析 10
3.1 电商用户基本特征的概述 10
3.2 电商用户基本特征模型的维度 10
3.3 电商用户基本特征模型的构建 13
第四章 基于用户基本特征的虚假评论者的识别 14
4.1 基于卖家用户基本特征的异常商家识别 14
4.2 基于买家用户基本特征的虚假评论者识别 14
4.2.1 用户相似度度量 14
4.2.2 虚假评论者的识别 16
4.2.3 用户基本特征的权重计算 16
第五章 实证分析 18
5.1 数据收集 18
5.2 实验结果分析 20
第六章 总结与展望 22
6.1 研究结论 22
6.2 局限性与研究展望 22
参考文献 24
致谢 26
第一章 绪论
1.1研究背景
信息技术的快速发展和网络普及率的逐渐提升,使得人们对于互联网的使用率与依赖感日益增强,从一开始的利用互联网查阅资料,发展到现在,互联网的功能越来越多,而且近几年来,随着电子商务技术的飞速发展和物流产业的快速扩大,网络购物这一方式早已迅速渗入到人们生活中的各个方面了。
近几年快速兴起的天猫双十一活动更是吸引了众多消费者的目光,据统计,2013年的天猫双十一当日达成了350.18亿元的总成交额,2014年双11当天的总交易额较之13年增加了约221亿元,而刚刚过去的2016年天猫双十一总交易额更是超1207亿。如此巨大的用户群与经济利益,使得淘宝商家动心不已,然而想要从一众淘宝商家中吸引消费者的视线并不是一件那么容易的事,于是商家们开始在网上雇佣水军或吹捧或诋毁某样商品来达到自己的目的,这一举动衍生出了一种新兴行业——刷单,刷手也就是我们所谓的网络水军或虚假评论者。他们会根据商家的要求对某样商品进行浏览下单,然后商家再虚拟发货,等一定的时间收货后刷手就会根据商家要求对商品进行评论。因为网络的虚拟性,消费者不可能在购买时对商品进行实物检查,而商家对商品的介绍并不能让消费者信任,此时消费者就会查看其他购买者的评论数量和内容,而这些评论往往会对买家用户的购买欲望产生决定性的影响。
1.2研究意义
电子商务技术的蓬勃发展和网购的便利性使得愈来愈多的消费者选择网络购物,买家在购物之后,通常会将自己对该产品的使用、商家的服务和物流情况都发表在网上,因为这些信息是同为买家的消费者所发表的,相对网络商家对产品的介绍更容易获得其他潜在买家的信任,因此,买家的评论信息成为了商品简介外,另一个取得商品各方面信息的有效途径。买家用户在网上进行购物的时候,通常会先看一下该产品的在线评论情况,较多的好评会使买家用户对该产品的好感度和购买欲望增强,而较多的差评则会使买家用户对该产品的好感度和购买欲望减弱,甚至会影响到买家用户对该产品所属商家的信任程度和好感度。同时,更高的好评率也会使商家在电商平台中的排名上升,更容易被消费者搜寻到。本来产品的在线评论功能是为了帮助消费者从一个比较公正公开的渠道更好的了解商品的性能和质量等问题,从而可以使之做出更为正确的购买决策,然而网络水军的存在使得电子商务平台上出现了大量的虚假评论,造成的影响也是十分恶劣的。首先对于消费者来说,虚假评论的存在极其容易混淆他们对商品的判断,从而做出错误的购买决策,大大降低了消费者的购物体验并造成了财产上的损失。同时对于商家来说,假的毕竟是假的,大量存在的虚假评论也会对商家的信誉和影响力的造成损伤,甚至会失去消费者的信任,从而造成产品销售量的减少。
由此可知,目前最大的问题就是对这些电子商务平台中大量的交易数据进行有效精准地分析,从中精确有效地将发表了虚假评论的用户和发表了真实评论的用户区分开来,剔除前者所发布的虚假评论并对他们和雇佣他们的商家进行曝光甚至封号等处理,维护真实评论者和诚信商家的权益,给所有人创造一个真实安全的网络购物环境,这样不管是对于消费者还是商家来说都有着十分重要的现实意义。
1.3国内外研究现状
在早期的互联网环境下,由于网络的普及率过低和计算机使用功能的限制,国内外对虚假评论者的识别研究主要是集中在邮件领域之内,之后随着信息技术的发展和网络使用率的提高,才开始慢慢向社交领域发展,如对于微博贴吧上擅长引导舆论的网络水军的识别研究,而近年来,电子商务技术在快速的发展着,人们的生活水平也在逐步提高,越来越多的人开始接触并使用淘宝京东等网上购物的APP,发展到现在,网络购物俨然成为了大多数人们的生活中必不可少的一部分了,这时,网络水军就不单单是指在社交平台上发布虚假言论,企图引导某件事件的舆论以及抹黑或者洗白某个名人的形象的有组织的用户,还包括受雇于人在电子商务平台上发布虚假评论的用户,他们的目的就是为了造谣中伤或者吹捧某件产品或者某个商家,他们的行为不仅会对商家造成名誉上的损失,同时也会对买家用户的经济利益造成一定的损失。因而对电子商务领域内虚假评论者的研究也就逐渐成为了国内外众多学者的研究重点。而相比较于其它领域内的对于虚假评论者的识别方法,电子商务领域内的识别工作可能就会显得比较复杂了。
1.3.1虚假评论识别研究
虚假评价的概念是在2008年的时候被初次提及,Nitin Jindal和Bing Liu[1]在研究中将之称为垃圾评论(Opinion Spam),他们将垃圾评论根据里面所写的内容分成下面这三种情况:第一种是虚假的评论,在金钱的驱使下,用户或吹捧或诋毁某种商品;第二种是只针对品牌的评论,评论者并不是在评论所购买的商品,而是在评论该产品所属的品牌或者商家,这种评论往往带有评论者对该品牌或商家的偏见,对于自己喜欢的品牌都是好评,而对于自己不喜欢的品牌就都是差评,对该商品本身并没有什么太大的参考价值;第三种是无关评论,即与该产品或是所属品牌并没有什么关系,评论内容通常是与该产品没有关联的广告或者是用户间的对话等内容。他们利用监督学习的方法对后两种垃圾评论类型进行识别,实验结果表明这两种是比较容易识别的,但对于第一种评论类型却是很难进行识别。然而即便是这样,他们在文中的研究分析对于后面研究虚假评论的识别这一问题的学者来说也有着十分重要的意义。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。