论文总字数:20469字
摘 要
在旅游业和互联网技术的迅速发展以及人们物质生活水平的提高,除了旅游需求的大幅度增加和旅游市场的进一步扩大,人们对于出游也有了更为充足的游前准备以及愈发广泛的选择空间。如何发掘出旅行者们旅游景点选择偏好的趋势,对于各级旅游部门和景点管理人员采取正确的发展战略具有重要意义。线上评论是游客发表对参观景点印象如何的一个重要平台,对于了解游客选择偏好具有重要指导作用。数据挖掘技术是对旅游景点游客行为进行预测分析的基础,本文通过对线上评论的爬取,获取评论数据并对其进行词频分析等一系列操作,完成数据挖掘,最后发掘出导游、司机、酒店等游客们深切关注的关键词。这些词反映了游客关注点的趋势,本文对这些关键词进行了扩展讨论,分析了关键词背后相关行业的发展弊端与趋势,对于如何走出困境本文也给出了一些建议,可以为当下景点管理人员制定发展战略提供一定的参考价值。
关键词:数据挖掘 线上评论 旅游景点 选择偏好
Abstract
As the increase of people’s living standard and the fast development of tourism and the Internet technology, people will have more adequate preparation before going out and more extensive travel choices besides the great increase in tourism demand and the further expand in tourism market. How to discover traveler preference become especially important to each tourist attraction’s managers because it can help they adopt correct and appropriate development strategy. Online reviews provide tourists a great platform to propose their opinions, which is beneficial to dig out sightseer preferences. Data mining technology is the basis of the forecast analysis of tourist attractions tourist behavior. This article applies the crawl of online comments, btain reviews data, word frequency analysis and a series of operation, finally finishes data mining and discovers some key words such as tour guide, driver, hotel and so on which receive extensive attention by tourists. Those key words reflect the trend of what tourists concern. Later, this article discusses those key words to discover related industry’s development and gives some suggestions about how to solve the dilemma. This can provide current attractions management personnel the certain reference value to set out development strategy.
KEY WORDS: Data Mining, online views, tourist attraction, tourists preferences
目 录
摘 要 2
第一章 绪论 4
1.1 引言 4
1.2 文献综述 4
1.3研究背景 5
1.3.1 数据挖掘 5
1.3.2 旅游电子商务 6
1.3.3 线上评论 7
1.3.4 词频分析 7
第二章 途牛、去哪儿旅游线上网站介绍 8
2.1 途牛网站 8
2.2 去哪儿网站 8
第三章 方法论 8
第四章 数据收集 9
第五章 数据处理及分析 9
5.1 数据处理 9
5.1.1 途牛网站数据分析 10
5.1.2 去哪儿网站数据分析 11
第六章 扩展与讨论 12
6.1 关键词分析 12
6.1.1 导游 13
6.1.2 司机 14
6.1.3 住宿 15
结 论 17
参考文献 18
致 谢 19
第一章 绪论
1.1 引言
随着国民收入的增长和互联网电子商务的发展,人们越来越多的选择线上旅游网站进行出游。同时,随着社会化媒体营销越来越受到旅游网站的关注,旅游社交、点评、攻略等网络媒体化产品在行业中的地位的必将凸显[1]。显而易见,旅游网站中的线上评论对人们出行决策的影响越来越大。人们在出行前会做各种准备工作,其中最为关键的一点便是对目的景点的选择。由于地理位置等原因,游客往往只能通过互联网了解自己想去的景点。这时,浏览线上评论会成为一个很好的方法。人们在游览完自己所去的景点后,往往会在各大旅游网站上留下自己对于这次旅行的感想与体会,这是游客们表达自己情感最直观的方式。同时,评论中包含的各种旅游景点的信息往往是游客们印象最深,最为关注的地方,对于旅游局和景点管理人员开展新的发展战略具有重要指导意义。
本文选择途牛和去哪儿作为评论数据的来源,选取丽江、西湖等著名景点的作为研究景点,通过对线上评论的爬取、整理、处理和分析等一系列操作,从评论数据中提取出出现频率高的词汇,并以此为基础挖掘出游客选择偏好,发现当今游客所关注的景点特征。通过对这些关键特征的分析,为各级旅游部门和景点管理人员制定出更好的发展战略提供几点建议。
1.2 文献综述
本研究主要侧重的方面有数据挖掘、线上评论、选择偏好和景点发展战略。其中:
数据挖掘方面:胡文瑜、孙志辉、吴英杰(2010)详细介绍了数据挖掘取样方法的分类,并对其优劣进行了对比。总结了数据挖掘领域中取样技术的发展和趋势,并对其目前所处的困境进行了探讨。王梦雪(2013)对数据挖掘的三种主要方法:决策树法、关联规则法、神经网络法进行了详细的介绍,并对其国内外的研究现状及研究热点进行了总结,最后指出其发展趋势。郭秀娟(2004)以关联规则挖掘算法中的Apriori算法为基础,对关联规则的算法进行了讨论,解决了一些数据库问题。线上评论方面:潘明阳(2011)通过抓取第三方网站中商品的评论信息,分析其中的情感倾向,确定了评论信息对消费者行为的影响。最后发现如果评论中包含的主观性越强,则其越能影响消费者对产品的印象。陆海霞、吴小丁、苏立勋、侯昱(2015)基于评论的文本内容,挖掘出那些影响线上购物的因素,为线上店铺管理人员制定决策提供了支持。王伟(2012)利用数据挖掘技术,分析预测图书馆用户行为,对于提高图书馆服务水平具有重要意义。选择偏好方面:李旭(2001)通过统计分析的方法对来华旅客的交通工具选择偏好进行了预测和分析。申明飞机、汽车、火车等为来华旅客主要选择的交通工具。其中,游客的偏好趋势从高到低为徒步、汽车、飞机、轮船和火车。李湘云(2012)以成都地区景点为例,指出游客对于景点偏好的顺序由高到底依次为自然风光类、历史遗迹类和风土人情类。此外还根据自身、社会和家庭三个方面给出一些景点营销策略。张虹(2003)研究了小型度假酒店对游客选择偏好的影响。景点发展战略方面:钟新周(2014)就攀枝花本地旅游资源利用不彻底,从培育特色旅游景点意识的方面提出了新的发展战略。马正风(2012)运用经济学知识,分析了品牌形象对消费者购买欲望的影响。
从上我们可以发现,国内关于数据挖掘和游客行为分析的文献资料颇为丰富,但是将两者结合,研究景点特征对游客行为的影响趋势的却几乎没有。本文将借鉴前人的经验,利用数据挖掘技术爬取线上评论并进行语义分析,总结游客行为发展趋势,并对景点管理人员提供建议,优化其景点发展战略。
剩余内容已隐藏,请支付后下载全文,论文总字数:20469字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;