论文总字数:22152字
摘 要
本科生签名: 崔明宇 导师签名: 日期: 2019/3/11
摘 要
本文用信息熵值和权重系数及语义分析相关技术,评估了直播平台主播的影响力及其成为热门主播的原因。
根据小葫芦信息网的对多个平台的主播的排名,我们进行为期一个月的信息爬取,涵盖弹幕信息及礼物信息等。通过对爬取信息进行数据清洗,整理出能表现主播影响力的五项指标,弹幕数目,弹幕发送人数,礼物价值,礼物数目,礼物发送人数。随后对这五项指标进行无量纲化处理,并进行信息熵值计算,从而得出各指标所占的权重值。根据权重值构造影响力计算公式,完成主播影响力的计算并构造影响力排名。在此之后,运用语义分析相关技术,对排名第一的主播进行语意分析。通过采用主播的弹幕信息的情感走势,构造词云,正负态度词出现次数等方法并通过图表显示来探究其影响力高的原因。
关键词:影响力,主播,信息熵值,语义分析,评分计算公式
Abstract
In this thesis, we evaluate the influence rank of anchors and figure out the reasons of why he or she possesses a high population by deploying some technics like information entropy, weight coefficient, semantic analysis and so on.
Based on the rank of anchors from XiaoHuLu information website, we crawl the information of anchors for a month which consist of barrage information and presents information, etc. By data cleaning, we figure out five parameters which have major contribution to the calculation of anchor influence and they are barrage number, sender number of barrage, present value, present number and sender number of present respectively. After cleaning, we deploy information entropy to calculate weight coefficient and construct formula of calculation of influence. Finally, we can use semantic technology to analyze the anchor who obtain first place in our rank list. Analyzing the emotional trend of barrage, word cloud and the frequency of positive and negative attitude words we can understand why he or she has a first rank in our list.
KEY WORDS: Influence, anchor, information entropy, semantic analysis, formula of evaluation
目 录
摘 要 5
Abstract 6
第一章 引言 8
1.1 研究背景 8
1.2 研究内容 9
1.3 论文结构 9
第二章 相关研究 10
2.1 入度算法 10
2.2 PageRank算法 10
2.3 Topic-sensitive PageRank 12
2.4 Topic-sensitive TwitterRank 14
2.5 本章小结 15
第三章 主播影响力评估方案 17
3.1 研究对象选取 17
3.2 评价指标确定 17
3.3 数据预处理 17
3.4 影响力评估算法 18
3.4.1 评估算法选取 18
3.4.2 主播影响力评估算法 18
第四章 主播影响力排名评测及分析 20
4.1 评测任务介绍 20
4.1.1 影响力排名评测 20
4.1.2 主播直播弹幕分析评测 20
4.2 评测结果 20
4.2.1 影响力排名评测结果 20
4.2.2 主播直播弹幕分析评测结果 22
4.3 评测合理性分析 22
第五章 主播影响力评估算法的应用 24
5.1 直播平台 24
5.2 其他应用 25
第六章 总结与展望 26
6.1 总结 26
6.2 展望 26
参考文献 27
致谢 28
- 引言
研究背景
近年来互联网飞速发展,大大的改变了我们生活的方式,从前的车马慢,到现在一条信息即可表达心意获得沟通,打破了原有的时空界限,改变着每一个人的社会形态。各行各业,生活中的方方面面无不受着其的影响,从学习,经济,工作,出行等等都因互联网的飞速发展而变得越来越使人生活方便。而在互联网发展中,也涌现了许多新的行业,从之前的线下购物,到现在的网购次日达,从之前的一家人围坐在电视前观看电视,到现在仅需要一部手机即可观看各类直播节目。而对于各类的直播节目,背后支撑着的是各类的直播平台。
直播行业据数据记载,起源于2005年,从一开始的探索期、启动期、发展期到现在已经趋向于稳定期。据统计数据显示,2016年中国直播行业市场规模已经达到157.1亿元。而在2017年的市场规模同比正常59.3%,当前已是2019年,直播行业已经趋向于成熟,行业发展早已步入了新的阶段,各自平台通过差异化发展建立核心优势。
在当前的直播行业中,有报告说直播行业的“至暗时刻”来了,直播行业在可见的未来中,格局会出现几种趋势。头部平台效应会更加剧烈,对于2018、2019两年来讲,有一些小的平台已经倒闭停播,甚至曾经很辉煌的熊猫直播也宣布停播,更多的流量集中在比较知名的大平台内,比如斗鱼直播,虎牙直播等,他们已经拥有了广泛的观众基础,用户也越来越愿意在这些大平台消费。其次,短视频带来的持续影响,目前的市场有些类似于存量市场,也就是说一个用户一天在手机上花费的总时长不变,平台竞争就到了观看A平台多一分钟,意味着观看B平台少一分钟,而短视频的异军突起,这其中以抖音短视频、快手短视频为主,大大抓住了用户平常的空余时间,这导致用户在短视频多花费一分钟,在直播平台就要少一分钟。这导致各平台以及短视频均努力尝试通过优质的内容来吸引住用户,并尝试引导用户在平台消费。直播的体验更多的是浸入式的体验,比如观看主播打一场游戏等,而短视频抓住的是碎片化的时间,随着短视频的用户量巨大增长,直播平台的用户流量会在未来进一步被分割。而以抖音为代表的,在二月份发布了多闪应用,该应用是围绕抖音短视频所建立的交友聊天分享平台,进一步分割用户流量,所以在我看来在未来的市场中,短视频不仅仅只想做短视频,更想导向到直播平台方向。根据以上两点,可以得出,优质的直播内容将成为这场直播战役中最为关键的一个要素。对于直播行业来说,最终不会走向没落,而是走向类似于电视节目那样,成为人们日常的口粮,因为其本身就是有价值的,实时的提供演唱会,一场比赛信息等。在这些方面,用户是有持续并长期的需求的,因此直播是不可替代不可或缺的,故大平台想从直播行业中获得稳定的现金流,必须持续推出优质的直播内容。在未来的直播中,一定是内容为王,从游戏直播,美妆直播,厨艺直播,娱乐直播等方面,精确的挖掘用户的潜在的内容需求。而如何能够推出有趣吸引人的内容直播,这就需要各大平台能够筛选出能产生大流量大现金流的主播,也就是根据主播的主播数据来判断现有主播的影响力,进而决定其是否有能力推出吸引人内容的直播。
研究内容
在这篇论文中,针对以上所提到的未来可能潜在的导致流量流失的趋势,这篇论文将着眼于去评估一位主播的影响力,这是对于一位主播的综合评价,当一位主播的影响力高的时候,那意味着他能够提供优质的直播内容吸引住用户,并且能够引导用户进行一定量的持续的消费,为平台提供长期稳定的现金流。本文将通过主播直播时候的两个方面(直播时互动效果,以及礼物的收入情况)来进行主播的影响力评估,这两个方面有五个可以量化的指标,分别是直播时收到的弹幕数目,发送弹幕的总用户数,收到的礼物价值总数,收到的礼物数目,发送礼物的人数。
论文结构
论文共分为6章,论文结构如图1-1所示,每章的主要内容具体如下:
剩余内容已隐藏,请支付后下载全文,论文总字数:22152字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;