论文总字数:27860字
摘 要
随着步入21世纪,互联网、社交网络等众多网络都在蓬勃发展。“网络”已经渗透到我们的日常生活的方方面面。与此同时对于“网络科学”这一领域的研究也迅速崛起。
在“网络科学”这一领域的重中之重是数据的度量和分析。因此,在实际应用、研究方法以及理论发展方面,网络分析都需要或繁或简的统计方法。本文的研究方向是学习掌握网络数据统计分析的方法,再进一步研究相应的R扩展包的使用以及应用。本文首先从描述性统计方法出发,了解操作网络数据的方法,之后掌握网络的可视化与特征化的方法。最后着手进行对网络建模与推断方面的研究,尤其详尽讨论网络建模中的统计方法。
在这一研究过程中,本文不可避免的要用到网络分析软件的平台加以辅助。毫无疑问,R语言在网络数据统计分析软件的开发中尤为活跃。在本论文中我们使用了大量的R程序去完成网络分析的各种任务。在这一过程中,本文所做的第一步也是最重要的一步,就是掌握各个扩展包中的函数的使用方法。例如如何使用igraph、network、sna等扩展包中的函数来实现对标准网络数据的操作、可视化与特征化;另外如何使用igraph、eigenmodel、ergm等扩展包中的函数去完成对网络的建模。
最后本文以lazega数据集为例,展示实际应用的成效。
关键词:网络数据分析、可视化、特征化、指数随机图模型、igraph
Abstract
As we enter the 21st century, many networks such as the Internet and social networks are booming. "Network" has penetrated into all aspects of our daily life. At the same time, research in the field of "network science" has also rapidly risen.
The top priority in this area of "network science" is the measurement and analysis of data. Therefore, in practical applications, research methods, and theoretical developments, network analysis requires either complex or simple statistical methods. The research direction of this article is to learn and master the method of statistical analysis of network data, and further study the use and application of the corresponding R expansion package. This article starts with the descriptive statistics method, understands the method of operating network data, and then grasps the method of visualization and characterization of the network. Finally, we started to study the modeling and inference of the network, especially the statistical methods in the network modeling.
In the course of this research, this article inevitably uses the network analysis software platform to assist. There is no doubt that R language is particularly active in the development of statistical analysis software for network data. In this paper we use a large number of R programs to accomplish various tasks of network analysis. In this process, the first and most important step in this article is to grasp the use of functions in each extension package. For example, how to use igraph, network, sna and other extended package functions to achieve standard network data manipulation, visualization and characterization; In addition, how to use igraph, eigenmodel, ergm and other extended package functions to complete the network modeling.
Finally, this paper uses the lazega dataset as an example to demonstrate the effectiveness of actual applications.
KEY WORDS: Network data analysis, visualization, characterization, exponential random model, igraph
目录
摘要 I
Abstract II
第一章 介绍 1
1.1 网络分析背景 1
1.2 网络分析的R语言平台 1
1.3 网络分析的类型 2
1.3.1 网络可视化与特征化 2
1.3.2 网络建模与推断 3
1.4 关于本文 4
第二章 操作网络数据 5
2.1 无向图和有向图 5
2.2 图的表示 6
2.3 图的操作 7
第三章 网络数据可视化 8
3.1 图可视化的基本元素 8
3.2 图的布局 8
3.3 修饰图的布局 11
3.4 大型网络可视化 13
第四章 网络图特征的描述性分析 16
4.1 节点和边的特征 16
4.1.1 节点度 16
4.1.2 节点的中心性 17
4.1.3 边的特征 20
4.2 网络的凝聚性特征 20
4.2.1 子图与普查 21
4.2.2 密度与相对频率 22
4.3 图分割 22
4.3.1 层次聚类 22
4.3.2 谱分割 24
第五章 网络图的统计模型与实例应用 26
5.1 指数随机图模型 26
5.2 模型界定 27
5.3 模型拟合 29
第六章 参考文献 32
第一章 介绍
1.1网络分析背景
现在人们常说“我们的世界变小了,世界的各个角落联系得更加紧密”,这句话很好的诠释了为什么网络在近年来引起人们浓厚的兴趣。从万维网互联网到Facebook这类的社交网络,我们无时无刻不被网络所包围着,并利用它们进行交流。同样的,人们在各种人类组织(如政府)、过程(如经济活动)和基础设施(如航空网络)中也相互连接起来。另外当我们把目光投向整个自然世界,我们同样可以找到很多例子:生态系统、食物网络、基因、传递信号的神经元都具有这种连接的复杂系统。
当描述系统中的元素及其相互连接的概念时,“网”的形象是一种自然的选择。然而“网络”这一术语有多种使用方式和形式。例如在牛津词典中将广义的“网络”定义为“相互连接事物的集合”。另一方面,“网络”经常与“图”(graph)互换使用,因为数学上通常利用各种图来表示网络。本文为加以区别,将使用术语“网络”表示广义概念,使用“网络图”强调所谈论的是网络的图表示。
剩余内容已隐藏,请支付后下载全文,论文总字数:27860字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;