论文总字数:23370字
摘 要
本文利用AMiner开放科学研究平台的科学家合作及论文引用数据集,编写了针对数据集的处理方法以及统计分析方法,建立了科学家合作网络和引文网络(我们把这两个网络统称为科学网络),并对网络的测度和演化机制进行了统计分析。我们观察到合作网络与引文网络均具有“无标度”特性,并且合作网络具有“小世界”特性。合作网络与引文网络的规模都呈指数增长。在引文网络演化过程中,我们观察到了论文的老化现象和引用的传递性。同时,我们发现,有约20%的概率,科学家发表的论文会引用自己或其直接合作者的论文。在合作网络演化过程中,我们发现科学家之间的合作以短期为主。同时,科学家之间的距离越近,将来合作的可能性越大。一个研究领域的合作网络从最初发展到成熟的过程中,主导网络发展的力量也从新增的科学家转变成网络中已经存在的科学家。
根据我们对两个网络演化机制的研究,结合前人的一些成果,我们建立并实现了合作网络和引文网络的协同演化模型。模型演化出的引文网络具有“无标度”特性,并且在网络中出现了论文的老化现象。同时,我们也从模型演化出的合作网络中观察到了短期合作的主导地位。模型网络与实际网络具有不错的一致性。
关键词:合作网络,引文网络,统计分析,协同演化,模型
Analysing and modeling of the co-evolution of
scientific coauthor networks and citation networks
Abstract
By using data from an open science platform called AMiner, we write code to analyse the data and construct the coauthor network of scientists and the citation network of papers (We call them science networks). We focus on measurement of networks and mechanism of the evolution of scientific networks. We find that the coauthor network has "scale-free" feature, as well as the citation network. The coauthor network has "small world" feature. Both the coauthor network and the citation network show exponential growth. We observe aging of papers and transmission of references. Moreover, scientists will cite papers written by themselves or their collaborators, and the probability is about 20%. We also find that most collaborations between scientists are short-term. Meanwhile, the closer the distance between scientists, the more the chance they will cooperate with each other. At the beginning of evolution of the coauthor network, new scientists lead the development of the coauthor network. As the network grows, the leading force is gradually controlled by existing scientists.
We model the coauthor network and the citation network by combining our findings with other relevant works. The model citation network shows "scale-free" feature and aging of papers. The model coauthor network is dominated by short-term cooperation. The model networks are consistent with real network in many ways.
Keywords: coauthor network, citation network, statistic analysis, co-evolution, model
目录
摘要 2
Abstract 3
第1章 绪论 2
1.1引言 2
1.2 研究背景 2
1.2.1 小世界和无标度网络 2
1.2.2 合作网络演化机制及模型 3
1.2.3 引文网络演化机制及模型 3
1.2.4 当前研究中存在的不足 3
1.3论文的工作及组织 4
第2章 科学网络拓扑分析 4
2.1数据集说明 4
2.2数据预处理和初步分析 4
2.2.1 数据预处理 4
2.2.2 数据集初步分析 6
2.3 科学网络建立及测度分析 7
2.4 引文网络与合作网络度分布 9
第3章 引文网络演化分析 11
3.1 引用与论文发表时间的关联 11
3.2 引文网络的聚类系数的意义 12
3.3 引文之间的作者关系分析 12
3.3.1引文之间的作者关系分析算法实现 12
3.3.2 引文之间的作者关系的数据分析 13
第4章 合作网络演化分析 15
4.1科学家发表论文数量分布 15
4.2 科学家合作期限分布 15
4.3 合作的连续性分析 17
4.4 合作网络中距离对合作的影响 18
4.5 每年新增边的比例变化分析 19
第5章 科学网络演化模型的建立及验证 21
5.1 科学网络模型的建立 21
5.1.1模型假设 21
5.1.2模型算法的实现 22
5.2模型参数设定 23
5.3 模型验证 23
第6章 总结及展望 26
致谢 27
参考文献 28
第1章 绪论
1.1引言
科学家们对科学网络的研究已经有很长的历史。早在1964年,Garfield就提出了用论文引用数据来研究科学史的建议[1]。10多年前,伴随着计算机科学的发展,出现了拥有大量且高质量科学论文的数据库。同时,计算机性能的提升及算法研究的深入使海量数据的处理成为了可能。此时,科学家才有能力对科学网络进行深入研究。
科学网络包括合作网络和引文网络。科学合作就是科学家为生产新的科学知识而共同工作。随着科学的迅速发展,科学研究中的合作关系日益成为影响科学生产能力发挥的巨大力量,引起越来越多的科学家以及科技管理人士的关注,科学家们对科学合作的研究也在逐渐深入。合著论文是科学合作的重要表现形式之一。合作网络以科学家为网络中的顶点,几个科学家共同发表一篇论文时,认为这些科学家之间具有合作关系,而合作关系就是网络中的边。引文网络是由学术论文间的引用关系构成的网络。大多数学术论文都会引用一篇或多篇以前的论文,并且通常会将其列在结尾部分的参考文献中[10]。引文网络中的顶点是论文,如果一篇论文在参考文献中引用了另一篇论文,就存在了一条前者指向后者的有向边。
剩余内容已隐藏,请支付后下载全文,论文总字数:23370字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;