基于知识图谱的数据开放研究综述毕业论文
2020-06-12 20:22:37
摘 要
本世纪初,开放获取和机构知识库的流行使得越来越多的学术数据被发布到互联网上共享。但开源代码只涉及技术层面,公众迫切希望能出现更广范围的数据公开与再利用,特别是政府采集和拥有的大量公共数据。而云计算的出现使得数据共享、流动、开放成为可能,数据成为激发新生产力的引擎。数据的角色从IT时代的产出者辅助角色转变为资产和生产要素,真正驱动大数据产业从概念进入实战阶段。数据开放作为飞速发展的跨学科研究领域,已经形成较为完善的知识体系。本文选取2007年-2016年间WOS(Web of science数据库)、CNKI(中国知网)中以数据开放为主题词的期刊论文,以知识图谱和文献计量为理论依据,以CiteSpaceⅢ为数据分析和可视化工具,通过论文数量的时间分布,揭示该领域发展的阶段特征;利用高频关键词的时区图和网络图,揭示该领域发展的内容分布,理清其发展脉络;从学科分布、核心期刊和边缘期刊的判别,揭示该领域发展的跨学科概貌;通过对作者综合析揭示该领域研究的人物关系,理清其发展流派。最后,提出数据开放领域的发展趋势。
关键词:数据开放 大数据 知识图谱 文献计量
ABSTRACT
The beginning of this century, the popularity of open access and institutional knowledge base makes more and more academic data published on the Internet to share. However, open source code only involves the technical level, the public eager to appear a wider range of data disclosure and re-use, especially the government to collect and have a large number of public data. The emergence of cloud computing makes data sharing, mobile, open possible, the data become the engine to stimulate new productivity. The role of the data from the IT era of the output of the auxiliary role of change into assets and production factors, and truly drive the big data industry from the concept into the actual stage. Data open as a rapid development of interdisciplinary research, has formed a more comprehensive knowledge system. In this paper, we selected the journal papers of WOS (Web of science database) and CNKI (China Knowledge Network) from 2007 to 2016 as the theoretical basis, using CiteSpace Ⅲ as data analysis and visualization tool , Through the time distribution of the number of papers, reveal the characteristics of the stage of the development of the field; the use of high-frequency keyword time zone map and network diagram, reveal the development of the content distribution in the field, sort out its development context; from the subject distribution, core journals and edge The identification of journals, revealing the cross-disciplinary overview of the development of the field; through the author's comprehensive analysis of the field of research to reveal the relationship between people, to clarify their development schools. Finally, the development trend of data open field is put forward.
Key words: open data ; big data; knowledge map ; Bibliometrics
目录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 研究背景 1
1.2 研究内容 2
1.3 研究意义 2
1.4 研究方法与思路 3
1.4.1 研究方法 3
1.4.2 研究思路 3
第二章 国内外文献计量分析 5
2.1 文献量分析 5
2.1.1 研究数据来源 5
2.1.2 研究时间序列分布 5
2.2 文献基金分析 6
2.3 文献机构分析 7
2.4 文献研究层次分析 8
2.5 文献被引分析 10
第三章 国内数据开放研究分析 11
3.1 研究内容分布 11
3.1.1 主题词变迁 11
3.1.2 主题词分布 14
3.2 跨学科概貌 15
3.3 国内期刊情况分析 16
3.3.1 总体情况分析 16
3.3.2 核心期刊与边缘期刊分析 17
3.4 作者统计分析 18
第四章 国外数据开放研究分析 18
4.1 研究内容分布 18
4.1.1 主题词变迁 18
4.1.2 主题词分布 19
4.2 跨学科概貌 20
4.3 国外期刊情况分析 21
4.3.1 总体情况分析 21
4.3.2 核心期刊与边缘期刊分析 21
4.4 高产作者分析 22
第五章 国内外数据开放研究分析 22
5.1 研究总体情况对比 22
5.2 研究趋势对比 24
结束语 25
参考文献 26
致谢 28
第一章 绪论
1.1 研究背景
1. 数据开放是时代的必然
数据是信息社会人们创新的源泉[1], 由于数据具有:(1)重复使用,就可以增值;(2)容易共享,而且使用的人越多,价值就会越大;(3)经过对数据整合以及重组,就可以大幅度增值的特点[2]。数据开放已然成为了一种新的社会运动与时代变革。自美国2010年美国在世界上第一次推出国家级的政府数据开放平台 data.gov后,截至 2014年 2 月 10 日,全球已有超过63个国家加入开放政府合作伙伴。联合国( UN) 、经济合作与发展组织( OECD) 、世界银行(WB) 也纷纷加入到开放数据的大军中来,建立起了各自的数据开放门户网站[3]。数据的价值远大于其所有可能用处的总和[4],通过数据开放可以带动经济的增长[5], 可以提高政府服务水平,包括提高透明度、打击腐败、增加信任、提升政府工作效率、节约政府运营成本[6];可以促进创新经济发展,带来全新的大数据产业发展环境[7],包括提高透明度、打击腐败、增加信任、提升政府工作效率、节约政府运营成本;可以帮助公民在生活中做出更好的决策,增加社会的活跃度[8],提高公民的生活质量。
2. 数据开放发展迅猛
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。