基于Gossip协议的分布服务监测研究毕业论文
2020-06-07 21:30:10
摘 要
随着计算机科学技术发展 ,云计算已成为一种广泛的运用模式。然而,云计算中存在有大量的服务器。其中,难免会有一部分服务器节点会出现故障,从而影响系统的正常运行。因此对云计算服务节点进行监测显得尤为必要。
Gossip是一种运用于P2P网络传输的经典协议。Gossip协议从提出发展至今,不断完善优化,已被证明是有效的手段,在监测健康和性能信息在异构分布式系统中,具有广泛的应用前景。
本课题使用Gossip协议实现对云服务的网络节点进行监控,通过记录每个节点的响应时间长短与健康响应时间进行比对,通过活动列表,怀疑矩阵,怀疑向量等特征值来进行故障监测和监控,找出故障节点。
本课题使用Java语言开发,运用eclipse作为开发环境,模拟实现对分布式系统的故障检测。
关键词:云计算;Gossip ;故障节点
Gossip-based distribution system service monitoring
ABSTRACT
With the development of computer science and technology, cloud computing has become a widely used model. However, there is a large number of servers in cloud computing. Among them, it is inevitable that some of the server nodes will fail, which will affect the normal operation of the system. Therefore, it is necessary to monitor the cloud computing service node.
Gossip is a classic protocol used in P2P network transmission. Gossip protocol has been improved and optimized since it was put forward. It has been proved to be an effective means and has broad application prospects in monitoring health and performance information in heterogeneous distributed systems.
This paper uses the Gossip protocol to realize network node for cloud services monitored by recording each node response time and response time of health were compared through the list of activities, suspected of suspected vector matrix, eigenvalue fault monitoring and monitoring, to find out the fault node.
This topic uses Java language development, uses eclipse as the development environment, simulates the realization to the distributed system breakdown examination.
Keywords:Cloud computing ;Gossip; fault node
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 课题背景 1
1.2 国内外相关研究现状 2
1.2.1 国内相关研究现状 2
1.2.2 国外相关研究现状 2
1.3 论文研究内容及结构 3
第二章 相关的理论和相关技术简介 4
2.1 Gossip 基本介绍 4
2.1.1 Gossip 协议概要 4
2.1.2 Gossip 协议优点 4
2.2 Eclipse平台介绍 4
2.3 Java 语言介绍 4
2.4 ZeroMQ 5
2.4.1 模式一:应答模式 5
2.4.2 模式二:订阅发布模式 6
2.4.3 模式三:基于分布式的处理模式(管道模式) 7
2.5 应用模型优点 7
2.6 本章小结 7
第三章 总体设计 8
3.1 程序中的资源健康监测 8
3.1.1 关键参数 8
3.1.2 性能需求 8
3.1.3 程序对于输入和输出要求 8
3.1.4 运行环境 9
3.2 系统功能原理 9
3.2.1 平面 Gossip 9
3.2.2 分层 Gossip 11
3.2.3 共识算法 12
3.3 本章小结 13
第四章 系统关键技术实现及结果 14
4.1 主要辅助类的实现 14
4.1.1 定义工具类 14
4.1.2 定义协议体 14
4.1.3 Gossip 协议体 15
4.2 主类的实现 16
4.2.1 打印函数 printMetaData() 17
4.2.2 消息发送函数 sendMetaData() 18
4.2.3 元数据取回函数 getMetaData() 18
4.2.4 更新怀疑矩阵 updateSuspectMatrix() 19
4.2.5 打印函数 printMetaData()内容 20
4.3 子线程类 SubscribeThread 实现 21
4.4 运行结果 22
4.5 本章小结 22
第五章 总结与思考 23
参考文献 24
第一章 绪论
1.1 课题背景
互联网已进入飞速发展的黄金期,商用集群技术(CTOS)组件展示了常规超级计算集群缺乏的简单性和成本效益,正因为如此,在过去我们已经看到它的普及和增加。无论如何,这种集群的异质性和快速增长的规模加剧了维护它们的难度。随着先进的计算能力的可用性的增加,需要在一个齐次系统中的相同节点之间检测和监控空闲资源,以减少计算和响应时间。在分布式环境中,需要的是从一个节点到另一个节点更大,更难以满足的资源变化量。要利用闲置资源,需要知道资源健康状态(例如活性)以及性能(例如可利用性)。
来自独立工作站和个人计算机(即 COTS 系统)故障困扰集群设计,并且这样的系统需要专用服务来监视节点和报告故障,允许自愈和检查指向应用并重新启动死进程。分布式系统需要的是一个可靠,并且速度较快和可扩展的低等级的健康监测服务。这样的进程的速度是非常重要的,因为低检测时间可以最小化故障对系统的影响,使故障与策略,如检查点和进程迁移快速恢复。然而,最小化故障检测时间不是一个简单的问题,因为故障在系统范围的共识必须以可伸缩的方式达成。
当然除了无故障的高效执行,计算机集群的性能是由许多方面(CPU 的利用率,内存的利用率)决定。性能监控对资源的利用率提供准确的估计,使时序要求严格的服务和长期运行的应用程序与流程具有迁移能力以用来分发流程和任务。资源监测服务作为性能、健康状况和可用资源的位置和使用信息的信息源。因此, 资源监控除了为用户和管理员提供一个单一系统映像,还提供了一种负载平衡和调度的关键底层服务中间件。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。