基于开源软件的云监控平台设计与实现
摘 要:最近几年,基于云计算的互联网服务迅速增长,数据中心的基础设施和应用资源不断增加。需要及时、高效的监控和管理资源的可用性,保证云服务的可靠性。通过对云监控的内容和特性的研究,提出一种管理云计算资源的云监控系统架构,重点对分布式架构、逻辑处理模块和云监控接口进行设计,实例中完成对私有云中物理主机、虚拟机、应用服务的批量监控,实现数据的存储和展示。
关键词:云监控;云计算监控;分布式系统
中图分类号:TP393.07 文献标识码:A
Abstract:Internet service based on cloud computing has rapidly increased in recent years, and the infrastructure of data center and application resources have also increased. So, in order to guarantee the reliability of cloud service, timely and highly efficient monitoring and usability of management resources are needed. This paper proposed a kind of cloud monitoring system framework to control cloud computing resources through researches on contents and features of cloud monitoring. The distributed architecture, logic processing module and interface of cloud monitoring were designed, and in practical case, batch monitoring over physical main machine, virtual machine and application service in private cloud have been finished with the realization of storage and demonstration of data.
Key words:cloud monitoring;cloud computing monitoring;distributed system
1 引 言
云计算是一种基于互联网的计算方式,通过这种方式,软硬件资源可以按需求提供给虚拟计算机和其他设备[1]。目前,云计算已经被广泛的应用在互联网服务中[2], 例如:Google的AppEngine产品、亚马逊的EC2、VmWare公司的Vsphere等。云计算的优势包括: 优秀的软、硬件资源利用率、可扩展性、高可用性、良好的容灾机制和按需服务的模式[3]。为了实现这些功能云计算数据中心的基础设施不断增加,虚拟服务器不断增加,应用系统不断增加。如何快速、有效的监控和管理云计算中大量的网络设备、计算资源、存储设备,保障各种应用系统稳定可靠运行变的越来越重要,迫切需要建立针对云计算的监控平台。
2 云监控系统总体设计
2.1 云监控的定义和内容
云计算平台的资源监控,简称云监控[4]。云监控不断衡量和评估云计算平台在性能,可靠性,电力损耗,计算能力等方面是否满足用户要求[5]并进行业务分析,对于提高系统的运行和应用效率。
根据云安全同盟CSA(Cloud Security Alliance)2009年的报告,云监控的内容可概括为七层:设备层、网络层、硬件层、操作系统层、中间件层、应用程序层以及用户层[6]。
2.2 云监控的特性
可用性
大型的云平台往往不止一个数据中心,每个数据中心又包括成百上千个节点,每个节点上又运行着各种资源,监测系统不能以牺牲资源为代价保证监控性能,需要切实减少资源占用率[7]。主要技术包括:采用分布式方式收集,过滤和分析数据[8]。使用改进的数据传输模型,减少对网络带宽消耗,如:主动传输(远程执行模式)和被动传输(节点数据推送模式)[9]。
可扩展性
面对大量的异构云资源,云监控上的资源采集模型需可自定义[10]。允许通过预定义监控项目和知识库进行分析监视,从而执行自动定义的动作解决简单故障。当有新的监控需求是,监控系统不必改变以前代码,动态扩展监控能力,当需要增加或删除监控项目时,能及时加载或卸载相应监控模块[11]。
可靠性
云监控需要及时采集云计算系统的运行状态信息,反映资源的实时变化信息,同时利用报警机制实现故障的告警。为系统管理人员定位故障提供数据支持,对故障及时采取相应措施。还要为云计算平台性能预测、故障分析、负载均衡提供数据来源[12],保证平台的可靠性。
2.3 系统总体设计架构
本文设计云监控平台总体体系架构如图1所示。云监控平台基于分布式架构实现,通过云计算接口模块调用不同的公有云、私有云API接口,采集云计算资源。对于其他设备采用客户端软件、SNMP协议等方式采集信息。逻辑处理模块负责将数据储存在数据库中,实现资源管理、时间管理和报警管理。最终通过Web前端展示。
(www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/
CSSCI核心/医学投稿辅导/职称投稿辅导。
投稿邮箱:fabiaoba365@126.com
在线咨询:
275774677、
1003180928
在线咨询:
610071587、
1003160816
联系电话:18796993035