许多组织发现,由于信息的规模和类型快速增加,其数据中心的运行复杂程度也迅速增加。Web 服务和复合应用环境也带来了更多的复杂性。IT团队需要管理的节点数量不断增加,节点上每天产生的告警、变更以及管理数据也在不断增加,并且工作请求的数量也在同步增加,这些都给IT团队带来更大的工作量。使用手动或特设的流程,无法跟上这些信息增长的节奏。
在云交付模型中,云服务提供者(包括但不限于IT团队)还需要基于策略交付可扩展的计算能力,并区分关键业务和非关键业务的正常运行时间和可用性。IT管理越来越需要自动化来整合物理和虚拟系统管理、并提高 IT 资源的总体利用率和端到端的解决能力。IDC相信,自动化的基础架构配置、交付和资产管理能力将帮助云服务提供者更准确更快速地响应应用的变化,提高容量规划能力,同时有效控制成本。
自动化是一整套IT策略,而不仅仅是一套软件或一个功能。通常,自动化需要通过实施整体解决方案来实现。对于云计算平台来说,以下几点是实现自动化的关键:
监控
为保证云计算平台正常运行,系统必须对整个云计算架构进行全面的监控,使得系统管理员能够时刻掌控整个架构,从而能够及时优化资源性能和可用性。监控通常是通过监控软件来实现的。通过对重要系统资源的监控,检测出瓶颈和潜在的问题并在严重的情况下进行自动恢复,才可以支撑云计算平台的灵活性和高可用性。监控的对象包括系统硬件设备(服务器、存储、网络等),也包括软件(应用程序、数据库、中间件等)。例如,系统必须监控CPU分配、使用率和负载的实时情况,才有可能在某一应用的工作负载发生变化时及时给予分配。如前所述,云计算平台通常会包括多种类型、多种结构以及多种品牌的硬件和软件,能够支撑云计算平台的监控软件需要较高的兼容性,能够同时监控异构的硬件设备和软件。
监控所产生的结果可以提供给系统管理员,也可以通过系统自动进行处理。监控软件必须具备完整的监控流程管理功能。能够完成设定性能阀值,超过阀值后自动发出警报信息,跟踪警报的原因,并发出相应的管理指令,采取相应的操作等一系列工作,使得系统监控处理不需要一定通过系统管理员来执行。
此外,监控功能还需具备一定的预测能力,通过历史数据分析云计算资源池中的资源消耗趋势、预测和避免问题发生。
动态应用迁移
为了支撑云计算平台的灵活性和高可用性,以及严格的服务水平协议(SLA),云平台上的业务应用需要能够动态的在虚拟机之间迁移。例如,对于一个重要应用程序的资源需求,如果出现了意料之外的峰值,并且同时出现了对资源的争用。系统可以将它移动到一台更大的服务器,或者将其他的、不重要的应用移动到不同的服务器,并使用所释放的资源来满足这个峰值。