但在实际与客户交流过程中,发现客户从来不认可让云计算管理平台自己去控制他们花钱买的服务器,他们就是要看看自己服务器上发生了什么事,就是要自己点个菜单、按个按钮来执行某个扩展、迁移操作才会放心。一直以来简单地认为这是当前客户用于云平台搭建的服务器数量太少,并且受到传统非云环境惯性思维的影响才有的错误想法,从来没有想过客户的这种“手工云管理”的想法是否有合理之处。
最近突然反问自己,云计算系统真的不能进行手工管理吗?那自动管理出现问题,到底应该怎么办?前段时间亚马逊机房宕机几天,管理平台出现各种问题,如果所有管理都是自动化,最终不可能解决问题。另外,目前基本上所有的IaaS厂商,都是让用户首先手工管理自己的虚拟机,后续才会提供自动部署、扩容等能力让用户选择。考虑到云计算系统的管理者、云资源的租用者的使用心理,云计算系统真的需要手工管理。
但是问题来了,手工一台台管理这么多机器,他们怎么搞定呢?一千台机器的管理员,每天工作8小时,平均每台机器上还花不到30秒,能干什么呢?
从本质上讲,管理员的手工管理,实际上是手工管理自己的资源,不论一台机器还是一万台机器,管理员要做的事,是对这个整体进行管理,对这个整体进行某些手工决策操作。所以,云计算管理平台要做的事,是提供一个强劲、可靠的监控系统,能够在任何时刻把任何机器的任何状态收集起来,进行整理后反馈给管理员,让管理员在任何时刻都能知道整个数据中心的计算、存储、网络资源的状态。同时,对一些迁移、伸缩等牵扯到资源使用的场景,应该允许管理员手工控制,当然,也可以按照管理员指定的规则自动控制。云计算管理平台的目标,应该是让管理员管理一千台机器的工作量减小到类似管理一台机器的工作量,应该提供大量自动操作,但最终把对系统使用的决策权留给管理员,而不是都自己搞定。云计算管理平台不是人工智能,它也的确做不到完全正确的决策,最终的使用决策还是要靠人。它需要做的,就是提供大量自动辅助功能,让管理员在任何时刻都知道系统状态,并很容易对系统进行调整。
得出几条结论:
云计算系统的监控要独立、可靠、强劲
云计算管理平台抽象一层简单、易于理解的管理操作,便于管理员对整个系统进行管理。
云计算管理平台的目标:让管理云数据中心与管理一台服务器一样简单.。