总24期
NAVIGATORS    领航者说
NAVIGATORS    领航者说
新华三CAS十年感悟:云在哪,我就在哪
文/IT大嘴巴 刘策

十年之前,我不认识你,你不属于我。

这首来自陈奕迅《十年》的歌词,用来形容云计算市场的发展再恰当不过了。

回首2011年,那时候的手机还可以拿来“砸核桃”,如果有人说手表可以监测生理数据甚至拨打电话,听起来就像是天方夜谭。对于大部分IT人来说,过去的10年是蓬勃发展的十年,也是日新月异的十年,那时候的IT基础设施也多数被国外品牌所垄断,如今则大相径庭。

更大的区别在于观念。以当下已经成熟得不能再成熟、深入人心的云计算应用来说,那时候却只是处于萌芽阶段,诸多行业大会所探讨的都是云的价值和应用的意义。虽然整个行业都对云应用寄予厚望,但是不同角色所“定义”的云计算却是五花八门的,“人云亦云”就是当时的最佳写照。

曾经,云即是虚拟化

许多人都将虚拟化与云计算等同起来,甚至有了“云即虚拟化”这样的说法。如今回头看看,这种说法未免过于片面,套用当下的一句流行语就是“格局小了”。但在那时,许多人都对此深信不疑,而一家名为VMware的公司更是标杆性的存在——对于大部分人来说,“上云”就是购买VMware的软件和服务。于是从2009年开始,一股虚拟化的“风暴”席卷中国,不少用户从传统架构向虚拟化迁移,成为了第一批吃螃蟹的人。用时任VMware大中华区高级业务拓展经理王俊标的话说:“我们是文明的拆迁办”。

但你可能不知道,就在VMware大张旗鼓进军中国市场的同时,也有一家企业开始了自主虚拟化平台的研发,这家公司就是后来业界的领航者紫光股份旗下新华三集团,而那款可以媲美VMware的软件叫做CAS。其实早在2009年,新华三集团就开启了CAS的研究工作,并于2011年正式宣布对外开放。回顾这段历史的时候,新华三集团云智产品线副总裁柳义利感慨万千——2009年,我们在数据中心市场已经站稳了脚跟,大家也已经开始倾向于虚拟化技术的应用。不仅仅是服务器的虚拟化,包括网络设备也要切入这个领域。坦白来说,那时候我们可能还没有想到做公有云、私有云,只是起步先把CAS做好,当时认为虚拟化就是云,至少是云的第一阶段。

图1 各种虚拟化技术及其主流厂商

这也正符合前面刚刚提到的“云即虚拟化”的说法。事实上,不只是新华三集团,包括整个行业对于云计算的认知在当时都是懵懂的,而不同虚拟化技术路线的选择也让人眼花缭乱。包括VMware、思科、思杰、红帽、瞻博甚至英特尔和AMD在内的诸多企业都有自家不同的解决方案。这其中,有人侧重于对于某个部件的虚拟化,比如服务器、网络;也有人侧重于桌面、应用场景的虚拟化……可以说,那是一个群雄逐鹿的时代,大家对于“虚拟化”三个字都有着各自的理解,自然也就有了不同的技术路线。

俗话说,条条大路通罗马,但事实上并非如此。今天回头看看,真正的虚拟化技术寥寥无几,更多曾经冲锋在虚拟化一线的厂商都是“为别人做嫁衣”。正因为如此,这种选择更像是当下流行的“拆盲盒”,在技术方向和路线没有明确的情况下,选择哪种虚拟化方式更多在于品牌自己的判断。幸好对于新华三集团来说,在一开始就选择了KVM作为发力点,并能够持之以恒地坚持,也才有了CAS十年的蓬勃发展。

“当时我们的理解就是把原来的资源池化、虚拟化,然后搞出抽象的资源管理,现在来看,其实就是CAS在做的类似于小云管理,以IaaS层的方式。10年下来我们从开始认为它就是云,到慢慢地沉淀下来,就成为我们整个紫光云3.0的公有云、私有云、桌面云以及超融合等等一系列最底层的基石”。这些观点来自新华三集团云与智能产品线CAS产品管理部部长刘刀桂,他也是团队的核心人物。在他看来,如果没有当初对于CAS项目的笃定和坚持,就很难在后来汹涌的云计算大潮中屹立不倒。

 

为什么是KVM?为什么选择本土化?

除了vSphere和KVM之外,Xen同样是当年主流的虚拟化道路之一,引领这一技术前进的是当时炙手可热的公司——思杰。许多新入行的IT人可能不再关注这个名字,但是在10年前,Citrix的名气并不逊色于VMware,两者就像武侠小说中的“南慕蓉与北乔峰”,甚至在虚拟化的渊源上,思杰的时代更早一些。

早在创建之初,思杰就确定了应用虚拟化和桌面虚拟化的方向,而后在2008年收购了Xen,开始进入私有云数据中心领域,2011年收购Cloud.com后开始进入云计算领域,并且以CloudStack在云计算领域大展拳脚;同时思杰公司又继续拓展虚拟化领域到移动设备管理,包括收购ZenPrise公司并整合自有产品Cloud Gateway,推出了XenMobile解决方案套件等等,一时风光无两。

既然Citrix千好万好,那为什么新华三集团最终选择的是KVM而不是Xen架构呢?原因有两个。“第一是KVM开发相对比较稳定,内核更新后结构不受影响;再一个就是当时社区基于KVM的技术比较好,特别是在2009年之后整个行业都出现了向KVM转型的趋势,所以我们也选择了KVM这条路线去做”,在谈到路线选择的时候,新华三集团云与智能产品线CAS产品开发部部长程炽文解释道。

这其实说明了中国云计算市场早期一个容易被人忽视的问题——本地化。如今,几乎所有的企业都在谈本地化,尤其是面对中国如此庞大市场,甚至海外厂商们都在不遗余力地推广本土化方案,“在中国,为中国”也成为了多家外企的座右铭。但在10年前,没人知道中国市场会发展成今天的规模,VMware和Citrix在中国市场更是全面照搬了国外的应用经验。但我们必须强调,在早期的虚拟化,特别是桌面虚拟化应用中,许多客户并没有获得太多云体验,反而增添了不少的痛苦——首先的问题就是浏览器。

在海外环境中,浏览器选择相对单一,比如IE、Firefox、Chrome和Safari等等,这些平台的插件都会遵循开发标准,利于管理。但是在国内,浏览器种类多达几十上百种,而且插件也是百花齐放,极少完全遵循标准化开发。所以云桌面客户一旦投入使用,遇到的问题千奇百怪。其次,海外客户部署虚拟桌面大部分是为了解决数据安全问题,但国内大部分是出于节约成本的目的部署云桌面,但是很显然这个目的在上云之后并没有实现,甚至IT开支更大。

算来算去,中国还是要有自己的、最好是基于开源应用的虚拟化系统,这正是新华三打造CAS平台的初衷。恰巧在当时,新华三集团的网络平台也正秉承着开放的路线(这在当时更为难得,封闭架构才是当年的主旋律),所以新华三也率先在业内实现了从底层计算、存储到网络的全开放平台,为虚拟化打下了基础。更重要的是,多年的网络销售经验,让新华三深刻理解客户需求——客户并不是单纯的希望购买某一款虚拟化软件或者某一个虚拟化平台,而是希望能够切实解决业务中的困难。正是在这种理念的指引下,新华三的CAS虚拟化解决方案直接针对客户的业务“出击”,用刘刀桂的话说就是“业务上对底层的需求会从技术的角度映射到对虚拟化的要求。”

从最早的虚拟化到后来的容器,再到如今的智能管理平台,如今的客户已经不太在乎CAS自身采用了怎样的架构或者技术路线,而是看重解决业务难题的能力。经过最近10年的发展,新华三集团的CAS平台已经实现了对于云计算、大数据等场景下的应用支持,并通过专门的API接口实现更多功能的对接与适配。“我们不仅仅是单卖一个CAS,而是整个系统,从计算、云产品各个方案联动的系统”,柳义利补充道。相对于传统的解决方案来说,新华三推出的云解决方案恰好解决了许多企业转型中面临的难题,解决了管理者对于“云”的困惑和业务迁移的迷茫。也正因为如此,CAS成为了继VMware之后中国市场占有率第二大的虚拟化平台,多年的技术积淀培育出了良好的用户口碑。

图2 H3C CAS架构图

稳定,成就坚实技术底座

提到CAS,许多用户第一个想到的就是稳定性。其实最早VMware进入中国市场就主打运营商领域,当年曾有一家运营商在虚拟化方面从2009年测试到了2011年,最终才拍板采购,这事儿甚至在VMware内部也称为了一段佳话。但你可能不知道,以CT出身的新华三集团也同样在运营商领域开创了一项纪录——2017年,某运营商的网络进行云业务改造,当时客户提出了“7个9”的要求。面对这样苛刻的条件,许多品牌都退缩了,甚至连尝试的勇气都没有。但是新华三的CAS团队依然知难而上,满足了客户“7个9”的大规模部署要求,赢得了客户的一致认可。

许多人可能对于“7个9”没有明确的概念,这是一种描述系统可靠性的说法,我们通常用“多少个9”代表系统的可靠性程度,“多少个9”表示在1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,“9”越多说明系统越稳定。我们通过下面的计算来感受下不同个数的9在不同级别的可靠性差异。

5个9:(1-99.999%)*365*24*60=5.26分钟,表示该系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。

6个9:(1-99.9999%)*365*24*60*60=31秒

7个9:(1-99.99999%)*365*24*60*60=3.15秒

你可千万不要小看这3.15秒对于业务能力造成的影响。来自著名调研机构Qualix Group的调查报告显示,服务器宕机1分钟,平均会使运输业损失15万美元,银行业损失27万美元,通信业损失35万美元,制造业损失42万美元,证券业损失45万美元……试想下如果某个省份的通信网络出现故障,会有多少电话难以接通,又会有多少网络业务因此中断,由此产生的损失又何止千万计。从这个角度来说,H3C CAS平台可谓是顶住了压力,也树立了虚拟化平台在关键业务应用中可靠性的新标杆。

当然,要达到这样的稳定性也并非是一朝一夕能完成的,在谈到“成功秘诀”的时候,柳义利也坦言踩过不少的坑、走过不少的弯路。虽然作为开源平台,KVM在代码开放性上具备先天优势,但实际业务应用中还是要根据客户的情况进行不断调整,这也让整个团队进入了高负荷的工作状态。按照柳义利的话说,CAS之所以有出色的表现,得益于团队“成年累月的积累”,从最初的理论设计到最终的落地实践可谓是经过了千百道工序的检验。我们常说“十年磨一剑”,但是对于CAS来说,打磨的动作从未停止,直到今天团队们依然对CAS进行不断的优化和迭代,以适应数字化的全新发展。

技术深耕满足差异化需求

多年的技术深耕,也为新华三集团打下了坚实的实践基础,可以满足各种用户的差异化需求——越是“奇葩”的要求越能够实现。据程炽文介绍,曾经某个科研机构定制了上万台虚拟机的服务,但是客户要求所有的虚拟机都要在1小时内实现启动部署。这在许多人眼中都是不可能完成的任务,即便是在KVM这样的开源平台,这个时间也显得过于苛刻。但CAS平台在45分钟内就实现了万台虚拟机的部署,还为客户提供了北向API接口的开放服务,从而引入更多的程序和智能化的管理,也让这上万台虚拟机运行得更为流畅。

“每个行业有自己的特点,KVM不仅能够实现基本业务应用,还可以针对特殊场景实现定制化。这方面,我们相对其他平台肯定是有优势的,客户也恰恰看重了我们的定制化服务、特殊场景的优化的差异化服务能力”,在谈到自身优势的时候,程炽文如是说。其实除了定制化之外,KVM的另一个好处就是开源,至少是相对其他平台来说减少了“被绑架”的风险。包括客户业务的迁移和后续的扩展方面,KVM也更具优势。

就这样,H3C CAS与中国云市场一起走过了蓬勃发展的十年。这十年间,中国云市场从无到有,从小到大,从私有云、公有云发展到混合云,无论是覆盖业务范围和应用场景都变得千姿百态。随之而来的,就是新华三的CAS平台也在不断迭代当中。如果说最早的“云即虚拟化”是CAS1.0版本的话,那么不断打磨自身为稳定性、可靠性与定制化就成为了CAS2.0的优先目标。在今年的领航者峰会上,新华三特别提到了“云智原生”的战略,将云业务与智能化进行协同,作为集团的主打战略推出,这更要求CAS团队从原有的虚拟化、容器进一步提升,将所有的能力融合在统一的平台中,也进一步赋能百行百业的数字化发展。

这就不能不提到最新版的CAS7.0。经过本次迭代后,CAS对于应用场景的业务赋能更为精准。这一方面体现为以“云智原生”理念指导,对于包括容器、虚拟机进行了统一的管理,支持Docker和K8s等应用;另一方面,针对当下异构计算特别是多元化计算的应用需求,CAS7.0还特别优化了硬件加速能力,通过智能加速卡对于原有客户业务进行加速。值得一提的是,这种加速本身并不消耗任何CPU算力资源,也就是实现了“算力零损耗”,将所有的算力都应用于客户的业务之中,真正实现“好钢用在刀刃上”。

业内常听到一种说法——好的产品自己会说话,意思就是好的产品会给用户带来极高的满意度,进而能够实现客户与客户之间的正向传播。但是你可能不知道,好的产品还会自己“开花结果”,按照新华三集团所说就是“长出新产品”。在许多人的印象中,服务器、存储乃至于超融合平台都是单独销售的,客户购买这些基础设施的主要应用就是构建底层IaaS平台,为上层应用服务。但对于CAS平台来说,无论是桌面虚拟化还是超融合都是需要“搭配”CAS来销售的,这种搭配并不是新华三的要求,而是客户发自内心的、真正认可CAS的价值,并希望能够借助于CAS管理新华三的基础设施。从这个角度来说,有点像是买iCloud送苹果手机的感觉。

这也证明了CAS平台的与时俱进。从最早的虚拟化到后来的容器,再到如今的“云智原生”和一体化管理,CAS所承载的任务越来越多,也预示了新华三集团所赋能的产业和领域越来越广。从2009年研发到2011年商用,H3C CAS平台奠定了自身在云计算市场中的坚定位置,而在谈到未来发展的时候,刘刀桂更希望CAS平台能够持续演进,并在技术上秉承“兼容并包”的开放理念,让无论是虚拟机还是容器抑或是其他技术都可以实现兼容,“既有容器的速度又有虚机的安全”,同时,也创建通往云化时代的第三条道路。

时至今日,云计算已经不再是单纯的某一项应用或者某一个概念,无论是私有云、公有云还是混合云都存在于我们常见的业务场景中,并且三者之间互有交叉,也相互区别。换句话说,当下的云应用更强调底层平台的“打通”,强调对不同行业的差异化覆盖和对于整个产业的全面赋能。对于新华三CAS来说,它所扮演的更多是底层平台的角色,在紫光云 3.0中,无论是私有云还是公有云,抑或是某些应用相关的行业云甚至超融合平台,在底层架构上都是基于CAS所实现的,这也恰恰证明了CAS这十年来发展的正确性,证明了新华三对于整个云市场的敏锐把控力。

“做一款好产品不难,但是能花十多年去做的并不多。未来CAS会向何处去?或许产品的外延会变化,但整个CAS团队的精神内核始终不变,而且是以一颗很接地气的、服务于客户的心去持续地进行产品的演进”。

分享到
关闭