新“国九条”:加强交易监管,增强资本市场内在稳定性
2024-04-13
更新时间:2024-04-13 01:57:02作者:橙橘网
公有云私有化是实现私有云的唯一路径?如何让用户既能继承过去的IT资产和运维能力,又可以提供面向未来的架构和服务能力,实现平滑演进?当前火热的AIGC大模型对企业来说会面临着怎样的难题?从虚拟化到轻量级云平台,再到私有云平台等等,企业到底面临着怎样的挑战?
刘健表示,云计算是创新发展特别快的技术架构,作为基础设施,需要具备可演进的能力。“就跟大家建房子一样,不能说砌完了之后推倒重来。但中国所有建云的,但凡大一点的公司就两种模式:第一种模式,公有云的下移,打包私有化部署。第二种模式,基于原来的VMware的虚拟化物理机的,慢慢往前发展。无非就两种模式-跨越式和渐进式。本质上很多的用户被跨越式引导或者过渡引导,用户(比如金融用户)用了之后很痛苦。”
“中国所有用户里边做运维的、做IT的,有公有云运维能力的占比非常低,但是大部分人都懂VMware、都懂IOE、都懂Linux,很少有人懂AWS、懂公有云,即使是有,非常少。一旦软件生态到了数据中心的时候,大家都感到无能为力。”刘健表示。
“很多用户困扰的是10年前买一套虚拟化设备,到今天再上私有云,整体架构不可利旧,也不可复用。更重要的是运维习惯也不同。对用户来说这就是非常大的基础设施浪费。此外,很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,任何一个设备部件的微调都需要从底层操作系统、虚拟化层、资源调度层乃至服务发放层重新适配。”庞慷宇继续解释道。
正是看到了很多用户确实需要一步步向上,迭代到私有云之路,而公有云私有化在很多时候都错配了资源,导致了严重的运维资源浪费,因此,浪潮云海认为有责任有担当,确立一条更符合用户当前实际需求的私有云发展路线。
“可演进的私有云就是另辟一条独立于公有云私有化的道路,希望可以成为可演进私有云赛道里的领军企业,也欢迎更多的厂商加入,共同把私有云的理念传递给更多用户。”庞慷宇提到。
对于可演进的私有云,浪潮云海认为,其首先必须是可继承的。“对过去的继承,继承利旧资产、继承运维能力是可演进的基础,不能继承就不能谈演进。无论是从算力设备到存储设备到网络设备,到安全设备,都是可以继承的。同时,既能继承过去的IT资产,又能继承过去的运维能力和习惯。”庞慷宇表示。
另外,可演进的私有云必须是可以演进的,面向未来的,逐步演进到私有云。包括架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI等);从最小3节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一CPU架构扩展到多CPU架构,从通用算力扩展到AI算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人工运维,到半自动、全自动AIops运维;业务可靠性从单点单中心可靠,到多中心高可靠。
那么,具备可演进能力的私有云需要具备什么特征呢?浪潮云海认为,需要具备三大特征即分层解耦、开放标准和一云多芯。
“不断演进私有云架构提供新的特性,不光是洞察到了过去用户的痛点,来帮他去利旧,帮他持续的迭代基础设施,也设计好了在InCloud OS V8可演进的私有云里如何向未来演进。”庞慷宇提到。
据介绍,新一代InCloud OS V8在存储层面可以支持NVMe-OF,支持ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储差异;在计算层面,可以实现一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;在服务层面可以对底层资源的便捷供给,在云平台上基于标准模板发布通用PaaS服务,快速嵌入云平台,对日志、运维等进行统一管理;在应用层面开放生态,以第三方伙伴服务为主。(崔玉贤)
(图1:浪潮数据云计算方案总监刘健)
(图2:浪潮数据云计算产品总监庞慷宇)
以下为网易科技等媒体对话浪潮数据云计算产品总监庞慷宇、浪潮数据云计算方案总监刘健部分内容:
问题一:因为可演进的私有云可能在资金上会更节约一些,是不是可能更容易受中小企业的青睐。中小企业目前有没有这样一个例子,比如说,他用了可演进的私有云在哪些方面节约,能不能给我们举一个例子。
庞慷宇:首先,我们的用户不仅是中小企业,企业只是我们一部分用户,更多的还是像公共事业、金融等很多其他的机构,但是在企业的范畴里边,真正需要我们的还真不是中小企业。因为在中小企业的应用里边,很多还是以虚拟机运维、PaaS服务为主,私有云很少渗透入中小企业。如果用国外的产品来打比方,中小企业一般会买一套VMware再加一套AWS,不会把AWS落地到自己的私有云中心。
我们主要面向的用户往往是有一定资产规模的,有一定建设背景,比如钢铁、港口。这类用户有一定的开发能力,IT能力被运维团队所主导,运维团队需要开发,但是开发是服务于运维的,这也是中国大多数非IT行业用户的企业画像。比如说,我们现在服务的机场集团在设计整体的私有云,包括港口、煤电,还有一些其他私有云用户才是真正需要可演进私有云架构的主体,因为他们往往认为VMware式的运维不满足他们的PaaS,而大型的公有云私有化浪费了整体资源。
我再说另外一类典型的用户:省级的农信。如果把它定位为企业的话,这种资产规模,两万亿左右的银行,也是典型的需要整体私有云的用户。当然了,中小企业也可以把这作为选择,我们从几个节点起也可以部署,因为我们把它做成了标准化解决方案。
问题二:可演进的私有云这一概念提出的时间也很久了,市场的接受度怎样,用户在哪些方面存在一些疑虑,浪潮云海怎么打消用户这些疑虑?
刘健:可演进私有云的提出估计有两三年左右的时间,但是我在理念和认识上,用户还没有很深的认知。因此,浪潮云海有责任帮助用户重新认识私有云,不能被单一云厂商绑定。重新认识私有云里边不管是从业务还是从技术,可演进在私有云里边是非常重要的一个核心。私有云是基础设施,你必须采用渐进式上云,这是私有云最基本的价值。
最开始提出来三年左右到现在,我们持续与用户沟通调研。从用户的反响来说,我认为所有的用户都认同这套逻辑,以金融行业为例,基本上六大行及中小银行都认同基础设施就是可演进的,私有云本身就是一个非常重要的基础设施,是需要可演进的。浪潮云海希望坚持可演进,围绕可演进去做产品、方案和服务,技术的迭代很快,我们的产品也是方案也是如此,所以用户也需要可演进的能力。我们希望把这种能力作为一种产品能力,提供给用户。
庞慷宇:我补充一点,你去看矿泉水,在矿泉水上面写得是“饮用纯净水”,但其实矿泉水并不是只有这一条路,它还有天然水这样的路,其实它是重新定义一个市场。在市场里边其实两三年前就有人提。为什么有人提?是因为有用户的需求所在。私有云不只有公有云私有化一条路,公有云私有化是实现私有云的一条路,一定有另外一条路,但另外一条路是没有领军厂商的,而且另外一条路里面的参与者往往是一些小型的聚焦在虚拟化为主的底层平台,这类厂商不具备在赛道里成长起来的能力。
所以我们这提出了可演进的私有云的架构,就是想另辟一条独立于公有云私有化的这条路,在私有路的路线里边再重新去确立一条更符合用户当前实际需求的路线,而我们看到的确确实实是有很多用户实际需要可演进的、一步一步向上迭代的这有云之路。并且公有云私有化在很多时候错配了资源,导致用户是要做私有云一步一步演进的,但是他没得选,选择了公有云私有化,反而会导致了严重的运维资源浪费。
我们也是看到了非常多惨痛的教训,浪潮云海有责任,也有担当,作为可演进私有云的领军企业持续投入,也欢迎更多的厂商加入,共同把可演进私有云的理念传递给更多的用户。
问题三:关于算力等价评估,因为您刚才也提到“1:2”的算力换算比例,为什么大家没有去把这件事情精细化,不知道在行业角度来说难度在哪,还有为什么浪潮云海可以精细化,包括等价评估的有效性,我不知道怎么样去看。
刘健:首先我先回答一个问题,浪潮云海做等价算力评估的本质在哪?第一,浪潮云海本身就是算力提供商,我因此我们经常给用户推荐的时候,需要建立一套算力换算逻辑。
第二,在金融行业研讨会上提出来以下问题:数据中心里边相当于5万台机器,现在要求每年按20%的比例扩容分配的时候,我需要提前建几个机房?因为它现在已经满了,肯定是“1:1点几”,那原来的机房肯定是不够的,那我建多少是合适的,那时候就开始发现在算力等价方面是一个问题或者叫课题。
我们内部研发就在云上,会做很多的预研,最早的时候算力等价不是我们的预研方向,只是预研算力从X86的等价调度到ARM上,后来发现可以结合算力去做模型出来。因为我们自己也有一些数据中心,然后基于自己的数据做了模型化。算力等价根本上是用户需求驱动的行业性的问题。一般情况是这样的,浪潮云海内部做产品化的时候,会提前抛出问题跟用户做很多的交流。此外,我们会把等价算力作为一个课题,联合金融机构做成国家课题,形成行业标准。
庞慷宇:我再补充讲一个细节,当竞争对手去做算力等价的时候面临很大问题。大家知道Intel的CPU型号,不同的型号它的算力是不一样的,不能简单的把主频乘以核心数就当作算力。 第一,别的竞争对手的实验室,无法拿到中国当前所有的CPU,浪潮云海整体实验室的能力是当前最好的;第二个,算力组合太多了,不光是CPU和CPU的组合,还有CPU跟内存的组合、CPU跟硬盘的组合、CPU跟网络的组合,因为RDMA网络、RoCE 网络、TCP网络组合不同表现出来的算力都不一样。
整体的多种组合评估了一下,得有十几万种组合来构成不同的算力模型基础设施,包括内存它主频都不一样,表现出来的内存虽然是一样大的,但是性能都不一样。我们评估了一下,有几万,甚至十几万种组合,在这十几万种组合里边需要找到一种通用的模型归纳出来。我们在做等价算力调度开发的时候,分为CPU基础算力+影响因子+系统配置,因为系统配置的时候Bios配置/系统配置软件层面也会产生影响,共分为这三类挑战。第一是数据归纳的能力;第二是巨量的数据组合;第三是基础的实验室条件。这些都是竞争对手很难跟我们来匹敌的。
刘健:我们一直在讲说做一云多芯最应该做的就是浪潮云海来做,要做好的只有浪潮云海能做好,因为只有浪潮云海最有条件,中国所有的CPU厂商,浪潮云海全支持,所以我们具备先天的优势。