打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
整机架之殇——后传

没想到前传的阅读量这么大,没看过的可看看整机架之殇——前传。后传其实比前传难写,需要拿捏好尺度。整机架在国内推行不太成功,笔者认为主要3大问题:

  1. 业务和机型拉通,技术优化;

  2. 供应链集成问题;

  3. IDC选择和交付问题;

谈细节之前,先梳理一下三个问题的几个关键点。

第一个问题——业务和机型拉通。这个关键点在于用户自身梳理和推动,供应商只能配合。而恰恰是用户内部推动事情往下走的关键一步,可谓整机架这门武功的总纲……供应商能做的,除了配合用户把产品做更优,更好用户体验之外,最困难还在于协助用户内部推动技术部门,业务部门,采购部门等多部门都认可整机架的理念,然后用户内部形成合力和产业链一起推动。光有PPT,软文,最后大伙吃饭还是喝粥还得靠订单。

第二个问题——供应链集成问题。解决三大关键点,谁买,谁集成,谁服务。只要采购量大,用户可以集采核心部件发货给集成公司。至于这里面买卖,集成,服务关系,如何拆分,如何保证技术,采购,服务都能多方面最优解,这个也更多是用户利益出发主导,供应商配合用户一起找出最匹配的供应链模式,供应商也找准对应的定位。

第三个问题——IDC选择和交付问题。整机架能否顺利上架,IDC是一个不得忽略的环节。很多时候,IDC公司一些设计问题,往往会导致整机架上架面临大挑战,甚至会出现整机架交付还不如传统交付来得方便(顺利)。这种打击无疑让所有人沮丧,前面问题1和2都解决了,大家满心欢喜期待的“快速交付”变成“龟速”交付,想必公司内部很难交差,绩效考评和KPI都不好弄呀!笔者晓得宝宝心里的苦呀……

思前想后,笔者还是谈谈做得成功的公司经验实践,做得不足的,可以对比改进,也可以和笔者私聊。

(一)

机型繁杂,难以归一,整机架稳定性的苦恼。公司业务越繁杂,所需的机型和配置就越多。不少公司业务部门下面也可以有IT部门,对设备采购有自主性,即使IT部门融合成平台部门,业务部门也有自己的IT要求,可以有别于其他部门,这就导致设备型号,配置需求不一致。好比一个家庭有3个儿女,每个人要不同的尺码,针对不同上学,运动,徒步,沙滩,休闲,派对等等都要不同鞋子匹配。而整机架出现,其实急剧变化的是玩法和格局,从品牌商,换成OEM厂商,再到ODM厂商。国内天蝎整机架设计上的方式是共享服务器电源PSU,共享风扇墙,意味着服务器内部没有电源模块,也没风扇,变成机架共用。而同时服务器内部结构少了好些部件之后,可以做结构和架构的重构,简化不需要的部件,定制化硬件和管理软件,最终目的服务器层面还得多塞节点,增加硬件密度,结构上简化方便维护。软件层面的开放标准也增加用户层面的技术掌控力,也方便运营。所以从大方向来说,这些肯定会使得TCO成本更低。听完了这些好处之后,是不是业务部门就应该叫好,拍板用呢?!要是那么容易,笔者也就没必要费时间写这篇文章了。因为整机架对服务器设计需要大量定制化工作,出货量少的时候,价格对比批量的标准品享受不到规模优势,未必便宜,供应商生产少,性能和技术还未必稳定。整机架的大用户,往往内部有较强实力的技术团队负责定制化研发,QA,更重要的是花费很多时间和业务部门一起评估机型和测试,确保最基本点——整机架支持业务可用,稳定。要是实际使用过程中碰到好些问题,业务部门多半存在顾虑,退回去老路不想用整机架也在情理之内。除了价格因素之外,业务不稳定那可是影响用户体验,这风险和损失谁扛责?另外如果新业务,或者需要新机型,那整机架机型不能覆盖怎么办?或者业务时间要求太急,整机架和业务测试技术工作还没完成,很可能求稳又用以前方式。为啥笔者建议Top-down搞,霸道总裁比技术大牛某种程度更有用。这大概就是好比有父母之言,夫妻之约,比自由恋爱来得确定性高?

(二)

设备集成的供应链苦恼。大型用户早期就开始凭借规模优势直接和上游供应商谈部件采购,例如服务器三大件,CPU,内存,闪存芯片(早年是机械硬盘,后期是固态硬盘SSD)。厉害的甲方有供应链的专业人才和技术人员一起,对相关供应商能力进行梳理,公司业务交付流程梳理,设计一种合适的供应链流程方式。目前国内整机架的开放性和兼容性不足,更多是整机架厂商作为整体集成商角色。这种情况会涉及很多问题,例如由于竞争关系,整机架之间厂商集成其他公司产品有难度?整机架公司和被集成厂商之间的服务如何解决?服务器公司是否有能力集成整机架?没有金刚钻,倒腾不来瓷器活。让生产服务器的公司,在工厂搞服务器和网络设备上架,还得做机架内的布线,按用户要求贴各种布线等等的标签。显而易见的是——这种集成交付,要是量不足,没有持续订单,厂商也不会招专业人士搞。这些活不见得需要高深的技术,但是人力活在于熟能生巧。让菜市场杀鱼的去弄鱼片料理,虽然能做,但终究没专业人士做得好和快。如果考虑海外交付,就更加复杂了,整机架到底怎么报关税,里面有网络,服务器,机架,电源等,而这些设备海运后会不会出现线缆松,设备损坏呢?是不是海外的模式又要和国内不一样呢?笔者了解,亚马逊和微软的在亚太的整机架交付都依赖区域内供应链,而非美国。除了这些,还有折旧问题。以往租赁IDC,机架和机架PDU都是可以复用,折旧期并不是和服务器一起。而国内整机架目前兼容性和供应商丰富度做得不足,机架,PSU都是和服务器一起按3~4年折旧。如果机架和PSU不折旧,如何复用,技术是否兼容支持都是大未知数。而且,国内天蝎整机架的技术规格相对以用户主导,厂商之间兼容不足,用户选择有限。这也导致国内推广整机架上缺乏更广泛用户的应用。笔者研究过微软的Olympus整机架,微软的方案其实也没用FB对OCP的设计,而是定制一款更通用的机架PDU。服务器也是含有小风扇和1+1的PSU(可以内置电池)。之所以说这个,每家公司最后从自己业务,设计,供应链一定会有一种更优的解。包括现在天蝎的设计,未必适合其他客户!有能力的公司,最好当然尽量使用业界有的设计避免重复造轮子,但外面不适合,就得自己搞了。OCP组织里面,FB主推的设计,微软Olympus,Google的48V机架,都是很大不同的。不一定非得集中PSU和母排才是整机架,不一定非得用天蝎机架规格,普通服务器也可以做整机架交付呀。回头要是几大用户整了别的规格更适合自己,大家以后见到“海蟒“、“山羯”之类机架代号(开个玩笑)不要感到意外。国内ODCC也想通过开源方式让更多产业链资源进来,推进技术应用降成本,只是看戏的多,真正唱的人少。随手贴几张微软的Olympus设计

估计搞IDC的人未必看得懂服务器的图,看不懂也没关系。这几张图主要讲了几点:

  1. 第一张图是没用统一PSU+母排的FB的OCP或者天蝎机架设计理念,微软使用一款定制的通用型rPDU;

  2. 第二张图是服务器自带PSU+电池(可选)和风扇,非天蝎和OCP的统一风扇墙;

  3. 第三张图是服务器管理交换机带的机架管理器,里面含有各种服务器管理工具外,还可以读取整机架的功耗,并装有温度,湿度(替代智能型PDU)。

另外,FB和MS这两个公司其实业务上没那么多竞争,两间公司以后也谋求一些技术通用性上的互补,兼容,谋求做大蛋糕,不过这都是后话。

(三)

啰嗦一堆,终于讲到笔者的专长IDC。老实说,IDC对于整机架来说,经常是成事不足败事有余,大概就是那个猪队友……要数IDC多宗罪,首当其冲应该是上架物理运输路径从卡车卸货,设备拆包,电梯,楼道,进机房区,最后上架,一路通常得各种打怪。

上图是新加坡某IDC的卸货平台设计,可以看到有相应的液压升降平台。很多人疑惑,有高度做个斜坡不就可以了吗?整机架因为重量大~1吨,造价一个过百万,斜坡角度有要求,否则会倾斜对人造成伤害,坡度高一点就会滑轮够不上,出现类似汽车的刮底盘问题。所以整机架对IDC的设计要求之一,就得“路见不平,拔掉相助”。

欣赏几张国外互联网公司无地板设计的IDC图

Facebook

微软

国内互联网公司例如百度和阿里近几年的IDC,如果要支持整机架的话,也都跟随欧美套路,无地板设计,做分离式独立支撑通道密闭。

百度

阿里

高架地板当然也可以用整机架,国外也有不少,例如谷歌就用高架地板。只是国外建筑设计满足进机房前有大斜坡等设计,确保搬运需求,同时高架地板用承重很高的设计。国内机房能省则省,大斜坡费地,好的高架地板费钱。业界流行的抠门做法是机架下面焊钢架,先预装好机架位置,高架地板选普通的。这整机架是滑进去的,焊钢架弄不好机架就掉坑里了……大家也留意到,如果没有地板设计,微模块其实有一个底座(用于走冷冻水管),这样的设计也同样不适合于整机架的部署。这么重的机架,怎么抬上去底座呢?如下图

笔者一直觉得微模块的底座非常影响整机架部署。当年参与一些项目设计的时候,微模块底座加斜坡,那模块之间就相隔太大距离不合适。去掉底座,就碰到列间空调水管问题,那就去掉列间空调换房间精密空调,反正列间空调未必见得节能,再后来,简化上架和布局,微模块拆得没什么东西,只有框架了。笔者当时感悟就是要整机架交付配合无高架地板设计,就要做个类似变形金刚一样灵活的通道密闭框架。笔者在海外看过不少机房,国外的机房都是空的,室内啥都没,完全可以做预制框架支持整机架交付,毫无违和感。北美整机架交付实践早,绝大部分都支持整机架交付。下图是笔者公司AirTrunk的机房包间。

如果时光倒流有机会重新设计,笔者会用大容量UPS/高压直流,大空调,母线,独立框架……反正机房包间地面除了通道密闭最好是什么都没,布线和末端配电尽量灵活配置。简单来说,作为Colo数据中心的设计者,难道不应该技术上尽量兼容各种客户的技术方案吗?

最后提一下,由于服务器采购周期和IDC建设周期不同,如果现有IDC的技术不满足,扩容机房需要整改才能部署整机架,这又是一个很痛苦的事。改造项目往往涉及新增变更合同等等商务流程。流程耽误的时间比整机架节省的时间往往要多,而且大多数IDC公司都不愿意整改,或者技术上极难整改,那就没辙了。另外一提是整机架集成电池等设计,技术上可以去掉UPS,但并非所有机架都是整机架,还有需要UPS供电的网络机架等。一旦碰到设备变更和搬运,UPS还是去不掉。就算UPS可以去掉,只有发电机的情况下,那供电的SLA怎么约定呢?整机架集成东西越多,会不会导致很难选机房呢?每个大公司对整机架的态度又会如何?咱们且看风云……

声明:上面图片均来自公开网络。感谢同行对本文提出的宝贵意见。

“如果觉得文章有用,麻烦点击右下角在看,谢谢!”

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
IDC 机房空调问题解决方案
【ODCC】大话数据中心——模块化数据中心技术和商业模式(下)(阿里巴巴陈炎昌)
IDC 机房建设要求
🔎什么情况能让王晓初出离愤怒,说出“你们不要逼我!”的狠话?
什么是服务器租用?服务器租用有什么好处?
安全节能更低碳 数据中心节能降耗策略
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服