刀片技术从1999年前后诞生,到2002年前后被业界广泛看好乃至大热。但现实与厂商和咨询机构的美好预期似乎存在着一些差距,目前刀片服务器的出货量仍不到10%,原因是什么?
开始反思之前,先来回顾一下IDC在2004年初公布的一份报告,这份报告说,截至2003年底,刀片出货量占到全球服务器市场1%左右的份额。而IDC在2003年曾更乐观地预测,到2007年,刀片的出货量将占到整个服务器市场的25%,销售额超过150亿美元,每年增长率超过200%。
而实际上,2005年刀片服务器在全球服务器市场上的出货量不到10%,远没有达到业界的预期,原因何在?
主因用户认同度
似乎不能简单怀疑IDC报告预测准确度的问题,因为在2001到2004年这段时间内,IDC的预测还是比较准确的――虽然可能是因为基数小,预测起来比较简单。
阻碍刀片增长的主要原因,或许来自用户的认同度。在这一点上,国内几大行业用户的观点曾惊人的相似。在2002年到2004年,许多刀片厂商在国内曾大力推广过第一代和第二代刀片服务器,而笔者就曾对电信、银行、证券、保险等重点行业用户进行过一番调查,却发现一个尴尬的事实:厂商所看重的刀片技术优势,从用户角度看,却成为痛脚。
一个例子是刀片的节能。从厂商观点看,在提供相同计算能力的前提下,刀片服务器比机架和塔式服务器要省电的多;但从IDC用户来看,刀片却给现有机房供电系统带来挑战,每机架只有16A的额定电流,而一个机架全是刀片服务器的话,必须要对现有供电线路进行改造,这一成本太高,所以用户宁愿使用机架服务器。
另一个例子是刀片节省空间。不少厂商曾经广泛宣传这一优势。但有用户指出,即使在大规模部署的情况下,刀片是否节省空间似乎还要从机房整体密度来计算,因为刀片服务器都部署在专门的Chassis(基座)中,如果使用专门的大机架,会降低部署密度;其次由于刀片服务器的单位发热量远超机架和塔式,在IDC空调散热功率不变的前提下,部署刀片的机架之间的间距也要大于部署传统服务器的机架间距,这样一来,刀片的计算密度优势似乎并没有多少。
除了上述分歧,在降低TCO、管理方便等方面,用户和厂商之间也都存在不同程度的认知差异,而正是由于这样的差异,造成了刀片服务器大热而不大卖的奇观。
次因技术限制
如果说,上述问题并非刀片服务器本身的技术问题,而是因为立场差异造成,可以期待用时间来慢慢弥补;而摆在刀片服务器面前的技术挑战,则更难逾越。
空间和散热是最大的挑战。刀片服务器因为要在足够小的空间里塞进足够多的内存和CPU,那么如何平衡空间和散热这对冤家就成为所有设计师的心病。
虽然刀片系统所采用的主要几种CPU和周边装置(如芯片组)的尺寸在过去几年中维持了一个比较固定的大小,但单位空间内的热量却在增长(从低频到高频,从32位到64位,从单核到多核)。而且由于64位CPU能够访问4GB以上的内存,过去每刀片只配置2~4个内存插槽的方法显然不能继续采用。
假如某个天才的设计师改善了空间问题,但随之而来的散热将令他头疼。以当前刀片产品来看,一个满配刀片服务器的机架功率可以轻松达到20KW,而满配机架服务器的机架最多也就8KW,如何散热?
在不考虑较为昂贵的液冷系统的情况下,看看风冷散热遇到哪些问题。通常认为,通过增加散热片上的空气对流或加大散热片尺寸就足以解决散热问题。
但实际上,用加强空气对流和加大散热片尺寸的散热方式都会受到限制,因为刀片的空间限制和内存模块决定了散热片尺寸不能任意增加;同时,处理器所产生的热量往往集中在一个小区域内,增加散热片的尺寸并不能等比例地达到强化散热的效果;另外一个因素是散热片本身的散热能力受到热阻效应的影响。
根据刀片服务器的物理特性,通常可以根据“最大散热功率=(处理器工作温度-周边温度)/热阻”这一公式来计算,这样可以计算出,如果一颗Opteron 275需要被配置在刀片上,同时有9.45立方英寸大小的散热片,这样通常在91.44米/分的风速下有0.62℃/W的热阻,假设有60W热量需要散发,而Opteron的工作温度是70摄氏度,那么风冷系统需要将环境温度控制到23摄氏度以下,但这在刀片系统中几乎是不可能的。

因而,在2004年,刀片配置的最高主频处理器是Xeon MP 3.06GHz,这在当时已经是极限。而目前,刀片服务器能配置的处理器最高功率,也没有超过100瓦,最多也就是HP配置的低热量安腾2的刀片产品。而IBM和HP也做出了特色设计:IBM将BladeCenter的高度从7U增加到9U,用空间换取更好的热阻;HP则是在每台刀片上安装散热风扇,用更大噪音的代价来获得更好的散热。或许,谁取得了刀片服务器空间、散热乃至供电方面的最佳平衡,谁将获得这一市场的最终胜利。






