如果不是为测量心率,血压,心电图,你可能想不起来每年做回体检。正如心脏是身体最重要的组成部分一样,电力系统基础设施对于数据中心而言,也是重要的组成部分。最保守的估计是电力系统中所有设备总值占整个数据中心资产价值的50-70%,(其中包含变压器,母线、断路器、线缆,UPS,配电柜,发电机等。) 对于数据中心运营商而言,但凡运营中由于电力相关问题导致的业务意外中断的突发情况,无疑是他们心中最大噩梦。 无论从总体拥有成本还是运营支出角度看,数据中心的“心脏”无疑都是其电力系统。
(备注:EKG与ECG通用,到表示心电图或体表心电图。)
表1:数据中心资产分配
表2:数据中心运行成本
如果只关注IT服务器管理工具,就像在体检时只检查血糖水平,却不检查心脏一样,忽略了数据中心内最重要的组件。那些放在封闭的房间,看起来陈旧的、颜色的陈旧的、灰色的柜体,默默的在那里运行着,保持数据中心持续运行,发出嗡嗡声响,销售在外面跟客户吹嘘着自己的IDC运转速度都快赶上TLC!这就是为什么需要专门能源电力管理系统(EPMS)成为数据中心重要的组成部分。正如建筑物管理系统(BMS)为冷却和设备机械系统创建的可视化平台,可以更为直观的看到系统运行情况,及时发现状况,同时系统能分析出有价值的电器资产。即使是数据中心基础设施管理(DCIM)也不完全具备EPMS所具备的功能,在设计上存在一些盲点。
(备注:TLC是闪存一种类型,全称为Triple-Level CellTLC芯片技术是MLC和TLC技术的延伸,最早期NAND Flash技术架构是SLC(Single-Level Cell),原理是在1个存储器储存单元(cell)中存放1位元(bit)的资料,直到MLC(Multi-Level Cell)技术接棒后,架构演进为1个存储器储存单元存放2位元。
EPMS :电力能源管理系统软件借助了计算机、通信设备、计量保护装置等,为系统的实时数据采集、开关状态检测及远程控制提供了基础平台。该电力监控系统可以为企业提供“监控一体化”的整体解决方案,主要包括实时历史数据库AcrSpace、工业自动化组态软件AcrControl、电力自动化软件AcrNetPower、“软”控制策略软件AcrStrategy、通信网关服务器AcrFieldComm、OPC产品、Web门户工具等,可以广泛地应用于企业信息化、DCS系统、PLC系统、SCADA系统。
BMS:建筑设备管理系统,是建筑设备自动化系统BAS、火灾启动报警系统FAS、安防自动化系统SAS的集成。它主要具有各子系统之间的协调、全局信息的管理以及全局事件的应急处理能力)
看看EPMS都在哪些方面对数据中心有益:
1、电气数据可视化
电气数据一般需要7*24小时在线监测。 看看下面具体例子。
a) 粒数据:来自电能表的数据有助于回答诸如“电路承载多少负载”等操作问题。 如果添加更多的服务器负载,会有风险? 变压器是否超载?“及时访问这些数据可以优化负载,从而使资产得到保护,避免带来的损害。
(备注:粒数据( grain data):基于时效性要求,能完整证明并真实记录某一事件发生或存在的数据颗粒的最小集合,该集合的数据颗粒可以是多源的;该电子数据一旦产生即不可被修改。粒数据的核心是证明某一事件的发生与存在,所以构成它的数据颗粒都需要具有该事件的属性,我称其为粒标签(grain lebal),粒标签是在数据生成时确立的,由数据产生各方依据规范在各自系统中自动生成,也可通过某种技术(如区块链)将各自产生的粒标签统一存储。依据标签实现相同标签的数据关联(包括横向与纵向),实现多源数据完整性整合与应用。)
表3 实时电气运行屏幕
A.操作员屏幕:快速浏览设备状态信息以查看关键电源设备,如变压器,UPS和断路器等,帮助运营商识别可能会影响正常运营的故障。
B.及时的电气报警:通过设置适当的报警阈值来识别电路过载;意外的断路器跳闸;从而帮助数据中心操作人员在轻微问题升级到危机之前进行有效干预。 EPMS带来更快的报警性能和准确的时间节点,这两者都有助于确定响应报警条件的有效性。
C. 与维护相关的电气数据:分析电路负载历史能够制定确切的运营维护计划。 例如,中断负荷分析以及后续运行分析表明,断路器的维护周期要比既定周期要短。相反,推迟定期维护也可能同样是有必要的,因为有时候现有电气设备负载较轻或者低于预期。这种有针对性的维护计划可以在大型数据中心推广,从而节省一定的运营成本。
2. 改善电气安全流程
在对数据中心运行、维护关键电源设备时需要注意安全。 在设备操作现场访问设备数据时,操作人员操作时需符合NFPA 70E标准要求的电弧闪光安全标准等规范和标准。 通过屏幕显示的设备运行状态,可以降低由于人为疏忽导致的问题带来的灾难性的伤害。毕竟,人为错误仍然是数据中心业务中断的主要原因(见图5)。
电气断路器和开关柜通过软件提供的“虚拟”标签,可以帮助运营人员及时发现设备哪里出现问题。此外,软件的安全功能确保只有与电气设备相关的运维人员才可以访问软件。
3.根本原因分析和事件取证
由于全球气候升温,电网受到前所未有的压力,所以停电并不常见。当面对如此系统如此复杂的数据中心时,难免会出错。要明确发生什么,更重要的是,要确认级联事件的序列,以此确保事件不再发生。还有就是额外功率电力管理系统功能十分便捷,特别是处理事后危机。 以下是EPMS捕获事件数据的三方面经验是非常宝贵:
A.电气报警:跟踪电压波动,例如:电压下降或升高;断路器跳闸,这种故障都是由于误操作导致。无论是改善内部业务还是与市政部门协商电力质量合同,都须先确认是否真有必要去做此事。
B.准确度高的事件顺序报告:在电气高速运转的世界,接近秒或分钟是远远不够的, 精确到1到10毫秒分辨率是有必要的,以防止业务意外中断:继电器接错,断路器故障等。
C.电能质量波形分析:目前电气系统的不足之处在于,能效的可靠性主要是通过UPS,转换开关作为保障,这要做的后果是实际上会降低电源质量。 随着停电的成本持续上涨,采用EPMS可以通过波形分析工具来帮助分析电气故障,谐波以及其他电气干扰等。 通过干扰方向检测工具可以快速隔离干扰,为事故发生后处理节省宝贵时间。
表4 电力波形分析表
4.能源会计和成本分配
对于数据中心运营商而言,保障数据中心的可靠性、正常运营是可以理解的,不过,随着业务发展,他们也许管理数据中心的能效。数据中心也引入精确度高 的工具对能耗进行测量,从而更有效的为托管客户提供更为精确的数据。EPMS可通过准确分配净能源成本(包括峰值需求和功率因子费用的辅助费用)来促进托管计费。 在许多情况下,数据中心通过更准确地计费工具,可向客户收取占收取费用很大比例的能耗成本。
除了从外计费的IT客户,许多数据中心的成本核算流程现在都需要在部门或成本中心层面进行内部计费。 EPMS软件通过大量计算,从而输出应用所需的数据。
表5意外中断分析
5.可持续发展和运营指标
管理人员现在希望数据中心人员能够掌握这些操作指标。 以下是EPMS可以提高可用指标的数量和质量的四个方面:
A.容量管理:通过分析电气基础设施中不同来源的电路负载,运营商评估它们是否可以安全地添加在特定区域的IT负载,而不会影响冗余。
B.操作性能:根据适用标准(如Green Grid recommendations)自动计算PUE,可使操作员更为轻松制作各类表格。
运行面板
C.能源报告:能源消费报告在粒度级别的需要验证的保护措施和采用节能性能符合的标准,如ISO50001.
(备注:ISO 50001能源管理体系全球标准ISO 50001已于2011年6月15日发布。将帮助各种规模的企业了解各个工作流程的基准能源使用量,该标准制定旨在实施降低能耗的行动计划、实现目标和能源绩效指标,并识别、优先处理、和记录各种能源绩效改善机会,从而实现节约。
各种全球性威胁,比如能源短缺、成本上升,以及遏制温室气体排放立法的增加,在我国,如“十二五”期间,我国确立了单位GDP能耗下降16%以及单位GDP碳排放强度下将17%的目标,以及《节约能源法》、《可再生能源法》、《循环经济法》、《清洁生产促进法》、《森林法》、《草原法》等有利于减缓气候变化的能源立法与环境立法的相继颁布和实施,都推动了该标准的制定。通过实施该标准,各种规模的企业不仅有潜力实现大幅财务节约,还可以通过声明其提升可持续发展的承诺,提高他们的声誉。)
D.可持续发展报告:可持续性不再是董事会上可有可无的想法。 将二氧化碳排放作为数据中心的业务目标和任务,需要一个稳固的计量系统作为依据。
通过EPMS来关注数据中心的电力基础设施,在这方面做出投资是值得的。单从投资回报率来看,这种投资可以比作“保险责任范围”内,投资一部分资本换来的是高额的回报。
是的,建筑管理系统当然可以在一定程度上整合电力设备,但BMS并不是完全针对电力系统开发的软件,BMS在管理机械系统方面的应用无疑是不错的,但是完全应用在电力方面将会低估数据中心的价值。
不要担心,与其他关键设施系统集成已不再恐怖。 DCIM能越来越多将各种组件集成在一起,建筑管理,数据中心操作和电源管理都在同一个操场上发挥得很好。
确保数据中心的电力系统得到良好的监控和调整 - 您的数据中心需要它的“心脏”在合适的位置。