近 30% 的数据中心意外中断是由环境问题引起的。一个不幸的事实是,许多数据中心经理没有意识到数据中心环境监控的重要性,直到为时已晚并且他们自己遇到了一个严重的问题。
鉴于现代数据中心需要远程监控和管理,当您缺乏可见性和现场人员最少时,您如何知道您的环境中发生了什么?答案是采用完整的远程数据中心管理策略,其中包括部署各种环境传感器以及监控、趋势分析和报告它们收集的数据以改进数据中心管理等最佳实践。
什么是数据中心环境监控?
数据中心环境监控是通过观察数据中心内的温度、湿度等状况,确保设备安全、高效运行。通过监控数据中心环境,数据中心经理可以知道条件何时超出建议范围,从而使他们能够在出现问题和客户受到影响之前修复任何问题。
数据中心环境监控的好处是什么?
“你无法管理你无法衡量的东西”这句话是对的。数据中心环境监控使您能够以多种方式优化站点和运营。监控数据中心环境的主要原因包括:
- 省钱。环境监测降低了运营成本,推迟了资本支出,并增加了未来增长的能力。例如,温度监控让您知道何时可以安全地提高温度设定点,从而减少能源浪费并节省冷却成本。同样,适当的数据中心气流监控可帮助您将风扇速度降低到数据中心所需的速度。
- 提高正常运行时间。停机的代价是巨大的,数据中心经理必须尽一切可能减少设备故障。环境监控可防止对 IT 设备的威胁,如过冷、静电放电、腐蚀和短路。
- 效率最大化。通过保持最佳温度、湿度、气流和其他环境条件,您可以减少能源浪费并延长设备的使用寿命。
- 监控您的托管环境。托管数据中心租户需要知道他们的设备环境中发生了什么。如果您是托管客户,请监控所有潜在的停机威胁,以提醒您的提供商可能未监控的问题。
- 做出更明智的决定。在数据中心基础设施管理 (DCIM) 软件中监控环境传感器的实时数据可提供可操作的见解。您可以使用零配置图表和报告、热延时视频、ASHRAE 冷却图表和可视化分析实时分析您的环境读数,以优化数据中心的健康状况和效率。
环境监测选项和位置
最常部署的环境传感器是:
- 温度。监控您环境中的温度以确定可能损坏设备和导致停机的热点的形成,或者了解您是否使数据中心过冷和能源超支。有些人错误地只监测房间的温度,而美国供暖、制冷和空调工程师协会 (ASHRAE) 指南建议在每个机架中放置不少于六个温度传感器,安装在顶部、中间, 以及机架正面和背面的底部。进气口的推荐温度范围在 18°-27°C / 65°-80°F 之间,与进气口相比,排气温度应不低于 20°C / 35°F。
- 湿度。当环境太干燥时,静电就会积聚。太潮湿,设备会腐蚀。由于任一方向的极端湿度水平都会损坏设备并导致停机,因此请监控湿度并保持稳定的环境。ASHRAE 建议数据中心的相对湿度应在 40% 到 60% 之间。由于湿度不像温度那样快速变化,因此需要的传感器更少。通常,每五个机架部署一个湿度传感器,并放置在机架的前面,但可以使用更多的湿度传感器来增加覆盖范围。
- 气流。数据中心内适当的气流将有助于避免热点并保持稳定的环境温度,但电缆和其他障碍物会随着时间的推移而堆积并扰乱气流。监控气流以确保冷空气有效冷却环境,并了解您是否需要进行调整。建议在每个冷空气供应处放置一个气流传感器,在每个热空气返回处放置一个。
- 压力。对于使用变速风扇的热通道/冷通道部署,通道之间的气流差异可能会导致某些隔板(如塑料窗帘)被拉入通道,造成空气泄漏,从而导致冷却效率低下和热点。类似地,高热量、高气压机架上方的烟囱可能会将热空气泄漏到低热量、低气压机架上方的相邻烟囱中。气压差传感器通常放置在机架的顶部和底部、过道之间、地板下穿孔标题之间以及通风口和空气室中。
环境传感器可以部署为即插即用设备,连接到智能机架 PDU、机架控制器、在线仪表、分支电路监视器和网关设备。从那里,您的数据中心管理软件可以收集、分析和报告传感器数据。传感器连接可以是有线或无线的。有线系统通常快速、可靠且不受电子干扰或距离的影响,但安装起来既昂贵又费时,并且容易损坏以及电线松动或断开。无线系统具有成本效益,可以放置在整个设施中而无需布线,并且易于扩展,但可能会受到干扰或传感器之间的长距离的影响。
其他需要考虑的传感器和智能设备
对于更完整的远程数据中心监控,您还应该考虑其他传感器和设备。当您不在现场时,您可能无法完全了解数据中心正在发生的事情。这些额外的传感器和智能设备填补了空白,因此您可以查看、了解和远程管理数据中心的一切。
- 震动。随着时间的推移,数据中心的振动可能会损坏磁盘驱动器并导致停机。当在具有部件管理功能的 DCIM 软件中绘制振动传感器数据随时间变化的图表时,可以轻松地在组织的整个全球基础设施中的每台设备中识别出故障概率更高的磁盘驱动器的品牌和型号。
- 水。及早发现数据中心内的水可以让您有足够的时间来预防潜在的灾难。考虑部署水传感器,以避免因未检测到的空调泄漏、冷凝、管道爆裂或局部管道故障而导致停机。
- 接触闭合。通过触点闭合确保您的数据中心安全,以了解您的机柜门是打开还是关闭。通常,触点闭合连接到第三方传感器,例如烟雾检测传感器或在柜门打开时拍摄照片的网络摄像头。
- 柜门锁。使用门锁确保您的橱柜安全,门锁可通过 RFID 卡或生物识别技术限制未经授权的用户访问。电子机柜门锁可以远程锁定和解锁,以限制对单个机柜或数据中心区域的物理访问,并可以提供审计报告以了解谁访问了什么以及何时访问。
- 相机。来自闭路电视 (CCTV) 摄像机的实时摄像机信号让您可以随时随地查看和保护您的数据中心。
汇集一切
数据中心环境监控对于识别和缓解威胁至关重要。通过部署正确的传感器和 DCIM 软件,您将最大限度地延长正常运行时间、节省能源和资金。现代 DCIM 软件开箱即用,可与所有领先供应商的传感器、环境监控聚合器和智能机架 PDU 配合使用,从根本上简化环境监控。