• 电子部件关联

BBU(电池备份单元)支持的人工智能时代的电力基础设施——数据中心的新挑战与解决方案

  • このエントリーをはてなブックマークに追加

生成式AI时代数据中心的电力需求与能源

生成式人工智能 (AI) 技术的快速发展推动了大型语言模型 (LLM) 的出现和商业化,例如 ChatGPT (GPT-4) 和 Llama 2。这些 LLM 需要强大的计算能力来训练海量数据集。此外,AI 代理(结合多种 AI 技术与自主决策设备的集成系统)正在积极开发中,这将在可预见的未来进一步增加处理负载。

在这种背景下,超大规模企业——谷歌、亚马逊网络服务 (AWS) 和 Meta 等领先的云服务提供商——正在大力投资针对人工智能利用进行优化的高性能、节能数据中心。例如,NVIDIA DGX H200 超级计算机配备了用于 AI 工作负载的高性能图形处理单元 (GPU),功耗高达 10.2 kW,大约是传统服务器的 5 至 40 倍,传统服务器通常使用 0.5 至 2 kW。

不断增长的电力需求导致数据中心的功耗显着增加。根据国际能源署 (IEA) 发布的2024 年电力报告,数据中心在 2022 年消耗约 460 TWh 电力,预计到 2026 年这一数字将超过 1,000 TWh。这个数字几乎相当于日本每年的总用电量。

在这种情况下,确保稳定且高度可靠的电源是数据中心运营的前提。特别是,电池备用单元 (BBU) 在瞬时波动或中断期间提供临时电源,以保存活动数据并实现安全系统关闭,对于保护基于信息的资产正迅速变得至关重要。

备用电源设备的类型和BBU的特点

市面上有各种针对不同应用和环境设计的备用电源解决方案。清晰了解它们的特性和差异,对于选择合适的电源保护设备至关重要。

  • ESS
    储能系统 (ESS) 是指用于能源管理的大规模电力存储系统。其主要用途包括平滑可再生能源输出的波动并实现峰值需求转移。储能系统还有助于稳定电力系统频率并调节输出,从而支持高质量电力的输送——这对于基础设施的稳定运行至关重要。

    ESS 可以储存电力长达数小时到数天,这使其对于大规模电力管理和优化社区之间的供需平衡非常有价值。
    参考网站:使用锂离子电池的储能系统(ESS)
  • UPS的
    不间断电源 (UPS) 是指在电源中断时提供几分钟到几小时不等的电力的设备。它们允许连接的系统在突然停电或瞬时电压下降期间继续稳定运行。在长时间断电的情况下,UPS 支持安全系统关闭,以防止关键系统中的设备故障或数据丢失。

    UPS 还可以防止电压波动,从而有助于保持电能质量。在数据中心,它们充当桥接电源,直到主电源恢复,被认为是提高整体系统可靠性的重要基础设施。
  • BBU
    备用电池单元 (BBU) 专门设计用于在瞬时电力波动或停电期间提供几秒钟到几分钟的短期备用电源。

    即使是瞬时的断电也会立即擦除存储在内存中的数据,从而对具有高速、高容量易失性内存的系统产生重大影响,例如用于 AI 处理的高性能 GPU 服务器。BBU 对于将大量数据从易失性存储器安全地传输到非易失性存储器或其他存储系统至关重要。与 UPS 相比,BBU 更紧凑,可以按机架安装,将它们分布在多个机架上,并使其成为数据中心在密度越来越高时节省空间、低维护的选择。

    下图说明了 BBU、UPS 和 ESS 的功能和典型安装。BBU 作为一种节省空间、快速响应的解决方案而受到特别关注。
BBU、UPS、ESS功能及安装配置差异说明图
类型供电持续时间墙壁插座供电的真空吸尘器特征
储能系统数小时至数天可以安置在单独的结构中当空间不是问题时;通常使用廉价的铅电池或 LFP 电池。
UPS小时在单独的房间内集中管理
基带单元分钟分布在各个机架上适用于高输出、小尺寸应用

BBU市场扩张及底层变化

随着AI服务器的普及,BBU市场正在快速扩张。基于GPU的高性能计算单元的采用显著增加了功耗,推动了对能够即时稳定供电的基础设施的需求。

包括微软和谷歌母公司 Alphabet 在内的领先超大规模企业尤其关注对人工智能基础设施的积极资本投资。据路透社 2024 年 4 月报道,微软的资本投资在 2024 年第一季度增至 115 亿美元,较上一季度增加 3 亿美元。Alphabet 的资本投资达到 120 亿美元,同比增长 91%。分析师预测,对人工智能基础设施的投资将继续增长。

领先云提供商的这些积极投资正在推动对整体数据中心基础设施的需求,包括高性能人工智能服务器的备用电源系统。每台 AI 服务器消耗超过 10 kW 的电力,需要 BBU 每年处理不断增长的电流和电压需求。

根据 Grand View Research 的《2024-2030 年数据中心 UPS 市场报告》,到 2024 年,全球数据中心 UPS(包括 BBU)市场价值约为 40.40 亿美元,预计到 2030 年将增长至约 64.11 亿美元。

此外,从云到边缘向分布式处理的持续转变增加了边缘数据中心对紧凑型 BBU 的需求,其中空间效率和灵活性是关键优先事项。现有的UPS也正在被BBU取代,特别是在新兴国家,反映了全球备用电源解决方案的多样化。

数据中心图片

BBU 挑战和不断发展的安全措施

BBU 的激增带来了安全挑战。BBU 系统中集成多个锂离子电池单元,增加了发生严重事故的风险,包括电池膨胀、破裂和起火,尤其是在电池因过流、过充或反复充放电循环而性能下降的情况下。

为了避免这些风险,二级保护机制至关重要;它们确保BBU能够即时检测到异常,并将电池与充放电电路物理隔离,以防止风险进一步升级。鉴于AI服务器需要短时间的高功率,二级保护电路必须设计得高可靠性,具有高速截止、低内阻和防误触发等特点。

通过实施正确的二级保护解决方案,可以避免发生火灾或设备损坏等灾难性故障的风险。此外,将故障设备从系统中隔离出来,有助于保持整个设备网络的整体健康和可靠性。

SCP:建立新的BBU保护标准

Dexerials 的自控保护器 (SCP) - 用于二级保护的表面贴装保险丝解决方案 - 可检测过流和过压等电气异常,然后物理断开受影响的电路。在配备多个锂离子电池单元(如 BBU)的系统中,自控保护器可确保快速、可靠地切断电源,从而能够移除或更换故障单元,保持系统的完整性。

每个SCP装置均提供保护,其紧凑轻巧的设计使其成为高密度安装的理想选择。此外,我们的 SCP 装置不具备自复位功能,从而增强安全性,避免了误触发或意外断电带来的二次风险。

这些功能使 Dexerials 的 SCP 成为人工智能服务器 BBU 设计的关键解决方案,具有高度的安全性、可靠性和设计灵活性。有关详细技术概述,请参阅" "。二级保护要素的基本知识:什么是SCP?- 保护锂 (Li) 离子电池不被点燃."

BBU 和 SCP 的潜力:电力基础设施可靠性的基石

生成式人工智能的发展开启了数据中心电力基础设施演进的新阶段。特别是,BBU 对于保护关键数据和系统免受瞬时断电至关重要。

虽然 BBU 在电源保护方面发挥着关键作用,但在维护和管理其完整性以确保其在紧急情况下可靠运行方面仍然存在挑战。.应对这些挑战需要快速识别和移除有故障或不可靠的单元,这可以通过集成高度可靠的二次保护保险丝来实现。这些保险丝通过电路隔离和强制关闭高风险设备来防止进一步升级,从而确保整体系统安全。

展望未来,Dexerials 致力于通过其表面贴装保险丝 (SCP) 提供安全性和可靠性,同时满足 BBU 市场支持更高电流的需求。通过这些努力,我们的目标是在这个不断发展的领域创造新的价值。

有关此产品的更多信息,请单击此处