人工智能(AI)正在改变各行各业,但其快速发展也带来了一个重大挑战:对计算能力的*需求。到2028年,预计超过50% 的数据中心关键IT能力将由AI驱动,而数据中心已经占全球电力消耗的2%以上——预计到2030年,这一数字将上升到 4.5%。1这给企业带来了一个困境:他们如何在坚持长期能效目标的同时满足AI不断增长的资源需求
部分答案可能在于我们如何处理数据存储。长期以来,传统硬盘驱动器(HDD)一直*解决方案,因为它们具有成本效益。但也存在明显的缺点——高功耗、大的物理占用空间和可靠性挑战。相比之下,像Solidigm D5-P5336 122TB SSD这样的超高容量固态硬盘(SSD)提供了一种*吸引力的替代方案,可显著降低存储能耗和空间要求。本文探讨了大容量SSD如何平衡AI的数据需求与对可持续实践的迫切需求,从而为实现更负责任的数据中心提供一条路径。
机械硬盘(HDD)的问题:旧技术,新问题
HDD刚刚迎来69岁生日。IBM于1956年以350 Disk File为型号发布了硬盘。此后的几十年里,HDD一直是数据中心的主打产品,但其机械设计与AI和分析工作负载的需求越来越不一致。HDD本质上比SSD慢、可靠性较低,体积也比SSD大得多,这导致效率低下,从而在整个数据中心生态系统中拖了后腿。HDD供应商自己也承认,随着硬盘容量的增加,原始性能会下降。2这一事实与不断增长的AI数据和性能要求相悖。
举个例子:您至少需要四个先进的30TB HDD才能匹配单个122TB SSD的容量。但是,HDD挑战超出了数据的物理“大小”。为了确保可靠性,许多存储设计人员采用了3倍复制等策略,即将同一块数据存储在三个单独的驱动器上,以降低故障风险。
正如听起来的那样,这增加了所需的驱动器数量三倍,同时也增加了对功率和空间的需求。其他技术(如短行程)仅使用HDD的一部分容量来提高性能——可能会进一步增加部署的驱动器数量。加速的HDD更换周期可能会进一步加剧问题。在五年内,这些缓解技术可以大大增加购买的HDD数量,从而增加其成本和对环境的影响。
表 1:比较HDD与SSD占用空间
图片
AI 驱动的电力短缺:每一瓦特都很重要
现代数据中心的能耗问题越来越受到关注,而AI是一个主要因素。存储虽然经常被忽视,但在这个系统中起着关键作用。数据中心中的每个驱动器都会消耗能源,并且随着AI工作负载的扩展,传统存储解决方案的效率问题变得更加明显。
设想一个50 PB的网络连接存储(NAS)解决方案,该解决方案专为性能和可靠性而设计。使用30TB HDD,您需要7143块HDD,每个驱动器在主动读写操作期间平均消耗9.8瓦。仅存储设备的功率总计就超过70千瓦(kW)。如果您将此推理应用于大规模数据中心的建设,则可能意味着节省的电力足够为整个社区供电。
相比之下,使用 Solidigm 122TB SSD的相同解决方案只需要857块SSD,每个驱动器在主动读取期间使用16瓦,总计13.7kW。这减少了80%的功耗,仅在存储设备上就节省了56 kW。更显著的优势是:HDD设置需要596台服务器来容纳驱动器,而SSD解决方案只需要36台,从而进一步降低了计算和冷却的电力需求。3
表 2:比较HDD与SSD解决方案级能耗
图片
在数据中心能耗翻倍的时代,这些节省*显著。大容量SSD不仅减少了存储的直接功耗占用,还减轻了对数据中心基础设施的压力,使其成为可持续扩展的关键工具。
空间效率:减少存储的物理占用空间
AI的数据需求不仅会给电网带来压力,还需要物理空间,甚至可能是大量的空间。对于假设的5艾字节(EB)NAS 部署,HDD和SSD之间的差异*明显。使用30TB HDD的解决方案需要775个机架,需要超过290,000平方英尺的数据中心空间。3相同的5EB如果配备122TB SSD只需要92个机架和36,000平方英尺。两个方案的NAS空间之比是8.4 : 1。122TB SSD可以在2U服务器中实现高达3PB的容量,4展示了HDD根本无法比拟的密度。
表 3: 实体建筑要求
图片
这种空间效率具有深远的环境影响。建造新的数据中心设施需要混凝土和钢材等材料,这两种材料都带有很高的碳排放。混凝土和钢材的生产合计占全球温室气体排放量的 15% 以上。5通过减少存储的物理占用空间,与HDD相比,大容量SSD可以使混凝土和钢材的隐含排放减少 80% 以上。较小的存储占用空间还降低了冷却要求,这是数据中心的主要能源需求。连锁反应是令人信服的:优化存储空间不仅可以节省面积,还有助于遏制AI物理基础设施对环境的更广泛影响。
表 4:HDD与SSD存储占用空间的温室气体影响
图片
固态存储的潜在优势
除了电源和空间之外,SSD 还提供不太明显但同样重要的效率优势。与依赖易磨损机械部件的HDD不同,SSD 具有更高的耐用性和更少的故障。例如,Solidigm 122TB SSD可在五年内提供无限的随机写入耐久性,5减少更换需求。在50PB NAS解决方案中,HDD解决方案需要7,143块盘,而SSD解决方案只需要857块盘。
在五年的部署中,需要制造、运输和处置的设备减少了数千台,显著减少了电子垃圾的储存。3按照同样的计算方式,建筑商可以减少近500吨的碳排放。将此逻辑大规模应用于新的数据中心建设,相当于每天让数千辆汽车停驶。
表 5:HDD与SSD生命周期终止处置影响
图片
然后,还有连锁反应。与HDD相比,更少、更小的SSD产生的热量也更少,从而降低了整个解决方案的冷却需求,这是数据中心中巨大的能源消耗。预期的SSD故障要少得多6转化为较小的制造和运输影响,这两者都会导致碳排放。从生产到生命周期结束,大容量SSD提供了一种更可持续的存储方法,使AI的数据需求与更小的环境足迹保持一致。
摘要:更易于管理的数据中心存储路径
随着AI持续推动创新,其环境影响不容忽视。HDD等传统存储解决方案因其功耗高、空间占用大和频繁的更换周期而变得越来越不可持续。Solidigm D5-P5336 122TB SSD提供了一个强大的替代方案,可将功耗降低多达80%,将数据中心占用空间缩减至八分之一,并通过提高性能、效率和耐用性来*限度地减少电子垃圾。
大容量SSD提供了一种实用的解决方案,使企业能够满足AI的极端数据需求,同时提高整体效率。通过重新思考存储方式,我们可以推动AI的变革*,同时与环境责任保持一致,从而证明创新和可持续性可以并行不悖。
点击阅读原文可访问Solidigm官网原文
注释:
1、来源–Semianalysis,2024年3月:https://semianalysis.com/2024/03/13/ai-datacenter-energy-dilemma-race/
2、来源–Western Digital,2023年5月:https://blog.westerndigital.com/dual-actuators/
3、来源–Solidigm。某些结果是使用Solidigm内部分析或架构模拟或建模进行估计或模拟的,仅供参考。系统硬件、软件或配置的*差异都可能影响您的实际性能。
4、来源–Solidigm。3PB基于2U服务器中的24个SSD乘以每个驱动器122.88TB容量。
5、来源–Solidigm。基于Solidigm D5-P5336的无限随机写入耐久性:122.88TB SSD、32KB随机写入性能和134PB写入(PBW)规格。
6、HDDAFR 来源–Backblaze,2024 年年终驱动器统计数据:https://www.backblaze.com/blog/backblaze-drive-stats-for-2024/ 。SSD AFR 数据基于 Solidigm第4代QLC产品的24个月AFR 实际值。
“Solidigm”是 SK hynix NAND 产品解决方案公司 (d/b/a Solidigm) 的商标。文中涉及的其他名称及商标属于各自所有者资产。
关于 Solidigm
Solidigm 是全球*的企业数据存储解决方案提供商。利用数十年的产品*优势和技术创新能力,Solidigm与客户精诚合作,帮助客户业务转型,并推动其迈入以数据为中心的未来。从核心数据中心到边缘数据中心,Solidigm强大的端到端产品组合赋能客户在AI等领域实现创新突破。Solidigm 总部位于美国加州兰乔科尔多瓦,作为SK海力士独立子公司在全球运营。如欲了解有关 Solidigm 的更多信息,请访问[https://solidigm.com],或关注微信公众号[SolidigmChina]。