数智时代的“算力荒”,端到端的绿色算力框架成为破局关键
(资料图)
随着数据成为新的生产要素,算力成为继热力、电力之后新的关键生产力。
2022年以来,以ChatGPT为代表的大模型应用不仅推动生产方式变革,应用底层的大模型在训练和运行阶段对于算力的需求也呈指数级增长——平均每3-4个月算力翻一倍,而每年算力增长幅度达到惊人的10倍。与此同时,全球算力也在飞速增长,近5年,算力总规模年均增速已超25%。然而, 全球算力资源的增长仍然无法满足人工智能应用对算力的扩大性需求 。
巨大的算力缺口引发业内广泛关注,企业和研究机构纷纷探寻解决路径。 一是在硬件层面 ,迭代现有CPU\GPU芯片、推出以数据中心为应用场景的DPU芯片; 二是在数据中心建设方面 ,推动建设“绿色数据中心”,降低PUE(Power Usage Effectiveness,电源使用效率)数值,在一些互联网企业和IDC企业的带动下,截至2023年6月,行业内先进绿色中心PUE降至左右; 三是在计算资源分配方面 ,通过算力共享、错峰使用等方式,提高单位算力利用效率。其中,外界普遍关注的是第一和第二种路径,对于算力利用效率的关注和研究则相对较少。
8月18日,在2023中国算力大会“算力低碳发展和智能创新”分论坛上,蚂蚁集团联合中国信通院发布了《面向算力应用环节的计算绿色化白皮书》,一方面对于现有的算力缺口问题提出新的方向,另一方面重视业务应用环节中算力利用效率较低的问题,提出 端到端的绿色算力体系,将原本聚焦于数据中心的绿色算力概念延展到各个环节 ,从发电来源、算力生产到业务应用,构建绿色算力的完整路径。
具体来说,端到端的绿色算力框架相比于绿色数据中心的概念,是通过上下游合作、软硬件协同的方式,推动算力更高效、更节能地支撑业务并产生价值。该框架主要提出三个“1”,包括:
“1”个倡议, 首次提出面向应用环节的计算绿色化概念和关键构成技术要素。在满足业务需求的前提下,通过高质量软件提升硬件算力的利用效率,达成节能减碳的效果。即企业通过“软硬件协同”的绿色计算技术,从绿色监测评估能力、低碳算力选择能力、全局资源调度优化能力、工作负载优化能力四个维度出发,持续提升自身在应用环节的计算绿色化水平。
“1”个效果, 基于蚂蚁绿色计算体系,有效提升了算力资源利用效率。从2019年开始,蚂蚁集团借助云原生架构升级的契机,开始研发“绿色计算”技术。蚂蚁的绿色计算是在使用绿色数据中心的前提下,通过蚂蚁本身全套高质量软件栈的能力,包括计算平台系统架构升级、业务软件更新以及业务应用与平台系统协同设计等方法提升算力资源利用效率。通过绿色计算,2022年全年蚂蚁集团的资源利用率已达到2019年的3倍。同时,蚂蚁提出了一套AI算法的绿色衡量指标体系及配套的全自动数据采集工具,相对于业界通过公式模拟、整机采集的方式,蚂蚁率先提出进程级别的能耗采集,更加精准地追踪每一个模型的能耗情况,单进程采集准确度95%以上,算力采集采用动态运行方式,相对于深度学习自身提供的静态模式,准确度提升200%以上。
“1”个总结, 数字经济正在改变生活方式和工作方式,但同时也加剧了能源消耗和环境问题。因此,在人工智能飞速发展的当下,在碳达峰和碳中和的全球性背景下,探索更为高效、节能、低碳的算力资源利用途径,成为了关键问题。一方面,采用绿色计算技术可以帮助组织和企业节约成本、提高效率,在市场竞争中获得优势。另一方面,绿色计算技术可以有效提高资源的利用效率,能够减少服务器的用量,从而减少碳排放,推动"双碳"目标的实现。
总体而言,绿色计算是未来数字化的关键根技术,也是多方主体为共同创建绿色和智能的世界所承担的社会责任。
(作者:上海社科院互联网研究中心主任、研究员 惠志斌)
标签: