中国信通院李洁等:算力基础设施的现状、趋势和对策建议

当前,云计算、人工智能、大数据等新一代信息技术快速发展,传统产业与新兴技术加速融合,数字经济蓬勃发展。算力基础设施作为各个行业信息系统运行的算力载体,已成为经济社会运行不可或缺的关键基础设施,在数字经济发展中扮演至关重要的角色。2019年,美国发布《国家战略性计算计划:引领未来计算》,将计算能力提升到国家战略高度,从先进计算、超算、高性能计算等多方面打造国家计算基础设施。近年来,我国对算力基础设施的重视程度不断提升,一体化发展、新型数据中心、算力基础设施等概念相继提出。2020年4月,国家发展和改革委员会首次对“新基建”的具体含义进行了阐述——基于新一代信息技术演化生成的基础设施,包含以数据中心、智能计算中心为代表的算力基础设施等。算力基础设施内涵外延广泛,建设运营主体丰富,技术环节众多,需要多方统筹协调、共同参与,促进其高质量发展。

1、算力基础设施的内涵和外延

算力基础设施本质是提供不同类型算力的基础设施。伴随着算力基础设施的发展,国家及地方相关政策文件提出了云数据中心、智算中心、一体化大数据中心等概念。经深入分析,发现这些概念是从数据中心采用的技术架构、提供的服务类型等不同维度提出的,物理实体都可以归为数据中心的不同形式和类型。当前,算力基础设施概念主要源于3个方面,一是提供算力资源的实体,如数据中心是面向市场的算力资源,超算中心是主要面向科研国防等重大项目或课题的算力资源;二是政策文件中出现的名词概念,新型计算中心概念不断涌现,如新基建政策中出现的算力基础设施、一体化大数据中心和行业大数据中心;三是技术融合,云计算服务、大数据、人工智能等新技术的兴起与发展,市场应用需求的导向,引发传统数据中心发生技术变革,使其成为技术创新的制高点,成为技术密集型产业,并催生新型计算中心形态,如智能计算中心。

狭义的算力基础设施指提供算力资源的基础设施,主要以算力资源为主体,包括底层设施、算力资源、管理平台和应用服务等,涵盖超算中心、数据中心和智算中心等提供的多样性算力体系。该类定义下的算力基础设施通过管理平台,实现跨区域、跨领域、跨部门协作,公共算力和商业算力共同提供服务,满足我国科技创新、产业升级和人民智慧生活的需求。

广义的算力基础设施是融算力生产、算力传输和IT能力服务为一体的ICT服务。考虑到算力本身是通过硬件、操作系统、数据库产业生态,算力资源与网络传输的共同作用,算力服务与社会生活的相互促进,本文认为算力基础设施既包含提供算力资源的实体、配套使用的存储资源、助力算力应用的数字技术,又涵盖通过敏捷弹性的云计算、提供算力资源输送的网络基础设施对外提供服务等内容。这更符合我国经济社会数字化转型,对算力多元化供给、普惠化使用、便捷化连接的现实需要。

算力基础设施是新基建的核心组成部分,对于我国数字经济发展支撑意义重大。一方面,通过深度应用互联网、大数据、人工智能等新兴技术,算力基础设施支撑传统基础设施转型升级,形成融合基础设施;另一方面,通过持续支持科学研究、技术开发和产品研制,算力基础设施支撑创新基础设施的落地建设和创新发展。在全球经济状态低迷、国际贸易冲突加剧和新冠肺炎疫情暴发的经济大幅下行压力之际,算力基础设施具备固定资产投资和数字基础设施双重属性,可推动我国经济高质量发展。短期来看,算力基础设施能够发挥固定资产投资的作用,发挥投资的“逆周期”调节作用,助力稳投资、扩内需,缓解当下之急;长期来看,算力基础设施能够促进数字基础设施的建设发展,有助于力行供给侧结构性改革,实现新旧动能转换、增长方式转型的经济高质量发展。

2、算力基础设施的发展趋势

2.1多元算力需求推动算力基础设施规模大幅增长

数据中心方面,从产业需求来看,5G、工业互联网、物联网、人工智能等信息技术与应用正加速发展和布局,数据量暴增,对数据中心的需求不断增长。预计未来几年,我国数据中心产业仍将继续保持高速增长趋势。截至目前,数据中心在算力基础设施总体规模中占比最高,超过90%,未来几年数据中心规模将保持年均20%的增速。智能计算中心方面,随着AI算力需求的增加和新基建政策的推动,AI算力进入需求加速期,而传统算力受效率、功耗和成本的限制提升缓慢,且用于AI专属计算性价比较低。按照AI基础架构规模增速来看,未来AI算力增速将达到60%以上。超算中心方面,随着产业升级和企业数字化转型加快,高性能算力需求不断旺盛,超算中心也将在“十四五”期间迎来新发展阶段。边缘数据中心方面,未来随着5G、工业互联网建设推进,边缘算力需求将日益迫切,边缘数据中心建设部署将进一步加快。

2.2算网协同实现算力资源的优化整合和敏捷连接

随着5G、物联网和工业互联网等技术的发展,海量边缘数据爆发式增长,以云计算为核心的集中式大数据时代,在网络延迟、隐私安全和能效等方面,已无法满足边缘数据处理需求,边缘计算应运而生,算力需求从云和端向网络边缘扩散下沉,高效算力需要深度融合计算和网络,实现计算资源和网络资源的敏捷连接。算网融合通过网络分发服务节点的算力信息、存储信息、算法信息等,结合网络信息(如路径、时延等),针对用户需求,提供最佳的资源分配及网络连接方案,从而实现整网资源的最优化使用。算网协同的最终形态,或将形成多种算力交易平台、算力交易商店,满足从多层次计算资源面向多样性终端算力使用需求。

2.3算力基础设施泛在布局保障算力普惠化服务

数据中心方面,大型数据中心和边缘数据中心将协同发展。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出加快构建全国一体化大数据中心体系,建设若干国家枢纽节点和大数据中心集群。国家发展和改革委员会、工业和信息化部等四部门发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》《全国一体化大数据中心协同创新体系算力枢纽实施方案》,提出建设大型数据中心建设的八大节点,为我国数据中心产业布局指明方向。随着边缘计算的推广应用,边缘数据中心在业界逐步探索建设应用,互联网头部企业纷纷开启边缘计算节点布局。超算中心方面,地方政府和高校正提速建设超算中心,并着力打造超算互联网,进一步降低超算算力使用成本和连接难度。智算中心方面,我国各地政府掀起智算中心建设潮,智算中心算力规模迅速扩大,为人工智能算力的商业普惠应用提供了良好的基础。

2.4绿色低碳是算力基础设施建设运营的主旋律

2006年开始,随着互联网快速发展,全球数据中心规模高速增长,能效水平成为产业关注热点,封闭冷热通道、提高出风温度、优化供配电设备效率、充分利用自然冷源等绿色节能技术不断推广应用,数据中心能效管理从粗犷发展进入精细管理,全球数据中心总体能效水平快速提高,我国数据中心能效水平不断提升,部分优秀绿色数据中心案例已全球领先。算力基础设施的供配电系统、冷却系统等设施组成功能与数据中心相似,数据中心领域应用的新一代绿色技术已经外溢到整个算力基础设施领域,如高压直流、预制化、液冷、自然冷却等。为应对全球气候变化和实现绿色发展,我国提出双碳发展战略,双碳战略的提出将从内而外改变算力基础设施建设运营的方式。从建设上看,预制化将加快算力基础设施向内外纵深扩展;从产品上看,供配电系统、制冷系统、IT设备等将会朝着节能高效的方向发展;从运营上看,智能运维、余热回收、可再生能源将会在算力基础设施领域充分应用。

3、算力基础设施建设面临的挑战

3.1多元算力设施建设薄弱,产业生态体系仍需完善

设施层面,当前数据中心规模占比最高,超过90%,而超算中心、智算中心和边缘数据中心总体规模较小,出现专用算力不足、部分地区通用算力过剩、能耗成本过高的局面,无法满足国防科技、产业转型和社会生活对于多元普惠算力的需求。生态层面,多样性算力面临挑战,硬件、操作系统、数据库的多样性算力产业体系需多方共建,软硬件自主研发投入不足,标准评测体系有待完善。国内硬件产品存在严重的同质化竞争现象,软件投入和应用难以支撑上层业务发展。算力衡量指标多维,而现有标准化工作推进不够完善,因此算力还无法像水电一样标准化衡量;平台兼容性问题突出,不同OS、固件、整机、芯片平台兼容性问题突出,制约了产业的进一步发展。

3.2算力标识和度量尚未统一,算网融合处于研究阶段

算力的标识和度量是全网算力资源衡量的基础,也是算力资源与应用需求敏捷对接的首要步骤。算力的统一标识和度量需要考虑诸多因素,在计算系统中,需要考虑精度、操作、指令、芯片、系统级的分层度量,不同的计算机对不同的应用有不同的适应性,因此很难建立一个统一的标准来比较不同计算机的性能。而且,算网协同中的算力标识度量不仅与硬件资源的计算能力、存储能力和通信能力密切相关,也取决于计算节点的服务能力和业务的支撑能力。当前,算网协同处于研究阶段,其实现路径业内存在较多的讨论,中国移动、中国联通等运营商提出了相关的实现路径和实践案例,预计未来仍需大量的标准化工作和技术研究工作。

3.3算力布局供需失衡,服务实体经济比例严重不足

国内算力布局存在供需对接失衡,主要体现在3个方面。一是中西部地区算力过剩,中西部地区应用需求不足,导致供给余量较大,“东数西算”模式尚未形成规模,造成资源闲置和浪费。二是用于产业互联网的算力不足,过去十年,主要由消费互联网带动算力市场发展,而未来十年,产业互联网将是算力市场的主要动力,在不考虑网络等因素的情况下,当前的算力建设应用显然存在与产业互联网发展需求不匹配的情况。当前,算力基础设施服务于传统行业和实体经济的比例较低,以提供通用算力为主的数据中心市场为例,服务于传统行业的比例不足10%。三是算力使用门槛较高,企业缺乏相关数字化转型人才,无法直接使用算力资源,因此需要通过云服务的方式提供算力服务,并通过低代码无代码提升软件开发效率,最大化降低人力和时间成本,降低算力使用门槛。

3.4算力基础设施整体能耗和碳排放不容忽视

算力基础设施的发展,很大程度上带来人力的解放和生产效率的提升,有助于提升社会整体能效,加速实现碳减排和碳中和,但是未来,随着算力基础设施规模的不断增长以及人工智能等更高算力密度需求技术的普及,算力基础设施自身的能耗和碳排放也将带来不小的挑战。以数据中心为例,2020年我国数据中心耗电量突破900亿千瓦时,碳排放量达0.6亿吨。据中国信息通信研究院云计算与大数据研究所测算,到2030年,我国数据中心耗电量将超过3 800亿千瓦时,如果不采用可再生能源,碳排放量将超过2亿吨,算力基础设施的绿色低碳亟待关注。近年来,以降低PUE为主要节能途径的方法取得了较大的成效,同时,全球算力基础设施的PUE降低放缓,节能改造与建设的边际效益逐步降低,进一步提高能效需要投入更多成本;另一方面,部分传统数据中心负载率不高、绿色管理不到位等造成数据中心能效改善效果不明显。

4、促进算力基础设施高质量发展的相关建议

4.1筑基多元算力产业,有序推进算力基础设施建设

提升算力基础设施关键技术研发能力,稳固产业链基础,包括基础软硬件自主研发,不同OS、固件、整机、芯片平台兼容性改善,多元算力评测基准体系构建等方面,推动行业标准化、通用化,促进各产品兼容性相关测试规范和标准的制定,并开展多元算力测试验证促进产业链成熟。有序分类建设算力基础设施,持续支撑消费互联网的算力需求,有序应对产业互联网发展带来的算力需求增长,同时也避免建用不匹配的资源浪费,综合考量科研院所、产业应用、城市治理和用户需求等因素,建设与数字经济相适应的算力基础设施。

4.2深入算网协同研究,积极促进算力和网络协同发展

加强算网协同技术研究和应用实践,深入探讨算网协同工作重点、难点和发展路径。一方面,加快网络优化和技术创新,联合应用方、设备供应商、第三方数据中心运营商、科研院校等产业界多方力量,通过标准的联合制定,形成面向社会各行各业、各类用户使用的网络,开展技术研究和产业应用创新,形成更好的算力传输网络。另一方面,开放算力市场,鼓励民间资本积极参与,形成竞争充分、服务优先、效率至上的算力市场,激发算力提供的水平以及算力消费的能力。通过对网络和算力的双方面推动,逐渐推动网络和算力的协同、融合。形成网络与算力协调发展的局面,提供一体化的算力服务。

4.3统筹算力资源布局,持续推动算力应用向传统行业渗透

统筹协调算力资源,各类算力基础设施需求各异,应分类引导、施策。从网络质量要求来看,对时延丢包、供电能力、运行稳定性、安全性要求极高的业务,应推动市场按需部署边缘数据中心;对时延丢包、运行稳定性的要求较高的业务,应重点布局京津冀、长三角、粤港澳、成渝等地区数据中心和云算力集群。从算力类型来看,对于满足国家、地方重大政务应用、科研需求的超算中心,应以“应用需求”为牵引开展建设和应用;对于人工智能训练、推理需求的业务,应推进技术提供方、产业用户等加快智能计算中心建设。推动算力服务与传统行业的技术融合、人才交流和商业合作,一方面加强技术研究和标准研制,推进低代码无代码开发平台的相关标准工作。另一方面,通过示范试点工程为传统行业数字化转型的成果应用提供大规模推广的基础,相关管理部门在立项、资金程序管理、奖励申报等方面为示范试点项目优先提供支持。

4.4关注绿色低碳算力,坚持探索绿色节能低碳减排新技术

完善算力基础设施绿色低碳监管体系,以电能利用效率PUE、水资源利用效率WUE、碳利用效率CUE等指标作为抓手,逐步完善算力基础设施对于节能产品、节能系统、可再生能源和清洁能源以及碳使用管理等绿色低碳管理体系,大力开展节约资源、节能降耗的算力基础设施关键技术的研发,如液冷、高压直流电(High Voltage Direct Current,HVDC)、模块化UPS等绿色高效技术,以及氢能、储能、可再生能源、碳捕集与封存(Carbon Capture and Storage,CCS)技术等节能减排技术,碳金融、碳管理等手段。建立健全算力基础设施全生命周期评价体系,加强算力基础设施绿色低碳运营能力建设,逐步将算力基础设施接入能耗监测平台,并探索对算力基础设施实际使用效率进行监测,加强算力基础设施项目的节能审查和老旧改造。

行业动态

云计算步入“深水区”:从数字化转型到赋能千行百业

2022-10-3 10:08:06

行业动态

我国云计算产业年增速超30% 驱动数字经济加速发展

2022-10-10 14:40:28

相关推荐