2022年可謂“東數西算”元年。2月,國家發展改革委等四部門批復同意京津冀地區、長三角地區、成渝地區、粵港澳大灣區啟動建設全國一體化大數據中心國家算力樞紐節點。此前,四部門已批復同意在內蒙古、貴州、甘肅和寧夏等四個節點啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群。至此,全國一體化大數據中心體系完成總體布局設計,東數西算工程正式全面啟動,開啟了我國算力資源全國范圍跨區域統籌布局的新篇章。
一、算力時代已來
算力通俗講就是計算能力,是指對數據的處理能力。算力可用FLOPS(Floating-point Operations Per Second,即每秒浮點運算次數)計量。算力存在于各種智能硬件設備,是推動人工智能、大數據、物聯網、區塊鏈等技術創新與應用的基礎支撐。
1964年,我國自行獨立設計的通用數字電子計算機119誕生,運算速度為每秒5萬次。然而,面對大量科研計算任務,這臺國內唯一可用的電子管計算機勻不出足夠機時,來自全國各地的科研工作者需要排隊等候才能使用。盡管后來上海華東計算技術研究所將119型計算機復制了一臺(J501計算機),但作為第一代電子管計算機,性能極不穩定。中國“氫彈之父”、著名核物理學家于敏就曾率領研究人員利用華東計算技術研究所國慶節假日期間空出的全部機時集中突擊,為了避免出錯又不浪費機時,采用“換人不停機”的方式工作,以減少機時損失。
如今,“搶機時”時代已經過去,超級計算機的運算速度以每秒千萬億次計算。國防科技大學的銀河、天河系列,中科院的曙光系列,聯想的深騰系列,無錫江南計算技術研究所的神威系列共同構成了我國超算力量,助力眾多科研領域取得豐碩成果。2022年上半年全球超級計算機500強榜單顯示,在全球浮點運算性能最強的500臺超級計算機中,中國部署的超級計算機數量達到173臺,位列全球第一。
當前,我國算力總規模已超過140 EFLOPS,近5年年均增速超過30%,算力規模排名全球第二。數據中心是算力的主要提供形式,截至2021年底,我國在用數據中心機架總規模超過520萬標準機架,平均上架率超過55%。掃地機器人、無人駕駛汽車、智能音箱……各種智能場景的背后都暗藏著計算的力量。隨著數字產業化、產業數字化進程不斷加快,數字經濟飛速發展,數據總量也呈爆發式增長。數據作為與土地、勞動力、資本、技術等并列的生產要素,與之相關的存儲、計算、傳輸、應用等算力需求都在大幅提升,預計每年仍將以20%以上的速度快速增長。算力,已經深入到數字經濟時代的各個角落,成為國民經濟發展的重要基礎設施。
數字經濟時代,算力已經成為衡量國家經濟發展程度的重要指標?!?/span>2021-2022全球計算力指數評估報告》顯示,國家計算力指數與GDP的走勢呈現出了顯著的正相關。從15個重點國家的計算力指數看,平均每提高1點,數字經濟規模和GDP將分別增長3.5‰和1.8‰,預計該趨勢在2021年—2025年將繼續保持。
同時,算力已成為推動我國經濟高質量發展的重要支撐。國家信息中心信息化和產業發展部主任單志廣在接受《經濟》雜志、經濟網記者采訪時表示,從技術融合看,人工智能、量子計算、類腦計算等新技術與計算產業相結合,拓展了全方位計算能力;從領域協同看,數據的泛在分布推動計算從云端向物聯網、邊緣計算逐步普及,隨著5G帶來低延時、高帶寬和高連接密度的管道,云游戲、云VR、云桌面、云手機等新興業務需求蓬勃發展;從行業滲透看,計算已經跨越IT產業本身,成為數字化基礎設施,為制造業、汽車行業、智慧城市等多領域的數字化轉型提供支撐。“以算力為核心融合大數據、人工智能、物聯網、區塊鏈等新興技術,并與智能制造、智慧城市、智慧醫療、智能交通等領域協同聯動,將為數字中國建設和數字經濟發展帶來強勁動力。”單志廣表示。
而東數西算最重要的意義在于有利于促進碳中和、碳達峰目標的實現??v觀中國算力版圖,東部占60%,西部占20%,東部遠高于西部。而從算力資源的空間分布潛力來看,西部潛力遠高于東部。建設數據中心需要大量土地、電力,東部資源日趨緊張,而西部土地廣闊、電價便宜、能源尤其是綠色能源豐富,將數據中心建立在西部,不僅能夠節約“西電東送”的成本,還能提高對西部光伏、風電等綠色能源的使用,助力“雙碳”目標實現。
具體來看,國家為8個算力樞紐內10個數據中心集群劃定了物理邊界,并明確了綠色節能、上架率等發展目標。比如,集群內數據中心的平均上架率至少要達到65%以上,可再生能源使用率要有顯著提升。據了解,2021年我國數據中心的PUE(電能使用效率)指標為1.49-1.5,整體處于較高水平。按照國家一體化數據中心建設要求,東部數據中心集群的PUE平均要求小于1.25,西部則要求小于1.2。未來,數據中心具有很大的節能減排空間。從能耗構成來看,服務器能耗占比約45%,供電損耗占比約10%,散熱能耗占比約43%,未來隨著供電和制冷技術不斷優化,加上西部天然的氣候和能源條件,這些都有利于減少碳排放。
二、筑牢三大基石
數據、算力、算法是支撐數字經濟發展三個要素。單志廣提到,當前從總體發展情況看,我國數據發展“大而不優”,算力發展“結構不均”,算法發展“整體不強”,需要根據我國國情實際,切實做好數字經濟支撐要素固根基、補短板、強弱項、增優勢,不斷做強做優做大我國數字經濟。
第一,數據發展“大而不優”。數據是發展數字經濟的關鍵要素。單志廣介紹,我國是目前世界上數據總量僅次于美國的第二數據大國,到2025年中國數據總量預計將躍居世界第一。但是,由于各行業信息化水平不一,大數據技術建設和業務應用水平差異較大,導致數據質量特別是大數據質量總體上參差不齊,數據純度不夠、價值不高。同時,大數據產業鏈中存儲環節總體上產能過剩,分析處理環節又欠缺失衡,導致數據通過清洗、加工、精化等提升數據質量的力度不夠,影響數據治理的優化。另外,數據共享、數據開放進展緩慢、成效不彰,已成為數字政府、智慧城市和數字經濟發展的瓶頸和制約。
第二,算力發展“結構不均”。單志廣表示,我國算力發展存在“三多三少”的結構性失衡。一是數據中心底層架構和服務能力存在結構性失衡,傳統數據中心多、智能計算中心少。當前,我國數據中心以傳統數據中心為主,通過虛擬化方式面向政府、企業和個人提供通用云計算服務,復雜計算能力不足??萍疾恐鲗ЫㄔO了8個國家超級計算中心,通過超級計算節點互聯方式面向海洋科學、油氣勘探、氣候氣象、生物醫藥等前沿科學領域開展應用計算研究與服務,商業化服務門檻較高。但在人工智能普及應用以及算法模型參數量和復雜度不斷提升的背景下,我國具有數據吞吐大、計算速度快、算法工具多、軟硬件協同、服務價格適中等特征的智能計算中心則相對較少,難以滿足產業數字化轉型和智能化升級需求。二是數據中心區域分布和規模類型存在結構性失衡,東部多中西部少、中小型多大型少。從區域分布看,北京、廣東、上海、浙江、江蘇等經濟發達省份人口及互聯網用戶密度大,互聯網、云計算等科技創新類企業多,是我國數據中心業務需求最旺盛的區域,也是數據中心資源最為集中的地區,上架率達到60%-70%。從規模類型看,2019年我國數據中心數量大約有7.4萬個,數據中心機架規模達到227萬架,可對外服務的IDC(Internet Data Center,互聯網數據中心)數量為2213個,其中,中小型數據中心占比超過87%,超大型數據中心相對較少,整體上存在重復建設、利用不足、能耗較大等問題。三是數據中心核心芯片和軟件產品存在結構性失衡,進口依賴多、國產自主少。硬件方面,服務器核心的數據處理、存儲和傳輸等高端芯片國產化能力偏弱,供應鏈集中在歐美日韓臺等國家和地區,以我國主流服務器芯片為例,國內企業主要基于AMD公司授權進行x86架構二次開發,難以掌握底層技術,存在較高的授權終止以及數據安全風險。軟件方面,長期以來,我國軟件應用市場由國外企業主導,在服務器操作系統、數據庫、高性能計算基礎軟件等領域缺乏擁有核心競爭力的本土龍頭骨干企業。此外,數據中心國產化軟硬件兼容方面還需不斷完善。
第三,算法發展“整體不強”。算法已成為人工智能的基礎。當前,數據和算力已經不再是人工智能發展的主要瓶頸,人工智能的創新主要就是算法的創新。在這樣的背景下,只有不斷探索新的算法機制,發展新的算法應用,開發新的算法模型,發掘和培養算法人才,才能為推動智能社會發展提供強勁動力。
單志廣認為,在數字經濟的三要素中,數據位于價值金字塔的底層,算力處于價值金字塔的中部,而算法處于價值金字塔的塔尖,它的價值含量最高,對數字經濟發展的作用最為關鍵。因此,應該高度重視算法基礎設施,實現算法基建化。算法基礎設施會被部署在算力基礎設施上,共同推動應用的發展。“近年來我國算法發展進展很快,百度、騰訊、科大訊飛等深度學習的算法能力在多個領域達到國際先進水平,AI領域的明星創業公司如曠視科技、商湯科技等聚焦在深度學習最擅長的視覺識別和語音識別領域,推動中國相關領域的技術水平達到國際一流。但是,我國的算法發展仍然整體上競爭能力不強、人才儲備不足、基礎能力不夠,迫切需要從整體上提升我國算法的國際競爭力和價值貢獻度。”單志廣說。
三、最大挑戰是“摸清家底”
簡單說,東數西算就是把東部的數據拿到西部進行計算。其中,數據指的是以二進制方式可以存儲處理的數字化信息,計算則代表我國豐富的算力資源。需要強調的是,全國一體化大數據中心是全局性的大概念,目前批復的8個國家樞紐節點和10個國家數據中心集群是構建全國一體化大數據中心的雛形,是開展全國范圍內的布局和優化,而東數西算相對而言是小概念,并不能單獨討論。而建設全國一體化大數據中心,其中一個方面就是實現集群之間的算力調度。無論是全國一體化大數據中心布局還是東數西算建設,背后都是復雜的巨系統的優化調度問題。
東數西算帶來的最大挑戰就是“摸清家底”。在東數西算工程實施中,數據資產和算力資源都存在持續性和動態性,要求人們必須實時摸清當前處于活躍狀態的、正在被處理的數據資產和運行中的算力資源,以及處于靜態環境里的被保存的數據資產和儲備算力資源,由此才能實現最優化的算力資源調配,使得各類數據資產能夠得到最為及時的分析處置。這需要對各類相關算力資產(IT硬件資產、IT軟件資產等)“摸清家底”,以便更精準地進行能源資源的消耗調配和預儲備,真正做到“心中有數”。
那么,這個大工程究竟應該如何布局?首先要對算力進行分類。算力分為三種類型,超算算力、智能算力和基礎算力,與此相對應的是超級計算(HPC)、智能計算和大數據處理系統三種計算模式。近年來,我國算力結構隨著應用需求的變化不斷演化,基礎算力占算力的比重由2016年的95%下降至2020年的57%,智能算力占算力的比重則由2016年的3%提升至2020年41%,超算算力在整體算力中的占比較為穩定,約為2%,主要用于科學計算與工程計算等領域。而東數西算工程目前是對超算算力和智能算力的調度和統籌,這是由于基礎算力承載的多是電子游戲、短視頻、即時通信等實時性較強的需求,就目前的技術而言,具有實時性的本地數據無法搬到異地計算,因此西部目前主要考慮的是承載后臺加工、離線分析、存儲備份等非實時算力需求。
即使對于能搬過去的計算機來說,一對一進行固定匹配而不是動態調度的可能性也較大。不同超級計算機的處理器、加速卡、框架等各不相同,算力基礎設施面臨異構化挑戰。這需要搭建智能異構算力平臺,突破異構算力適配、異構算力網絡調度等關鍵技術,優化東西部各類算力資源的配比。
單志廣認為,東數西算不是現在時,而是全國一體化大數據中心建設的將來時,是全國一體化大數據中心的一類高級應用模式。他進一步解釋,全國一體化大數據中心理論上包括所有的A數B算,A、B可為東、西、南、北、中等各方位的任意排列組合,而東數西算只是其中一種情況。對于當前的現在時,只能叫“東數西存”,實時性數據仍然是“東數東算”“西數西算”。等到全國各個節點全部打通形成網絡并且建立起成熟的調度系統和機制后,才能實現面向業務、面向服務質量(QoS,Quality of Service)、面向成本的優化調度,才是真正意義上實現了“東數西算”。
單志廣表示,全國一體化大數據中心體系和“東數西算”工程要發揮實效,至少要從以下三個方面進一步落細落實。第一,要做好國家規劃布局的國家算力樞紐節點、國家數據中心集群與現有的全國各地各類型算力設施的統籌、銜接和配合,形成合理分工、科學聯動、高效協作機制,切實發揮國家布局的引領和示范作用。第二,要在業務層面上做好供需匹配和精準對接,解決“誰的‘東數’由誰來‘西算’”這一問題。沒有業務保障,算力設施就無法發揮應有作用,從而造成設施空置和能源空耗。這種供需匹配可能需要在國家層面、省市級層面、企業層面、業務層面等多層級開展面向性能、價格、效益等多方面的測算,形成真正的應用需求供給和可持續的長效動力機制。第三,最核心關鍵的是,要具備實現算力統籌和智能調度的算力網絡,能夠在全國范圍內,根據動態業務需求,在云、網、邊之間實現按需分配和靈活調度計算、存儲、網絡等資源。
我國算力交易平臺也正處于探索發展階段。6月,上海市通信管理局制定了《新型數據中心“算力浦江”行動計劃(2022-2024年)》,力求通過構建以高性能算力為主的多元算力服務生態體系,依托上海新型互聯網交換中心平臺交換架構的獨特性,先行先試,探索打造中國首個算力交易集中平臺。未來,算力資源度量標準將會實現統一,算力資源按需購買、合理使用將成為現實,實現全國算力可調度、可交換,各方按需供給。
四、逐鹿算力經濟
東數西算戰略工程的實施,意味著圍繞“數據”“算力”兩大關鍵詞的多維化、復合型產業生態集將會逐漸形成。能源行業、信息通信行業、互聯網行業、運營商、工程建設行業領域里的相關企業將會是東數西算工程基礎建設階段的最早獲益者。
東數西算工程帶來的是用電量的激增。隨著我國數據中心能源消耗的逐年攀升,電費支出約占數據中心年運營成本的95%。對于能源行業而言,“控碳不控電”是能源企業的終極目標。在為數據中心配置綠色電力上,國家電網有限公司中遵循“資源稟賦”原則。對于綠色電力資源豐富的地區,國家電網落實國家實施方案,積極推動利用清潔能源電力,保障數據中心供電;對于缺乏綠色電力資源的地區,國家電網也在現有綠電交易的基礎上,擴大可再生能源市場化交易范圍,鼓勵數據中心企業參與可再生能源市場交易。在應對負荷增加上,國家電網各?。▍^市)公司通過推動負荷中心常規電源建設、提升跨區輸電能力、優化區域主網架等各種措施,確保安全可靠供電。
東數西算工程中的數據中心是典型的關鍵信息基礎設施。對于信息通信行業中的網絡安全企業來說,東數西算工程會給數據資產安全性問題帶來巨大挑戰。華順信安是一家主營網絡安全業務的公司,該公司專家告訴《經濟》雜志、經濟網記者,未來數十年間,東部大數據將爆炸式地涌現,這必將加大數據資產的流動性、動態性和聚集性,也必然會使得數據資產面臨來自網絡空間里的各類惡意攻擊。惡意攻擊者將會猙獰地竊取、惡意銷毀數據資產,甚至是去破壞對數據資產的算力支撐。因此,在東數西算工程的規劃、建設甚至運維階段,都要確保網絡安全。
另外,東數西算工程讓“數據”和“算力”實現了具有規劃性的深度融合,這意味著,數據蘊含的更多價值將會被挖掘發現,數據要素將會在數字經濟建設過程中發揮出更大的作用。以數據為重要核心資源的新型高科技企業,會在東數西算工程加持下獲得加速發展的良機。
而運營商的優勢在于算力網絡。算力網絡是云網融合數字基礎設施的特征和重要組成部分,電信運營商是算力網絡建設的主力軍。在2021年7月舉行的國際電信聯盟電信標準化部門(ITU-T)第13研究組(SG13)報告人會議上,通過了由中國電信研究院網絡技術研究所牽頭的算力網絡框架與架構標準(Y.2501),成為首項獲得國際標準化組織通過的算力網絡標準。
技術支撐是“東數西算”工程成功推進的核心。包括華為、騰訊、阿里等互聯網企業已經在“東數西算”算力樞紐節點地區布局或投產了數據中心,為東數西算工程落地助力。過去一年多,隨著鵬城云腦II和武漢人工智能計算中心的上線,華為逐漸參與各地人工智能計算中心的建設,騰訊在不同區域均部署了數據中心,以保證數據安全和穩定性。
當下,目之所及的算力經濟可能只是未來發展前景的冰山一角。電力時代有“電網”,進入算力時代,也將有“算網”??梢韵胂?,在實現基礎性原始創新和大量技術攻關后,算力未來會“飛入尋常百姓家”。像用水、電一樣,使用算力將更為簡單、便捷。(薛新怡對本文亦有貢獻)
(來源:《經濟》雜志;作者: 翟曉汀 張軍紅)