算力風云:解碼未來計算大潮

WEEX 唯客博客, 作者:Iris Chen, Dr. Nick 一、需求與挑戰並存 《2022-2023全球計算力指數評估報告》指出,在全球GDP增速放緩的背景下,數字經濟仍然保持強勁的增長態勢,全球主要國家數字經濟佔GDP比重正逐年上升,預計樣本國家整體比重將從2022年的50.2%提高到2026年的54.0%,算力已逐漸成為推動經濟增長的主要力量。計算力指數每提高1點,國家的數字經濟和GDP將分別增長3.6‰和1.7‰。更為關鍵的是,當計算力指數超過40分時,每提升1點對GDP增長的推動力將高出40分以下的1.3倍,超過60分時甚至達到3倍。算力先發地區的優勢會隨著算力投資比重的增加獲得強化,進一步拉開與后發地區的差距,可見發展算力的重要性。   1、AIGC浪潮來襲,算力行業需求巨大 隨著人工智慧、區塊鏈、物聯網及AR/VR等關鍵技術的應用和發展,未來的算力需求將增加。預計到到2030年: 人工智慧:深入滲透到所有行業,將需要16000 EFLOPS的算力(相當於在智能手機中嵌入1600億個高通驍龍855 NPU2) 區塊鏈:支持加密數字貨幣等領域,將需要5500 EFLOPS的算力(相當於13億個AntMiner V9) 物聯網:連接工廠和家庭的所有設備,將需要8500 EFLOPS的算力(相當於在高端物聯網邊緣設備中使用79億個晶元) Space computing/AR/VR/Metaverse:在充分發揮潛力的情況下,將需要3900 EFLOPS的算力(相當於21億個SONY PS4控制台) 與此同時,2022年ChatGPT爆火引發AIGC浪潮來襲,算力需求進一步增加。Open AI發布的GPT系列中,GPT3是由1750億參數組成的語言模型,GPT4的參數更是達萬億級別,隨著大模型參數量的日益增大,訓練一個AI模型所需的算力將每兩年增長275倍。這將全球AI計算市場規模增速推至新高度,IDC預測,2026年全球AI計算市場規模將達346.6億美元,其中生成式AI計算市場將從2022年的8.2億美元增長到2026年的109.9億美元,佔AI計算市場份額從4.2%增長到31.7%。在此發展趨勢下,未來對算力的需求巨大。   2、安全威脅成本難減,算力行業面臨挑戰 (1)    安全:算力網路靈活接入,分散式資源節點多 算力網路由算網服務層、算網調度層、算力中心、邊緣算力/用戶中心、算力承載網路五個主要部分組成。然而,這一架構在提供高效、靈活的計算服務的同時,也帶來了一系列安全挑戰: 算力網路具有算力泛在、靈活接入等特點,頻繁的資源鏈接將導致資源的攻擊暴露面增加 算力網路中流通著海量且涉及機密隱私的數據,在傳輸過程中被篡改或泄露將造成嚴重後果 算力服務是端到端服務,用戶群體龐大,分散式資源節點數量較多,數據信息管理較繁雜,存證溯源困難 算網新型架構新增算網感知單元、算網控制單元等網元,管控複雜度提升 (2)    成本:GPU供不應求,算力閑置嚴重 隨著Al的繁榮,對GPU的需求激增。目前大部分GPU市場由英偉達佔據,然而英偉達晶元供貨量緊張,價格也水漲船高,以A100 GPU為例,其市場單價已達15萬元,兩個月內漲幅超50%。同時,大模型的應用將更大地提高算力成本。經測算,1萬枚英偉達A100晶元是做好AI大模型的算力門檻,像GPT3的單次訓練成本已高於1200萬美元。 同時,GPU存在算力閑置問題。GPT3訓練1750億個參數的模型需要在內存中保存超過1TB的數據,這超過了當今現有的任何GPU,受限於內存,需要更多的GPU進行并行計算和存儲,導致GPU利用率低和算力閑置。而同樣因為受限於內存,模型複雜度與所需要的GPU數量並不是線性增長關係,這將加重GPU利用率低的問題,GPT4在大約25000個A100 GPU上進行90到100天的訓練,其算力利用率僅為32%至36%。還有很多算力存在於獨立數據中心、加密礦工和MacBook、遊戲PC等用戶的消費設備中,這些資源很難聚合和利用。   隨著算力的蓬勃發展,電力需求也將快速增長。預計2023-2027年全球數據中心電力需求為430-748太瓦時,相當於2024-2027年全球電力需求的2-4%,這給電力基礎設施帶來挑戰。摩根士丹利預測,在GPU利用率從60%提高到70%的基準情境下,全球數據中心在2023-2027年的總電力容量將達70-122吉瓦,複合年增長率為20%,具體而言: 牛市情景下(90%的晶元利用率):預計2023-2027年全球數據中心的電力需求為446-820太瓦時 熊市情景下(50%的晶元利用率):預計2023-2027年全球數據中心的電力需求為415-677太瓦時 因此,能夠滿足算力快速增長的電力需求的公司將從這一趨勢中收益,特別是那些能夠減少數據中心供電延遲的電力解決方案提供商。 二、發展趨勢及項目介紹 1、去中心化計算為Web 3提供安全低成本的算力解決方案 Web 1的本質是聯合,網頁是「只讀的」,用戶只能搜索信息,瀏覽信息;Web 2的本質是互動,網站是「可寫可讀的」,用戶不僅僅是內容的接收方,還可以參與創作內容。而Web 3是萬物互聯的時代,網站是「可讀可寫可持有的」,用戶所創數字內容的所有權和控制權都歸屬於自己,可以自主選擇與他人簽訂協議進行分配。Web 3作為下一代互聯網的代表,強調去中心化、開放性和用戶主權,而去中心化計算區別於傳統雲計算,有效滿足了現代技術驅動的計算需求,成為Web 3基礎設施的核心。隨著互聯網新技術的發展和數據量的進一步擴大,去中心化應用市場發展前景廣闊,智研諮詢預測,預計2025年全球去中心化應用市場規模將達11855.4億美元。   面對算力行業的安全、成本及電力挑戰,建設去中心化的分散式算力網路是AI基礎設施發展的重要方向。去中心化計算通過算力的租賃、共享、調度等綜合利用現有計算資源,為Web 3生態系統中的各種應用提供了一個安全、低成本、無停機服務的算力解決方案。與傳統的中心化系統相比,去中心化計算的具體優勢如下: 》安全 參與者都具有處理能力。如果一個參與者受到威脅,其他參與者可以做出反應。 允許分散式控制和決策。有助於確保沒有任何單個實體能夠對互聯網或其用戶實施完全控制,用戶不太可能受到監控或審查,在線隱私和言論自由更大。 》低成本:去中心化計算將成本和責任分散到多個實體,在長期內更加可負擔和可持續,目前市場上的Web 3去中心化算力平台能夠提供比中心化算力平台普遍低80-90%的價格。 更便宜的計算能力。在傳統數據中心中,成本構成為伺服器(30%)、住房(12%)、網路(15%)、AC(21%)、電源(17%)和人工(5%),而去中心化計算依賴於用戶以互利的方式共享資源和貢獻計算能力,理論上可以節省70%的成本。 更便宜的訓練成本。去中心化計算允許藉助數千個無伺服器技術的并行線程,可以將GNN訓練擴展到十億個邊緣模型。據UCLA的研究,對於大模型,去中心化計算每美元可以提供比傳統系統高2.75倍的性能,對於稀疏性大模型,去中心化計算快1.22倍,便宜4.83倍。 更便宜的部署成本。傳統的AI解決方案需要在軟體開發、基礎設施和人才方面進行大量投資。而去中心化計算可以讓開發者利用現有的資源和基礎設施,使構建和部署AI應用程序變得更容易。同時能使AI開發民主化,用戶可以共享計算資源併合作開發AI解決方案。 更加適合AI的基礎設施。通過降低訓練和計算的成本,去中心化計算有潛力使更多的組織和個人使用AI,並推動眾多行業的增長和創新。 》無停機服務:去中心化網路節點分散,理論上永不宕機,不存在單點故障。 項目介紹 Akash Network:去中心化雲計算市場,可讓用戶安全高效地買賣計算資源。區別於其他去中心化平台,用戶可以在Akash託管容器上運行任何雲原生應用程序,沒有必要用新的專有語言重寫整個互聯網,也沒有供應商鎖定來阻止切換雲提供商。 io.net:去中心化計算網路,允許機器學習工程師以低於中心化服務的成本訪問分散式雲集群。有IO工人、IO雲、IO瀏覽器等特色產品,在Solana上估值超10億美元。 2、AI推動高性能計算,高性能計算賦能AI 高性能計算是指使用超級計算機和并行計算機集群解決高級計算問題的計算系統。該類系統通常比最快的桌面電腦、筆記本電腦或伺服器系統快100萬倍以上,在自動駕駛汽車、物聯網和精準農業等已建立和新興領域都有廣泛的應用。 高性能計算在數據中心總可用市場中僅佔5%左右的份額,但隨著AI的快速發展和大模型的運用,AI和高性能數據分析工作負載的增加推動著HPC系統設計的變化,HPC也對AI進行賦能,兩者互相推動發展。全球HPC支出在2022年約為370億美元,Hyperion預測,將在2026年達到520億美元,同時HPC賦能的AI市場在2020-2026年複合增長率將達到22.7%。   項目介紹 Arweave:最新提出的AO協議,用非以太坊模塊化方案的架構,可在存儲公鏈上實現超高性能運算甚至達成准Web2的體驗,給了Web3 x AI一個很好的新基建。 iExec:提供高性能計算服務的去中心化雲計算平台,允許用戶租用計算資源以執行計算密集型任務,例如數據分析、模擬和渲染等。 CETI:由crypto.com前CEO創辦,瞄準企業級的高性能計算中心。 3、人機交互轉折點:空間計算 空間計算是指通過使用AR/VR技術,將用戶的圖形界面融入真實物理世界,從而改變人機交互的計算機。2015年Microsoft發布MR頭顯Hololens是現代空間計算的一個里程碑,儘管並未普及,但它證明了空間計算的潛力,而今年Apple發布的Vision Pro帶來了更精準的空間感知技術和更深入的用戶交互體驗,將空間計算推向熱點。 實際上,我們正在到達人機交互的一個轉折點:從傳統的鍵盤和滑鼠配置轉向觸摸手勢、對話式AI和增強視覺計算交互的邊緣。據IDC的預測,2023年全球VR設備的出貨量將達917萬台,同比增長7%,而AR設備的出貨量為44萬台,同比增長57%,預計未來四年,VR市場將以每年20%以上的速度增長,而AR市場將達70%以上,AR/VR技術的發展將大大提高空間計算的重要性。繼PC和智能手機之後,空間計算有潛力推動下一波顛覆性變革——使技術成為我們日常行為的一部分,用實時數據和通信連接我們的物理和數字生活。   項目介紹 Clore.ai:連接租戶和需要GPU的用戶的平台,旨在讓用戶能夠以具有競爭力的價格和靈活的條款訪問強大的計算資源。其強大的GPU允許用戶以專業水平渲染電影,顯著下降所需的時間,並且與各種渲染引擎兼容,也可用於AI訓練、挖礦。 Render Network:去中心化的GPU渲染平台,旨在推進下一代渲染與AI技術,用戶能夠按需將GPU渲染工作擴展到世界各地的高性能GPU節點。 4、邊緣計算成為雲計算的重要補充 邊緣計算是指在物理位置上更靠近終端設備的位置處理數據,其中「邊緣」在與最終用戶的往返時間最多為20毫秒的位置,邊緣計算將算力資源部署在離終端設備更近的位置,使得數據可以在本地進行處理,從而減少了數據傳輸到雲端進行處理的延遲和網路帶寬的壓力,因此在延遲、帶寬、自主性和隱私方面更具優勢。   Facebook、亞馬遜、微軟、谷歌和蘋果等科技巨頭都在投資邊緣計算和邊緣位置(從內部IT和OT到外部、遠程站點),以更接近最終用戶和數據生成的地方。美銀預測,預計到2025年,75%的企業生成數據將在邊緣創建和處理,到2028年,邊緣計算的市場規模將達到4040億美元,2022-28年複合年增長率為15%。   項目介紹 Aethir:雲計算基礎設施平台,2024年4月推出Aethir Edge,作為Aethir唯一授權的挖礦設備,Aethir Edge正在引領去中心化邊緣計算的發展,帶領邊緣計算的未來邁向民主化。 Theta Network:去中心化視頻傳輸服務平台,旨在解決現有視頻傳輸系統中高成本和低效率等瓶頸問題。計劃於2024年第二季度推出基於完全跨越邊緣架構的混合雲計算平台Theta EdgeCloud。 5、AI訓練有望全面轉向AI推理 在去中心化的趨勢下,AI訓練並不是目前DePIN最好的落地場景。AI生產對算力的要求主要圍繞AI推理和AI訓練兩方面。AI訓練指通過投喂大量的數據,訓練出一個複雜的神經網路模型,AI推理指利用訓練好的模型,使用大量數據推理出各種結論,因此,去中心化與算力結合,難度係數從訓練到微調訓練再到推理是逐層遞減的。若在以太坊上構建一個去中心化算力應用供GPT使用,僅單個矩陣乘法運算將消耗Gas費高達100億美元並且需要1個月之久,每個token(1000 token約等於750個單詞)的訓練成本通常約為6N(N是大語言模型的參數數量),而推理成本僅約為2N,也就是說推理成本大約相當於訓練成本的三分之一。 同時,相較於AI訓練,AI推理與消費電子等大規模應用終端的需求聯繫更為緊密。Counterpoint Research預測,全球PC市場的出貨量將在2024年回到疫情前的水平,預計從2020年起,AI PC將以50%的複合增速增長,並在2026年後主導PC市場。隨著2024年AI PC、AI智能手機等全新融合AI的消費電子產品的湧現,端側AI大模型及AI軟體大規模應用趨勢將日益顯現,這也意味著AI推理的重要性日益凸顯,成為高效運行端側大模型及AI軟體背後的核心技術,AI行業的發展重心有望從訓練全面轉向推理。   項目介紹 Nosana:基於區塊鏈的分散式GPU資源共享平台,旨在解決市場上GPU短缺的問題。2023年轉向AI推理,率先推出了用於AI推理的大規模GPU計算網格,這是一個有目的地將區塊鏈技術集成到AI中的舉措,使其成為處理AI苛刻計算要求的理想工具。 Exabits:去中心化AI和高性能計算服務平台,旨在構建公平、易用、包容的AI生態系統,為AI模型訓練和推理提供負擔得起的加速計算。     WEEX唯客交易所官網:weex.com

Previous:

Next: