WEEX 唯客博客, 作者: Alex Xu , Mint Ventures 引言 截止目前來看,本輪加密牛市周期是商業創新上最為乏味的一輪,缺少上一輪牛市 DeFi 、 NFT 、 Gamefi 這樣的現象級熱潮賽道,導致整體市場行情缺少產業熱點,用戶、產業投資和開發者的增長都比較乏力。 這也反映在目前的資產價格上,整輪周期來看,大部分 Alt coins 對於 BTC 的匯率持續失血,其中也包括 ETH 。畢竟智能合約平台的估值是由應用的繁榮程度決定的,當應用的發展創新乏善可陳,公鏈的估值也很難抬升。 而 AI 作為本輪較新的加密商業門類,受益於外部商業世界爆炸式的發展速度和持續不斷的熱點,仍有可能為加密世界的 AI 賽道項目帶來不錯的注意力增量。 而在筆者 4 月發布的 IO . NET 報告中,梳理了 AI 與 Crypto 結合的必要性,即加密經濟方案在確定性、調動配置資源和免信任上的優勢,可能是解決 AI 隨機性、資源密集和人機難辨三個挑戰的方案之一。 在加密經濟領域的 AI 賽道,筆者嘗試再通過一篇文章,對一些重要問題進行討論和推演,包括: · 加密 Ai 賽道還有哪些萌芽中,或將在未來爆發的敘事 · 這些敘事的催化路徑和邏輯 · 敘事相關的項目標的 · 敘事推演的風險和不確定性 本文為筆者截至發表時的階段性思考,未來可能可能發生改變,且觀點具有極強的主觀性,亦可能存在事實、數據、推理邏輯的錯誤,請勿作為投資參考,歡迎同業的批評和探討。 以下為正文部分。 加密 AI 賽道的下一波敘事 在正式盤點加密 AI 賽道的下一波敘事前,我們先來看一下目前的加密 AI 的主要敘事,從市值排序來看,超過 10 億美金的分別有: 算力: Render ( RNDR ,流通市值 38.5 億)、 Akash (流通市值 12 億)、 IO . NET (最近一輪一級融資估值 10 億) 演算法網路: Bittensor ( TAO ,流通市值 29.7 億) AI 代理: Fetchai ( FET ,合併前流通市值 21 億) 數據時間:2024.5.24,貨幣單位均為美金。 除了以上幾個領域,下一個單項目市值超 10 億的 AI 賽道會是哪個? 筆者覺得可以從兩個視角來推測:「產業供給端」的敘事和「 GPT 時刻」的敘事。 AI 敘事的第一個視角:從產業供給端,看 AI 背後的能源和數據賽道機會 從產業供應端來看, AI 發展的四個推動力為: · 演算法:優質的演算法能更高效地執行訓練和推理任務 · 算力:無論是模型訓練還是模型推理,都需要 GPU 硬體提供算力,這也是當下主要的產業瓶頸,行業缺芯導致中高端晶元價格高企 · 能源: AI 所需的數據計算中心會產生大量的能源消耗,除了 GPU 本身執行計算任務所需的電力之外,處理 GPU 散熱的也需要非常多的能源,一個大型數據中心冷卻系統就佔總能源消耗的 40% 左右 · 數據:大模型性能的提升需要擴大訓練參數,這意味著海量的優質數據需求 針對上述四個產業的推動力,演算法和算力賽道均有流通市值超過 10 億美金的加密項目,而能源和數據賽道尚未出現同市值體量的項目。 而實際上,能源和數據的供給短缺或許將很快來臨,成為新一波的產業熱點,從而帶動加密領域相關項目的熱潮。 我們先來說能源。 2024 年 2 月 29 日,馬斯克在博世互聯世界 2024 大會上談到:「我在一年多前就預測過晶元短缺,下一個短缺的將是電力。我認為,明年將沒有足夠的電力來運行所有的晶元。」 從具體數據來看,李飛飛領導的斯坦福大學人工智慧研究所( Human – Centered Artificial Intelligence )每年都會發布《 AI 指數報告》,在該團隊 2022 年發布的、針對 21 年 AI 產業的報告中,研究小組評估認為當年 AI 耗能規模只佔全球電力需求的 0.9%,對能源和環境的壓力有限。而 2023 年,國際能源署( IEA )對 2022 年的總結是:全球數據中心消耗了大約 460 太瓦時( TWh )的電力,佔全球電力需求的 2%,並預測到 2026 年,全球數據中心能耗最低也會有 620 太瓦時,最高會達到 1050 太瓦時。 而實際上,國際能源署的估測仍然保守了,因為目前已經有大量圍繞 AI 的項目即將上馬,其對應的能源需求規模遠超其 23 年的想象。 比如微軟和 Open AI 正在籌劃的星際之門( Stargate )項目。這個計劃預計在 2028 年啟動,2030 年左右建成,該項目計劃構建一台擁有數百萬個專用 AI 晶元的超級計算機,為 Open AI 提供前所未有的計算能力, 支持其在人工智慧尤其是大型語言模型方面的研發。該計劃預計耗資超過 1000 億美金,比當下的大型數據中心成本還要高出 100 倍。 而僅僅星際之門一個項目的能耗就高達 50 太瓦時。 也正是因為如此, OpenAI 的創始人山姆奧特曼在今年 1 月的達沃斯論壇上談到:「未來人工智慧需要能源突破,因為人工智慧消耗的電力將遠遠超出人們的預期。」 在算力和能源之後,快速增長的 AI 行業的下一個短缺的領域很可能是數據。 或者說, AI 所需要的優質數據的短缺已經成為現實。 目前人類從 GPT 的進化中,已經基本摸清了大語言模型能力增長的規律——即通過擴大模型參數和訓練數據,就能指數級別提升模型的能力——且這一進程短期還看不到技術瓶頸。 但問題是優質且公開的數據在未來或許將越來越稀少, AI 產品在數據上可能會面臨跟晶元、能源一樣的供需矛盾。 首先是數據所有權的爭端增加。 2023 年 12 月 27 日,《紐約時報》正式向美國聯邦地方法院起訴 OpenAI 和微軟,指控它們未經許可使用了自己數百萬篇文章用於訓練 GPT 模型,要求它們對「非法複製和使用獨特價值的作品承擔數十億美元的法定和實際損害賠償」,還要銷毀所有包含《紐約時報》版權材料的模型和訓練數據。 此後的 3 月底,《紐約時報》發表了一篇新的聲明,矛頭不僅指向了 Open AI ,還瞄準了 Google 和 Meta 。《紐約時報》這份聲明中說, Open AI 通過一款名為 Whisper 的語音識別工具轉錄了大量 YouTube 視頻中的語音部分,然後生成文字,作為文本來訓練 GPT -4。《紐約時報》表示,現在大公司訓練 AI 模型時使用小偷小摸的手段已經非常普遍,並表示這樣的事谷歌也在做,他們也把 YouTube 視頻內容轉成文字,用於自己大模型的訓練,本質上侵犯了視頻內容創作者的權益。 《紐約時報》與 Open AI 作為「 AI 版權第一案」,考慮到案件內容的複雜性和對內容和 AI 產業未來的深遠影響,未必很快能得出一個結果。最終可能的結果之一是雙方庭外和解,財大氣粗的微軟和 Open AI 支付一筆大額補償金。但未來更多的數據版權摩擦勢必將抬高優質數據的綜合成本。 此外,作為世界上最大的搜索引擎, Google 也曝出正在考慮對自己的搜索功能收費,只不過收費對象不是普通大眾,而是 AI 公司。 來源:路透社 谷歌的搜索引擎伺服器里保存著大量內容,甚至可以說是自從 21 世紀以來所有互聯網頁面上出現過的內容谷歌都保存著。而目前 AI 驅動的搜索產品,海外的如 perplexity ,國內的如 Kimi 、秘塔,都對這些搜索到的數據通過 AI 進行加工,再輸出給用戶。搜索引擎對 AI 的收費,必然提升數據的獲取成本。 實際上,除了公開的數據之外, AI 巨頭們還盯上了非公開的內部數據。 Photobucket 是一家老牌的圖片和視頻託管網站, 在 2000 年代初曾擁有 7000 萬用戶和近一半的美國在線照片市場份額。隨著社交媒體的興起, Photobucket 用戶數量大幅下降,目前僅剩 200 萬活躍用戶(它們每年要支付 399 美金的高昂費用),而根據用戶註冊時簽署的協議和隱私政策,超過一年沒用使用的賬戶會被回收,還支持 Photobucket 對用戶上傳的圖片和視頻數據的使用權。 Photobucket 首席執行官 Ted Leonard 透露,其擁有的 13 億張照片和視頻數據對訓練生成式 AI 模型極具價值。他正在與多家科技公司就出售這些數據進行談判,報價範圍從每張照片 5 美分到 1 美元不等,每段視頻超過 1 美元,其估計 Photobucket 可提供的數據價值超過 10 億美金。 專註於人工智慧發展趨勢的研究團隊 EPOCH ,根據 2022 年機器學習對數據的使用和新數據的生成情況,再考慮計算資源的增長,曾經發表了一篇關於機器學習所需的數據的情況報告《 Will we run out of data ? An analysis of the limits of scal in g data sets in Mach in e Learn in g》,報告的結論是高質量的文本數據大約會在 2023 年 2 月到 2026 年之間用盡,圖像數據則會在 2030 年到 2060 年間用盡。如果數據的利用效率不能顯著提高,或出現新的數據來源, 目前依賴於海量數據集的大型機器學習模型趨勢可能會放緩。 而就目前 AI 巨頭們紛紛高價採買數據的情況來看,免費的優質文本數據真的已經基本用盡, EPOCH 在 2 年前的預測是比較準確的。 同時,圍繞「 AI 數據短缺」的需求的解決方案也在出現,即: AI 數據提供服務。 Defined . ai 就是一家為 AI 公司提供定製化真實高質量數據的公司。 Defined.ai 所能提供的數據類型舉例:https://www.defined.ai/datasets 它的生意模式是: AI 公司給 Defined . ai 提供自己對於數據的需求,比如就圖片而言,質量方面需要解析度達到多少以上、避免模糊、過曝、內容真實。內容方面 AI 公司可以根據自己的訓練任務,定製特定的主題,比如需要夜裡的照片、夜裡的錐桶、停車場、指示牌,用來提高 AI 在夜景下的識別率。大眾都可以領任務,拍完上傳由公司審核,然後把符合要求的部分按張數結算,價格大約是一張高質量的圖片 1-2 美元,一個十幾秒的短片 5-7 美元,一部 10 分鐘以上的高質量影片 100-300 美元,文本是千字 1 美元,領分包任務的人可以得到其中 20% 左右的費用。數據提供可能會成為「數據標記」之後的又一門眾包生意。 全球範圍的任務眾包分配、經濟激勵、數據資產的定價/流通和隱私保護、人人可以參與,聽起來就特別像一門適合 Web3 範式的商業門類。 產業供給端視角下的 AI 敘事標的 晶元短缺引發的關注滲透到加密行業,讓分散式算力成為了截止目前最熱門、市值最高的 AI 賽道類別。 那麼 AI 產業在能源和數據上的供需矛盾如果在未來 1-2 年中爆發,加密行業目前有哪些敘事相關的項目? 先來看能源類的標的。 已經上線了頭部 CEX 的能源類項目非常稀少,僅有 Power Ledger (代幣 Powr )一個。 Power Ledger 於 2017 年立項,是一個基於區塊鏈技術的綜合能源平台,旨在實現能源交易的去中心化,推動個人和社區直接交易電力,支持可再生能源的廣泛應用,並通過智能合約確保交易的透明和高效。最初 Power Ledger 基於以太坊改造而來的聯盟鏈運行。2023 年下半年, Power Ledger 更新了白皮書,並推出了自己的綜合型公鏈,該公鏈基於 Solana 的技術框架改造而來,便於處理分散式能源市場中的高頻微交易。目前 Power Ledger 的主要業務包括: · 能源交易:允許用戶點對點地直接買賣電力,特別是來自可再生能源的電力。 · 環境產品交易:比如碳信用和可再生能源證書的交易,以及基於環境產品的融資。 · 公鏈運營:吸引應用開發者在 Powerledger 區塊鏈上構建應用,公鏈的交易費用以 Powr 代幣支付。 目前 Power Ledger 項目的流通市值為 1.7 億 $,全流通市值為 3.2 億 $。 相比能源類的加密標的,數據賽道的加密標的數量則更豐富一些。 筆者僅羅列目前自己關注的,並已經至少上線了幣安、 OKX 和 Coinbase 其中一家 CEX 的數據賽道項目,且按照 FDV 從低至高排列: 1. Streamr – DATA Streamr 的價值主張是構建一個去中心化的實時數據網路,允許用戶自由地交易和分享數據,同時保持對自己數據的完全控制。通過其數據市場, Streamr 希望使數據生產者能夠直接向感興趣的消費者銷售數據流,無需中介機構,從而降低成本並提高效率。 來源:https://streamr.network/hub/projects 在實際的合作案例中, Streamr 與另一個 Web3 車載硬體項目 DIMO 合作,通過裝載在車輛上的 DIMO 硬體感測器收集溫度、氣壓和其他數據,形成天氣數據流傳輸給需要的機構。 與其他數據項目相比, Streamr 更側重於物聯網、硬體感測器的數據,除了上面提到的 DIMO 車載數據之外,其他項目還有赫爾辛基的實時交通數據流等。因此, Streamr 的項目代幣 DATA 也曾經在去年 12 月, Depin 概念最火熱的時候一度創造出了單日翻倍的漲幅。 目前 Streamr 項目的流通市值為 4400 萬 $,全流通市值為 5800 萬 $。 2. Covalent – CQT 與其他數據類項目不同的是, Covalent 提供的是區塊鏈數據。 Covalent 網路通過 RPC 從區塊鏈節點讀取數據,然後對這些數據進行處理和組織,創建一個高效的查詢資料庫。這樣, Covalent 的用戶們可以快速地檢索到他們需要的信息,而不必直接從區塊鏈節點進行複雜的查詢,這類服務也被稱為「區塊鏈數據索引」。 Covalent 的客戶以 B 端為主,其中既有 Dapp 項目,比如各種 Defi ,也包括很多中心化加密公司,比如 Consensys ( Metamask 的母公司), CoinGecko ( 知名加密資產行情站 )、 Rotki ( 稅務工具 )、 Rainbow ( 加密錢包 ) 等,此外傳統金融行業中的巨頭富達、四大會計事務所安永,也是 Covalent 的客戶。根據 Covalent 官方披露的數據,項目的來自於數據服務的收入已經超過同領域的頭部項目 The Graph 。 Web3 行業由於鏈上數據的完整性、公開性、真實性以及實時性,有望成為細分 AI 場景和特定「 AI 小模型」的優質數據來源。 Covalent 作為數據提供方,已經開始為各類 AI 場景提供數據,並推出了專門面向 AI 的可驗證的結構化數據。 來源:https://www.covalenthq.com/solutions/decentralized-ai/ 比如為鏈上智能交易平台 SmartWhales 提供數據,利用 AI 識別出盈利的交易模式和地址; Entendre Finance 則通過 Covalent 的結構化數據,經過 AI 處理用於實時洞察、異常檢測和預測分析等。 目前來看, Covalent 提供的鏈上數據服務的主要場景仍以金融為主,但隨著 Web3 產品和數據類型的泛化,鏈上數據的使用場景也將進一步拓展。 目前 Covalent 項目的流通市值為 1.5 億 $,全流通市值為 2.35 億 $,相對於同賽道的區塊鏈數據索引項目 The Graph ,具有比較明顯的估值優勢。 3. Hivemapper – Honey 在所有數據素材中,視頻數據的單價往往是最高的。 Hivemapper 可以為 AI 公司提供包括視頻和地圖信息在內的數據。 Hivemapper 本身是一個去中心化的全球地圖項目,旨在通過區塊鏈技術和社區貢獻來創建一個詳細、動態且可訪問的地圖系統。參與者可以通過行車記錄儀( dashcam )捕捉地圖數據並將其添加到開源的 Hivemapper 數據網路中,並基於貢獻獲得項目代幣 HONEY 的獎勵。為了提高網路的效應和降低交互成本, Hivemapper 構建在 Solana 上。 Hivemapper 最早成立於 2015 年,最初的願景是使用無人機創建地圖,但後來發現這種模式難以擴展,從而轉向使用行車記錄儀和智能手機來捕捉地理數據,降低了全球地圖製作的成本。 與 Google map 等街景和地圖軟體相比,Hive map per 通過激勵網路和眾包模式,能更高效地拓展地圖覆蓋範圍、保持地圖實景的新鮮度、提升視頻質量。 在 AI 對數據的需求爆發之前, Hivemapper 的主要客戶包括汽車產業的自動駕駛部門、導航服務公司、政府、保險和地產公司等。如今 Hivemapper 則可以通過 API 為 AI 和大模型提供廣泛的道路和環境數據,通過不斷更新的圖像和道路特徵數據流的輸入, AI 和 ML 模型將能夠更好地將數據轉化為能力的提升,執行與地理位置、視覺判斷有關的任務。 數據來源:https://hivemapper.com/blog/diversify-ai-computer-vision-models-with-global-road-imagery-map-data/ 目前 Hivemapper – Honey 項目的流通市值為 1.2 億 $,全流通市值為 4.96 億 $。 除了以上三個項目之外,數據賽道的項目還有 The Graph – GRT (流通市值 32 億 $, FDV 37 億 $),其業務與 Covalent 類似,也提供區塊鏈數據索引的服務;以及 Ocean Protocol – OCEAN (流通市值 6.7 億 $, FDV 14.5 億 $,本項目即將與 Fetch . ai 和 SingularityNET 合併,代幣轉換為 ASI ),一個開源協議,旨在促進數據和數據相關服務的交換和貨幣化,將數據消費者與數據提供者連接起來,從而在保證信任、透明和可追溯性的前提下共享數據。 AI 敘事的第二個視角: GPT 時刻再現,通用人工智慧降臨 在筆者看來,加密行業里「 AI 賽道」的元年是 GPT 震驚世界的 2023 年,加密 AI 項目的暴漲,更多是 AI 產業爆炸式發展帶來的「熱度餘波」。 雖然 GPT3 .5 之後 GPT4 、 turbo 等的能力不斷升級,以及 Sora 在視頻創作能力的驚人展現,包括 Open AI 之外的大語言模型也快速發展,但不可否認的是 AI 的科技進步給大眾帶來的認知衝擊正在減弱,人們開始逐漸使用 AI 工具,大規模的崗位替代似乎還未發生。 那麼,未來 AI 領域是否還會再現「 GPT 時刻」,出現讓大眾震驚的 AI 跨越式發展,讓人們意識到自己的生活和工作都將因此被改變? 這個時刻可能是通用人工智慧( AGI )的降臨。 AGI 指的是機器擁有類似於人類的綜合認知能力,能夠解決各種複雜問題,而不僅限於特定任務。AGI 系統擁有高度的抽象思維、廣泛的背景知識、全領域的常識推理和因果關係理解、以及跨專業的遷移學習等能力。 AGI 的表現與各個領域最優秀的人類無異,就綜合能力來說則完…