加密 AI 賽道的下一波敘事推演:催化因素、發展路徑和相關標的

WEEX 唯客博客, 作者:Alex Xu   引言 截止目前來看,本輪加密牛市周期是商業創新上最為乏味的一輪,缺少上一輪牛市DeFi、NFT、Gamefi這樣的現象級熱潮賽道,導致整體市場行情缺少產業熱點,用戶、產業投資和開發者的增長都比較乏力。 這也反映在目前的資產價格上,整輪周期來看,大部分Alt coins對於BTC的匯率持續失血,其中也包括ETH。畢竟智能合約平台的估值是由應用的繁榮程度決定的,當應用的發展創新乏善可陳,公鏈的估值也很難抬升。 而AI作為本輪較新的加密商業門類,受益於外部商業世界爆炸式的發展速度和持續不斷的熱點,仍有可能為加密世界的AI賽道項目帶來不錯的注意力增量。 而在筆者4月發布的IO.NET報告中,梳理了AI與Crypto結合的必要性,即加密經濟方案在確定性、調動配置資源和免信任上的優勢,可能是解決AI隨機性、資源密集和人機難辨三個挑戰的方案之一。 在加密經濟領域的AI賽道,筆者嘗試再通過一篇文章,對一些重要問題進行討論和推演,包括: 加密Ai賽道還有哪些萌芽中,或將在未來爆發的敘事 這些敘事的催化路徑和邏輯 敘事相關的項目標的 敘事推演的風險和不確定性 本文為筆者截至發表時的階段性思考,未來可能可能發生改變,且觀點具有極強的主觀性,亦可能存在事實、數據、推理邏輯的錯誤,請勿作為投資參考,歡迎同業的批評和探討。 以下為正文部分。 加密AI賽道的下一波敘事 在正式盤點加密AI賽道的下一波敘事前,我們先來看一下目前的加密AI的主要敘事,從市值排序來看,超過10億美金的分別有: 算力:Render(RNDR,流通市值38.5億)、Akash(流通市值12億)、IO.NET(最近一輪一級融資估值10億) 演算法網路:Bittensor(TAO,流通市值29.7億) AI代理:Fetchai(FET,合併前流通市值21億) *數據時間:2024.5.24,貨幣單位均為美金。 除了以上幾個領域,下一個單項目市值超10億的AI賽道會是哪個? 筆者覺得可以從兩個視角來推測:「產業供給端」的敘事和「GPT時刻」的敘事。 AI敘事的第一個視角:從產業供給端,看AI背後的能源和數據賽道機會 從產業供應端來看,AI發展的四個推動力為: 演算法:優質的演算法能更高效地執行訓練和推理任務 算力:無論是模型訓練還是模型推理,都需要GPU硬體提供算力,這也是當下主要的產業瓶頸,行業缺芯導致中高端晶元價格高企 能源:AI所需的數據計算中心會產生大量的能源消耗,除了GPU本身執行計算任務所需的電力之外,處理GPU散熱的也需要非常多的能源,一個大型數據中心冷卻系統就佔總能源消耗的40%左右 數據:大模型性能的提升需要擴大訓練參數,這意味著海量的優質數據需求 針對上述四個產業的推動力,演算法和算力賽道均有流通市值超過10億美金的加密項目,而能源和數據賽道尚未出現同市值體量的項目。 而實際上,能源和數據的供給短缺或許將很快來臨,成為新一波的產業熱點,從而帶動加密領域相關項目的熱潮。 我們先來說能源。 2024年2月29日,馬斯克在博世互聯世界2024大會上談到:「我在一年多前就預測過晶元短缺,下一個短缺的將是電力。我認為,明年將沒有足夠的電力來運行所有的晶元。」 從具體數據來看,李飛飛領導的斯坦福大學人工智慧研究所(Human-Centered Artificial Intelligence)每年都會發布《AI指數報告》,在該團隊2022年發布的、針對21年AI產業的報告中,研究小組評估認為當年AI耗能規模只佔全球電力需求的0.9%,對能源和環境的壓力有限。而2023年,國際能源署(IEA)對2022年的總結是:全球數據中心消耗了大約460太瓦時(TWh)的電力,佔全球電力需求的2%,並預測到2026年,全球數據中心能耗最低也會有620太瓦時,最高會達到1050太瓦時。 而實際上,國際能源署的估測仍然保守了,因為目前已經有大量圍繞AI的項目即將上馬,其對應的能源需求規模遠超其23年的想象。 比如微軟和OpenAI正在籌劃的星際之門(Stargate)項目。這個計劃預計在2028年啟動,2030年左右建成,該項目計劃構建一台擁有數百萬個專用AI晶元的超級計算機,為OpenAI提供前所未有的計算能力,支持其在人工智慧尤其是大型語言模型方面的研發。該計劃預計耗資超過1000億美金,比當下的大型數據中心成本還要高出100倍。 而僅僅星際之門一個項目的能耗就高達50太瓦時。 也正是因為如此,OpenAI的創始人山姆奧特曼在今年1月的達沃斯論壇上談到:「未來人工智慧需要能源突破,因為人工智慧消耗的電力將遠遠超出人們的預期。」 在算力和能源之後,快速增長的AI行業的下一個短缺的領域很可能是數據。 或者說,AI所需要的優質數據的短缺已經成為現實。 目前人類從GPT的進化中,已經基本摸清了大語言模型能力增長的規律——即通過擴大模型參數和訓練數據,就能指數級別提升模型的能力——且這一進程短期還看不到技術瓶頸。 但問題是優質且公開的數據在未來或許將越來越稀少,AI產品在數據上可能會面臨跟晶元、能源一樣的供需矛盾。 首先是數據所有權的爭端增加。 2023年12月27日,《紐約時報》正式向美國聯邦地方法院起訴OpenAI和微軟,指控它們未經許可使用了自己數百萬篇文章用於訓練GPT模型,要求它們對「非法複製和使用獨特價值的作品承擔數十億美元的法定和實際損害賠償」,還要銷毀所有包含《紐約時報》版權材料的模型和訓練數據。 此後的3月底,《紐約時報》發表了一篇新的聲明,矛頭不僅指向了OpenAI,還瞄準了Google和Meta。《紐約時報》這份聲明中說,OpenAI通過一款名為Whisper的語音識別工具轉錄了大量YouTube視頻中的語音部分,然後生成文字,作為文本來訓練GPT-4。《紐約時報》表示,現在大公司訓練AI模型時使用小偷小摸的手段已經非常普遍,並表示這樣的事谷歌也在做,他們也把YouTube視頻內容轉成文字,用於自己大模型的訓練,本質上侵犯了視頻內容創作者的權益。 《紐約時報》與OpenAI作為「AI版權第一案」,考慮到案件內容的複雜性和對內容和AI產業未來的深遠影響,未必很快能得出一個結果。最終可能的結果之一是雙方庭外和解,財大氣粗的微軟和OpenAI支付一筆大額補償金。但未來更多的數據版權摩擦勢必將抬高優質數據的綜合成本。 此外,作為世界上最大的搜索引擎,Google也曝出正在考慮對自己的搜索功能收費,只不過收費對象不是普通大眾,而是AI公司。 來源:路透社 谷歌的搜索引擎伺服器里保存著大量內容,甚至可以說是自從21世紀以來所有互聯網頁面上出現過的內容谷歌都保存著。而目前AI驅動的搜索產品,海外的如perplexity,國內的如Kimi、秘塔,都對這些搜索到的數據通過AI進行加工,再輸出給用戶。搜索引擎對AI的收費,必然提升數據的獲取成本。 實際上,除了公開的數據之外,AI巨頭們還盯上了非公開的內部數據。 Photobucket是一家老牌的圖片和視頻託管網站,在2000年代初曾擁有7000萬用戶和近一半的美國在線照片市場份額。隨著社交媒體的興起,Photobucket用戶數量大幅下降,目前僅剩200萬活躍用戶(它們每年要支付399美金的高昂費用),而根據用戶註冊時簽署的協議和隱私政策,超過一年沒用使用的賬戶會被回收,還支持Photobucket對用戶上傳的圖片和視頻數據的使用權。Photobucket首席執行官Ted Leonard透露,其擁有的13億張照片和視頻數據對訓練生成式AI模型極具價值。他正在與多家科技公司就出售這些數據進行談判,報價範圍從每張照片5美分到1美元不等,每段視頻超過1美元,其估計Photobucket可提供的數據價值超過10億美金。 專註於人工智慧發展趨勢的研究團隊EPOCH,根據2022年機器學習對數據的使用和新數據的生成情況,再考慮計算資源的增長,曾經發表了一篇關於機器學習所需的數據的情況報告《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》,報告的結論是高質量的文本數據大約會在2023年2月到2026年之間用盡,圖像數據則會在2030年到2060年間用盡。如果數據的利用效率不能顯著提高,或出現新的數據來源,目前依賴於海量數據集的大型機器學習模型趨勢可能會放緩。 而就目前AI巨頭們紛紛高價採買數據的情況來看,免費的優質文本數據真的已經基本用盡,EPOCH在2年前的預測是比較準確的。 同時,圍繞「AI數據短缺」的需求的解決方案也在出現,即:AI數據提供服務。 Defined.ai就是一家為AI公司提供定製化真實高質量數據的公司。 Defined.ai所能提供的數據類型舉例:https://www.defined.ai/datasets 它的生意模式是:AI公司給Defined.ai提供自己對於數據的需求,比如就圖片而言,質量方面需要解析度達到多少以上、避免模糊、過曝、內容真實。內容方面AI公司可以根據自己的訓練任務,定製特定的主題,比如需要夜裡的照片、夜裡的錐桶、停車場、指示牌,用來提高AI在夜景下的識別率。大眾都可以領任務,拍完上傳由公司審核,然後把符合要求的部分按張數結算,價格大約是一張高質量的圖片1-2美元,一個十幾秒的短片5-7美元,一部10分鐘以上的高質量影片100-300美元,文本是千字1美元,領分包任務的人可以得到其中20%左右的費用。數據提供可能會成為「數據標記」之後的又一門眾包生意。 全球範圍的任務眾包分配、經濟激勵、數據資產的定價/流通和隱私保護、人人可以參與,聽起來就特別像一門適合Web3範式的商業門類。 產業供給端視角下的AI敘事標的 晶元短缺引發的關注滲透到加密行業,讓分散式算力成為了截止目前最熱門、市值最高的AI賽道類別。 那麼AI產業在能源和數據上的供需矛盾如果在未來1-2年中爆發,加密行業目前有哪些敘事相關的項目? 先來看能源類的標的。 已經上線了頭部CEX的能源類項目非常稀少,僅有Power Ledger(代幣Powr)一個。 Power Ledger於2017年立項,是一個基於區塊鏈技術的綜合能源平台,旨在實現能源交易的去中心化,推動個人和社區直接交易電力,支持可再生能源的廣泛應用,並通過智能合約確保交易的透明和高效。最初Power Ledger基於以太坊改造而來的聯盟鏈運行。2023年下半年,Power Ledger更新了白皮書,並推出了自己的綜合型公鏈,該公鏈基於Solana的技術框架改造而來,便於處理分散式能源市場中的高頻微交易。目前Power Ledger的主要業務包括: 能源交易:允許用戶點對點地直接買賣電力,特別是來自可再生能源的電力。 環境產品交易:比如碳信用和可再生能源證書的交易,以及基於環境產品的融資。 公鏈運營:吸引應用開發者在Powerledger區塊鏈上構建應用,公鏈的交易費用以Powr代幣支付。 目前Power Ledger項目的流通市值為1.7億$,全流通市值為3.2億$。 相比能源類的加密標的,數據賽道的加密標的數量則更豐富一些。 筆者僅羅列目前自己關注的,並已經至少上線了幣安、OKX和Coinbase其中一家CEX的數據賽道項目,且按照FDV從低至高排列: 1.Streamr – DATA Streamr的價值主張是構建一個去中心化的實時數據網路,允許用戶自由地交易和分享數據,同時保持對自己數據的完全控制。通過其數據市場,Streamr希望使數據生產者能夠直接向感興趣的消費者銷售數據流,無需中介機構,從而降低成本並提高效率。 來源:https://streamr.network/hub/projects 在實際的合作案例中,Streamr與另一個Web3車載硬體項目DIMO合作,通過裝載在車輛上的DIMO硬體感測器收集溫度、氣壓和其他數據,形成天氣數據流傳輸給需要的機構。 與其他數據項目相比,Streamr更側重於物聯網、硬體感測器的數據,除了上面提到的DIMO車載數據之外,其他項目還有赫爾辛基的實時交通數據流等。因此,Streamr的項目代幣DATA也曾經在去年12月,Depin概念最火熱的時候一度創造出了單日翻倍的漲幅。 目前Streamr項目的流通市值為4400萬$,全流通市值為5800萬$。 2.Covalent – CQT 與其他數據類項目不同的是,Covalent提供的是區塊鏈數據。Covalent網路通過RPC從區塊鏈節點讀取數據,然後對這些數據進行處理和組織,創建一個高效的查詢資料庫。這樣,Covalent的用戶們可以快速地檢索到他們需要的信息,而不必直接從區塊鏈節點進行複雜的查詢,這類服務也被稱為「區塊鏈數據索引」。 Covalent的客戶以B端為主,其中既有Dapp項目,比如各種Defi,也包括很多中心化加密公司,比如Consensys(Metamask的母公司), CoinGecko (知名加密資產行情站)、Rotki (稅務工具)、Rainbow (加密錢包)等,此外傳統金融行業中的巨頭富達、四大會計事務所安永,也是Covalent的客戶。根據Covalent官方披露的數據,項目的來自於數據服務的收入已經超過同領域的頭部項目The Graph。 Web3行業由於鏈上數據的完整性、公開性、真實性以及實時性,有望成為細分AI場景和特定「AI小模型」的優質數據來源。Covalent作為數據提供方,已經開始為各類AI場景提供數據,並推出了專門面向AI的可驗證的結構化數據。 來源:https://www.covalenthq.com/solutions/decentralized-ai/ 比如為鏈上智能交易平台SmartWhales提供數據,利用AI識別出盈利的交易模式和地址;Entendre Finance則通過Covalent的結構化數據,經過AI處理用於實時洞察、異常檢測和預測分析等。 目前來看,Covalent提供的鏈上數據服務的主要場景仍以金融為主,但隨著Web3產品和數據類型的泛化,鏈上數據的使用場景也將進一步拓展。 目前Covalent項目的流通市值為1.5億$,全流通市值為2.35億$,相對於同賽道的區塊鏈數據索引項目The Graph,具有比較明顯的估值優勢。 3.Hivemapper – Honey 在所有數據素材中,視頻數據的單價往往是最高的。Hivemapper可以為AI公司提供包括視頻和地圖信息在內的數據。Hivemapper本身是一個去中心化的全球地圖項目,旨在通過區塊鏈技術和社區貢獻來創建一個詳細、動態且可訪問的地圖系統。參與者可以通過行車記錄儀(dashcam)捕捉地圖數據並將其添加到開源的Hivemapper數據網路中,並基於貢獻獲得項目代幣HONEY的獎勵。為了提高網路的效應和降低交互成本,Hivemapper構建在Solana上。 Hivemapper最早成立於2015年,最初的願景是使用無人機創建地圖,但後來發現這種模式難以擴展,從而轉向使用行車記錄儀和智能手機來捕捉地理數據,降低了全球地圖製作的成本。 與Google map等街景和地圖軟體相比,Hivemapper通過激勵網路和眾包模式,能更高效地拓展地圖覆蓋範圍、保持地圖實景的新鮮度、提升視頻質量。 在AI對數據的需求爆發之前,Hivemapper的主要客戶包括汽車產業的自動駕駛部門、導航服務公司、政府、保險和地產公司等。如今Hivemapper則可以通過API為AI和大模型提供廣泛的道路和環境數據,通過不斷更新的圖像和道路特徵數據流的輸入,AI 和 ML模型將能夠更好地將數據轉化為能力的提升,執行與地理位置、視覺判斷有關的任務。 數據來源:https://hivemapper.com/blog/diversify-ai-computer-vision-models-with-global-road-imagery-map-data/ 目前Hivemapper – Honey項目的流通市值為1.2億$,全流通市值為4.96億$。 除了以上三個項目之外,數據賽道的項目還有The Graph – GRT(流通市值32億$,FDV 37億$),其業務與Covalent類似,也提供區塊鏈數據索引的服務;以及Ocean Protocol – OCEAN(流通市值6.7億$,FDV 14.5億$,本項目即將與Fetch.ai和SingularityNET合併,代幣轉換為ASI),一個開源協議,旨在促進數據和數據相關服務的交換和貨幣化,將數據消費者與數據提供者連接起來,從而在保證信任、透明和可追溯性的前提下共享數據。 AI敘事的第二個視角:GPT時刻再現,通用人工智慧降臨 在筆者看來,加密行業里「AI賽道」的元年是GPT震驚世界的2023年,加密AI項目的暴漲,更多是AI產業爆炸式發展帶來的「熱度餘波」。 雖然GPT3.5之後GPT4、turbo等的能力不斷升級,以及Sora在視頻創作能力的驚人展現,包括OpenAI之外的大語言模型也快速發展,但不可否認的是AI的科技進步給大眾帶來的認知衝擊正在減弱,人們開始逐漸使用AI工具,大規模的崗位替代似乎還未發生。 那麼,未來AI領域是否還會再現「GPT時刻」,出現讓大眾震驚的AI跨越式發展,讓人們意識到自己的生活和工作都將因此被改變? 這個時刻可能是通用人工智慧(AGI)的降臨。 AGI指的是機器擁有類似於人類的綜合認知能力,能夠解決各種複雜問題,而不僅限於特定任務。AGI系統擁有高度的抽象思維、廣泛的背景知識、全領域的常識推理和因果關係理解、以及跨專業的遷移學習等能力。AGI的表現與各個領域最優秀的人類無異,就綜合能力來說則完全超越最優秀的人類群體。 實際上,無論科幻小說和遊戲、影視作品之中的呈現,還是在GPT迅速普及之後的大眾預期,社會大眾對超越人類認知水平的AGI的出現早有預期。或者說,GPT本身就是AGI的先導產品,是通用人工智慧的預言版。 而GPT之所以有這麼大的產業能量和心理衝擊,在於其落地的速度和表現超越了大眾的預期:人們沒想到,一個能完成圖靈測試的人工智慧系統真的到來了,而且速度這麼快。 實際上,人工智慧(AGI)或許將在1-2年內再次復現「GPT時刻」的突然性:人們才剛剛適應GPT的輔助,就發現AI已經不僅僅是一個助手,它甚至能獨立完成極具創造性和挑戰的工作,包括那些困住人類頂尖科學家幾十年的難題。 在今年4月8日,馬斯克接受了挪威主權財富基金首席投資官Nicolai Tangen的採訪,談到了AGI出現的時間。 他說:「如果把AGI定義為比最聰明的那部分人類還要聰明的話,我認為它很可能在2025年出現。」 也就是按照他的推斷,最多就是還需要1年半的時間,AGI就將降臨。當然,他加了一個前提條件,就是「電力和硬體都跟得上的話。」 AGI的降臨的好處是顯而易見的。 它意味著人類的生產力水平將大跨步地上一個台階,大量困住我們幾十年的科研難題將迎刃而解。假如我們把「最聰明的那部分人類」定義為諾貝爾獎得主的水平,也就意味只要能源、算力、數據足夠,我們可以擁有無數個不知疲倦的「諾獎得主」,全天候攻關那些最難的科學問題。 而實際上諾獎得主並不是幾億分…

Previous:

Next: