WEEX 唯客博客, 一、生成式AI融資暴漲,ML市場未來可期1、 成本高昂融資卻難,演算法領域巨頭壟斷2、 演算法模型孤立分散,亟需合作釋放價值二、Web 3革新AI演算法,Bittensor領跑行業板塊1、Polkadot生態明星項目,持續升級致力開發2、尤馬共識分配獎勵,子網架構擴展網路(1)主要角色及工作流程(2)共識機制(3)子網架構(4) 神經元網路3、項目公平啟動,市值板塊前列4、行業擁抱開源,模型協作加持三、FUD風聲鶴唳,拒絕盲從盲信四、風險提示 一、生成式AI融資暴漲,ML市場未來可期 20世紀30年代以來,關於AI的研究從未停歇,數據、算力、演算法三要素層面不斷取得進步和發展。2017年,Google Brain團隊創建transformer模型,這是一種最初用於語言翻譯的機器學習模型。自此,使用大語言模型(Large Language Model,簡稱LLM)生成文本和圖像的模式被發掘,並應用於ChatGPT等生成式AI產品中,引發AIGC浪潮,市場對生成式AI的興趣顯著增長,2023年相關企業和項目的總融資暴漲至140億美元。與此同時,生成式AI背後的機器學習等演算法也被寄予厚望,預計到2030年,AI和機器學習(Machine Learning,簡稱ML)的市場規模將分別達到1.6萬億美元和3050億美元。而事實上,由於科技巨頭壟斷和模型市場分散,AI演算法領域的創新十分低效。 圖1、2023年生成式AI總融資暴漲至140億美元 圖2、2030年AI和ML市場規模將達$1.6T和$305B 資料來源:CB insights,Dot Labs 資料來源:Precedence Research,Dot Labs 1、 成本高昂融資卻難,演算法領域巨頭壟斷 今年以來,矽谷出現了AI領域的收購潮,包括Amazon、Microsoft和Google在內的科技巨頭紛紛出手,收購了Character.ai、Inflection AI、Adept等多家明星初創企業。其中Microsoft為躲避美國聯邦貿易委員會的反壟斷調查,在收購Inflection AI時發明了反向收購招聘(reverse acquihire)模式,支付6.5億美元用於技術授權,同時招募Inflection AI的核心人員和大部分技術團隊,此後大公司在進行收購時紛紛效仿。這些收購行為不僅凸顯了AI大模型競爭的日益激烈,也預示著AI演算法領域正在逐漸成為巨頭們的專屬遊戲場。據Canalys統計,2024年Q2三大雲服務提供商AWS、Microsoft Azure、Google Cloud的市場份額總計高達63%。科技巨頭集中壟斷,初創企業舉步維艱,造成該現象主要有兩個原因,一是AI模型開發成本高,需要大量資金,二是對於初創企業來說,融資卻難。 隨著AI模型複雜性和數據密集性的增加,計算資源需求呈指數級增長,這意味著AI模型開發需要昂貴的硬體投資或直接依賴雲服務提供商。Anthropic的CEO最近公開表示,當前AI模型的訓練成本已達到10億美元量級,未來三年內可能會飆升至100億甚至1000億美元。同時,應用端貨幣化進展緩慢,進一步加劇了成本問題。儘管市場對AI應用的期待很高,但實際的營收情況和生產速度卻遠低於預期,美國軟體公司從年初至今幾乎沒有產生與AI相關的收入,而據AlphaWise針對CIO的調查,AI應用投入生產的時間還在逐漸延遲,預計2024年上半年投入生產首個項目的CIO比例從2023年Q4的34%顯著下降至2024年Q2的10%。 今年起對AI初創企業的投資列車也開始緩慢減速,年輕企業完成新一輪融資目標已經變得越來越困難。據Deutsche Bank統計,2024年Q1美國生成式AI初創企業的種子輪和早期融資總額僅為1.23億美元,較上一季度暴跌超過2/3,融資交易數量從上一季度的70多筆銳減至34筆。 面對如此高昂的研發成本和日益緊縮的融資環境,只有互聯網大廠們還能保持著高額的研發支出。據Morgan Stanley預計,2024-2025年主要雲服務提供商(包括Google、Microsoft、Meta、騰訊、百度、Apple、IBM、Oracle)的資本支出接近3800億美元,比過去三年總和多近500億美元。因此,從頭開始構建模型對大多數企業來說是一項艱巨的任務,據紅杉資本關於LLM的調查,只有15%的受訪創始人和團隊願意進行這項工作,通常還是使用LLM API。 2、 演算法模型孤立分散,亟需合作釋放價值 對於AI賽道上的企業來說,競爭是零和的,一家的模型贏得了市場,其他家就會出局,即使第三方應用集成也需要模型所有者的許可。因此,每家企業的演算法和模型都是孤立的,演算法之間無法相互學習,開發新模型必須從頭開始,無法進行知識的轉移和積累,且模型之間缺乏複合效應,例如,如果一個模型精通西班牙語,另一個模型精通編程,當用戶需求是使用AI解釋帶西班牙語註釋的代碼時,顯然兩個演算法合力輸出效果最好,但目前的環境限制了這種合作。功能的有限導致價值的有限,因此,整個AI演算法領域的合力未能得到充分發揮,需要新的合作模式來釋放其真正的價值。 二、Web 3革新AI演算法,Bittensor領跑行業板塊 在AI風起雲湧之際,Web 3的去中心化理念為AI行業發展提供了新的契機,大量「Web 3+AI」的優質案例湧現,相關代幣熱度高漲。加密貨幣和區塊鏈通過激勵、貢獻和協調等形式從數據、算力、演算法三個核心要素方面促進著AI的發展,顯示出分散式網路資源的強大潛力。 l Cyrpto+數據(如Filecoin):AI模型需要大量數據進行訓練,區塊鏈技術通過激勵機制鼓勵數據提供者貢獻數據,或利用去中心化的數據存儲為數據訓練提供更加分散化的途徑。 l Crypto+算力(如Render):開發AI模型需要強大的計算能力,區塊鏈技術可以利用分散在各地的如個人顯卡等計算資源,通過加密貨幣鼓勵提供閑置的算力資源。 l Crypto+演算法(如Bittensor):與數據和算力的資源密集型特性不同,演算法更傾向於技術密集,是各家AI企業持續迭代的秘方和壁壘,因此難以通過激勵從零直接創造出一個更好的演算法。所以除了激勵和貢獻的邏輯,Crypto和演算法的結合還需要篩選機制,從現有演算法中篩選出最適合的演算法或演算法組合,避免市場被單一演算法壟斷。Bittensor就是該方面的代表項目。 隨著AI敘事的火熱,Bittensor在去年年底從眾多Web 3項目中脫穎而出,其代幣$TAO半年漲幅超10倍,市值高峰一度達到了近50億美元,雖然近來因子網機制效率等質疑有所下跌,但Grayscale於今年8月推出$TAO加密投資信託的舉動,仍體現了市場對其一定的信心。9日凌晨帶AI功能的IPhone 16發布,當天AI領域代幣大漲7%,$TAO以10%的漲幅領跑板塊。 Bittensor利用區塊鏈網路和激勵機制,對不同的演算法進行調度和篩選,在AI演算法領域形成了一個自由競爭且點對點的模型市場,激勵機器智能的生產,其目標是讓Google這樣的科技巨頭認識到,使用其提供的神經網路作為自己機器學習網路的補充是有利的,並為此付費。在這個機器學習的協作網路中,知識生產者出售工作成果,消費者購買這些知識來增強自己的AI模型,通俗概括而言,Bittensor不生產演算法,只是優質演算法的搬運工。這種去中心化的方式允許知識快速擴展和共享,模型不再孤立,競爭也不再是零和,Bittensor類似於一個不可阻擋的知識庫,呈指數級增長。 1、 Polkadot生態明星項目,持續升級致力開發 Bittensor由Opentensor Foundation支持開發,其背後有一支優秀的團隊。據LinkedIn信息,該公司共有34名員工,團隊的大多數成員都擁有計算機科學、AI和工程的背景經驗。項目的具體融資金額等情況並未透露,已知投資者有Digital Currency Group、Polychain Capital、FirstMark Capital、GSR。團隊主要成員: l Jacob Steeves:創始人,擁有機器學習研究背景,曾在Google任職。 l Ala Shaabana:聯合創始人,擁有計算機科學的博士學位和一定的學術研究背景,曾在多倫多大學擔任助理教授,在VMware、Instacart擔任軟體工程師。 l Garrett Oetken:CTO,同時是Quantum Star Technologies的聯合創始人兼研發主管,曾擔任Safeguard Equipment的首席軟體工程師,在自然語言處理、計算機視覺、機器學習和數據分析等領域擁有豐富經驗。 2019年,Jacob Steeves和Ala Shaabana創立Bittensor,最初設想是將其建立為Polkadot平行鏈。2021年1月,項目競拍獲得一條平行鏈插槽,發布初版網路「Kusanagi」,併發行第一批$TAO,5月由於共識機制問題網路暫停,11月網路升級分叉為「Nakamoto」繼續開放。出於對Polkadot開發速度的擔憂,項目在2023年3月進行了戰略性轉變,決定開發自己的專有區塊鏈,網路再次升級演變為「Finney」,進一步提升了內核代碼性能和網路整體效率,成為建立在Polkadot生態上,使用自己基於Substrate的獨立的L1區塊鏈,同月,$TAO在MEXC上線,$TAO現已上線Binance、Bitget等16個交易所。在過去的一年裡,Bittensor通過Synapse更新優化了模型交互能力、通過Revolution升級實現了子網擴展,其與Cerebras合作開發的BTLM模型,不僅是能和幾乎所有移動設備兼容的3B參數模型,且性能與許多7B模型齊平,在Hugging Face上廣受好評。 2、尤馬共識分配獎勵,子網架構擴展網路 Bittensor是怎麼在技術上解決AI演算法領域存在的創新低效問題呢?作為一個開源協議,Bittensor利用礦工和驗證器的工作為用戶提供其需要的AI模型,促進模型間的學習和協作,並基於尤馬共識等共識機制分配$TAO獎勵。其利用專攻不同類型模型的子網細分AI模型任務,促進細分領域的專業化發展,並借鑒大腦神經網路構造建立節點間的信息傳輸及處理。 (1) 主要角色及工作流程 要理解Bittensor技術上怎樣解決AI演算法領域創新低效的問題,先要知道Bittensor網路中的主要角色以及角色間如何配合完成最基本的工作流程。主要角色有礦工、驗證器和用戶: 供給側 礦工(Miner):託管其AI模型並提供給Bittensor網路。其對網路的貢獻取決於所提供模型的質量和性能,根據貢獻大小獲得相應量的$TAO獎勵。 驗證器(Validator):充當Bittensor網路中的評估者,評估AI模型的質量和性能。驗證器們對模型的篩選和評估越一致,獲得的$TAO獎勵就越多。(註:根據項目官網提供的名單,現有驗證器主要是項目方自己旗下機構,存在一定去中心化不足的問題) 需求側 用戶(User):Bittensor網路里AI模型的最終使用方,可以是個人消費者,也可以是使用AI模型做應用的開發者們。其支付$TAO使用模型進行消費。 工作流程:①用戶輸入自己的需求②驗證器將需求路由給礦工(路由指根據礦工的歷史表現、模型能力和任務類型,選擇性地分發任務)③礦工輸出答案④驗證器評估答案質量,將質量最高的模型返回給用戶。概括來說,在Bittensor網路中,礦工提供模型,驗證器評價模型,用戶使用評價最高的模型。 在分發任務和輸出結果時,Bittensor引入了混合專家機制(Mixtral of Experts,簡稱MoE),旨在利用多個模型來完成任務,每個專家模型都專註於特定方面,當任務包含多個方面時,將被拆解傳輸至不同的專家模型中進行處理,提高了解決複雜問題的準確性和效率。例如前文提到的情況,如果有一個模型精通西班牙語,一個模型精通編程,當用戶需求是使用AI解釋帶西班牙語註釋的代碼時,兩個模型將合作產出結果。Bittensor利用MoE機制促進了模型間的協作和組合,網路里的模型像可以任意組合變換的樂高積木一樣,擅長不同領域的AI模型(如文本、圖像或音頻處理)相互組合,適應用戶多樣化的任務需求。 (2) 共識機制 共識機制是指去中心化網路中確保所有節點就數據狀態達成一致的協議,旨在獎勵網路中有價值的節點。傳統的共識機制主要有PoW機制(Proof-of-Work,工作量證明)和PoS機制(Proof-of-Stake,權益證明),其中,PoW機制指礦工通過每10分鐘進行一次算力競賽爭奪記賬權力和代幣獎勵,理論上除非有人能掌握全網51%以上的算力,否則網路是無法被篡改的,該機制下的網路去中心化強但資源浪費問題嚴重,為解決這個問題,出現了PoS機制,該機制下只有滿足一定條件的節點(如質押一定數量代幣)才可能被選擇作為出塊節點爭奪記賬權力,持有的代幣越多越可能出塊,所以去中心化程度相對弱。Bittensor採用的共識機制是尤馬共識和PoI機制: 尤馬共識(Yuma Consensus):「PoW機制+PoS機制」的混合共識機制。當驗證器對模型評分后,評分傳輸到鏈上,質押$TAO數量多的驗證器的權重高,根據該機制對礦工和驗證器進行代幣獎勵。與傳統的共識機制相比,這種混合共識機制既減少了資源消耗,也保持了一定的去中心化程度。同時,由於網路是去中心化的,它允許在節點間分配計算資源,具有高度的可擴展性。 PoI機制(Proof-of-Intelligence,智能證明):PoW機制和PoS機制的變體,用以激勵節點添加有用的機器學習模型和結果的一種機制。礦工和驗證器需要執行機器學習任務來證明其智能,而不是解決複雜的數學問題或質押代幣,機器學習模型的輸出越準確越有價值,就越有可能被選中向鏈中添加新塊並獲得$TAO獎勵。 Bittensor在其共識機制下分配節點獎勵時,結合了博弈論的評分方法(game-theoretic scoring methods),根據對網路整體預測準確性和達成共識的邊際貢獻為每個模型分配一個Shapley值,損失越低的模型該值越高。 (3) 子網架構 2023年10月,Bittensor通過Revolution升級,引入了子網概念,標誌著其發展的重要里程碑。在Bittensor生態系統中,有一個區塊鏈和許多連接到這個區塊鏈的平台,這些平台被稱為子網。Bittensor依賴其獨特的子網架構,不同類型的模型組成不同的子網,比如專攻圖片的模型為一子網,專攻聲音的模型為一子網。每一類數字商品在其所屬子網中生產,應用程序構建在這些特定的子網上,為用戶提供服務。子網存在於區塊鏈之外,是鏈下競爭,優秀的礦工和驗證器才能獲得$TAO獎勵。 子網內部進行輸出模型、評價模型等最基本的工作流程后,子網驗證器將評價通過Bittensor API傳輸到鏈上,作為鏈上尤馬共識的集體輸入,共識機制的輸出決定如何給子網礦工和子網驗證器分配獎勵。 其中,根網路(root network)是一種特殊的子網,根網路的驗證器為Bittensor網路中質押量最大的64個驗證器,所有子網則是根網路的礦工,分配$TAO獎勵時,先由根網路根據子網表現分配給每個子網,子網再分配給其所有者、礦工和驗證器。一個子網包含256個UDI插槽,其中192個屬於礦工,64個屬於驗證器,只有質押量最大的64個節點才能成為驗證器,表現不佳的礦工會被新註冊的礦工替換,表現不佳的子網也會被新註冊的子網替換。 Bittensor目前有52個子網(不包括根網路),未來將進一步增加到64個。其中19號Vision、9號Pretraining、18號Cortex.t受到較大關注,排放量(emission,指$TAO的產生和分配)佔比分別為8.57%、5.1%和4.94%。部分子網的具體情況: 3號MyShell TTS:註冊於2024年5月,由麻省理工學院、牛津大學和普林斯頓大學等知名機構的核心成員組成,旨在創建一個無代碼平台,使沒有編程背景的用戶能夠輕鬆創建和使用語音機器人,使頂級TTS模型(Text To Speech,文本到語音)的訪問更加民主化。 9號Pretraining:註冊於2023年10月,專註於為機器學習模型提供高效的預訓練服務,允許用戶利用去中心化的計算資源進行大規模的模型預訓練,旨在提升模型的性能和訓練效率。 18號Cortex.t:註冊於2023年10月,該子網的功能與ChatGPT相似,旨在通過集體智能為用戶提供高質量的文本和圖像響應。 19號Vision:註冊於2023年12月,利用分散式規模推理子網(DSIS)框架,專註於去中心化的圖像生成和推理,旨在最大化Bittensor網路的輸出能力,允許礦工自由選擇技術堆棧來處理需求並生成響應。 21號Omega Any-to-Any:註冊於2024年7月,專註於實現去中心化的多模態AI交互,可以在文本、圖像、視頻等不同類型的數據或信息之間進行轉換和理解。 42號Masa:註冊於2024年8月,基於LLM的去中心化AI數據子網,旨在提供高效的數據貢獻和處理機制。是Bittensor中首個發行代幣的子網,引入了$MASA和$TAO的雙代幣獎勵模型,CoinList社區輪代幣銷售中17分鐘被搶購一空,超募認購超過6.4倍。 (4) 神經元網路 為了構造模型間能夠協作的網路,Bittensor在信息傳輸上借鑒了人類大腦神經網路的認知過程,神經網路中的節點在Bittensor中表示為子網礦工和子網驗證器,每個子網礦工或子網驗證器運行一個客戶端軟體作為一個計算單元,稱為「神經元」,每個神經元由模型、數據集和損失函數組成,這些神經元協同工作,旨在利用輸入的數據和神經元間的通信來優化各自的損失函數,其具體過程:①神經元將其數據集中的一批輸入信息(synapse object)通過樹突(dentrite)發送給相鄰的神經元,同時在其內部模型也處理同一批信息。②相鄰神經元使用其模型處理輸入,並將輸出返回給原始神經元。③原始神經元通過軸突(axon)接收併合並這些輸出,通過考慮相鄰神經元的損失和自身的損失來更新其梯度。 這個過程應用到子網架構中來看。在某一子網內的前饋期間,來自外部世界的輸入只能連接到子網驗證器,子網驗證器再傳輸到子網礦工,子網和神經網路一樣是二分的,外部世界的輸入僅連接到輸入層(input layer),隱藏層(hidden layer)與外部世界隔離。之後,子網礦工可以直接與子網驗證器通信,子網礦工和子網驗證器之間的雙向通信構成了激勵機制中協議的核心,這樣的雙向是多對多的,但任意兩個子網驗證器或子網礦工並不相連。 3、 項目公平啟動,市值板塊前列 2021年1月,Bittensor選擇了「公平啟動」(fair launch),即沒有代幣保留給創始團隊和VC,獲取$TAO的唯一方法是在公開市場上購買代幣或參與挖礦和驗證活動,確保每個$TAO都反映了真正的機器學習工作。由於目前驗證器大多是Bittensor旗下機構,可以合理推測,驗證器可以先挖幣再分發給做市商來做市,因此公平啟動不意味著完全…