最近這些年,區塊鏈領域鑼鼓喧天,人工智慧(AI)領域鞭炮齊鳴,但這兩大變革性技術卻似乎交集不多。但從概念上看,區塊鏈和 AI 有不少互補之處,比如區塊鏈技術固有的去中心化特性也許可以幫助解決 AI 的中心化問題,區塊鏈透明且可驗證的性質或許有助於解決 AI 模型的不透明問題。
前段時間,「區塊鏈 X AI」的概念炒作讓不少相關加密貨幣市值大增,整個板塊的市值一度超過 200 億美元,如圖 1 所示。這說明市場對這一組合相當看好,投資者也頗有信心。
圖 1:不同細分領域的加密貨幣市值,2024 年 4 月 18 日數據
但是,區塊鏈和 AI 的整合實踐中也暴露出了這兩者存在的一些衝突之處,比如 AI 需要密集計算和大量存儲,而區塊鏈的分佈式賬本架構則強調冗餘 —— 每個節點都會存儲和計算同樣的信息。
近日,清華大學和 Fraunhofer HHI 等機構的一個研究團隊發布了一篇論文《Blockchain and Artificial Intelligence: Synergies and Conflicts》,分析了區塊鏈和 AI 之間存在的技術協同和衝突。值得注意的是,該團隊並沒有埋頭分析理論,而是著眼於加密貨幣市場,分析了市值超過 1000 萬美元的「區塊鏈 X AI」項目和一些特定用例。
下面我們就來看看這篇論文講了啥,得到了什麼有趣或有用的見解。
區塊鏈 X AI:協同與衝突#
圖 2 展示了區塊鏈和 AI 之間的互補與對立之處。
區塊鏈和 AI 的協同之處#
去中心化與中心化。GPT 等當前最佳的大型語言模型(LLM)的訓練和維護需要大量算力、電力和數據資源。舉個例子,2020 年發布的 GPT-3 的訓練過程的計算成本大約為 460 萬美元。如此高的成本讓 AI 大模型成為了少數幾家大型科技公司的角力場 —— 它們也基本上成了 AI 市場的壟斷者。這樣的壟斷可能會妨礙競爭,這也是美國和歐洲等地區的政策制定者經常表達的擔憂 —— 這些地區在執行反壟斷法方面非常積極,以維持市場平衡以及防止市場被單一實體主導。相比之下,區塊鏈技術則是去中心化的;這樣的特性或許能用於解決 AI 系統的中心化問題。只要部署得當,區塊鏈的去中心化特性可防止任何一方控制整個網絡。這一特性可幫助在 AI 系統內實現某種監管機制,實現更平衡的權力分佈,並促進各方協同合作。因此,整合區塊鏈技術可望解決 AI 領域內有關監管和壟斷的爭論,使 AI 治理變得更加包容和公平。
透明度與黑箱本質。區塊鏈技術的另一大特點是透明,其上的交易和記錄都是可驗證且不可篡改的。另一方面,AI 卻宛如一個黑箱 —— 人們很難明晰其決策背後的推理過程。也許我們可以使用區塊鏈賬本來記錄 AI 的決策過程,實現透明的審計跟蹤,從而提升 AI 應用的可信度。此外,區塊鏈還能整合先進的加密技術(比如 zk-SNARK 等零知識證明)或使用安全硬件(比如 Trusted Execution Environments / 可信執行環境 / TEE)。這些技術可幫助驗證特定的計算步驟是否被忠實準確地執行。
數據管理和依賴。區塊鏈可通過智能合約與星際文件系統(IPFS)等協議監管數據與數據訪問權限。
開源與閉源。區塊鏈可通過加密協議實現共享所有權,進而實現細粒度的隱私配置,從而解決 AI 專有模型的局限性。如果能讓共享式 AI 系統(由參與方聯合訓練和控制)的性能達到商業模型的水平,那麼 AI 發展的透明度將會大幅提升。這也能促進人們創造更公正和全面的人工智慧解決方案。
區塊鏈和 AI 之間的衝突#
儘管區塊鏈和 AI 之間有上述協同共進之處,但它們之間的運營需求卻存在重大衝突,妨礙了這兩者的整合。
計算成本和負載。對於 GPT-4 和 Llama 3 等大型語言模型(LLM),訓練和推理都需要大量計算資源。區塊鏈的共識機制、加密操作和不利的數據結構都會增加計算負擔,從而影響可擴展性。
存儲限制和數據密集度。區塊鏈的去中心化特性儘管能確保安全和冗餘,但也會導致顯著的存儲需求,這對數據驅動的 AI 系統來說無疑是高成本和低效的。在以太坊等通用區塊鏈系統(GBPS)中,每一個節點都必須存儲所有信息,因為冗餘能保證該區塊鏈網絡的安全性和彈性,但卻不利於可擴展性。由於以太坊虛擬機(EVM)上的新數據都會被儲存成交易格式,那麼 EVM 結構上的常見數據可能會有礙檢索的速度。另一方面,AI 應用則會生成和處理大量數據,這就需要高效且可擴展的存儲解決方案。
偽匿名和安全性挑戰。區塊鏈允許通過非對稱加密實現無許可、偽匿名的訪問;而針對可能出現的女巫攻擊(Sybil Attack),則可通過設置計算或資金屏障來保護網絡。另外,某些用例是將區塊鏈用作提升隱私保護和分佈式 AI 訓練的平台,使用的技術包括聯邦學習等;而如果這些用例支持偽匿名地參與訓練過程,則可能出現風險。
這些方法容易被對抗式聯邦學習攻擊攻破,而想要確定惡意攻擊者的身份卻非常困難,因為根據設計,向整體 AI 模型提交的貢獻是私密的並且難以測量。
操作不匹配。大多數區塊鏈虛擬機都使用了固定的賬本操作以保證結果是確定的 —— 這很重要,畢竟金融交易涉及的都是錢。而浮點運算則可能在計算中出現精度損失,尤其是當計算數量級相差巨大的多個數值時。但是,AI 訓練的一種常見做法是將浮點參數歸一化到 0 到 1 之間,因為這有助於實現穩定有效的梯度流並提供隱式的正則化,由此提升整體訓練效果。
區塊鏈 X AI:用例研究#
基於上述區塊鏈和 AI 的協同與衝突,可以來看看用例了。該團隊調研了在整合區塊鏈和 AI 方面做得最好的一些項目。他們關注的重點是已有產品,並發行了代幣且市值超過 1000 萬美元的項目。此外還有一些市值雖低於 1000 萬美元,但用例新穎的項目。他們基於三個研究問題對這些項目進行了分類:
- 該項目內區塊鏈和 AI 技術協同整合的程度如何?
- 區塊鏈在該項目中的作用?
- AI 在該項目中的作用?
聚類分析結果如圖 3 所示,其中包含 4 個主要聚類:AI 是區塊鏈的外圍技術、AI 參與到區塊鏈中、區塊鏈管理 AI 過程、區塊鏈是 AI 的核心基礎設施。
AI 是區塊鏈的外圍技術#
AI 可幫助提升與區塊鏈交互的用戶體驗、實現智能化分析、簡化區塊鏈應用的開發流程等。
AI 參與到區塊鏈中#
AI 可以積極地參與到區塊鏈生態系統和治理結構中。該團隊在論文中給出了兩個探索方向:一是讓 AI 智能體作為參與者或利益相關者加入到分佈式網絡中,比如讓 AI 自己在 Dex 上炒幣;二是讓 AI 參與治理 DAO(去中心化自治組織),不過目前來看這方面還比較困難。
區塊鏈管理 AI 過程#
現在人們越來越多地使用區塊鏈技術來管理 AI 過程,為資源共享、數據管理和應用部署創建一個去中心化框架。
區塊鏈是 AI 的核心基礎設施#
以太坊等通用區塊鏈系統(GPBS)面臨這可擴展性、安全性和去中心化的三角權衡。
以以太坊為例,其安全性由分散在全世界的數千個節點保證,驗證者數量已超過 100 萬。為了達成共識和最終確定(finality),每一個新的信息區塊都必須到達這個全球網絡的每個節點並被每個節點驗證,而每個區塊的大小都在千字節量級並且每 12 秒創建一個,這會導致高昂的存儲和計算成本。
因此,直接在鏈上執行或存儲計算密集型的 AI 操作是不現實的;但現在 Layer2 rollup 正在成為一個比較熱門的範式。簡單來說,Layer2 rollup 就是指不在鏈上而在鏈下處理交易,之後將處理結果彙集後再記錄到鏈上;這種解決方案既能提升吞吐量,也能降低成本,頗具成本效益。
類似地,專門為 AI 用例開發的區塊鏈必須(1)克服與高計算和存儲成本、公共訪問和底層虛擬機限制相關的挑戰以及(2)將區塊鏈單純用作純管理、治理和安全層。表 1 展示了將區塊鏈用作核心基礎設施的新系統。
表 1:將區塊鏈用作 AI 的基礎設施,其中 DAI = 分佈式人工智慧、BC = 區塊鏈、DT/FL = 分佈式訓練 / 聯邦學習、C-Layer = 計算層、TA = 技術分析、DM = 分佈式管理、PoS = 權益證明、 DPoS = 委託式權益證明、dBFT = 委託式拜占庭容錯、FL = 聯邦學習、DID = 去中心化身份、ZK = 零知識、DePIN = 去中心化物理基礎設施網絡、DC = 分佈式計算、DD = 分佈式數據、ASBS = 特定應用的區塊鏈系統、IPFS = 星際文件系統、* = 成熟度低 / 沒有公共代碼,? = 信息不可用。