Web2 AI はエンドツーエンドの共同訓練を傾向とし、Web3 AI はより離散的なモジュールの組み合わせを採用しています。Web2 AI は文脈に基づいてリアルタイムでさまざまな特徴の重要性スコアを計算し、融合戦略を動的に調整することができます。一方、Web3 AI は事前に重みを固定したり、単純なルールで融合するかどうかを判断することが多く、柔軟性に欠けています。
しかし、Web2 AI の壁はまだ形成され始めたばかりであり、これは主要企業の競争の初期段階です。Web2 AI の利益がほぼ消失したときに残された痛点こそが Web3 AI の参入の機会です。それまでの間、Web3 AI プロジェクトは、周辺からの参入、点と面の結合、環状の推進が可能かどうか、そして変化する市場の需要に対応する柔軟性を備えているかを注意深く見極める必要があります。
Web3 AI開発のジレンマ:モジュラーの誤解と将来のブレークスルーの方向性
Web3 AI開発のジレンマと今後の方向性
NVIDIAの株価は再び最高値を更新し、多モーダルモデルの進化はWeb2 AIの技術的障壁を深めました。意味の整合から視覚理解、高次元埋め込みから特徴融合まで、複雑なモデルは驚くべき速度で様々なモーダルの表現方法を統合し、ますます閉じられたAIの高地を構築しています。米国株式市場は行動で投票し、暗号通貨関連の株もAI株も小さなブル相場を形成しました。しかし、この熱潮は暗号通貨分野とはまったく関係がないようです。
最近のWeb3 AIにおけるエージェントの方向性の試みには明らかな偏差が存在します:非中央集権的な構造を使ってWeb2スタイルのマルチモーダルモジュールシステムを組み立てようとしていますが、実際には技術と考え方の両方がずれているのです。モジュールの結合性が非常に強く、特徴の分布が高度に不安定で、計算力の需要がますます集中している今日、Web3におけるマルチモーダルモジュール化は立ち位置を確保するのが難しいです。
Web3 AIの未来は単なる模倣ではなく、戦略的な迂回にあります。高次元空間での意味の整合から、注意メカニズムにおける情報のボトルネック、さらには異種計算能力下での特徴の整合に至るまで、Web3 AIは「農村が都市を包囲する」を戦術的な指針として必要としています。
Web3 AI はフラット化されたマルチモーダルモデルに基づいており、セマンティクスの不整合がパフォーマンスの低下を引き起こします。
現代のWeb2 AIのマルチモーダルシステムにおける「セマンティックアラインメント」とは、異なるモダリティの情報を同じセマンティックスペースにマッピングし、モデルがこれらの異なる形態の信号の背後にある内在的な意味を理解し、比較できるようにすることを指します。高次元の埋め込み空間が実現される前提で、ワークフローを異なるモジュールに分割することにのみ、コスト削減と効率向上の意義があります。しかし、Web3エージェントプロトコルは高次元の埋め込みを実現できません。なぜなら、モジュール化はWeb3 AIの一種の錯覚だからです。
Web3 AIに高次元空間を実現することを求めることは、Agentプロトコルに関わるすべてのAPIインターフェースを自ら開発することを求めることに等しく、これはそのモジュール化の本来の意図に反します。Web3 AIが描く中小企業向けのモジュール化されたマルチモーダルシステムは、検証に耐えません。高次元アーキテクチャはエンドツーエンドの統一されたトレーニングまたは協調最適化を要求しますが、Web3 Agentの「モジュールはプラグイン」という考え方は、逆に断片化を悪化させています。
業界の壁を持つ全体リンクのインテリジェントエージェントを実現するには、エンドツーエンドの共同モデリング、クロスモジュールの統一埋め込み、協調トレーニングと展開のシステム化されたエンジニアリングが必要です。しかし、現在の市場にはそのような痛点は存在せず、当然市場の需要もありません。
低次元空間では、注意メカニズムは精密に設計できない
高水準のマルチモーダルモデルは、精密な注意メカニズムの設計を必要とします。注意メカニズムが機能する前提は、マルチモーダルが高次元であることであり、高次元空間において、精密な注意メカニズムは、膨大な高次元空間から最も重要な部分を最短時間で見つけ出すことができます。
モジュール化されたWeb3 AIは統一された注意スケジューリングを実現できません。まず、注意メカニズムは統一されたQuery-Key-Value空間に依存していますが、独立したAPIはそれぞれ異なるフォーマットや分布のデータを返すため、相互作用可能なQ/K/Vを形成できません。次に、マルチヘッドアテンションは異なる情報ソースに同時に並行して注意を向けることを可能にしますが、独立したAPIはしばしば線形呼び出しであり、並行処理や動的な重み付けの能力が欠けています。最後に、本当の注意メカニズムは全体の文脈に基づいて各要素に動的に重みを割り当てますが、APIモデルでは、モジュールは独立した文脈しか見ることができず、モジュール間のグローバルな関連性や焦点を実現できません。
離散型のモジュール化された組み合わせは、特徴の融合が表面的な静的接続にとどまることを引き起こします。
"特徴融合"は、アライメントとアテンションに基づいて、異なるモダリティから処理された特徴ベクトルをさらに組み合わせることです。Web3 AIは最も単純な連結段階にとどまっています。動的特徴融合の前提は高次元空間と精密なアテンションメカニズムです。
Web2 AI はエンドツーエンドの共同訓練を傾向とし、Web3 AI はより離散的なモジュールの組み合わせを採用しています。Web2 AI は文脈に基づいてリアルタイムでさまざまな特徴の重要性スコアを計算し、融合戦略を動的に調整することができます。一方、Web3 AI は事前に重みを固定したり、単純なルールで融合するかどうかを判断することが多く、柔軟性に欠けています。
Web2 AIはすべてのモダリティ特徴を高次元空間にマッピングし、融合プロセスにはさまざまな高次相互作用操作が含まれます。それに対して、Web3 AIの各エージェントの出力次元は非常に低く、複雑なクロスモーダル関連を表現するのが難しいです。さらに、Web2 AIはエンドツーエンドのフィードバックを通じて自動的に融合戦略を調整できるのに対し、Web3 AIは主に人手または外部プロセスに依存して評価と調整を行います。
AI業界の壁が深まっているが、痛点はまだ現れていない
Web2 AIのマルチモーダルシステムは、膨大なデータ、強力な計算能力、先進技術、効率的なチームを必要とする大規模なプロジェクトです。この全体的かつスタック型のシステム的な作業は、非常に強力な業界の壁を構成し、少数の先進的なチームのコア競争力を生み出します。
Web3 AIは、農村が都市を包囲する戦術で発展すべきであり、エッジシーンで小規模に試験を行い、コアシーンの機会を待つべきです。Web3 AIの利点は、分散化、高い並行性、低い結合性、そして異種計算能力の互換性にあり、軽量構造、容易な並行処理、そしてインセンティブを与えられるタスクに適しています。
しかし、Web2 AI の壁はまだ形成され始めたばかりであり、これは主要企業の競争の初期段階です。Web2 AI の利益がほぼ消失したときに残された痛点こそが Web3 AI の参入の機会です。それまでの間、Web3 AI プロジェクトは、周辺からの参入、点と面の結合、環状の推進が可能かどうか、そして変化する市場の需要に対応する柔軟性を備えているかを注意深く見極める必要があります。