Difficultés du développement de l'IA Web3 : erreurs de modularité et directions de percée futures

robot
Création du résumé en cours

Les défis et les futures directions du développement de l'IA Web3

Le prix des actions d'NVIDIA a atteint un nouveau sommet, l'évolution des modèles multimodaux a approfondi les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'incorporation haute dimensionnelle à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse incroyable divers modes d'expression, construisant une forteresse IA de plus en plus fermée. Le marché boursier américain a voté par l'action, que ce soit des actions liées aux crypto-monnaies ou des actions d'IA, toutes ont connu un petit marché haussier. Cependant, cette vague d'enthousiasme semble n'avoir aucun lien avec le domaine des crypto-monnaies.

Récemment, les tentatives de Web3 AI dans la direction des agents montrent un écart directionnel évident : essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée représente en réalité un double décalage technique et de pensée. Aujourd'hui, avec une forte couplage des modules, une distribution des caractéristiques hautement instable et une demande de puissance de calcul de plus en plus concentrée, le modulaire multimodal a du mal à s'implanter dans Web3.

L'avenir de l'IA Web3 ne réside pas dans une simple imitation, mais dans une approche stratégique et détournée. De l'alignement sémantique dans des espaces de haute dimension, aux goulots d'étranglement d'information dans les mécanismes d'attention, jusqu'à l'alignement des caractéristiques sous une puissance de calcul hétérogène, l'IA Web3 doit adopter la tactique de "l'encerclement des villes par les campagnes".

Web3 AI basé sur un modèle multimodal aplati, l'alignement sémantique non réussi entraîne une faible performance

Dans les systèmes multimodaux de l'IA Web2 modernes, "l'alignement sémantique" fait référence à la cartographie des informations provenant de différentes modalités dans un même espace sémantique, permettant ainsi au modèle de comprendre et de comparer les significations sous-jacentes de ces signaux aux formes très différentes. Ce n'est que si l'on parvient à réaliser un espace d'incorporation de haute dimension que la division du flux de travail en différents modules a un sens en termes de réduction des coûts et d'efficacité. Cependant, le protocole Web3 Agent ne peut pas réaliser d'incorporation de haute dimension, car la modularité est une illusion de l'IA Web3.

Exiger que l'IA Web3 réalise un espace de dimensions élevées équivaut à exiger que le protocole Agent développe de manière autonome toutes les interfaces API impliquées, ce qui va à l'encontre de l'intention de modularité. Le système multimodal modulaire décrit par les petites et moyennes entreprises de l'IA Web3 ne résiste pas à l'analyse. Une architecture de haute dimension nécessite un entraînement unifié de bout en bout ou une optimisation collaborative, tandis que l'idée de "module comme plugin" de Web3 Agent exacerbe plutôt la fragmentation.

Pour réaliser un agent intelligent à chaîne complète avec des barrières sectorielles, il est nécessaire de passer par une modélisation conjointe de bout en bout, un embedding unifié entre les modules, ainsi qu'une ingénierie systématique pour l'entraînement et le déploiement collaboratifs. Cependant, le marché actuel ne présente pas de tels points de douleur, il n'y a donc naturellement pas de demande sur le marché.

Dans un espace de faible dimension, le mécanisme d'attention ne peut pas être conçu avec précision

Des modèles multimodaux de haut niveau nécessitent la conception de mécanismes d'attention précis. La condition préalable au fonctionnement des mécanismes d'attention est que le multimodal possède une haute dimension. Dans un espace de haute dimension, un mécanisme d'attention précis peut trouver la partie la plus essentielle parmi une énorme quantité d'espace de haute dimension en un minimum de temps.

La planification de l'attention unifiée ne peut pas être réalisée avec une IA Web3 basée sur des modules. Tout d'abord, le mécanisme d'attention repose sur un espace de Query-Key-Value unifié, tandis que les API indépendantes retournent chacune des données dans des formats et des distributions différents, rendant impossible la formation d'un Q/K/V interactif. Deuxièmement, l'attention multi-tête permet de se concentrer simultanément sur différentes sources d'information, alors que les API indépendantes sont souvent appelées de manière linéaire, manquant de la capacité de parallélisme et de pondération dynamique multi-voies. Enfin, un véritable mécanisme d'attention attribue dynamiquement des poids à chaque élément en fonction du contexte global, alors qu'en mode API, les modules ne peuvent voir que des contextes indépendants, rendant impossible l'association et la focalisation globales entre les modules.

La modularité discrète de l'assemblage entraîne une fusion des caractéristiques qui reste à un assemblage statique superficiel.

"Fusion des caractéristiques" consiste à combiner davantage les vecteurs de caractéristiques obtenus après le traitement de différentes modalités, sur la base de l'alignement et de l'attention. L'IA Web3 en est restée à la phase de concaténation la plus simple, car la fusion dynamique des caractéristiques nécessite un espace de haute dimension et un mécanisme d'attention précis.

L'IA Web2 a tendance à s'entraîner de manière conjointe de bout en bout, tandis que l'IA Web3 adopte davantage une approche de collage de modules discrets. L'IA Web2 peut calculer en temps réel l'importance des différentes caractéristiques en fonction du contexte et ajuster dynamiquement la stratégie de fusion ; alors que l'IA Web3 fixe souvent les poids à l'avance ou utilise des règles simples pour décider de la fusion, manquant ainsi de flexibilité.

L'IA Web2 mappe toutes les caractéristiques de modalité dans un espace de haute dimension, le processus de fusion comprenant diverses opérations d'interaction de haut niveau. En revanche, les dimensions de sortie des agents de l'IA Web3 sont très faibles, ce qui rend difficile l'expression des relations complexes entre modalités. De plus, l'IA Web2 peut automatiquement ajuster sa stratégie de fusion grâce à des retours de bout en bout, tandis que l'IA Web3 dépend souvent de processus manuels ou externes pour évaluer et ajuster les paramètres.

Les barrières de l'industrie de l'IA se renforcent, mais les points de douleur ne se sont pas encore manifestés.

Le système multimodal de l'IA Web2 est un projet d'ingénierie vaste qui nécessite des données massives, une puissance de calcul importante, des technologies avancées et une équipe efficace. Ce travail systématique à l'échelle complète et sur toute la pile crée de fortes barrières à l'entrée dans l'industrie, tout en forgeant la compétitivité centrale de quelques équipes leaders.

L'IA Web3 devrait se développer en utilisant une tactique entourant les villes par les campagnes, en testant à petite échelle dans des scénarios périphériques, en attendant l'apparition d'opportunités dans des scénarios centraux. L'avantage de l'IA Web3 réside dans sa décentralisation, son haut degré de parallélisme, sa faible couplage et sa compatibilité avec des puissances de calcul hétérogènes, ce qui la rend adaptée aux structures légères, aux tâches facilement parallélisables et incitatives.

Cependant, les barrières de l'intelligence artificielle Web2 ne font que commencer à se former, c'est le début de la compétition entre les entreprises leaders. Ce n'est que lorsque les dividendes de l'intelligence artificielle Web2 auront presque disparu que les points de douleur qu'elle laisse derrière elle constitueront une opportunité d'entrée pour l'intelligence artificielle Web3. Avant cela, les projets d'intelligence artificielle Web3 doivent soigneusement déterminer s'ils peuvent entrer par les marges, combiner des points et des surfaces, avancer de manière circulaire, et s'ils possèdent la flexibilité nécessaire pour faire face à des demandes de marché en constante évolution.

AGENT-7.69%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Reposter
  • Partager
Commentaire
0/400
TaxEvadervip
· 07-31 04:33
Défaillance de la décentralisation
Voir l'originalRépondre0
ContractExplorervip
· 07-30 07:04
Il faut encore innover et percer.
Voir l'originalRépondre0
FlashLoanLordvip
· 07-30 06:57
La fin de la distribution est la centralisation
Voir l'originalRépondre0
MEVHunterZhangvip
· 07-30 06:51
L'optimisation explicite est devenue un goulot d'étranglement.
Voir l'originalRépondre0
FloorPriceNightmarevip
· 07-30 06:51
L'esprit du travail ne peut plus avancer.
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)