Dilemas en el desarrollo de Web3 AI: errores de modularidad y direcciones futuras de ruptura

robot
Generación de resúmenes en curso

Las dificultades y direcciones futuras del desarrollo de la IA en Web3

Las acciones de Nvidia alcanzaron un nuevo máximo, y la evolución de los modelos multimodales ha profundizado la barrera tecnológica de la IA en Web2. Desde la alineación semántica hasta la comprensión visual, desde la incrustación en alta dimensión hasta la fusión de características, los modelos complejos están integrando a una velocidad sorprendente diversas formas de expresión, construyendo una alta cumbre de IA cada vez más cerrada. El mercado de valores de EE. UU. ha votado con acciones, ya sea en acciones relacionadas con criptomonedas o en acciones de IA, todas han experimentado un pequeño mercado alcista. Sin embargo, esta ola de entusiasmo parece estar completamente desconectada del ámbito de las criptomonedas.

Recientemente, los intentos de Web3 AI en la dirección de Agentes presentan una desviación evidente: se intenta ensamblar un sistema modular multimodal al estilo Web2 utilizando una estructura descentralizada, lo que en realidad es una doble desalineación técnica y de pensamiento. En un contexto donde la acoplabilidad de los módulos es extremadamente alta, la distribución de características es altamente inestable y la demanda de potencia de cálculo se concentra cada vez más, es difícil para el modularismo multimodal establecerse en Web3.

El futuro de la IA Web3 no está en la simple imitación, sino en la maniobra estratégica. Desde la alineación semántica en espacios de alta dimensión, hasta el cuello de botella de la información en mecanismos de atención, y la alineación de características bajo potencia de cálculo heterogénea, la IA Web3 necesita adoptar la táctica de "rodear las ciudades desde el campo" como su programa estratégico.

Web3 AI basado en un modelo multimodal aplanado, la falta de alineación semántica provoca un bajo rendimiento

En los sistemas multimodales de la moderna IA de Web2, "alineación semántica" se refiere a mapear la información de diferentes modalidades en el mismo espacio semántico, permitiendo que el modelo comprenda y compare los significados subyacentes de estas señales tan diferentes. Solo al lograr un espacio de incrustación de alta dimensión tiene sentido dividir el flujo de trabajo en diferentes módulos para reducir costos y aumentar la eficiencia. Sin embargo, el protocolo Web3 Agent no puede lograr incrustaciones de alta dimensión, ya que la modularidad es una ilusión de la IA de Web3.

Requerir que la IA Web3 implemente espacios de alta dimensión equivale a exigir que el protocolo Agent desarrolle por sí mismo todas las interfaces API involucradas, lo que va en contra de su intención de ser modular. El sistema multimodal modular descrito por las pequeñas y medianas empresas de Web3 AI no resiste un examen riguroso. La arquitectura de alta dimensión requiere un entrenamiento unificado de extremo a extremo o una optimización colaborativa, mientras que la idea de "módulo como complemento" de Web3 Agent acentúa la fragmentación.

Para implementar un agente inteligente de cadena completa con barreras en la industria, es necesario un modelado conjunto de extremo a extremo, una incrustación unificada entre módulos, así como un enfoque sistemático para el entrenamiento y despliegue colaborativos. Sin embargo, actualmente no existe un punto de dolor en el mercado, por lo que tampoco hay demanda del mercado.

En un espacio de baja dimensionalidad, el mecanismo de atención no puede ser diseñado con precisión

Los modelos multimodales de alto nivel requieren el diseño de mecanismos de atención precisos. La premisa para el funcionamiento del mecanismo de atención es que el multimodal posea alta dimensionalidad; en un espacio de alta dimensionalidad, un mecanismo de atención preciso puede encontrar la parte más central en el menor tiempo posible de entre una gran cantidad de espacio de alta dimensionalidad.

La atención modular de Web3 AI no puede lograr una programación de atención unificada. En primer lugar, el mecanismo de atención depende de un espacio unificado de Query-Key-Value, mientras que las API independientes devuelven datos en diferentes formatos y distribuciones, lo que impide formar un Q/K/V interactivo. En segundo lugar, la atención de múltiples cabezas permite centrarse en diferentes fuentes de información simultáneamente, mientras que las API independientes a menudo son llamadas lineales, careciendo de la capacidad de ponderación dinámica paralela y múltiple. Por último, un verdadero mecanismo de atención asigna dinámicamente pesos a cada elemento en función del contexto general, mientras que en el modo API, el módulo solo puede ver contextos independientes, lo que impide la correlación y el enfoque global entre módulos.

La modularidad discontinua en la combinación ha llevado a que la fusión de características permanezca en una unión estática superficial.

"Fusión de características" es la combinación adicional de vectores de características obtenidos tras el procesamiento de diferentes modalidades, basada en la alineación y la atención. La IA de Web3 se encuentra en la etapa más simple de concatenación, ya que la fusión dinámica de características requiere un espacio de alta dimensión y un mecanismo de atención preciso.

La IA de Web2 tiende a un entrenamiento conjunto de extremo a extremo, mientras que la IA de Web3 utiliza más la técnica de ensamblaje de módulos discretos. La IA de Web2 puede calcular en tiempo real la puntuación de importancia de diversas características según el contexto y ajustar dinámicamente la estrategia de fusión; mientras que la IA de Web3 a menudo fija los pesos de antemano o utiliza reglas simples para determinar si se debe fusionar, careciendo de flexibilidad.

La IA de Web2 mapea todas las características de los modos a un espacio de alta dimensión, y el proceso de fusión incluye múltiples operaciones de interacción de alto orden. En comparación, la IA de Web3 tiene dimensiones de salida de sus agentes muy bajas, lo que dificulta la expresión de complejas asociaciones multimodales. Además, la IA de Web2 puede ajustar automáticamente la estrategia de fusión a través de retroalimentación de extremo a extremo, mientras que la IA de Web3 depende en gran medida de procesos manuales o externos para evaluar y ajustar parámetros.

Las barreras en la industria de la IA se están profundizando, pero los puntos críticos aún no han aparecido

El sistema multimodal de Web2 AI es un gran proyecto de ingeniería que requiere una gran cantidad de datos, potencia de cálculo, tecnología avanzada y un equipo eficiente. Este trabajo sistemático, de extremo a extremo y de pila completa, constituye una barrera de entrada muy fuerte en la industria y también crea la ventaja competitiva central de unos pocos equipos líderes.

La inteligencia artificial de Web3 debería desarrollarse utilizando la táctica de rodear las ciudades desde el campo, realizando pruebas a pequeña escala en escenarios periféricos y esperando que surjan oportunidades en los escenarios centrales. La ventaja de la inteligencia artificial de Web3 radica en su descentralización, alta paralelización, baja acoplamiento y compatibilidad con potencia de cálculo heterogénea, lo que la hace adecuada para estructuras ligeras, tareas fáciles de paralelizar y que se pueden incentivar.

Sin embargo, las barreras del Web2 AI apenas están comenzando a formarse, lo que representa una etapa temprana de competencia entre las empresas líderes. Solo cuando los beneficios del Web2 AI se hayan desvanecido casi por completo, los puntos de dolor que deja serán la oportunidad para que el Web3 AI intervenga. Antes de eso, los proyectos de Web3 AI necesitan discernir cuidadosamente si pueden entrar desde el margen, combinar puntos y áreas, avanzar de manera cíclica, y si tienen la flexibilidad para adaptarse a las demandas del mercado en constante cambio.

AGENT-18.07%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Republicar
  • Compartir
Comentar
0/400
TaxEvadervip
· 07-31 04:33
Fallo de descentralización
Ver originalesResponder0
ContractExplorervip
· 07-30 07:04
Es necesario innovar y seguir rompiendo barreras.
Ver originalesResponder0
FlashLoanLordvip
· 07-30 06:57
El final de lo distribuido es la centralización
Ver originalesResponder0
MEVHunterZhangvip
· 07-30 06:51
La optimización explícita se ha convertido en un cuello de botella.
Ver originalesResponder0
FloorPriceNightmarevip
· 07-30 06:51
El alma del trabajo ya no puede moverse.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)