Акции Nvidia снова достигли рекордного уровня, а эволюция многомодальных моделей углубила технологический барьер Web2 AI. От семантической согласованности до визуального восприятия, от высокоразмерных вложений до слияния признаков, сложные модели с поразительной скоростью интегрируют различные способы выражения модальностей, создавая все более закрытую крепость AI. Рынок акций в США проголосовал действиями: как акции, связанные с криптовалютами, так и акции AI продемонстрировали небольшой бычий тренд. Однако эта волна кажется совершенно не связанной с областью криптовалют.
Недавние попытки Web3 AI в направлении Агентов имеют явное отклонение: они пытаются собрать многомодульную модульную систему в стиле Web2 с использованием децентрализованной структуры, что на самом деле является двойным несоответствием технологий и мышления. В условиях высокой взаимосвязанности модулей, высокой нестабильности распределения признаков и возрастающей централизации вычислительных мощностей, многомодульная модульная система в Web3 трудно находит свое место.
Будущее Web3 AI заключается не в простой имитации, а в стратегическом обходе. От семантической согласованности в высокоразмерном пространстве до информационного узкого места в механизме внимания и согласования признаков в условиях гетерогенной вычислительной мощности, Web3 AI должен использовать тактическую программу "село окружает город".
Web3 AI основан на плоской многомодальной модели, несоответствие семантики приводит к низкой производительности
В современных мультимодальных системах Web2 AI "семантическое выравнивание" означает отображение информации разных модальностей в одно и то же семантическое пространство, позволяя модели понимать и сравнивать внутренние значения этих различных сигналов. Только при условии реализации высокоразмерного встраиваемого пространства имеет смысл делить рабочий процесс на разные модули для снижения затрат и повышения эффективности. Однако протокол Web3 Agent не может реализовать высокоразмерное встраивание, поскольку модульность является иллюзией Web3 AI.
Требование к Web3 AI реализовать высокоразмерное пространство, по сути, равносильно требованию агентского протокола самостоятельно разработать все вовлеченные API-интерфейсы, что противоречит его модульной концепции. Модульная мультимодальная система, описанная малым и средним бизнесом Web3 AI, не выдерживает критики. Высокоразмерная архитектура требует единого обучения от конца до конца или совместной оптимизации, тогда как подход Web3 Agent "модуль равен плагину" наоборот усугубляет фрагментацию.
Для реализации полного цепочного интеллектуального агента с барьерами в отрасли необходимо прорывное решение, которое включает совместное моделирование от конца до конца, унифицированное встраивание между модулями, а также систематическую инженерную работу по совместному обучению и развертыванию. Однако в настоящее время на рынке нет такой боли, и, следовательно, нет и рыночного спроса.
В низкоразмерном пространстве механизм внимания не может быть точно спроектирован
Высокоуровневые мультимодальные модели требуют разработки сложных механизмов внимания. Предпосылкой для работы механизмов внимания является высокая размерность мультимодальных данных; в пространстве высокой размерности сложные механизмы внимания могут за кратчайшее время находить самые ключевые части из огромного объема данных.
Модульный Web3 AI не может реализовать единое управление вниманием. Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, в то время как независимые API возвращают данные в разных форматах и с различным распределением, что не позволяет сформировать взаимосвязанное Q/K/V. Во-вторых, многоголовое внимание позволяет одновременно и параллельно сосредоточиться на различных источниках информации, тогда как независимые API часто вызываются линейно, не имея возможности параллельной и многократной динамической весовой настройки. Наконец, настоящий механизм внимания динамически распределяет веса для каждого элемента на основе общего контекста, тогда как в режиме API модуль может видеть только независимый контекст, что не позволяет реализовать глобальную связь и фокусировку между модулями.
Дискретная модульная компоновка приводит к тому, что слияние признаков остается на поверхностной статической компоновке
"Слияние признаков" заключается в дальнейшем комбинировании векторных признаков, полученных после обработки различных модальностей, на основе выравнивания и внимания. Web3 AI находится на самой простой стадии объединения, поскольку динамическое слияние признаков требует высокоразмерного пространства и точного механизма внимания.
Web2 AI склонен к совместному обучению от начала до конца, в то время как Web3 AI чаще использует метод дискретной модульной сборки. Web2 AI может в реальном времени вычислять важность различных характеристик в зависимости от контекста и динамически корректировать стратегию слияния; в то время как Web3 AI часто заранее фиксирует веса или использует простые правила для определения, следует ли объединять, что приводит к отсутствию гибкости.
Web2 AI отображает все модальные характеристики в высокоразмерное пространство, а процесс слияния включает в себя множество сложных взаимодействий. В отличие от этого, у Web3 AI выходные размеры агентов крайне малы, что затрудняет выражение сложных кросс-модальных связей. Кроме того, Web2 AI способен автоматически настраивать стратегии слияния через обратную связь от конца до конца, в то время как Web3 AI в значительной степени полагается на ручные или внешние процессы для оценки и настройки параметров.
Барьеры в индустрии ИИ углубляются, но болевые точки еще не появились
Мультимодальная система Web2 AI является крупным инженерным проектом, который требует огромного объема данных, мощных вычислительных ресурсов, передовых технологий и эффективной команды. Эта комплексная работа по всей цепочке и стеку создает сильные барьеры для входа в отрасль и формирует核心竞争力少数领先团队.
Web3 AI должен развиваться по стратегии окружения города сельской местностью, начиная с небольших испытаний в пограничных сценах и ожидая появления возможностей в основных сценах. Преимущества Web3 AI заключаются в децентрализованности, высокой параллельности, низкой связанности и совместимости гетерогенной вычислительной мощности, что делает его подходящим для легковесных структур, легко параллелизуемых и мотивирующих задач.
Тем не менее, барьеры Web2 AI только начинают формироваться, и это ранняя стадия конкуренции среди ведущих компаний. Только когда выгоды Web2 AI исчезнут, оставшиеся болевые точки станут возможностью для входа Web3 AI. До этого момента проекты Web3 AI должны тщательно оценить, могут ли они войти с краю, сочетая точки и поверхности, продвигаясь по кругу, а также имеют ли они гибкость для реагирования на постоянно меняющиеся рыночные требования.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Развитие Web3 AI: заблуждения о модульности и направления будущих прорывов
Проблемы и будущие направления развития Web3 AI
Акции Nvidia снова достигли рекордного уровня, а эволюция многомодальных моделей углубила технологический барьер Web2 AI. От семантической согласованности до визуального восприятия, от высокоразмерных вложений до слияния признаков, сложные модели с поразительной скоростью интегрируют различные способы выражения модальностей, создавая все более закрытую крепость AI. Рынок акций в США проголосовал действиями: как акции, связанные с криптовалютами, так и акции AI продемонстрировали небольшой бычий тренд. Однако эта волна кажется совершенно не связанной с областью криптовалют.
Недавние попытки Web3 AI в направлении Агентов имеют явное отклонение: они пытаются собрать многомодульную модульную систему в стиле Web2 с использованием децентрализованной структуры, что на самом деле является двойным несоответствием технологий и мышления. В условиях высокой взаимосвязанности модулей, высокой нестабильности распределения признаков и возрастающей централизации вычислительных мощностей, многомодульная модульная система в Web3 трудно находит свое место.
Будущее Web3 AI заключается не в простой имитации, а в стратегическом обходе. От семантической согласованности в высокоразмерном пространстве до информационного узкого места в механизме внимания и согласования признаков в условиях гетерогенной вычислительной мощности, Web3 AI должен использовать тактическую программу "село окружает город".
Web3 AI основан на плоской многомодальной модели, несоответствие семантики приводит к низкой производительности
В современных мультимодальных системах Web2 AI "семантическое выравнивание" означает отображение информации разных модальностей в одно и то же семантическое пространство, позволяя модели понимать и сравнивать внутренние значения этих различных сигналов. Только при условии реализации высокоразмерного встраиваемого пространства имеет смысл делить рабочий процесс на разные модули для снижения затрат и повышения эффективности. Однако протокол Web3 Agent не может реализовать высокоразмерное встраивание, поскольку модульность является иллюзией Web3 AI.
Требование к Web3 AI реализовать высокоразмерное пространство, по сути, равносильно требованию агентского протокола самостоятельно разработать все вовлеченные API-интерфейсы, что противоречит его модульной концепции. Модульная мультимодальная система, описанная малым и средним бизнесом Web3 AI, не выдерживает критики. Высокоразмерная архитектура требует единого обучения от конца до конца или совместной оптимизации, тогда как подход Web3 Agent "модуль равен плагину" наоборот усугубляет фрагментацию.
Для реализации полного цепочного интеллектуального агента с барьерами в отрасли необходимо прорывное решение, которое включает совместное моделирование от конца до конца, унифицированное встраивание между модулями, а также систематическую инженерную работу по совместному обучению и развертыванию. Однако в настоящее время на рынке нет такой боли, и, следовательно, нет и рыночного спроса.
В низкоразмерном пространстве механизм внимания не может быть точно спроектирован
Высокоуровневые мультимодальные модели требуют разработки сложных механизмов внимания. Предпосылкой для работы механизмов внимания является высокая размерность мультимодальных данных; в пространстве высокой размерности сложные механизмы внимания могут за кратчайшее время находить самые ключевые части из огромного объема данных.
Модульный Web3 AI не может реализовать единое управление вниманием. Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, в то время как независимые API возвращают данные в разных форматах и с различным распределением, что не позволяет сформировать взаимосвязанное Q/K/V. Во-вторых, многоголовое внимание позволяет одновременно и параллельно сосредоточиться на различных источниках информации, тогда как независимые API часто вызываются линейно, не имея возможности параллельной и многократной динамической весовой настройки. Наконец, настоящий механизм внимания динамически распределяет веса для каждого элемента на основе общего контекста, тогда как в режиме API модуль может видеть только независимый контекст, что не позволяет реализовать глобальную связь и фокусировку между модулями.
Дискретная модульная компоновка приводит к тому, что слияние признаков остается на поверхностной статической компоновке
"Слияние признаков" заключается в дальнейшем комбинировании векторных признаков, полученных после обработки различных модальностей, на основе выравнивания и внимания. Web3 AI находится на самой простой стадии объединения, поскольку динамическое слияние признаков требует высокоразмерного пространства и точного механизма внимания.
Web2 AI склонен к совместному обучению от начала до конца, в то время как Web3 AI чаще использует метод дискретной модульной сборки. Web2 AI может в реальном времени вычислять важность различных характеристик в зависимости от контекста и динамически корректировать стратегию слияния; в то время как Web3 AI часто заранее фиксирует веса или использует простые правила для определения, следует ли объединять, что приводит к отсутствию гибкости.
Web2 AI отображает все модальные характеристики в высокоразмерное пространство, а процесс слияния включает в себя множество сложных взаимодействий. В отличие от этого, у Web3 AI выходные размеры агентов крайне малы, что затрудняет выражение сложных кросс-модальных связей. Кроме того, Web2 AI способен автоматически настраивать стратегии слияния через обратную связь от конца до конца, в то время как Web3 AI в значительной степени полагается на ручные или внешние процессы для оценки и настройки параметров.
Барьеры в индустрии ИИ углубляются, но болевые точки еще не появились
Мультимодальная система Web2 AI является крупным инженерным проектом, который требует огромного объема данных, мощных вычислительных ресурсов, передовых технологий и эффективной команды. Эта комплексная работа по всей цепочке и стеку создает сильные барьеры для входа в отрасль и формирует核心竞争力少数领先团队.
Web3 AI должен развиваться по стратегии окружения города сельской местностью, начиная с небольших испытаний в пограничных сценах и ожидая появления возможностей в основных сценах. Преимущества Web3 AI заключаются в децентрализованности, высокой параллельности, низкой связанности и совместимости гетерогенной вычислительной мощности, что делает его подходящим для легковесных структур, легко параллелизуемых и мотивирующих задач.
Тем не менее, барьеры Web2 AI только начинают формироваться, и это ранняя стадия конкуренции среди ведущих компаний. Только когда выгоды Web2 AI исчезнут, оставшиеся болевые точки станут возможностью для входа Web3 AI. До этого момента проекты Web3 AI должны тщательно оценить, могут ли они войти с краю, сочетая точки и поверхности, продвигаясь по кругу, а также имеют ли они гибкость для реагирования на постоянно меняющиеся рыночные требования.