Виклики розвитку Web3 AI: модульні помилки та напрямки майбутніх突破ів

robot
Генерація анотацій у процесі

Визови та майбутні напрямки розвитку Web3 AI

Акції Nvidia знову досягли рекорду, еволюція мультимодальних моделей поглибила технологічний бар'єр Web2 AI. Від семантичного вирівнювання до візуального розуміння, від високорозмірних вбудовувань до об'єднання ознак, складні моделі дивовижними темпами інтегрують різні способи вираження, будуючи дедалі закриту AI-територію. Ринок акцій США голосує діями, незалежно від того, чи це акції, пов'язані з криптовалютою, чи акції AI, всі вони проходять через невелику бичачу тенденцію. Однак ця хвиля ентузіазму, здається, не має жодного відношення до сфери криптовалют.

Нещодавні спроби Web3 AI в напрямку Agent мають очевидне відхилення: намагаються зібрати модульну систему в стилі Web2 за допомогою децентралізованої структури, що насправді є подвійним спотворенням технології та мислення. У сьогоднішньому світі, де модулі мають дуже високу зв'язність, розподіл ознак є надзвичайно нестабільним, а вимоги до обчислювальної потужності дедалі більше зосереджені, модульна система в Web3 важко може знайти своє місце.

Майбутнє Web3 AI полягає не в простому наслідуванні, а в стратегічному обході. Від семантичної уніфікації у високорозмірному просторі до інформаційних вузьких місць у механізмі уваги, а також до уніфікації ознак під гетерогенними обчисленнями, Web3 AI потрібно використовувати "село, що оточує місто" як тактичну програму.

Web3 AI на основі спрощеної багатомодальної моделі, семантична несумісність призводить до зниження продуктивності

У сучасних мультимодальних системах Web2 AI "семантичне вирівнювання" означає відображення інформації з різних модальностей в одну семантичну простір, що дозволяє моделям розуміти та порівнювати внутрішній зміст цих різних сигналів. Лише за умови досягнення високодомірного вбудованого простору розподіл робочих процесів на різні модулі має сенс для зниження витрат та підвищення ефективності. Однак протокол Web3 Agent не може реалізувати високодомірне вбудоване простір, оскільки модульність є ілюзією Web3 AI.

Вимога до Web3 AI реалізувати високопірний простір фактично є вимогою до протоколу Agent самостійно розробити всі необхідні API інтерфейси, що суперечить його модульній концепції. Модульна багатомодальна система, описана малими та середніми підприємствами Web3 AI, не витримує критики. Високодимензійна архітектура вимагає єдиного навчання від початку до кінця або спільної оптимізації, в той час як підхід Web3 Agent "модуль - це плагін" навпаки загострює фрагментацію.

Щоб реалізувати повноцінний розумний агент з бар'єрами в індустрії, необхідно здійснити спільне моделювання від кінця до кінця, єдине впровадження між модулями, а також систематичну інженерію для спільного навчання та розгортання. Але на сьогоднішній день на ринку немає таких больових точок, отже, немає й попиту на ринку.

У низьковимірному просторі механізм уваги не може бути точно спроектований

Високоякісні мультимодальні моделі потребують розробки досконалих механізмів уваги. Умовою функціонування механізму уваги є наявність високих вимірів мультимодальності, у високовимірному просторі досконалий механізм уваги може за найкоротший час знайти найосновніші частини з величезного високовимірного простору.

Модульна Web3 AI не може реалізувати єдине управління увагою. По-перше, механізм уваги залежить від єдиного простору Query-Key-Value, тоді як незалежні API повертають дані в різних форматах і з різними розподілами, що не дозволяє створити інтерактивні Q/K/V. По-друге, багатоголове увагу дозволяє одночасно зосереджуватись на різних джерелах інформації, тоді як незалежні API часто викликаються лінійно, що позбавляє їх можливості паралельного та динамічного зважування. Нарешті, справжній механізм уваги динамічно розподіляє ваги кожному елементу на основі загального контексту, тоді як в API-режимі модулі можуть бачити лише незалежний контекст, що не дозволяє реалізувати глобальну асоціацію та фокусування між модулями.

Дискретна модульна збірка призводить до того, що злиття ознак залишається на поверхневому статичному з'єднанні

"Злиття ознак" - це подальше об'єднання векторів ознак, отриманих після обробки різних модальностей на основі вирівнювання та уваги. Web3 AI залишається на найпростішій стадії з'єднання, оскільки динамічне злиття ознак передбачає наявність високооб'ємного простору та точного механізму уваги.

Web2 AI схильний до енд-ту-енд спільного навчання, тоді як Web3 AI більше використовує підхід з дискретними модулями. Web2 AI може в реальному часі розраховувати важливість різних ознак на основі контексту і динамічно коригувати стратегію злиття; тоді як Web3 AI часто заздалегідь фіксує ваги або використовує прості правила для визначення, чи слід зливати, що позбавляє його гнучкості.

Web2 AI відображає всі модальності ознак у високорозмірному просторі, а процес злиття включає в себе багато видів взаємодії вищого порядку. На відміну від цього, у Web3 AI вихідні виміри кожного агента дуже низькі, що ускладнює вираження складних міжмодальних зв'язків. Крім того, Web2 AI може автоматично налаштовувати стратегію злиття через зворотний зв'язок «від кінця до кінця», тоді як Web3 AI в значній мірі покладається на ручні або зовнішні процеси для оцінки та налаштування параметрів.

Бар'єри в AI-індустрії поглиблюються, але болючі точки ще не з'явилися

Багатомодальна система Web2 AI є великим інженерним проектом, який потребує величезних обсягів даних, потужних обчислювальних ресурсів, передових технологій та ефективних команд. Така системна робота з повним спектром послуг створює дуже сильний бар'єр для входження в галузь і формує основну конкурентоспроможність кількох провідних команд.

Web3 AI повинен розвиватися за тактикою "села оточують місто", пробуючи себе в маломасштабних крайових сценаріях, чекаючи на появу можливостей у ключових сценах. Переваги Web3 AI полягають у децентралізації, високій паралельності, низькій зв'язаності та сумісності гетерогенної обчислювальної потужності, що підходить для легких структур, простих для паралелізації та мотивуючих завдань.

Однак бар'єри Web2 AI тільки починають формуватися, і це рання стадія конкуренції між провідними компаніями. Лише коли прибутки Web2 AI зникнуть майже повністю, залишені ними болючі моменти стануть можливістю для входу Web3 AI. До того часу проекти Web3 AI повинні ретельно визначити, чи можуть вони входити з краю, поєднуючи окремі елементи, просуваючись по колу, а також чи мають гнучкість, щоб відповідати на постійно змінювані потреби ринку.

AGENT-11.8%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Репост
  • Поділіться
Прокоментувати
0/400
TaxEvadervip
· 07-31 04:33
втрата децентралізації
Переглянути оригіналвідповісти на0
ContractExplorervip
· 07-30 07:04
Треба ще інновацій і проривів
Переглянути оригіналвідповісти на0
FlashLoanLordvip
· 07-30 06:57
Кінець розподілу – це централізація
Переглянути оригіналвідповісти на0
MEVHunterZhangvip
· 07-30 06:51
Явна оптимізація стала вузьким місцем
Переглянути оригіналвідповісти на0
FloorPriceNightmarevip
· 07-30 06:51
Душа роботи не може рухатися.
Переглянути оригіналвідповісти на0
  • Закріпити