Khó khăn và hướng phát triển tương lai của Web3 AI
Giá cổ phiếu Nvidia lại lập đỉnh cao mới, sự tiến hóa của các mô hình đa phương thức đã làm sâu sắc thêm rào cản công nghệ của AI Web2. Từ căn chỉnh ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến kết hợp đặc trưng, các mô hình phức tạp đang tích hợp các cách biểu đạt khác nhau với tốc độ đáng kinh ngạc, xây dựng một vùng đất AI ngày càng khép kín. Thị trường chứng khoán Mỹ đã bỏ phiếu bằng hành động, bất kể là cổ phiếu liên quan đến tiền điện tử hay cổ phiếu AI, đều đã xuất hiện một đợt sóng nhỏ tăng giá. Tuy nhiên, làn sóng này dường như không liên quan gì đến lĩnh vực tiền điện tử.
Gần đây, những nỗ lực của Web3 AI trong hướng Agent có sự lệch lạc rõ ràng về phương hướng: cố gắng lắp ráp hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung, thực tế là một sự sai lệch về cả công nghệ và tư duy. Trong bối cảnh tính liên kết mô-đun cực kỳ mạnh, sự phân bố đặc trưng không ổn định cao và yêu cầu tính toán ngày càng tập trung, mô-đun đa phương thức rất khó đứng vững trong Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước đơn giản, mà ở việc đi đường vòng chiến lược. Từ việc điều chỉnh ngữ nghĩa trong không gian bậc cao, đến nút thắt thông tin trong cơ chế chú ý, rồi đến việc điều chỉnh đặc trưng dưới sức mạnh tính toán không đồng nhất, Web3 AI cần lấy "nông thôn vây thành phố" làm chương trình hành động.
Web3 AI dựa trên mô hình đa phương thức phẳng, sự không khớp ngữ nghĩa dẫn đến hiệu suất thấp
Trong hệ thống đa mô thức AI Web2 hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các mô thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh ý nghĩa tiềm ẩn phía sau những tín hiệu có hình thức khác biệt này. Chỉ khi đạt được không gian nhúng đa chiều, việc chia quy trình làm việc thành các mô-đun khác nhau mới có ý nghĩa trong việc giảm chi phí và tăng hiệu quả. Tuy nhiên, giao thức Web3 Agent không thể đạt được không gian nhúng đa chiều, vì mô-đun hóa là một ảo tưởng của AI Web3.
Yêu cầu Web3 AI thực hiện không gian đa chiều, về cơ bản là yêu cầu giao thức Agent tự phát triển tất cả các API liên quan, điều này đi ngược lại với mục đích mô-đun ban đầu của nó. Hệ thống đa mô-đun mà các doanh nghiệp nhỏ và vừa trong Web3 AI mô tả không thể chịu được sự kiểm tra. Kiến trúc đa chiều yêu cầu đào tạo đồng bộ đầu cuối hoặc tối ưu hóa phối hợp, trong khi tư duy "mô-đun tức là plugin" của Web3 Agent lại làm gia tăng sự phân mảnh.
Để hiện thực hóa một tác nhân thông minh toàn chuỗi với rào cản ngành, cần phải có mô hình hợp tác từ đầu đến cuối, nhúng thống nhất giữa các mô-đun, cũng như kỹ thuật hệ thống cho việc đào tạo và triển khai hợp tác. Tuy nhiên, hiện tại thị trường không có điểm đau nào như vậy, do đó cũng không có nhu cầu thị trường.
Trong không gian chiều thấp, cơ chế chú ý không thể được thiết kế một cách tinh vi.
Mô hình đa phương thức cấp cao cần thiết kế cơ chế chú ý tinh vi. Điều kiện tiên quyết để cơ chế chú ý hoạt động là đa phương thức có độ chiều cao, trong không gian chiều cao, cơ chế chú ý tinh vi có thể tìm ra phần cốt lõi nhất trong không gian độ chiều cao khổng lồ trong thời gian ngắn nhất.
Web3 AI dựa trên mô-đun không thể thực hiện việc lập lịch chú ý thống nhất. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi các API độc lập trả về dữ liệu với định dạng và phân bố khác nhau, không thể tạo thành Q/K/V có thể tương tác. Thứ hai, chú ý đa đầu cho phép đồng thời chú ý đến các nguồn thông tin khác nhau, trong khi các API độc lập thường thực hiện gọi tuyến tính, thiếu khả năng phân phối động đa đường và song song. Cuối cùng, cơ chế chú ý thực sự sẽ phân bổ trọng số một cách động cho mỗi yếu tố dựa trên ngữ cảnh tổng thể, trong khi trong chế độ API, các mô-đun chỉ có thể nhìn thấy ngữ cảnh độc lập, không thể đạt được mối liên hệ và tập trung toàn cầu giữa các mô-đun.
Mô-đun hóa rời rạc dẫn đến việc tích hợp đặc điểm dừng lại ở các mảnh ghép tĩnh nông.
"Tích hợp đặc trưng" là việc kết hợp thêm các vectơ đặc trưng thu được từ các chế độ khác nhau sau khi đã xử lý dựa trên căn cứ của căn chỉnh và sự chú ý. Web3 AI vẫn ở giai đoạn ghép nối đơn giản nhất, vì việc tích hợp đặc trưng động yêu cầu không gian chiều cao và cơ chế chú ý tinh vi.
Web2 AI có xu hướng đào tạo liên kết từ đầu đến cuối, trong khi Web3 AI thường áp dụng cách ghép nối các mô-đun rời rạc. Web2 AI có khả năng tính toán điểm quan trọng của các đặc tính theo ngữ cảnh theo thời gian thực và điều chỉnh chiến lược kết hợp một cách linh hoạt; trong khi Web3 AI thường cố định trọng số trước hoặc sử dụng quy tắc đơn giản để xác định xem có kết hợp hay không, thiếu tính linh hoạt.
Web2 AI ánh xạ tất cả các đặc điểm của các mô hình vào không gian nhiều chiều, quá trình hội tụ bao gồm nhiều thao tác tương tác bậc cao. Ngược lại, đầu ra của các Agent trong Web3 AI có chiều thấp, khó diễn đạt mối liên hệ phức tạp giữa các mô hình. Hơn nữa, Web2 AI có khả năng tự động điều chỉnh chiến lược hội tụ thông qua phản hồi đầu cuối, trong khi Web3 AI chủ yếu phụ thuộc vào quy trình thủ công hoặc bên ngoài để đánh giá và điều chỉnh tham số.
Rào cản trong ngành AI đang gia tăng, nhưng điểm đau vẫn chưa xuất hiện
Hệ thống đa mô hình AI Web2 là một dự án kỹ thuật khổng lồ, cần một lượng lớn dữ liệu, sức mạnh tính toán mạnh mẽ, công nghệ tiên tiến và đội ngũ hiệu quả. Công việc hệ thống toàn chuỗi và toàn ngăn này tạo ra rào cản ngành rất mạnh mẽ, và cũng tạo ra năng lực cốt lõi của một số đội ngũ dẫn đầu.
Web3 AI nên phát triển theo chiến thuật bao vây thành phố từ nông thôn, thử nghiệm quy mô nhỏ ở các cảnh biên giới, chờ đợi cơ hội xuất hiện ở các cảnh cốt lõi. Ưu điểm của Web3 AI là phi tập trung, song song cao, độ liên kết thấp và khả năng tương thích tính toán dị thể, phù hợp với cấu trúc nhẹ, dễ song song và có thể khuyến khích các nhiệm vụ.
Tuy nhiên, rào cản của Web2 AI chỉ mới bắt đầu hình thành, đây là giai đoạn đầu của sự cạnh tranh giữa các doanh nghiệp hàng đầu. Chỉ khi lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới trở thành cơ hội để Web3 AI tham gia. Trước khi điều đó xảy ra, các dự án Web3 AI cần phải phân tích cẩn thận xem liệu có thể tham gia từ phía biên, kết hợp điểm và mặt, thúc đẩy vòng tròn, cũng như liệu có đủ linh hoạt để đáp ứng nhu cầu thị trường đang thay đổi.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Khó khăn trong phát triển Web3 AI: Hiểu lầm về mô-đun và hướng đột phá trong tương lai
Khó khăn và hướng phát triển tương lai của Web3 AI
Giá cổ phiếu Nvidia lại lập đỉnh cao mới, sự tiến hóa của các mô hình đa phương thức đã làm sâu sắc thêm rào cản công nghệ của AI Web2. Từ căn chỉnh ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến kết hợp đặc trưng, các mô hình phức tạp đang tích hợp các cách biểu đạt khác nhau với tốc độ đáng kinh ngạc, xây dựng một vùng đất AI ngày càng khép kín. Thị trường chứng khoán Mỹ đã bỏ phiếu bằng hành động, bất kể là cổ phiếu liên quan đến tiền điện tử hay cổ phiếu AI, đều đã xuất hiện một đợt sóng nhỏ tăng giá. Tuy nhiên, làn sóng này dường như không liên quan gì đến lĩnh vực tiền điện tử.
Gần đây, những nỗ lực của Web3 AI trong hướng Agent có sự lệch lạc rõ ràng về phương hướng: cố gắng lắp ráp hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung, thực tế là một sự sai lệch về cả công nghệ và tư duy. Trong bối cảnh tính liên kết mô-đun cực kỳ mạnh, sự phân bố đặc trưng không ổn định cao và yêu cầu tính toán ngày càng tập trung, mô-đun đa phương thức rất khó đứng vững trong Web3.
Tương lai của Web3 AI không nằm ở việc bắt chước đơn giản, mà ở việc đi đường vòng chiến lược. Từ việc điều chỉnh ngữ nghĩa trong không gian bậc cao, đến nút thắt thông tin trong cơ chế chú ý, rồi đến việc điều chỉnh đặc trưng dưới sức mạnh tính toán không đồng nhất, Web3 AI cần lấy "nông thôn vây thành phố" làm chương trình hành động.
Web3 AI dựa trên mô hình đa phương thức phẳng, sự không khớp ngữ nghĩa dẫn đến hiệu suất thấp
Trong hệ thống đa mô thức AI Web2 hiện đại, "căn chỉnh ngữ nghĩa" đề cập đến việc ánh xạ thông tin từ các mô thức khác nhau vào cùng một không gian ngữ nghĩa, giúp mô hình hiểu và so sánh ý nghĩa tiềm ẩn phía sau những tín hiệu có hình thức khác biệt này. Chỉ khi đạt được không gian nhúng đa chiều, việc chia quy trình làm việc thành các mô-đun khác nhau mới có ý nghĩa trong việc giảm chi phí và tăng hiệu quả. Tuy nhiên, giao thức Web3 Agent không thể đạt được không gian nhúng đa chiều, vì mô-đun hóa là một ảo tưởng của AI Web3.
Yêu cầu Web3 AI thực hiện không gian đa chiều, về cơ bản là yêu cầu giao thức Agent tự phát triển tất cả các API liên quan, điều này đi ngược lại với mục đích mô-đun ban đầu của nó. Hệ thống đa mô-đun mà các doanh nghiệp nhỏ và vừa trong Web3 AI mô tả không thể chịu được sự kiểm tra. Kiến trúc đa chiều yêu cầu đào tạo đồng bộ đầu cuối hoặc tối ưu hóa phối hợp, trong khi tư duy "mô-đun tức là plugin" của Web3 Agent lại làm gia tăng sự phân mảnh.
Để hiện thực hóa một tác nhân thông minh toàn chuỗi với rào cản ngành, cần phải có mô hình hợp tác từ đầu đến cuối, nhúng thống nhất giữa các mô-đun, cũng như kỹ thuật hệ thống cho việc đào tạo và triển khai hợp tác. Tuy nhiên, hiện tại thị trường không có điểm đau nào như vậy, do đó cũng không có nhu cầu thị trường.
Trong không gian chiều thấp, cơ chế chú ý không thể được thiết kế một cách tinh vi.
Mô hình đa phương thức cấp cao cần thiết kế cơ chế chú ý tinh vi. Điều kiện tiên quyết để cơ chế chú ý hoạt động là đa phương thức có độ chiều cao, trong không gian chiều cao, cơ chế chú ý tinh vi có thể tìm ra phần cốt lõi nhất trong không gian độ chiều cao khổng lồ trong thời gian ngắn nhất.
Web3 AI dựa trên mô-đun không thể thực hiện việc lập lịch chú ý thống nhất. Đầu tiên, cơ chế chú ý phụ thuộc vào không gian Query-Key-Value thống nhất, trong khi các API độc lập trả về dữ liệu với định dạng và phân bố khác nhau, không thể tạo thành Q/K/V có thể tương tác. Thứ hai, chú ý đa đầu cho phép đồng thời chú ý đến các nguồn thông tin khác nhau, trong khi các API độc lập thường thực hiện gọi tuyến tính, thiếu khả năng phân phối động đa đường và song song. Cuối cùng, cơ chế chú ý thực sự sẽ phân bổ trọng số một cách động cho mỗi yếu tố dựa trên ngữ cảnh tổng thể, trong khi trong chế độ API, các mô-đun chỉ có thể nhìn thấy ngữ cảnh độc lập, không thể đạt được mối liên hệ và tập trung toàn cầu giữa các mô-đun.
Mô-đun hóa rời rạc dẫn đến việc tích hợp đặc điểm dừng lại ở các mảnh ghép tĩnh nông.
"Tích hợp đặc trưng" là việc kết hợp thêm các vectơ đặc trưng thu được từ các chế độ khác nhau sau khi đã xử lý dựa trên căn cứ của căn chỉnh và sự chú ý. Web3 AI vẫn ở giai đoạn ghép nối đơn giản nhất, vì việc tích hợp đặc trưng động yêu cầu không gian chiều cao và cơ chế chú ý tinh vi.
Web2 AI có xu hướng đào tạo liên kết từ đầu đến cuối, trong khi Web3 AI thường áp dụng cách ghép nối các mô-đun rời rạc. Web2 AI có khả năng tính toán điểm quan trọng của các đặc tính theo ngữ cảnh theo thời gian thực và điều chỉnh chiến lược kết hợp một cách linh hoạt; trong khi Web3 AI thường cố định trọng số trước hoặc sử dụng quy tắc đơn giản để xác định xem có kết hợp hay không, thiếu tính linh hoạt.
Web2 AI ánh xạ tất cả các đặc điểm của các mô hình vào không gian nhiều chiều, quá trình hội tụ bao gồm nhiều thao tác tương tác bậc cao. Ngược lại, đầu ra của các Agent trong Web3 AI có chiều thấp, khó diễn đạt mối liên hệ phức tạp giữa các mô hình. Hơn nữa, Web2 AI có khả năng tự động điều chỉnh chiến lược hội tụ thông qua phản hồi đầu cuối, trong khi Web3 AI chủ yếu phụ thuộc vào quy trình thủ công hoặc bên ngoài để đánh giá và điều chỉnh tham số.
Rào cản trong ngành AI đang gia tăng, nhưng điểm đau vẫn chưa xuất hiện
Hệ thống đa mô hình AI Web2 là một dự án kỹ thuật khổng lồ, cần một lượng lớn dữ liệu, sức mạnh tính toán mạnh mẽ, công nghệ tiên tiến và đội ngũ hiệu quả. Công việc hệ thống toàn chuỗi và toàn ngăn này tạo ra rào cản ngành rất mạnh mẽ, và cũng tạo ra năng lực cốt lõi của một số đội ngũ dẫn đầu.
Web3 AI nên phát triển theo chiến thuật bao vây thành phố từ nông thôn, thử nghiệm quy mô nhỏ ở các cảnh biên giới, chờ đợi cơ hội xuất hiện ở các cảnh cốt lõi. Ưu điểm của Web3 AI là phi tập trung, song song cao, độ liên kết thấp và khả năng tương thích tính toán dị thể, phù hợp với cấu trúc nhẹ, dễ song song và có thể khuyến khích các nhiệm vụ.
Tuy nhiên, rào cản của Web2 AI chỉ mới bắt đầu hình thành, đây là giai đoạn đầu của sự cạnh tranh giữa các doanh nghiệp hàng đầu. Chỉ khi lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới trở thành cơ hội để Web3 AI tham gia. Trước khi điều đó xảy ra, các dự án Web3 AI cần phải phân tích cẩn thận xem liệu có thể tham gia từ phía biên, kết hợp điểm và mặt, thúc đẩy vòng tròn, cũng như liệu có đủ linh hoạt để đáp ứng nhu cầu thị trường đang thay đổi.