Hiểu Bacalhau 1.0 trong một bài viết: Khai phá tiềm năng của dữ liệu riêng tư

Nguồn ban đầu: Mạng Filecoin

*Bài viết này dựa trên bài trình bày của Simon Worthington tại Hội nghị thượng đỉnh Boston vào tháng 5 năm 2023. *

Bacalhau cách mạng hóa bối cảnh xử lý dữ liệu bằng cách cho phép tính toán gốc dữ liệu: gửi mã để chạy phân tích nơi dữ liệu nằm, thay vì di chuyển dữ liệu vào mã. Bằng cách bảo quản dữ liệu và cho phép dữ liệu được ủy quyền, kiểm tra và kiểm soát để tính toán, nhiều dữ liệu hơn có thể được sử dụng đồng thời giảm nguy cơ sử dụng sai mục đích, đây là câu trả lời cho vấn đề quản trị dữ liệu. Khối lượng dữ liệu đang tăng nhanh hơn 45% so với băng thông mạng, 57% dữ liệu được lưu trữ bên ngoài đám mây hoặc trung tâm dữ liệu truyền thống và việc di chuyển dữ liệu quá chậm và tốn kém đối với bất kỳ tổ chức nào hoạt động trên quy mô lớn.

Có một lý do chính đáng khác để giữ dữ liệu cục bộ: kiểm soát. Cho dù thông qua các quy định bắt buộc như Đạo luật về trách nhiệm giải trình và cung cấp thông tin bảo hiểm y tế (HIPAA) hay Quy định chung về bảo vệ dữ liệu (GDPR) hay các biện pháp bảo vệ riêng đối với bí mật tài chính hoặc bí mật nhạy cảm của công ty, thì gần như 100% tất cả dữ liệu đều nằm dưới một số hình thức quản trị. Di chuyển dữ liệu vào máy tính sẽ đưa dữ liệu ra khỏi vùng an toàn thông thường và làm tăng nguy cơ sử dụng sai mục đích.

Hiểu về Bacalhau 1.0 trong một bài viết: Giải phóng tiềm năng của dữ liệu riêng tư

Hầu hết dữ liệu không hoàn toàn mở hoặc đóng mà tồn tại trong một phạm vi nhất định. Trong phạm vi này, những người cụ thể có thể được cấp quyền truy cập cho các mục đích cụ thể.

Nguồn: ODI

Kể từ năm 2008, tổng số tiền phạt quản lý dữ liệu toàn cầu đã lên tới gần 250 tỷ USD. Do đó, không có gì ngạc nhiên khi hầu hết các doanh nghiệp sợ chia sẻ dữ liệu, dẫn đến 68% dữ liệu của công ty chưa được khai thác. Trên thực tế, về nguyên tắc, hầu hết dữ liệu được kiểm soát có thể được chia sẻ và sử dụng để đưa ra quyết định hiệu quả hơn — nhưng chỉ với đúng người và đúng mục đích.

Chia sẻ dữ liệu yêu cầu thực thi kỹ thuật

Hầu hết các tổ chức cố gắng đáp ứng nhu cầu này bằng các thỏa thuận hoặc hợp đồng chia sẻ dữ liệu nghiêm ngặt. Các giao thức này rất tốn kém và mất thời gian để thiết lập—đối với các doanh nghiệp như chính phủ quốc gia hoặc tổ chức tài chính, có thể mất hàng tháng để hoàn tất quá trình quản trị dữ liệu nhằm cho phép chia sẻ dữ liệu giữa các nhóm nội bộ.

Tệ hơn nữa, những thỏa thuận này đơn giản là không hoạt động — hầu hết các thỏa thuận chia sẻ dữ liệu hoàn toàn không thể thực thi được và chỉ nhằm mục đích mang lại cảm giác an toàn sai lầm. Khi dữ liệu vượt qua ranh giới tin cậy, chỉ có các cơ chế mềm (chẳng hạn như tin tưởng mọi người tuân thủ thỏa thuận) mới có thể ngăn chặn lạm dụng. Hoạt động thực tế của việc chia sẻ dữ liệu là vô hình đối với mọi người và rất khó để giám sát.

“Hợp đồng hoặc thỏa thuận giữa nhà cung cấp dữ liệu và người sử dụng dữ liệu thường tỏ ra không hiệu quả.

Trong vụ bê bối Cambridge Analytica, các điều khoản hợp đồng hoàn toàn bị phớt lờ và dữ liệu cá nhân bị lạm dụng.

Việc thiếu bất kỳ bằng chứng kỹ thuật mạnh mẽ nào có thể ngăn cản phòng xử án tiếp cận thông tin hợp lệ và khiến các cơ quan quản lý, chính trị gia, nhà báo và công chúng khó hiểu chuyện gì đã xảy ra. "

——Đặt niềm tin vào niềm tin dữ liệu, Register Dynamics, 2019

Rõ ràng, điều cần thiết là một cách mới để tái sử dụng dữ liệu qua các ranh giới tin cậy: một cách cho phép các nhà phân tích truy cập dữ liệu một cách đơn giản, có kiểm soát mà không gặp rủi ro về tiền phạt theo quy định và tiêu đề cho chủ sở hữu dữ liệu.

Bacalhau làm cho việc chia sẻ dữ liệu trở nên rõ ràng và có thể kiểm tra được

Tại Bacalhau, chúng tôi tin rằng điện toán dựa trên dữ liệu là câu trả lời cho những thách thức về quản trị dữ liệu. Bằng cách bảo toàn dữ liệu và cho phép dữ liệu được ủy quyền, kiểm tra và kiểm soát để tính toán, có thể sử dụng nhiều dữ liệu hơn đồng thời giảm nguy cơ lạm dụng.

Hơn nữa, vì Bacalhau là một nền tảng điện toán phân tán nên không cần phải di chuyển dữ liệu đến bộ lưu trữ trung tâm. Dữ liệu có thể tồn tại ở bất cứ đâu trong tổ chức, tránh những thay đổi khó khăn về tổ chức và lấy đi mọi quyền kiểm soát của chủ sở hữu dữ liệu.

Chúng tôi tự hào thông báo rằng là một phần của Bacalhau 1.0, chúng tôi đã bổ sung khả năng quản trị dữ liệu và công việc. Với Bacalhau, chủ sở hữu dữ liệu có thể kiểm soát ai, cái gì, ở đâu, tại sao và cách thức tính toán được thực hiện trên dữ liệu riêng tư của họ.

Mã điều khiển Bacalhau và đầu ra

Bacalhau sử dụng cách tiếp cận hai bước để kiểm soát công việc. Đầu tiên, chủ sở hữu dữ liệu có cơ hội kiểm tra xem các công việc có tuân thủ chính sách của họ hay không. Giai đoạn tiền quản trị này xảy ra trước khi công việc bắt đầu chạy và cho phép quản trị phê duyệt hoặc từ chối tính toán dựa trên dữ liệu sẽ được sử dụng, người yêu cầu công việc và mã sẽ được thực thi đối với công việc.

Mặc dù con người luôn nắm quyền kiểm soát, nhưng không phải mọi quyết định đều cần được đưa ra bởi con người. Quá trình tiền quản trị linh hoạt và có thể được tự động hóa khi cần thiết. Chủ sở hữu dữ liệu có thể đặt chính sách, kiểm tra sâu các tính toán sắp tới, đặt các chính sách khác nhau cho những người khác nhau và gọi các thuật toán phức tạp để phân tích bảo mật và rủi ro. Khi một công việc không phù hợp với điều khiển tự động, con người có thể đưa ra quyết định cuối cùng.

Hiểu về Bacalhau 1.0 trong một bài viết: giải phóng tiềm năng của dữ liệu riêng tư

Bacalhau cung cấp hai cổng để tính toán - một trước khi tính toán và một sau khi tính toán.

Sau khi được phê duyệt, Bacalhau sẽ gửi công việc tới người thực thi thích hợp, người này chỉ có quyền truy cập vào dữ liệu được yêu cầu và được cách ly an toàn khỏi hệ thống máy chủ. Bacalhau áp đặt các ràng buộc tài nguyên đối với các công việc để kiểm soát sức mạnh xử lý và mức sử dụng bộ nhớ.

Mặc dù kiểm soát trước cung cấp một tuyến phòng thủ đầu tiên hợp lý cho sự tin cậy, nhưng nói chung, việc quyết định xem một chương trình máy tính sẽ làm gì mà không chạy nó là một việc khó khăn và đòi hỏi các kỹ năng kỹ thuật. Chúng tôi đã học được từ kinh nghiệm rằng ONS và các môi trường nghiên cứu được kiểm soát có liên quan khác đã cho phép truy cập dữ liệu có kiểm soát một cách an toàn trong nhiều thập kỷ và vay mượn từ thực tiễn của họ trong lĩnh vực kỹ thuật số. Do đó, ngoài các điều khiển trước khi thực hiện, Bacalhau còn cho phép sửa đổi kết quả sau khi thực hiện trước khi chúng được phát hành cho người gửi tác vụ.

Khi Bacalhau hoàn thành các tính toán của mình, nó sẽ lưu kết quả vào một trường tiền phát hành riêng tư. Sau đó, quản trị viên sử dụng kết quả kiểm tra lý lịch của công việc để xác định xem những kết quả đó có phù hợp với công việc hay không. Kết quả có thể được tải xuống nếu quản trị viên cho rằng nội dung phù hợp để chia sẻ. Hơn nữa, quyền truy cập vào khu vực lưu trữ riêng bị khóa nghiêm ngặt và người dùng chỉ có thể truyền kết quả cho công việc của chính họ thông qua tính năng tải xuống của Bacalhau.

Cũng giống như các biện pháp kiểm soát trước, toàn bộ các phân tích phức tạp có thể được thực hiện trên các kết quả. Với công nghệ Amplify, chủ sở hữu dữ liệu có thể tự động phát hiện thông tin nhận dạng cá nhân (PII), tóm tắt dữ liệu dạng bảng như CSV và phân tích nội dung trong hình ảnh và video clip. Siêu dữ liệu được tạo có thể được sử dụng để tự động công bố kết quả và cung cấp thông tin có giá trị cho quá trình ra quyết định của con người.

Điều khiển để mở một bài học chung mới

Tính toán trên dữ liệu được phân tách bằng ranh giới tin cậy cho phép chia sẻ dữ liệu lớn, nhưng hiện không có giải pháp kỹ thuật an toàn nào. Các tổ chức hiện có thể áp dụng kiểm duyệt công việc Bacalhau và truy cập dữ liệu mở mà không cần quản trị dữ liệu phức tạp nếu dữ liệu do một tổ chức nắm giữ được chia sẻ rộng rãi hơn để tạo ra giá trị chung.

Ví dụ: một trường đại học có thể cung cấp nhiều dữ liệu hơn cho các nhà khoa học công dân hoặc các nhà nghiên cứu bên ngoài, một cơ quan chính phủ có thể cho phép cơ quan khác phân tích dữ liệu của mình hoặc một nhóm tại tổ chức tài chính được quản lý chặt chẽ có thể cho phép cơ quan khác phân tích sâu dữ liệu của mình. Tóm lại, điều quan trọng là không tiết lộ dữ liệu thô cho những người dùng ít tin cậy hơn. Bacalhau đảm bảo rằng người dùng nhận được kết quả phân tích của họ và không có gì khác.

Hiểu về Bacalhau 1.0 trong một bài viết: Giải phóng tiềm năng của dữ liệu riêng tư

Mô hình điện toán được kiểm soát phân tán tương tự cũng cho phép học tập liên kết giữa những người tham gia trong các tổ chức khác nhau. Với Bacalhau, các tổ chức độc lập có thể tiến hành phân tích chuyên sâu từ dữ liệu tổng hợp mà không cần chia sẻ dữ liệu. Với các kỹ thuật học liên kết, các nhà khoa học dữ liệu giờ đây có thể đào tạo các mô hình máy học hoặc AI trên bộ dữ liệu của nhiều tổ chức độc lập hoặc thậm chí cạnh tranh khác nhau mà không trao cho các tổ chức đó quyền kiểm soát dữ liệu và khả năng hiển thị chính xác về việc sử dụng dữ liệu.

Ví dụ, các cơ quan chính phủ trung ương chịu trách nhiệm xây dựng các chính sách kinh tế vĩ mô có thể sử dụng dữ liệu do các tổ chức địa phương nắm giữ. Tương tự như vậy, các cơ quan trong ngành như cơ quan quản lý bảo hiểm có thể đào tạo người mẫu bằng cách gửi các công việc Bacalhau học tập liên kết cho tất cả các công ty bảo hiểm thành viên của họ.

Tập trung dữ liệu vào một nơi có thể dẫn đến việc bán hoặc sử dụng sai dữ liệu tổng hợp có giá trị này; nhưng việc lưu trữ dữ liệu cục bộ cho phép mỗi công ty bảo hiểm chắc chắn rằng dữ liệu của họ chỉ được sử dụng cho các mục đích cùng có lợi.

Tính toán các đảo để phân tích chủ đề cụ thể

Cuối cùng, khả năng kiểm soát chi tiết đối với việc thực thi công việc do Bacalhau cung cấp giờ đây cho phép quản trị viên trở thành cổng vào các đảo máy tính. Trong cấu trúc này, các nhà cung cấp máy tính độc lập và chủ sở hữu dữ liệu quan tâm đến việc cung cấp tài nguyên cho các mục đích cụ thể có thể ủy quyền công việc cho các bộ điều khiển đáng tin cậy.

Hiểu về Bacalhau 1.0 trong một bài viết: Giải phóng tiềm năng của dữ liệu riêng tư

Ví dụ, các nhà khoa học hợp tác để thu thập dữ liệu y tế có thể giúp điều trị ung thư có thể cung cấp dữ liệu và tính toán thông qua người quản lý bên ngoài mà họ tin tưởng. Người kiểm soát chỉ chấp nhận những công việc tuân thủ các chính sách đã thỏa thuận—trong trường hợp này, những công việc góp phần vào các phương pháp điều trị ung thư mới.

Bằng cách này, các nhà khoa học có thể tập trung vào các mục tiêu công ích lớn hơn bằng cách ủy quyền các yêu cầu truy cập bên ngoài cho các bộ điều khiển. Với nhật ký kiểm tra mạnh mẽ của Bacalhau, các nhà khoa học sau này có thể xác minh rằng những người kiểm soát đã hành động theo các chính sách đã được thống nhất.

Bacalhau là tương lai của việc chia sẻ dữ liệu

Chúng tôi rất vui mừng được phát hành khả năng quản lý dữ liệu và công việc trong Bacalhau 1.0! Chúng tôi tin rằng điện toán dữ liệu đại diện cho một cách suy nghĩ mới về chia sẻ dữ liệu—nói tóm lại, giữ an toàn cho dữ liệu bằng cách không chia sẻ dữ liệu đó!

Ngày nay, chúng tôi đang làm việc với các công ty và cơ quan chính phủ nhận ra tiềm năng của điện toán được quản lý xuyên qua các ranh giới tin cậy. Nếu bạn muốn tìm hiểu thêm về cách các tính năng này có thể hoạt động cho bạn, hãy tham gia Bacalhau Slack hoặc liên hệ trực tiếp với chúng tôi.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)