استكشاف مقدمة التدريب اللامركزي للذكاء الاصطناعي: Prime Intellect يقود نمط الشبكات التعاونية الجديد

استكشاف الحدود المتقدمة للتدريب اللامركزي: الكأس المقدسة لـ Crypto AI

في سلسلة القيمة الكاملة للذكاء الاصطناعي، يُعتبر تدريب النماذج هو المرحلة الأكثر استهلاكًا للموارد والأعلى من حيث العوائق التقنية، حيث يحدد بشكل مباشر الحد الأقصى لقدرات النموذج وفعالية تطبيقه الفعلي. بالمقارنة مع استدعاء المرحلة الاستدلالية الخفيف، يتطلب عملية التدريب استثمارًا مستمرًا في قوة الحوسبة الكبيرة، وعمليات معالجة بيانات معقدة، ودعم خوارزميات تحسين عالية الكثافة، مما يجعلها "الصناعة الثقيلة" الحقيقية لبناء نظام الذكاء الاصطناعي. من منظور نماذج الهيكل، يمكن تقسيم طرق التدريب إلى أربع فئات: التدريب المركزي، التدريب الموزع، التعلم الفيدرالي، والتدريب اللامركزي الذي يتم مناقشته في هذه الورقة.

كأس المقدّس للذكاء الاصطناعي في العملات الرقمية: استكشافات متقدّمة في التدريب اللامركزي

التدريب المركزي هو الطريقة التقليدية الأكثر شيوعًا، حيث يتم تنفيذ جميع عمليات التدريب من قبل مؤسسة واحدة داخل مجموعة محلية عالية الأداء، حيث يتم تنسيق تشغيل جميع مكونات الأجهزة والبرامج الأساسية ونظام جدولة المجموعات وإطار التدريب بواسطة نظام تحكم موحد. هذه البنية التحتية المتكاملة تعزز كفاءة مشاركة الذاكرة، وتزامن التدرجات، وآليات تحمل الأخطاء، مما يجعلها مثالية لتدريب نماذج كبيرة مثل GPT وGemini، ولديها مزايا الكفاءة العالية والتحكم في الموارد، ولكنها تعاني في نفس الوقت من مشاكل احتكار البيانات، وحواجز الموارد، واستهلاك الطاقة، ومخاطر النقطة الواحدة.

التدريب الموزع هو الطريقة الرئيسية الحالية لتدريب النماذج الكبيرة، حيث تتلخص الفكرة الأساسية في تقسيم مهام تدريب النموذج ثم توزيعها على عدة آلات للتنفيذ المتزامن، بهدف التغلب على قيود الحساب والتخزين في جهاز واحد. على الرغم من أن لديها خصائص "موزعة" من الناحية الفيزيائية، إلا أن النظام الكلي لا يزال تحت سيطرة وإدارة مركزية، وغالبًا ما يعمل في بيئة شبكة محلية عالية السرعة، من خلال تقنية NVLink للحافلات السريعة، حيث يقوم العقدة الرئيسية بتنسيق المهام الفرعية بشكل موحد. تشمل الطرق الرئيسية:

  • التوازي البياني: كل عقدة تدرب معلمات بيانات مختلفة مشتركة، يجب مطابقة أوزان النموذج
  • التوازي النموذجي: نشر أجزاء مختلفة من النموذج على عقد مختلفة لتحقيق قابلية التوسع العالية
  • تنفيذ متسلسل على مراحل: زيادة معدل الإرسال
  • التوازي الشددي: تقسيم دقيق لحساب المصفوفات، تعزيز درجة التوازي

التدريب الموزع هو مزيج من "التحكم المركزي + التنفيذ الموزع"، على غرار نفس المدير الذي يقود عن بُعد تعاون موظفي "المكاتب" المتعددة لإنجاز المهام. في الوقت الحالي، يتم تدريب تقريبًا جميع النماذج الكبيرة الرئيسية (GPT-4 وGemini وLLaMA وغيرها من خلال هذه الطريقة.

اللامركزية التدريب تمثل مسارًا مستقبليًا أكثر انفتاحًا ومقاومةً للرقابة. تتمثل ميزتها الأساسية في: يمكن أن تكون عدة عقد غير موثوقة ) أجهزة كمبيوتر منزلية، أو وحدات معالجة رسومات سحابية، أو أجهزة حافة ( تعمل معًا لإكمال مهام التدريب دون منسق مركزي، عادةً من خلال بروتوكول يقود توزيع المهام والتعاون، ويعتمد على آلية تحفيز مشفرة لضمان نزاهة المساهمات. تشمل التحديات الرئيسية التي تواجه هذا النموذج:

  • صعوبة التوافق بين الأجهزة المتنوعة وتقسيم المهام: صعوبة التنسيق بين الأجهزة المتنوعة وكفاءة منخفضة في تقسيم المهام
  • اختناق كفاءة الاتصال: عدم استقرار الاتصال الشبكي، وجود اختناق واضح في مزامنة التدرج
  • نقص التنفيذ الموثوق: عدم وجود بيئة تنفيذ موثوقة، مما يجعل من الصعب التحقق مما إذا كانت العقدة تشارك فعليًا في الحساب
  • نقص التنسيق الموحد: لا يوجد جهاز تحكم مركزي، توزيع المهام، وآلية التراجع عن الاستثناءات معقدة

يمكن فهم التدريب اللامركزي على أنه: مجموعة من المتطوعين من جميع أنحاء العالم، يساهمون كل منهم بقوة الحوسبة لتدريب النموذج بشكل متعاون، ولكن "التدريب اللامركزي الكبير القابل للتطبيق حقًا" لا يزال يمثل تحديًا هندسيًا منهجيًا، ويتعلق بمجالات متعددة مثل هندسة النظام، بروتوكول الاتصال، أمان التشفير، الآلية الاقتصادية، والتحقق من النموذج، لكن ما إذا كان يمكن تحقيق "التعاون الفعال + تحفيز الصدق + النتائج الصحيحة" لا يزال في مرحلة استكشاف النماذج الأولية المبكرة.

التعلم الفيدرالي كمرحلة انتقالية بين التوزيع واللامركزية، يؤكد على الاحتفاظ بالبيانات محليًا، وتركيز تجميع معلمات النموذج، وهو مناسب للسيناريوهات التي تركز على امتثال الخصوصية ) مثل الرعاية الصحية والمالية (. يتمتع التعلم الفيدرالي بهيكل هندسي للتدريب الموزع وقدرة على التعاون المحلي، بينما يجمع أيضًا مزايا توزيع البيانات من التدريب اللامركزي، ولكنه لا يزال يعتمد على جهة تنسيق موثوقة، ولا يتمتع بخصائص الانفتاح الكامل ومقاومة الرقابة. يمكن اعتباره نوعًا من "اللامركزية الخاضعة للرقابة" في السيناريوهات التي تتطلب امتثال الخصوصية، حيث تكون مهام التدريب، وهيكل الثقة وآلية الاتصال أكثر اعتدالًا، مما يجعله أكثر ملاءمة كهيكل نشر انتقالي في الصناعة.

![كأس المقدس للذكاء الاصطناعي: استكشاف الحدود للتدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-a8004f094fff74515470052b3a24617c.webp(

اللامركزية تدريب الحدود، الفرص والطرق الواقعية

من منظور نمط التدريب، فإن التدريب اللامركزي لا يناسب جميع أنواع المهام. في بعض السيناريوهات، بسبب تعقيد هيكل المهمة، أو ارتفاع متطلبات الموارد، أو صعوبة التعاون، فإنه بطبيعته غير مناسب لإكماله بكفاءة بين العقد غير الموثوقة والمختلفة. على سبيل المثال، يعتمد تدريب النماذج الكبيرة غالباً على ذاكرة وصول عشوائي كبيرة، زمن انتقال منخفض، وعرض نطاق ترددي عالي، مما يجعل من الصعب تقسيمه ومزامنته بفعالية في شبكة مفتوحة؛ كما أن المهام التي تفرض قيوداً قوية على خصوصية البيانات والسيادة مثل الرعاية الصحية، والمالية، والبيانات الحساسة ) مقيدة بالقوانين والامتثال والاعتبارات الأخلاقية، مما يمنع المشاركة المفتوحة؛ بينما المهام التي تفتقر إلى حوافز التعاون مثل نماذج الشركات المغلقة أو تدريب النماذج الداخلية ( تفتقر إلى الدافع للمشاركة الخارجية. تشكل هذه الحدود معاً القيود الواقعية الحالية على التدريب اللامركزي.

لكن هذا لا يعني أن التدريب اللامركزي هو مسألة زائفة. في الواقع، في أنواع المهام الهيكلية الخفيفة، سهلة التوازي، والمحفزة، يظهر التدريب اللامركزي آفاق تطبيق واضحة. بما في ذلك، على سبيل المثال لا الحصر: ضبط LoRA، مهام ما بعد التدريب المتعلقة بمحاذاة السلوك ) مثل RLHF، DPO (، تدريب البيانات الجماعي ومهام التوصيف، تدريب نماذج القاعدة الصغيرة القابلة للتحكم في الموارد، وكذلك سيناريوهات التدريب التعاوني التي تشارك فيها الأجهزة الطرفية. تتمتع هذه المهام عمومًا بخصائص عالية من التوازي، وانخفاض الترابط، وتحمل قوة الحوسبة المتنوعة، مما يجعلها مناسبة جدًا للتدريب التعاوني من خلال الشبكات P2P، بروتوكول Swarm، المحسنات الموزعة، وما إلى ذلك.

![كأس القدر للذكاء الاصطناعي في العملات الرقمية: استكشافات اللامركزية في التدريب])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(

تحليل المشاريع الكلاسيكية للتدريب اللامركزي

حالياً في مجال التدريب اللامركزي والتعلم الفيدرالي، تشمل المشاريع الرائدة في مجال blockchain كل من Prime Intellect وPluralis.ai وGensyn وNous Research وFlock.io. من حيث الابتكار التكنولوجي وصعوبة التنفيذ الهندسي، قدمت Prime Intellect وNous Research وPluralis.ai العديد من الاستكشافات الأصلية في تصميم النظام والخوارزميات، مما يمثل الاتجاهات الرائدة في البحث النظري الحالي؛ بينما فإن مسارات التنفيذ لكل من Gensyn وFlock.io واضحة نسبياً، ويمكن ملاحظة تقدم هندسي أولي. ستقوم هذه المقالة بتحليل التقنيات الأساسية والهندسة المعمارية وراء هذه المشاريع الخمسة بالتتابع، بالإضافة إلى مناقشة الفروق والعلاقات التكميلية بينها في نظام تدريب الذكاء الاصطناعي اللامركزي.

) Prime Intellect: الرائد في الشبكات التعاونية للتعلم المعزز القابل للتحقق من مسار التدريب

تسعى Prime Intellect إلى بناء شبكة تدريب AI غير معتمدة على الثقة، مما يتيح لأي شخص المشاركة في التدريب والحصول على مكافآت موثوقة مقابل مساهماته الحسابية. تأمل Prime Intellect من خلال ثلاثة وحدات PRIME-RL + TOPLOC + SHARDCAST، في إنشاء نظام تدريب AI لامركزي يتمتع بالتحقق والانفتاح وآلية تحفيز كاملة.

(# 01، هيكل بروتوكول Prime Intellect و قيمة الوحدات الرئيسية

![كأس القدر للذكاء الاصطناعي: استكشاف الحدود في التدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp###

02، شرح آلية التدريب الرئيسية لـ Prime Intellect

#PRIME-RL: هيكل مهمة التعلم المعزز غير المتزامن المفكوك

PRIME-RL هو إطار نمذجة وتنفيذ المهام المخصص لسيناريوهات التدريب اللامركزية من قبل Prime Intellect، مصمم خصيصًا للشبكات المتنوعة والمشاركة غير المتزامنة. يستخدم التعلم المعزز ككائن تكيفي أولوي، مما يفكك هيكليًا عمليات التدريب والاستدلال وتحميل الأوزان، مما يسمح لكل عقدة تدريب بإكمال دورة المهمة بشكل مستقل محليًا، والتعاون من خلال واجهات معيارية وآليات التحقق والتجميع. مقارنةً بعمليات التعلم بالإشراف التقليدية، يعد PRIME-RL أكثر ملاءمة لتنفيذ التدريب المرن في بيئات عدم وجود جدولة مركزية، مما يقلل من تعقيد النظام، ويؤسس أيضًا لدعم المهام المتعددة بشكل متوازي وتطور الاستراتيجيات.

#TOPLOC:آلية التحقق من سلوك التدريب الخفيف

TOPLOC(الملاحظة الموثوقة & فحص المحلية) هو آلية جوهرية للتحقق من التدريب اقترحها Prime Intellect، تُستخدم لتحديد ما إذا كان العقدة قد أكملت فعلاً تعلم استراتيجية فعالة بناءً على بيانات الملاحظة. على عكس الحلول الثقيلة مثل ZKML، لا يعتمد TOPLOC على إعادة حساب النموذج بالكامل، بل يكمل التحقق الهيكلي الخفيف من خلال تحليل المسارات المحلية للتناسق بين "سلسلة الملاحظات ↔ تحديث الاستراتيجية". يحوّل هذا النظام للمرة الأولى المسارات السلوكية خلال عملية التدريب إلى كائنات قابلة للتحقق، وهو الابتكار الرئيسي لتحقيق توزيع مكافآت التدريب دون الحاجة إلى الثقة، مما يوفر مسارًا قابلاً للتطبيق لبناء شبكة تدريب تعاونية لامركزية قابلة للتدقيق والتحفيز.

#SHARDCAST: بروتوكول تجميع الوزن غير المتزامن ونقله

SHARDCAST هو بروتوكول لنشر وتجمع الوزن تم تصميمه بواسطة Prime Intellect، مُحسّن خصيصًا لبيئات الشبكة الحقيقية التي تتسم باللامركزية، وحدود النطاق الترددي، وتغير حالة العقد. يجمع بين آلية نشر gossip واستراتيجيات التزامن المحلي، مما يسمح لعدة عقود بتقديم تحديثات جزئية بشكل مستمر في حالات غير متزامنة، مما يحقق تقاربًا تدريجيًا للأوزان وتطورات متعددة النسخ. بالمقارنة مع طرق AllReduce المركزية أو المتزامنة، يُحسن SHARDCAST بشكل ملحوظ قابلية التوسع وقدرة التحمل للتدريب اللامركزي، وهو الأساس الرئيسي لبناء توافق الوزن المستقر وتكرار التدريب المستمر.

#OpenDiLoCo: إطار الاتصال المتناثر غير المتزامن

OpenDiLoCo هو إطار تحسين الاتصالات الذي طوره فريق Prime Intellect بناءً على مفهوم DiLoCo الذي طرحته DeepMind، وهو مستقل ومفتوح المصدر، مصمم خصيصًا للتحديات الشائعة في التدريب اللامركزي مثل قيود النطاق الترددي، وتنوع الأجهزة، وعدم استقرار العقد. يعتمد هيكله على التوازي البياني، من خلال بناء هياكل طوبولوجية Sparse مثل Ring وExpander وSmall-World، مما يتجنب التكلفة العالية للتزامن العالمي، ويعتمد فقط على الجيران المحليين لإكمال تدريب النموذج بشكل تعاوني. من خلال الجمع بين التحديثات غير المتزامنة وآلية التحمل لنقاط الانقطاع، يجعل OpenDiLoCo وحدات GPU الاستهلاكية والأجهزة الطرفية تشارك بشكل مستقر في مهام التدريب، مما يعزز بشكل ملحوظ إمكانية المشاركة في التدريب التعاوني العالمي، ويعتبر أحد البنى التحتية الأساسية للاتصالات لبناء شبكة تدريب لامركزية.

#PCCL: مكتبة الاتصالات التعاونية

PCCL###Prime Collective Communication Library( هي مكتبة اتصالات خفيفة الوزن تم تصميمها خصيصًا من قبل Prime Intellect لبيئة تدريب الذكاء الاصطناعي اللامركزية، وتهدف إلى حل عنق الزجاجة في التكيف الذي تعاني منه المكتبات التقليدية في الأجهزة المتنوعة والشبكات ذات النطاق الترددي المنخفض. يدعم PCCL الهيكليات النادرة، وضغط التدرج، والتزامن منخفض الدقة، واستئناف النقاط، ويمكن تشغيله على وحدات معالجة الرسومات الاستهلاكية والعقد غير المستقرة، وهو المكون الأساسي الذي يدعم قدرة الاتصالات غير المتزامنة في بروتوكول OpenDiLoCo. لقد عزز بشكل ملحوظ من تحمل النطاق الترددي لشبكة التدريب وتوافق الأجهزة، مما يفتح "آخر ميل" من البنية التحتية للاتصالات لبناء شبكة تدريب تعاونية حقيقية مفتوحة وغير قائمة على الثقة.

![كأس القدر لـ Crypto AI: استكشافات متقدمة في التدريب اللامركزي])https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(

)# 03، شبكة Prime Intellect للتحفيز وتقسيم الأدوار

بنى Prime Intellect شبكة تدريب قابلة للتحقق، بدون إذن، مزودة بآلية حوافز اقتصادية، مما يسمح لأي شخص بالمشاركة في المهام والحصول على المكافآت بناءً على المساهمات الحقيقية. يعمل البروتوكول على أساس ثلاثة أنواع من الأدوار الأساسية:

  • مُطلق المهمة: تحديد بيئة التدريب، النموذج الأولي، دالة المكافأة ومعايير التحقق
  • عقد تدريب: تنفيذ التدريب المحلي، تقديم تحديثات الوزن ومسارات المراقبة
  • عقد التحقق: استخدام آلية TOPLOC للتحقق من صحة سلوك التدريب والمشاركة في حساب المكافآت وتجميع الاستراتيجيات

تتضمن العملية الأساسية للبروتوكول نشر المهام، تدريب العقد، التحقق من المسارات، تجمع الأوزان ( SHARDCAST ) وتوزيع المكافآت، مما يشكل حلقة تحفيزية حول "سلوك التدريب الحقيقي".

![كأس القدر لذكاء التشفير: استكشاف الحدود للتدريب اللامركزي]###https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(

)# 04، INTELLECT-2: إطلاق أول نموذج تدريب قابل للتحقق اللامركزية

أصدرت Prime Intellect INTELLECT-2 في مايو 2025، وهو أول نظام في العالم يعتمد على اللامركزية، ويعمل بدون حاجة للثقة.

PRIME-0.7%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • مشاركة
تعليق
0/400
degenwhisperervip
· منذ 6 س
اه، هذه الشيء فعلاً مثير للاهتمام قم ببحثك الخاص (DYOR) قضيت عدة أيام أشعر أنه موثوق جداً
شاهد النسخة الأصليةرد0
GasWastervip
· 07-30 07:48
يا رجل، قوة الحوسبة هي رسوم الغاز الجديدة حقًا حقًا... ارقد بسلام محفظتي
شاهد النسخة الأصليةرد0
MoneyBurnerSocietyvip
· 07-30 07:31
خبير في الوقوع في الفخاخ، AI قد باع ثلاث بطاقات رسومية
شاهد النسخة الأصليةرد0
GasFeeNightmarevip
· 07-30 07:24
لا عجب أن تكون الصناعة الثقيلة، فإن تدريب قوة الحوسبة يكلف أكثر من غاز.
شاهد النسخة الأصليةرد0
MultiSigFailMastervip
· 07-30 07:23
قوة الحوسبة这么贵拿头التعدين
شاهد النسخة الأصليةرد0
  • تثبيت