أسواق بيانات الذكاء الاصطناعي اللامركزية تنطلق الآن، إليك ما تحتاج إلى معرفته

في كل مرة تبحث فيها أو تتصفح أو تتفاعل مع تطبيق، فأنت تولّد بيانات.

هذه البيانات تساوي مليارات بالنسبة لشركات الذكاء الاصطناعي، لكن المنصات التي تجمعها تحتفظ تقريبًا بكل هذه القيمة.

جيل جديد من أسواق بيانات الذكاء الاصطناعي اللامركزية يريد قلب هذه المعادلة — باستخدام العملات المشفّرة لدفع الأموال مباشرة للمساهمين كلما استُخدمت بياناتهم في تدريب نموذج تعلّم آلي.

الآلية أعمق بكثير من مجرد شعار بسيط مثل "امتلك بياناتك".

هناك طبقات تحقق، وأنظمة التحصيص، وقيود خصوصية، واقتصاديات رمزية — وهذه العناصر مجتمعة هي التي تقرر ما إذا كان المساهم يُدفَع له بعدل أو لا يُدفَع له إطلاقًا.

تشرح هذه المقالة كيف تعمل هذه الأنظمة من الأساس.

باختصار

تربط أسواق بيانات الذكاء الاصطناعي اللامركزية بين الأشخاص الذين يملكون بيانات خام وبين مطوري الذكاء الاصطناعي الذين يحتاجون إلى مجموعات تدريب موثوقة ومُعلَّمة، وتستخدم عملات مشفّرة للتعامل مع المدفوعات دون حاجة للثقة بطرف وسيط.

يقدّم المساهمون بياناتهم، التي تُتحقق على السلسلة أو عبر شبكات أوراكل لامركزية قبل الإفراج عن الدفعة، ما يزيل المنصة الوسيطة من معادلة تقاسم الإيرادات.

تسمح تقنيات حماية الخصوصية مثل التعلّم الاتحادي والبراهين عديمة المعرفة بتحقيق الدخل من البيانات دون أن تغادر المعلومات الخام جهاز المساهم.

توائم اقتصاديات الرموز، بما في ذلك التحصيص، والعقوبات (Slashing)، وتسجيل السمعة، الحوافز بحيث يقدّم المساهمون بيانات دقيقة لا بيانات عديمة القيمة.

تمثّل مشاريع مثل Kled AI على شبكة سولانا الحدود الحالية لهذا النموذج، لكنه يمتد إلى سلاسل متعددة وهياكل متنافسة مختلفة.

لماذا تحتاج شركات الذكاء الاصطناعي إلى كل هذه البيانات ومن يدفع ثمنها اليوم؟

نماذج اللغة الضخمة وأنظمة التعرّف على الصور "شرهة للبيانات" بدرجة يصعب المبالغة في وصفها.

عملية تدريب واحدة لنموذج متقدّم يمكن أن تستهلك مئات المليارات من رموز النص، وملايين الصور المعلّمة، أو سنوات من إشارات السلوك البشري المسجّلة.

هذه البيانات يجب أن تأتي من مكان ما.

اليوم، يأتي معظمها من عدد محدود من القنوات.

يجمع الزحف على الويب نصوصًا متاحة للعامة على نطاق واسع. وتمنح صفقات ترخيص المنصات مختبرات الذكاء الاصطناعي حق الوصول إلى مجموعات بيانات خاصة — مثل ريديت، وناشري الأخبار، ووكالات الصور.

وتدفع منصات الوساطة الجماعية في وضع العلامات مبالغ صغيرة للعمّال البشريين لوضع تسميات على الصور، أو نسخ الصوت، أو تقييم ردود الذكاء الاصطناعي من حيث الدقة.

سوق الوساطة في البيانات كبير لكنه استغلالي؛ فكثير من العمّال على المنصات المركزية يجنون بين 1 و5 دولارات في الساعة، بينما تُباع مجموعات البيانات المعلّمة التي ينتجونها لمطوري الذكاء الاصطناعي بمبالغ أكبر بعدة مرّات لكل سجل واحد.

المشكلة بنيوية؛ فالمنصة المركزية الواقعة بين مالك البيانات ومشتريها من مطوري الذكاء الاصطناعي تستحوذ على معظم الهامش. هي من يحدد الأسعار، ويفرض معاييره الخاصة للجودة، ويمكنه استبعاد المساهمين بلا آلية تظلّم حقيقية. أما الأسواق اللامركزية فستستبدل هذه الطبقة بعقود ذكية، وبروتوكولات مفتوحة، وقنوات دفع قائمة على الرموز المشفّرة.

ما هو سوق بيانات الذكاء الاصطناعي اللامركزي بالضبط؟

في جوهره، سوق بيانات الذكاء الاصطناعي اللامركزي هو بروتوكول يلتقي فيه عرض البيانات مع طلبها دون وجود وسيط متحكّم.

جانب المشتري هو مطورو الذكاء الاصطناعي أو فرق الأبحاث التي تنشر "طلب بيانات" — يحدد نوع البيانات، ومعايير الجودة، ومتطلبات الصيغة، والسعر الذي سيدفعونه مقابل كل سجل مُتحقق منه.

جانب البائع هو المساهمون الأفراد أو مجمِّعو البيانات الذين يلبّون هذه الطلبات.

يعمل العقد الذكي كطبقة ضمان (إسكرو).

يقفل المشتري الأموال في العقد عندما ينشر الطلب. وعندما يقدّم مساهم بيانات تجتاز خطوة التحقق، يفرج العقد عن الدفعة تلقائيًا.

لا يحتاج أي من الطرفين إلى الثقة بالطرف الآخر؛ فكلاهما يثق بشفرة العقد.

البيانات نفسها عادة لا تُخزَّن على السلسلة.

تخزين غيغابايت من الصور المعلّمة على إيثريوم (ETH) أو سولانا (SOL) سيكون باهظ التكلفة.

بدلًا من ذلك، تُخزَّن البيانات في شبكة تخزين لامركزية مثل IPFS أو Arweave، وما يُسجَّل على السلسلة هو تجزئة (هاش) موجهة للمحتوى — بصمة فريدة للملف.

يتحقق العقد الذكي من أن التجزئة التي قدّمها المساهم تطابق ملفًا موثوقًا غير معدَّل قبل الإفراج عن الدفعة.

تجزئة المحتوى هي سلسلة قصيرة من الأحرف تُستخرج رياضيًا من المحتوى الدقيق للملف. إذا غيّرت بايتًا واحدًا في الملف تتغيّر التجزئة بالكامل، ما يجعل من المستحيل المطالبة بالدفع مقابل بيانات معدَّلة أو معاد تدويرها بعد fact.

كيف يعمل التحقق من البيانات دون بوّاب مركزي؟

التحقق هو أصعب مشكلة في هذا التصميم؛ فالمنصة المركزية تستطيع توظيف مراجعِين للجودة.

أما العقد الذكي فلا يستطيع قراءة صورة أو الحكم على ما إذا كان نص ما معلَّمًا بدقة؛ بل يمكنه فقط تنفيذ منطق محدّد. تحل الأسواق اللامركزية هذه المعضلة عبر ثلاثة أساليب رئيسية غالبًا ما تُستخدم معًا.

البراهين التشفيرية تناسب البيانات المهيكلة التي يمكن التحقق من صحتها رياضيًا. إذا كان المساهم يقدّم مسارات GPS أو قراءات حساسات أو سجلات مالية، يمكن لبرهان عديم المعرفة أن يؤكد أن البيانات تحقق خصائص معيّنة، وأنها سُجّلت في وقت محدد، وتقع ضمن نطاق صالح، وجاءت من جهاز معيّن، من دون الكشف عن القيم الخام نفسها.

التحقق الجماعي يناسب مهام الوسم ذاتية الحكم. يراجع عدة مساهمين مستقلين نفس القطعة من البيانات ويقدمون تقييماتهم. يقارن العقد بين الردود ويدفع للمساهمين الذين تتوافق إجاباتهم مع الأغلبية، بينما يعاقب المنحرفين باستمرار. هذا إصدار لامركزي لتقنية الوسم المكرر التي تستخدمها المنصات المركزية لكشف المساهمين الكسالى أو الخبيثين.

التحصيص والعقوبات (Staking & Slashing) يضيفان طبقة اقتصادية فوق ذلك. يودِع المساهمون قدرًا من رمز المنصة الأصلي قبل أن يُسمح لهم بتقديم البيانات. إذا رُفضت مساهماتهم مرارًا أو وُسمت على أنها احتيالية عبر طبقة التحقق الجماعي، تُستقطَع حصتهم جزئيًا أو كليًا. هذا يجعل تقديم بيانات منخفضة الجودة مكلفًا ماليًا، ويوائم حافز المساهم مع متطلبات الجودة لدى المشتري.

كيف تحمي تقنيات الحفاظ على الخصوصية المساهمين؟

التوتر الواضح في هذا النموذج هو الخصوصية؛ فإذا باع مستخدم سجلّات تصفحه أو بياناته الصحية لمطوّر ذكاء اصطناعي، فالقيمة حقيقية، لكن درجة التعرّض كذلك. تعالج الأسواق اللامركزية هذه الإشكالية من خلال تقنيتين تزدادان نضجًا.

التعلّم الاتحادي يُبقي البيانات الخام على جهاز المساهم بالكامل. بدلًا من إرسال البيانات إلى خادم مركزي، يُرسَل نموذج الذكاء الاصطناعي نفسه إلى جهاز المساهم. يُدرَّب النموذج محليًا على البيانات الخام، ثم تُرسَل فقط أوزان النموذج المحدّثة — وهي معلمات رياضية مجردة لا تكشف مباشرة عن البيانات الأساسية — إلى المطوّر. تُجمَّع تحديثات الأوزان من مساهمين عديدين لإنتاج نموذج أفضل. بيانات التدريب لا تغادر بيئة المساهم أبدًا.

الخصوصية التفاضلية تضيف ضوضاء إحصائية محسوبة إلى مجموعة البيانات قبل مشاركتها، ما يجعل من المستحيل عكس هندسة سجلّات فرد بعينه من البيانات المجمَّعة، مع الحفاظ على الأنماط الإحصائية التي تجعل مجموعة البيانات مفيدة للتدريب. ويمكن ضبط مقدار الضوضاء: المزيد من الضوضاء يعني خصوصية أقوى لكن فائدة بيانات أقل قليلًا.

لهذه التقنيات أهمية تنظيمية أيضًا؛ فالقوانين مثل اللائحة العامة لحماية البيانات (GDPR) في أوروبا وقانون خصوصية المستهلك في كاليفورنيا بالولايات المتحدة تفرض قواعد صارمة على نقل البيانات الشخصية واستخدامها. السوق الذي يمكنه أن يُثبت بشكل موثوق أن سلسلة معالجة بياناته لا تنقل معلومات شخصية خام قد يواجه مسارًا تنظيميًا أنظف بكثير من سوق يكتفي بتحقيق الدخل من تصدير البيانات الخام.

اقتصاديات الرموز، والتحصيص، وكيف يتقاضى المساهمون مستحقاتهم فعليًا

تختلف آلية الدفع من منصة إلى أخرى، لكن معظمها يستخدم رمز فائدة أصليًا بدلًا من الدفع مباشرة بأصل كبير مثل بيتكوين (BTC). يخدم الرمز عدة وظائف في آن واحد.

أولًا، هو وحدة الحساب لطلبات البيانات؛ فيسعّر المشترون عروضهم بالرمز، ما يعني أن الرمز يلتقط جانب الطلب من القيمة — فكلما زادت طلبات البيانات المنشورة، زاد مقدار الرمز المطلوب لتمويلها.

ثانيًا، يخلق التحصيص حالة تجميد على جانب العرض؛ إذ يجب على المساهمين حيازة الرمز وتحْصيصه للمشاركة في السوق، ما يزيل جزءًا من المعروض المتداول ويوائم حوافز المساهمين مع صحة الشبكة.

ثالثًا، غالبًا ما تُربط السمعة بتاريخ الرمز؛ فالمساهم الذي حصَّص باستمرار، وقُبلت مساهماته، ولم يتعرض لعقوبات، يبني سجلًا يمكن التحقق منه على السلسلة. يمكن لدرجة السمعة هذه أن تمنحه علاوة سعرية على بياناته، لأن المشترين يثقون به أكثر من مساهم جديد بلا تاريخ.

عمليًا، تبدو تدفقات الدفع كما يلي: ينشر المشتري طلبًا ويودِع مثلًا 500 رمز في عقد الإسكرو. يقدّم مساهم 50 سجلًا معلّمًا. تتحقق طبقة التحقق وتوافق عليها. يطلق العقد 50 رمزًا للمساهم، و2 رمز للمتحققين الذين وافقوا على المساهمة، ويحتفظ بالـ448 رمزًا المتبقية لمساهمين قادمين. يحصل المشتري على حق الوصول إلى السجل الموثوق لمجموعة البيانات بمجرد تأكيد الدفع.

لا تنجح اقتصاديات الرموز إلا إذا كان هناك طلب حقيقي على البيانات؛ فالمشاريع التي تنطلق مع مستوى عالٍ من الحماس المضاربي لكن دون حالات استخدام حقيقية أو طلب مستدام على مجموعات البيانات ستواجه صعوبة في إبقاء قيمة الرموز ودافع المساهمين متماسكين على المدى الطويل. مكافآت المساهمين بدون وجود مشترين من مطوري الذكاء الاصطناعي يدفعون على الجانب الآخر من السوق تخلق ضغطاً تضخمياً على الرمز غير قابل للاستدامة.

Also Read: تأجيل اكتتاب OpenAI بقيمة تريليون دولار مع اختبار تقلبات السوق لطموحات ألتمان

كيف تطبّق Kled AI ومشاريع مشابهة هذا النموذج على سولانا

تُجسّد Kled AI أحدث ما وصل إليه هذا المجال على شبكة Solana. يقدّم البروتوكول نفسه كسوق لامركزي يمكن للأفراد من خلاله تحقيق الدخل من بياناتهم الشخصية تحديداً لأغراض تدريب نماذج الذكاء الاصطناعي. تكاليف المعاملات المنخفضة والإنتاجية العالية لسولانا تجعل من العملي تنفيذ مدفوعات صغيرة وعالية التكرار كما تقتضي اقتصاديات أسواق البيانات، إذ يصبح دفع جزء بسيط من الرمز المميّز مقابل صورة موسومة واحدة مجدياً اقتصادياً على سولانا بطريقة لا تتوفر على شبكة إيثريوم الرئيسية.

هندسة سولانا مهمة أيضاً من ناحية السرعة. التحقق من البيانات الذي يُطلق عملية صرف الدفعة يحتاج إلى تسوية سريعة. المساهم لن يقبل بسوق ينتظر فيه ساعات لتأكيد الدفع. تؤمّن نهائية المعاملات دون الثانية على سولانا تجربة دفع قريبة من المنصات التقليدية مع الحفاظ على خصائص العقود الذكية عديمة الثقة.

Velvet، التي تتصدر الاهتمام إلى جانب Kled AI، تتبنى زاوية مختلفة؛ فهي محطة محافظ على السلسلة مدعومة بالذكاء الاصطناعي تدمج بين التداول الفوري، والعقود الدائمة، واستراتيجيات العائد. صلتها بهذا المجال أنها تجسد نفس الفكرة الأساسية: أنظمة ذكاء اصطناعي تعمل باستخدام بيانات على السلسلة وتُسوي العمليات باستخدام رموز مشفّرة. بينما تخلق Kled AI سوقاً للبيانات الخام الخاصة بالتدريب، تمثّل Velvet مثالاً لتطبيق ذكاء اصطناعي يستهلك هذا النوع من بيانات السوق المعالجة. إنهما يمثلان طرفي نفس خط أنابيب اقتصاد البيانات.

تشمل المشاريع الأخرى التي تُبنى في هذا المجال Ocean Protocol، الذي كان رائداً في مفهوم أصول البيانات المرمّزة على إيثريوم، وGrass، التي تكافئ المستخدمين تحديداً على المساهمة بحزمة النطاق غير المستغلة وبيانات التصفّح في خطوط تدريب نماذج الذكاء الاصطناعي. لكل منها نهج معماري مختلف قليلاً، لكنها تشترك جميعاً في النموذج الجوهري نفسه: مدفوعات مفروضة تشفيرياً مقابل مساهمات بيانات تم التحقق منها.

Also Read: تجميد Mythos من Anthropic يفتح الباب أمام المنافسين الآسيويين Sakana AI و360

من المستفيد فعلياً من هذا النموذج وما هي المخاطر

بالنسبة لمقدمي البيانات الأفراد، الجاذبية واضحة: القيمة التي كان يُستخرج معظمها مجاناً يمكن الآن الاستحواذ عليها مباشرة. شخص يملك حضوراً كبيراً على وسائل التواصل، أو خبرة متخصصة في نطاق معيّن، أو وصولاً إلى أنواع بيانات نادرة، مثل السجلات الطبية أو المستندات القانونية المهنية أو المحتوى غير الإنجليزي، يمكنه أن يطالب بعلاوة سعرية مجدية في سوق فيه طلب حقيقي من مطوري الذكاء الاصطناعي.

بالنسبة لمطوري الذكاء الاصطناعي، توفّر الأسواق اللامركزية إمكانية الوصول إلى أنواع بيانات يصعب الحصول عليها عبر الاستخلاص الآلي أو التراخيص التقليدية. بيانات التفضيلات البشرية، والوسوم في المجالات المتخصّصة، والمحتوى متعدد اللغات من مناطق ممثَّلة تمثيلاً ناقصاً نادرة فعلاً. بروتوكول يمكنه الحصول على تلك البيانات والتحقق منها على نطاق واسع يمثل قيمة حقيقية.

المخاطر أيضاً حقيقية، على الجانبين. تقلب أسعار الرموز يعني أن المساهم الذي يُدفَع له اليوم بالرمز الأصلي قد يجد أن قيمة تلك الدفعة بالدولار انخفضت بشكل ملحوظ عند محاولته إنفاقها. المشترون يواجهون الخطر المعاكس: قد يقفز سعر الرمز بين وقت التخطيط لشراء البيانات ووقت التنفيذ، ما يجعل تكلفة الحصول على البيانات أعلى من الميزانية المرصودة.

جودة البيانات ما زالت تحدياً غير محلول على نطاق واسع. آليات التحقق الجماعي وآليات الرهن تقلل الاحتيال لكنها لا تقضي عليه.

يمكن لفاعلين خبيثين متقدمين التحايل على أنظمة السمعة بمرور الوقت، ومطورو الذكاء الاصطناعي الذين يشترون بيانات من سوق جديد غير مُثبت السمعة يتحملون مخاطر جودة لا وجود لها عند الشراء من مزودي وسوم بيانات راسخين ذوي سجلات طويلة.

المخاطر التنظيمية هي العامل الأكثر غموضاً. تحقيق الدخل من البيانات الشخصية يقع عند تقاطع قانون خصوصية البيانات، وتنظيم الأوراق المالية المتعلق بالرموز المستخدمة، وأطر حوكمة الذكاء الاصطناعي التي ما زالت قيد الصياغة. قد يكون السوق ملتزماً تماماً في ولاية قضائية بينما يقع في منطقة رمادية قانونياً في أخرى.

Also Read: هل يتجه إيثريوم إلى 1,000 دولار بعد فقدان مستوى دعم رئيسي؟

أفكار ختامية

تمثل أسواق بيانات الذكاء الاصطناعي اللامركزية إجابة محددة تقنياً لمشكلة اقتصادية حقيقية: الأشخاص الذين يولّدون بيانات التدريب تاريخياً لم يحصلوا إلا على جزء ضئيل من قيمتها.

العقود الذكية، والتخزين القائم على عناوين المحتوى، والتعلم الموحَّد، ورهن الرموز المميزة، معاً تخلق نظاماً يمكن فيه أن تتدفق تلك القيمة مباشرة إلى المساهمين، من دون وسيط منصّة يستحوذ على هامش الربح.

النموذج لا يزال في مراحله الأولى.

اقتصاديات الرموز في طور النضوج، وأنظمة التحقق تحتاج لإثبات قدرتها على التوسع إلى ملايين المساهمين بدون إمكانية التلاعب، والبيئة التنظيمية حول تحقيق الدخل من البيانات الشخصية ما زالت غير مستقرة.

لكن جانب الطلب من المعادلة لن يختفي.

مطورو الذكاء الاصطناعي يحتاجون إلى مزيد من البيانات، وبأنواع أكثر، مما يمكن للمصادر المركزية توفيره بشكل موثوق.

هذا الاحتياج الهيكلي هو ما يمنح أسواق البيانات اللامركزية أطروحتها طويلة الأجل.