ChatGPT يسرب بيانات التدريب وينتهك الخصوصية

[ad_1]

وجد الباحثون في مختبر الذكاء الاصطناعي التابع لشركة جوجل، ديب مايند، طريقة سهلة من أجل كسر عملية “المحاذاة لروبوت الدردشة ChatGPT” المصممة لجعل روبوت الدردشة بالذكاء الاصطناعي يبقى داخل حواجز الحماية.

ووجد الباحثون أنهم يستطيعون إجبار روبوت الدردشة على نشر مقاطع كاملة من الأدبيات التي تحتوي على بيانات تدريبه، وذلك بكتابة أمر في الموجّه ومطالبة ChatGPT بتكرار كلمة، مثل “قصيدة” إلى ما لا نهاية، مع أن هذا النوع من التسرب ليس من المفترض أن يحدث مع الذكاء الاصطناعي الخاضع لعملية المحاذاة.

كما يمكن أيضًا التلاعب بروبوت الدردشة من أجل إعادة إنتاج أسماء الأفراد وأرقام هواتفهم وعناوينهم، وهو ما يعد انتهاكًا للخصوصية مع عواقب وخيمة محتملة.

ويطلق الباحثون على هذه الظاهرة اسم “الحفظ المستخرج”، وهو هجوم يجبر روبوت الدردشة على الكشف عن الأشياء التي خزنها في الذاكرة.

وكتب المؤلف الرئيسي، ميلاد نصر، وزملاؤه في ورقة البحث الرسمية: “طورنا هجوم تباعد جديدًا يتسبب بانحراف النموذج عن أجيال أسلوب روبوت الدردشة، وإصدار بيانات التدريب بمعدل عالٍ بمقدار 150 مرة عما كان عليه عند التصرف بشكل صحيح.

ويرتبط جوهر الهجوم على الذكاء الاصطناعي التوليدي بجعل ChatGPT ينحرف عن عملية المحاذاة المبرمجة ويعود إلى طريقة تشغيل بسيطة.

ويبني علماء البيانات روبوتات الدردشة بالذكاء الاصطناعي التوليدي، مثل ChatGPT، من خلال عملية تسمى التدريب، إذ يتعرض روبوت الدردشة في حالته الأولية إلى مليارات البايت من النص، بعضها من مصادر الإنترنت العامة، مثل ويكيبيديا، وبعضها من الكتب المنشورة.

وتعد الوظيفة الأساسية للتدريب هي جعل روبوت الدردشة يعكس أي شيء يُعطى له، بشكل يشابه عملية ضغط النص ومن ثم فك ضغطه.

ويستطيع روبوت الدردشة من الناحية النظرية أن يعيد بيانات التدريب بمجرد تدريبه إذا حصل على مقتطف نصي صغير من ويكيبيديا ومطالبته باستجابة النسخ المتطابق.

وتتلقى روبوتات الدردشة، مثل ChatGPT، طبقة إضافية من التدريب، وتُضبط بطريقة تمنعها من إعادة النص المجرد فقط، بل تستجيب بمخرجات من المفترض أن تكون مفيدة، مثل الإجابة عن سؤال أو المساعدة في تطوير تقرير.

وتخفي الطبقة الإضافية من التدريب المنفذة عبر عملية المحاذاة وظيفة النسخ المتطابق. وكتب الباحثون: “لا يتفاعل عادةً معظم المستخدمين مع النماذج التأسيسية، بل يتفاعلون مع النماذج اللغوية المضبوطة من أجل التصرف بشكل أفضل وفقًا لرغبات الإنسان”.

واعتمد نصر على إستراتيجية مطالبة روبوت الدردشة بتكرار كلمات معينة إلى ما لا نهاية من أجل إجبار ChatGPT على الابتعاد عن الطبقة الإضافية من التدريب.

وحصل الباحثون على فقرات حرفية من الروايات ونسخ حرفية كاملة من القصائد، كما عثروا على معلومات تعريف شخصية محفوظة لعشرات الأفراد، مثل أرقام الهواتف.

وسعى المؤلفون إلى تحديد مقدار البيانات التدريبية التي قد تتسرب، وعثروا على كميات كبيرة من البيانات، مع أن البحث كان محدودًا بسبب تكلفة الاستمرار في إجراء التجربة.

وكتب نصر وفريقه: “استخرجنا أكثر من 10000 نموذج فريد بميزانيتنا المحدودة البالغة 200 دولار، مع أن الشخص الذي ينفق المزيد من الأموال من أجل الاستعلام عن واجهة برمجة تطبيقات ChatGPT قد يستخرج المزيد من البيانات”.

وكشف المؤلفون عن النتائج التي توصلوا إليها لشركة OpenAI، التي يبدو أنها قد اتخذت خطوات من أجل مواجهة الهجوم.

[ad_2]

مصدر الخبر

رابط حاسبه حساب مواطن التقديريه الجديدة 1444

حقيقة وفاة الملك سلمان بن عبد العزيز خادم الحرمين الشريفين…

ما هو برنامج دعم التوظيف

حقيقة اعفاء السعوديين من تأشيره دخول البوسنة والهرسك

ما ديانة العقيد رابح العنزي مسلم ام مسيحي

من هو العقيد رابح العنزي تويتر وقصته مع ولي العهد

تفاصيل وموعد مباراة سيلتا فيجو والنصر يلا شوت اليوم 2023-07-17…

تفاصيل وموعد مباراة جلاسكو رينجرز ونيوكاسل يونايتد يلا شوت اليوم…

تفاصيل وموعد مباراة فالنسيا ونوتينجهام فورست يلا شوت اليوم 2023-07-18…

تفاصيل وموعد مباراة أياكس وشاختار دونتسك يلا شوت اليوم 2023-07-18…

تفاصيل وموعد مباراة وست هام يونايتد وتوتنهام هوتسبير يلا شوت…

تفاصيل وموعد مباراة فيوتشر والأهلي يلا شوت اليوم 2023-07-02 في…

تم الإجابة عليه: لخص كيف يؤثر الصيد الزالة لنوع واحد…

تم الإجابة عليه: صمم مخططا لمجتمع يحافظ على التنوع الحيوي…

تم الإجابة عليه: يهدد بها الإنسان التنوع الحيوي

تم الإجابة عليه: لخص لماذا يعد معدل الانقراض حاليا أكبر…

تم الإجابة عليه: اختر أحد العوامل التي تهدد التنوع الحيوي…

تم الإجابة عليه: قوم وناقش أهمية المحافظة على التنوع الحيوي…

مقارنة بين حاسوبي Surface Laptop 6 و MacBook Air M3

مراجعة شاملة لهاتف Xiaomi 14 Ultra الجديد

كيف سيساعد الذكاء الاصطناعي التوليدي سيري في التفوق على ChatGPT؟

5 طرق لتحسين الأمان عند استخدام متصفح كروم

كيف يُحسن الواقع الافتراضي والواقع المُعزز تجربة التعليم؟

أفضل مسكن للأسنان

hoe oud is frenkie de jong

الفقاريات هي حيوانات ليس لها عمود فقري

رابط استعلام البحث عن منحة العمالة الغير منتظمة mom.manpower.gov.eg رابط وزارة القوى العاملة المصرية

تردد قناة العربية الحدث الجديد 2023 على النايل سات وعربسات alhadath

تفسير حلم النمر للمتزوجة

منوعات

ChatGPT يسرب بيانات التدريب وينتهك الخصوصية

اترك تعليقاً إلغاء الرد

تفسير حلم الميت ينظر إلى الحي وهو صامت .. ما تفسير رؤية الميت ينظر إلى الحي ولا يتكلم؟

كيف تساعد الحواسيب المدعومة بالذكاء الاصطناعي في تعزيز الإبداع والإنتاجية؟

لماذا لن تستطيع محركات البحث المدعومة بالذكاء الاصطناعي التغلب على جوجل؟

أمازون تواجه مشكلات في الدقة والخصوصية مع Amazon Q

كيفية إدارة الإشعارات في نظام iOS 17