تفسير نموذج مُدرب لاكتشاف خطاب الكراهية في التغريدات العربية

المهندس ربيع محي الدين الكردي

المهندس ربيع محي الدين الكردي

الملخص

يُعتبر انتشار خطاب الكراهية أحد أكبر المشكلات التي تقض مضجع شبكات التواصل الاجتماعي وتؤثر بشكلٍ كبيرٍ على مستخدميه، ما دفع الباحثين إلى توظيف نماذج تعلم الآلة المتنوعة في اكتشافه ومواجهته. إلا أن هذه النماذج تفتقر إلى الشفافية والوضوح فيما يخص آلية اتخذاها لقرار التصنيف النهائي، ما يؤثر سلباً على فهم مُخرجاتها واكتشاف نقاط ضعفها وتحسين أدائها.

يهدف البحث إلى تفسير مُخرجات النموذج ماربيرت MARBERT وذلك بعد الضبط الدقيق لبارامتراته في مهمة اكتشاف خطاب الكراهية في اللهجات العربية العامية. استُخدمت خوارزمية المُشتقات المتكاملة Integrated Gradients لتفسير مُخرجات النموذج فيما يخص صنف خطاب الكراهية ودُرست العوامل التي تدخل في اتخاذ قراراته من خلال تحليل تأثير مساهمات كلمات التغريدة في تصنيفها. سُلط الضوء أيضاً على مواطن الضعف التي تقود النموذج إلى تصنيفاتٍ خاطئةٍ. كما شُكلت قوائمٌ من الكلمات الأكثر تأثيراً في اختيار صنف خطاب الكراهية.

توصل البحث إلى إثبات تمكن النموذج من فهم أنماط لغوية معقدة وربطها مع خطاب الكراهية، واكتشف المطبات التي يقع فيها والتي تتمثل بالاستعارات والسخرية وغيرها ما يفيد في معرفة أماكن التحسين وتركيز الجهود فيها.