الميّزات الأكثر فعاليةً في الاكتشاف الآليّ لخطاب الكراهية

اسم الباحث:

المهندس: ربيع محي الدين الكردي

اسم المشرف:الدكتور: كمال السلوم-الدكتور: وسيم رمضان

العنوان:

الميّزات الأكثر فعاليةً في الاكتشاف الآليّ
لخطاب الكراهية

العنوان باللغة الإنكليزية:

Most Effective Features in Automated Detection of Hate Speech

العام:2024

القسم:هندسة البرمجيات ونظم المعلومات

الملخص:

يُعدّ انتشار خطاب الكراهية على شبكات التواصل الاجتماعيّ ظاهرةً خطيرةً تقضّ مضجع هذه الشبكات، ويعاني الأفراد والمجتمعات على حدٍ سواء من آثارها المدمّرة على جميع الأصعدة، إذ يتراوح طيف أضرارها بين التوتّر النّفسيّ الشخصيّ وصولاً إلى تفكّك المجتمعات وإثارة النّعرات الطائفيّة ونشر ثقافة رفض الآخر. وعليه، تنال مسألة اكتشاف خطاب الكراهية اهتماماً واسع النطاق يهدف إلى إيجاد طرائقٍ وقوانينٍ وسياساتٍ تسعى إلى كبح جماح انتشار هذا السّلوك الخطير. لذلك يبذل الباحثون من جميع أنحاء العالم جهوداً حثيثةً في دراسة هذه المشكلة وابتكار طرائقٍ فعّالةٍ لمحاربتها: وبالتحديد في بناء تدريب نماذج تعلُّم آلةٍ مختلفةٍ لاكتشافها.

تلعب الميّزات دوراً مهمّاً في تدريب نماذج تعلُّم الآلة وتؤثّر تأثيراً مباشراً على أداء هذه النماذج. على الرّغم من ذلك، لا توجد كثيرٌ من المحاولات الّتي تسعى إلى تحسين جودة الميّزات المستخدمة في تدريب نماذج اكتشاف خطاب الكراهية بهدف تحسين أدائها. يعاني اكتشاف خطاب الكراهية أيضاً من تحدّياتٍ كثيرةٍ وخاصّةً في الّلغة العربيّة لما تفرضه من تعقيداتٍ لغويّةٍ ولهجاتٍ متنوعةٍ جعلت من بناء نماذجَ فعّالةٍ أمراً صعباً. إضافةً إلى ذلك، تفتقر نماذج تعلُّم الآلة الحديثة إلى الشفافية والوضوح فيما يخصّ قراراتها، ما يجعل تحسين أدائها أمراً في غاية الصّعوبة.

وعليه، تهدف هذه الدّراسة إلى محاربة خطاب الكراهية في النّصوص المكتوبة بالّلهجات العربيّة العاميّة والمنشورة ضمن شبكات التّواصل الاجتماعيّ. تهدف الدراسة إلى فهم آلية أخذ القرارات في نموذجٍ مبنيٍّ على المحوّلات Transformers دُرب من أجل هذا الغرض، واستخراج أهم الميزات المُساهمة في اكتشاف خطاب الكراهية وأكثرها فعاليةً وتحليل دورها في عمليّة الاكتشاف، بالإضافة إلى إثبات أهميّة تفسير النّماذج Model Explaining في تحسين عمل نماذج تعلُّم الآلة، وفي النّهاية، توظيف تلك الميّزات المُستخرجة في تدريب نموذجٍ مُحسَّنٍ قادرٍ على اكتشاف خطاب الكراهية في التّغريدات العربيّة بكفاءةٍ تفوق النّماذج الأخرى الحاليّة. سُمي هذا النّموذج XHateMARBERT.

تتلخّص المساهمة المقدمّة في هذه الدّراسة في اتّجاهين أساسيّين: الاتجاه الأول، تحليل الميّزات المُستخدمة في تدريب نموذجٍ أوليٍّ مبنيٍّ على المحوّل MARBERT قادرٍ على اكتشاف خطاب الكراهية في التّغريدات العربيّة، سُمّي هذا النّموذج باسم HateMARBERT. يُجرى تحليل ميزات HateMARBERT بالاعتماد على خوارزميّة تفسير النّماذج المعروفة بالمُشتقّات المتكاملة Integrated Gradients ومعرفة مقدار مساهمة كلّ ميّزةٍ في قرار التّصنيف النّهائي، يليه استخراج أكثر الميّزات تأثيراً على اكتشاف صنف خطاب الكراهية.

الاتجاه الثاني، إثبات فعاليّة الميّزات المُستخرجة، وفي الوقت نفسه إثبات أهميّة خوارزميات التّفسير، في تطوير نماذجَ ذات كفاءةٍ أعلى في اكتشاف خطاب الكراهية. تُحقق هذه الدّراسة ذلك من خلال تطبيق مجموعةٍ من الطّرائق المبتَكرة المُقترحة لتعديل الميّزات المُستخرجة من عملية التّفسير السّابقة، تتمثل بإزالة الميّزات أو إخفائها من آليّة الانتباه أو استبدالها عشوائيّاً بميّزاتٍ مرتبطةٍ ارتباطاً وثيقاً بخطاب الكراهية أو استبدالها بميّزاتٍ أخرى مشابهةٍ سياقياً، ثم تدريب نموذجِ اكتشافٍ مُحسَّنٍ على الميّزات المُعدّلة: XHateMARBERT.

تمكّنت طريقة الاستبدال السّياقي من تحسين قيمة F1-Score عن قيمته في HateMARBERT من أجل مجموعة بيانات الاختبار بزيادة قدرها 1.26% (من 88.57% إلى 89.83%)، وحقّقت أفضل قيمة إحكامٍ Precision بزيادةٍ بلغت 1.99% (من 88.43% إلى 90.42%). على نحوٍ مشابهٍ، تمكّنت طريقة إزالة الميّزات من تحسين قيمة الاستدعاء Recall بمقدار 1.36% (من 89.19% إلى 90.55%). حقّقت الطرائق المُقترحة نتائجَ مشابهةً عند تطبيقها على مجموعة بياناتٍ ثانيةٍ لتأكيد فعاليتها وقابليتها للتعميم.

تُؤكّد نتائج الدّراسة أهميّة توجيه الجهود نحو تحسين ميّزات التّدريب والّتي تؤدّي إلى تحسين أداء النّماذج النّاتجة. تُؤكد الدّراسة أيضاً إمكانيّة الاستفادة من خوارزميّات تفسير النّماذج في اختيار الميّزات الأكثر فعاليةً في عمليّة اكتشاف خطاب الكراهية، وليس فقط في توضيح قرارات هذه النّماذج، وتُثبت ذلك بالتجارب. يفتح ذلك الباب على مصراعيه أمام المجتمع العلميّ من أجل رفد الطّرائق الحاليّة في اكتشاف خطاب الكراهية بكوكبةِ طرائقٍ جديدةٍ تعتمد بأساسها على خوارزميّات التّفسير ورفع سويّة نماذج اكتشاف خطاب الكراهية.

الكلمات المفتاحية: تعلم آلة، تعلم عميق، معالجة لغات طبيعية، تحليل مشاعر، خطاب كراهية، نماذج مبنية على المحولات، ذكاء اصطناعي قابل للتفسير، ماربيرت، مشتقات متكاملة، ميزات، تغريدة.

تحميل البحث