تحسين تنبؤات أنظمة التوصية باستخدام نماذج تعلم الآلة اسم الباحث: م. محمد هيثم ديب اسم المشرف: أ. د. ناصر أبو صالح العنوان: تحسين تنبؤات أنظمة التوصية باستخدام نماذج تعلم الآلة العنوان باللغة الإنكليزية: Improving Recommendation Systems’ Predictions Using Machine Learning Models العام:2024 القسم:هندسة البرمجيات ونظم المعلومات الملخص: من أكثر أصناف أنظمة التوصية شهرةً واستخدامًا هي أنظمة التوصية المُعتَمِدة على الفلترة التعاونية Collaborative Filtering (CF)، إذ تقوم أنظمة التوصية CF بتقديم توصيات للمستخدمين من خلال إيجاد العلاقات الخطية بين التفاعلات السابقة المتمثلة بتقييمات المستخدمين للعناصر، ولكنها تعاني من مشاكل عديدة أبرزها البدء البارد وتناثر المعطيات الناتج عن قلة التقييمات الخاصة بالعناصر من قبل المستخدمين، بالإضافة إلى أنّها لا تستخدم كامل ميزات المعطيات المتعلقة بالمستخدمين والعناصر والتفاعلات فيما بينهم وذلك يؤدي إلى ضعف الدقة التنبؤية المُقدَّمة من تلك الأنظمة في التنبؤ بالتقييمات وتقديم أفضل التوصيات. يمكن حل تلك المشاكل بتسخير معطيات جديدة غير التقييمات التي تعتمد عليها أنظمة التوصية CF فقط، وذلك من خلال استخدام نماذج تعلّم الآلة Machine Learning (ML) التي يمكن من خلالها الاستفادة من جميع ميزات العناصر وميزات المستخدمين المتوفرة في مجموعة المعطيات. يُقدِّم هذا البحث مجموعة من الطرق والمنهجيات في استخدام نماذج تعلّم الآلة التقليدية والعميقة في تحسين تنبؤات أنظمة التوصية CF بالتقييمات، وتتمثل بمنهجيتين: المنهجية الأولى هي استخدام نماذج تعلّم الآلة التقليدية في التنبؤ بتقييمات العناصر من خلال الاستفادة من جميع ميزات العناصر والمستخدمين المتوفرة في مجموعة المعطيات، ودمج نتائجها كدخل لأنظمة التوصية CF للحصول على نماذج هجينة تتفوق على كل من نماذج تعلّم الآلة التقليدية وأنظمة التوصية CF. استخدم البحث 5 نماذج لتعلّم الآلة التقليدية و4 طرق لتكديس تلك النماذج لنحصل على نماذج أفضل، ومن ثم دمج نتائجها مع 4 أنظمة توصية CF. كان أفضل النتائج من ناحية الأداء التنبؤي ونسبة تخفيض الخطأ لنظام ALS المدمج مع نموذج التعلّم Stacking XGBoost، إذ إنّ طريقة التكديس باستخدام XGBoost قد قدمت نتائج جيدة جدًا بالمقارنة مع بقية النماذج، وإنّ استقرار ALS واستخدام التقييمات من مرحلة ML قد قدَّم نسبة تخفيض جيدة جدًا تصل إلى -63.65% بالنسبة لنظام ALS الأساس. تمت التجارب والمقارنات باستخدام مجموعة معطيات Book Crossing، ومقياس الأداء التنبؤي للنماذج والأنظمة هو مقياس الخطأ RMSE. المنهجية الثانية هي استخدام نماذج التعلّم العميق في تحسين نظام التوصية NeuMF من خلال الاستفادة من كامل ميزات المعطيات وخاصة النصية منها للحصول على أفضل أداء تنبؤي بالتقييمات. تُقدِّم الدراسة نموذجًا مقترحًا NeuMF-XT والذي تمّ فيه تعديل بنية نظام NeuMF بإضافة طبقات التسوية بالدفعات والإسقاط، واستخدام نموذج تعلّم الآلة XGBoost لتكديس كل من MLP_all وGMF للحصول على نموذج مُحَسَّن NeuMF_XGBoost والذي تم ربطه مع نموذج عصبوني نصي ConvBiLSTMAtt_all والذي يستفيد من قدرة الطبقات التلافيفية في استخراج واكتشاف الميزات الدلالية المحلية وقدرة BiLSTM على الاحتفاظ بالاعتماديات الطويلة بين ميزات الدخل النصية، بالإضافة إلى قدرة الانتباه في تقديم أوزان الانتباه إلى خرج BiLSTM للتركيز على أهم الميزات المفتاحية التي تُعبر عن مشاعر السياق المتمثلة بالتقييمات. أظهرت النتائج تفوُّق النماذج المُقتَرَحة بالنسبة لمجموعات المعطيات الثلاث وهي Book Crossing، Amazon Gift Cards، Shopify App Store وذلك بنسب تخفيض للخطأ تساوي -42.39%، -61.82%، -65.15% بالمقارنة مع مقياس الخطأ RMSE للنظام الأساس NeuMF وبنسب تخفيض للخطأ تساوي -72.51%، -69.23%، -85.77% بالمقارنة مع مقياس الخطأ MAE للنظام الأساس NeuMF. الكلمات المفتاحية: تعلّم الآلة، التعلّم العميق، الفلترة التعاونية، التكديس، تعزيز التَدَرُّج، تضمين الكلمات، الانتباه، المعالجة المسبقة، التحليل العاملي للمصفوفة العصبوني. تحميل البحث