تحسين خوارزمية Apriori من خلال تقليل مسح قاعدة البيانات

  • الباحث: د. محمد حجوز

الملخص

 تعتمد خوارزمية قواعد الارتباط في تقنية التنقيب في البيانات على إيجاد علاقات مثيرة للاهتمام وارتباطات ملحوظة بين العناصر المختلفة في مجموعة كبيرة من البيانات. ومن الأمثلة الشهيرة عن النقيب في البيانات باستخدام تقنية قواعد الارتباط هو تحليل سلة السوق. حيث تعتبر خوارزمية Apriori هي أول خوارزميات قواعد الارتباط. إلا أن هذه الخوارزمية تحتوي على مشكلتين في عملية التنقيب في البيانات: الأولى هي أنها تحتاج إلى الكثير من الوقت لمسح كامل قاعدة البيانات والثانية هي أنه ينتج عددًا كبيرًا من المجموعات المرشحة غير ذات الصلة والتي تشغل ذاكرة النظام. نقدم في هذا البحث خوارزمية محسنة عن هذه الخوارزمية لحل هاتين المشكلتين. ستعمل خوارزمية Apriori المحسّنة على تقليل عدد مرات مسح قاعدة بيانات بالكامل من خلال تقليل التوليد الزائد للعناصر الفرعية حتى نحصل في الأخير على واحدة من مجموعات العناصر المرشحة توافق الدعم الأدنىminsup . لتحقيق هذه الأهداف سنستخدم مفهوم المجموعة الرئيسة العامة وأمثلة قواعد البيانات. تعمل خوارزمية Apriori المحسّنة على تقليل استهلاك موارد النظام وتحسين كفائته.

منشور
2023-05-11
القسم
سلسلة العلوم الأساسية