تحسين خوارزمية التجميع Mean-Shift بتقدير كثافة الكائنات والنطاق الترددي

  • إعداد: كيندا العيسى

الملخص

يعتبر تجميع البيانات واحد من أهم الأدوات المستخدمة في تنقيب البيانات. تقسم خوارزميات التجميع مجموعة من الكائنات إلى عدة تجمعات (عناقيد). تعتبر خوارزمية الـ من خوارزميات التجميع الأكثر استخداماً، ولكنها تعاني من بعض المشاكل، حيث ان الخوارزمية لا تقوم بتعيين قيمة نصف القطر (النطاق الترددي) للنافذة وانما المستخدم يقوم بإدخاله عشوائياً، كما أن الخوارزمية لا تعيّن المراكز الابتدائية للنافذة وانما تعيّن بشكل عشوائي في البداية، لذلك يصبح عدد التكرارات لتنفيذ الخوارزمية كبير، وكذلك التحديد العشوائي لمراكز العناقيد الابتدائية قد يؤدي لإعطاء نتائج مختلفة. نقدم في هذا البحث خوارزمية معدلة لحل بعض المشاكل التي تعاني منها خوارزمية الـ Mean-Shift. قمنا باقتراح آلية لتعيين المراكز الابتدائية للعنقود بحساب قيم دالة الكثافة للكائنات، بعد ان كانت الخوارزمية الاصلية تقوم بالاختيار العشوائي للمراكز الابتدائية، إضافة إلى تحديد قيمة نصف القطر  آلياً بدلاً من إدخالها من قبل المستخدم.

منشور
2023-08-09
القسم
سلسلة العلوم الأساسية