تحسين عملية التعرف على الأشخاص بالاعتماد على خوارزمية  YOLOv3 – Tiny

م. احمد إبراهيم عمران

م. احمد إبراهيم عمران

الملخص

يعتبر التعرف على الأشخاص ضمن الصور الرقمية والفيديو أمر مهم للغاية في العديد من التطبيقات كالتعرف على المشاة وأنظمة النقل الذكية والقيادة الذاتية للمركبات، وأصبحت العديد منها يحتاج إلى نتائج دقيقة وسريعة في آن معاً كونها تعمل ضمن الزمن الحقيقي.

مع تطور الخوارزميات التي تعتمد على الشبكات العصبونية التلافيفية والحاجة إلى تسريعها مع الحفاظ على الدقة، تعتبر خوارزمية YOLO (You Look Only Once) خياراً جيداً للتعرف على الاشياء بسرعة تناسب تطبيقات الزمن الحقيقي.

تم في هذا البحث تقديم دراسة مرجعية عن خوارزمية YOLOv3-tiny التي تعمل بسرعة ولكنها تعاني من انخفاض الدقة، لذلك تم تعديلها في مرحلة تحديد عدد وأبعاد الصناديق المرجعية (anchor boxses) وفق طريقة تجميع التوقعات الكبرى Expectation–Maximization (EM) باستخدام نموذج غوص المختلط(Gaussian Mixture Models) (GMM) لزيادة دقة التعرف بدلاً من خوارزمية K-means المستخدمة في الخوارزمية الأساسية، تم تدريب الشبكة على جزء من قاعدة بيانات Open Images v6 الخاص بالأشخاص، وكانت نتيجة متوسط الدقة للنموذج المعدل %84.77 mAP= وهي دقة جيدة مقارنة بـ 81.55% الناتجة عن استخدام خوارزمية K-means، و82.41% الناتجة عن خوارزمية Birch و82.3% الناتجة عن خوارزمية DBSCAN.