تحسين النموذج YOLOv4واستخدامه في التعرف على الأشخاص

  • م. احمد إبراهيم عمران

الملخص

تستخدم تقنية الرؤية الحاسوبية للتعرف على الأشخاص وهي أحد أهم وظائف المركبات ذاتية القيادة من أجل اكتشاف حركة الأشخاص ضمن المسارات المخصصة لها، لمنع الحوادث وتجنب المركبات المتحركة والعقبات. وكذلك في المجالات الأمنية حيث من المهم التعرف على الجاني ومطاردته ضمن حشد من الناس بسرعة وكفاءة عالية مناسبة للتطبيقات المحمولة ضمن الزمن الحقيقي. تُستخدم الشبكة العصبونية التلافيفية CNN من أجل تصميم خوارزميات تؤدي هذه المهمة بدقة عالية. تُعتبر عائلة You Only Look Once (YOLO)  من اهم الخوارزميات في وقتنا الحالي التي تُستخدم لمهام التعرف والتي تحقق أداء جيد من حيث الدقة، ولكن النماذج ذات الدقة العالية تملك عدد عمليات فاصلة عائمة في الثانية Floating-point Operations per Seconds FLOPS كبير وحجم كبير نسبياً لا يناسب التطبيقات المحمولة. في هذا البحث تم تعديل نموذج YOLOv4  الأساسي كونه نموذج يعمل بكفاءة عالية ولكنه يعاني من زيادة عدد عمليات الفاصلة العائمة، لمعالجة هذه المشكلة تم استخدام نموذج

*طالب دكتوراه في قسم هندسة التحكم الآلي والحواسيب

**أستاذ مساعد في قسم هندسة التحكم الآلي والحواسيب

Efficientnet-B0 لتخفيض حجم النموذج مع اجراء بعض التعديلات عليه كما تم استخدام شبكة Cross Stage Partial (CSP) بعد تعديلها من أجل زيادة الدقة. تم بناء خوارزمية CspEffYolo لتحقيق الهدف المطلوب، وتم تدريبها باستخدام قاعدة بيانات Google Images ومن ثم اختبارها والحصول على النتائج، ومقارنتها مع النتائج المماثلة لنموذج YOLOv4  الأساسي وEfficientnet-B0. حقق النموذج متوسط معدل الدقة mAP=90.4%، مقارنة بـ88% و85.9% للنموذج YOLOv4   الأساسي وEfficientnet-B0 على التوالي. بالإضافة إلى تخفيض عدد عمليات الفاصلة العائمة وكذلك حجم النموذج.

منشور
2024-05-10
القسم
سلسلة العلوم الهندسية الميكانيكية و الكهربائية و المعلوماتية