التحديات الرئيسية لتعلم الألة المتعلقة بخوارزميات التدريب

نقول عن نمودج لخوازمية من خوارزميات تعلم الألة أنه يعمل بشكل جيد إذا قام بتعميم أي بيانات إدخال جديدة من قاعدة بيانات المشكلة التي نود حلها بطريقة مناسبة. هذا سيساعدنا على عمل تنبؤات حول البيانات المستقبلية. هناك مشكلتان رئيسيتان متعلقتان بالخوارزميات المختارة و هما :

1- Overfitting :

لأبسط هذه المشكلة نأخد المثال التالي، تخيل أنك زرت مدينة سياحية و ذهبت إلى الشاطئ و إستأجرت مكانا فيه شمسية و كرسي و طاولة و بعدها إكتشفت أن صاحب المكان أخد منك مبلغا أكثر من اللازم بسبب أنك لا تعرف الثمن الحقيقي و غريب عن المدينة! بعض الناس ممن يحدث معهم مثل هذا و للأسف يقعون في التعميم بأن سكان هذه المدينة كلهم لصوص! في حين يوجد الأمناء و الطيبين في هذه المدينة و بكثرة! مادام أن البشر يقعون في التعميم المغلوط (التعميم الأكثر من اللازم) فالألة أيضا ليس حالها أفضل من البشر. يحدث هذا في مجال تعلم الألة عندما نجد أن الخوارزمية تعمل بشكل جيد أثناء عملية التدريب و تقدم نسبة خطأ قليلة و لكن في مرحلة الإختبار نحصل على نتائج سيئة للغاية و لا تستطيع الخوارزمية المستعملة التعميم على البيانات الجديدة المدخلة! كما في الصورة في الشكل الذي على اليمين و هو خاص بعملية التصنيف (classification) و كذلك يوجد هذا المشكل في عملية الإنحدار (regression ) و التعلم العميق (deep learning )، الخوارزميات من النوع (non-parametric and non-linear) تكون لها حرية أكبر لإنشاء نمودج بهذا الشكل و بالتالي تكون عرضة أكثر ل (Overfitting) أو إختيار خوارزمية معقدة لحل مشكل بسيط. من بين الحلول المقترحة لتجاوز هذه الظاهرة هي :

إضافة المزيد من البيانات إلى قاعدة البيانات من أجل صورة أعم حول المشكلة و تصحيح عيوب قاعدة البيانات و إختيار الخصائص المناسبة. إستخدام (Cross-Validation). إستخدام (Regularization). التعديل على المعاملات الداخلية (hyper-parameter). 

2- Underfitting :

هو عكس (Overfitting) تماما، حيث يتعامل ببساطة مع مشكلة معقدة، كما يظهر في الصورة على اليسار و أن نسبة الخطأ تكون كبيرة و واضحة أثناء عملية التدريب. و هذا يحدث عندما نختار خوارزمية غير مناسبة مثلا خوارزمية خطية لحل مشكلة تحتوي على بيانات غير خطية أو يكون لدينا نقص في البيانات من أجل عملية التدريب. و من بين الحلول المقترحة هي :

إختيار خوارزمية أكثر ملائمة لنوع المشكلة. حسن إختيار الخصائص و إضافة أخرى جديدة. التعديل على المعاملات الداخلية (hyper-parameter ). تدريب الخوارزمية لوقت أطول ... إلخ.



#الذكاء_الإصطناعي #تعلم_الألة #التعلم_العميق
#artificial_intelligence #machine_learning #deep_learning

الكاتب : هشام فلواط - hichem felouat
تابعوا مقالاتي على الهاشتاج : #هشام_فلواط

Comments

Popular posts from this blog

نصائح إلى الطلبة الذين سيدرسون تخصص الإعلام الألي

تحسين أداء خوارزميات تعلم الألة

أقسام الذكاء الاصطناعي Subdomains of AI