تصغير حجم الخصائص المستخرجة من البيانات

Dimensionality Reduction : Principal Component Analysis PCA

في بعض المجالات تكون البيانات ضخمة جدا و عدد (Features ) كبيرا جدا يعني أبعادا كثيرة و هذا قد يصعب علينا العمل في مجال تعلم الألة أو حتى يستحيل ذلك في بعض المجالات الأخرى نظرا لقدرات الحواسب المحدودة. ال (Features ) في حد ذاتها قد تسبب تداخلا بين بياناتنا إذا لم نحسن إختيارها، مثلا لتنصيف البرتقال و التفاح و الليمون قد تكون خاصية الشكل غير مفيدة بل تخلق تداخلا و تعقد عملية التصنيف كون الأشكال بينها متشابهة عكس خاصة اللون التي تفصل بينهم بشكل واضح. في هذا المقال نشير إلى طريقة فعالة جدا لتصغير حجم (Features) و هي طريقة رياضية إحصائية إسمها (PCA) و تعتمد على حساب (Covariance matrix ) و (Eigen vectors and values)  ثم تعيد ترتيب البيانات وفق هذه الحسابات أو الأبعاد و بعدها تختار (K Eigen vectors ) و الذي يمثل عدد الأبعاد التي نرغب في تحويل (تصغير ) الخصائص (Features ) إليها.

الصورة 1

هذه الطريقة (PCA) جاهزة على مكتبة (Scikit-Learn ). و كمثال تطبيقي حولها إخترنا قاعدة بيانات تحتوي على (Examples = 569  features = 30)  قمنا بعرض ذلك في السطر 17 من الصورة 1 و تم إظهار النتائج في الصورة 3. في السطر 19 من الصورة 1 إستعمالنا طريقة (PCA) لتصغير (Features ) إلى 5 أبعاد فقط (n_components = 5) . بعد التنفيذ عرضنا النتائج الجديدة في السطر 21 من الصورة 1 و النتائج في الصورة 3. في السطرين 23 و 26 قمنا بتقسيم البيانات إلى قسمين (التدريب و الإختبار ) ب (Features ) العادية و ب (Features ) بعد التصغير على الترتيب. إستعملنا خوارزمية (SVM) من أجل هذا المثال الصورة 2 و بالصدفة كانت النتائج متطابقة. الفرق هو بدل العمل ب (Features : 569 * 30 = 17070) إستعملنا فقط (Features : 569 * 5 = 2845)، رغم هذا الفارق الكبير في (Features )  التي قدمت لكل خوارزمية إلا أننا حصلنا على نفس النتائج و هكذا تظهر فعالية و قوة تصغير (Features ) و كذلك طريقة (PCA).

الصورة 2
الصورة 3
رابط الكود هنا

#الذكاء_الإصطناعي #تعلم_الألة #التعلم_العميق
#artificial_intelligence #machine_learning #deep_learning
الكاتب : هشام فلواط - hichem felouat
تابعوا مقالاتي على الهاشتاج : #هشام_فلواط

Comments

Popular posts from this blog

مقدمة

تحسين أداء خوارزميات تعلم الألة

أنواع الطرق المستخدمة في مجال تعلم الألة The type of machine learning