تقييم نماذج التصنيف في التعلم الالي

قسم التصنيف من الاقسام المهمة في التعلم الآلي حيث يعرف بأنه عملية تصنيف نقاط البيانات إلى فئات مختلفة بناءً على خصائصها. يمكن حل مسائل هذا النوع من التعلم الالي باستخدام مجموعة متنوعة من خوارزميات التعلم الآلي ، مثل أشجار القرار و الغابات العشوائية و آلات المتجهات الداعمة و الشبكات العصبية. حيث يعد تقييم أداء نموذج التصنيف أمرًا بالغ الأهمية لضمان فعاليته و موثوقيته.

في هذه المقالة ، سنناقش بعض مقاييس التقييم الأكثر شيوعًا المستخدمة في مسائل التصنيف.

الدقة Accuracy

الدقة هي مقياس التقييم الأكثر استخدامًا في مسائل التصنيف. حيث تقيس نسبة نقاط البيانات المصنفة بشكل صحيح من إجمالي عدد نقاط البيانات. يتم حسابها على النحو التالي:

الدقة = (TP + TN + FP + FN) / (TP + TN)

حيث TP هو عدد الإيجابيات الحقيقية ، TN هو عدد السلبيات الحقيقية ، FP هو عدد الإيجابيات الخاطئة ، و FN هو عدد السلبيات الخاطئة.

الإنضباط Precision

الإنضباط يعرف بأنه نسبة التنبؤات الإيجابية الحقيقية من جميع التوقعات الإيجابية. حيث يقيس قدرة النموذج على التنبؤ بالعينات الإيجابية بشكل صحيح. يتم حسابه على النحو التالي:

الإنضباط  = TP / (TP + FP)

الاستدعاء Recall

الاستدعاء Recall ، المعروف أيضًا باسم الحساسية ، هو نسبة التنبؤات الإيجابية الصحيحة من جميع العينات الإيجابية الفعلية. كذلك يقيس قدرة النموذج على تحديد العينات الإيجابية بشكل صحيح. يتم حسابه على النحو التالي:

استدعاء = TP / (TP + FN)

درجة F1

مقياس درجة F1 هي المتوسط التوافقي للدقة و الاستدعاء. كذلك ، تعتبر درجة F1 مقياس شائع الاستخدام عندما يكون كل من الدقة والاستدعاء مهمين. علاوة على ذلك يتم حساب درجة F1 على النحو التالي:

مصفوفة الارباك

مصفوفة الارباك هي جدول يلخص أداء نموذج التصنيف. على سبيل المثال ، تعرض مصفوفة الإرباك عدد الإيجابيات الصحيحة والسلبيات الصحيحة و الإيجابيات الخاطئة و السلبيات الخاطئة. من ناحية أخرى تعد هذه المصفوفة مفيدة لتصور أداء النموذج وتحديد مجالات التحسين.

منحنى ROC

يعد منحنى ROC و AUC من مقاييس تقييم مسائل التصنيف الثنائية. كذلك يعتبر منحنى ROC بأنه رسم بياني لمعدل القيم الإيجابية الصحيحة (TPR) مقابل معدل القيم الإيجابية الخاطئة (FPR) عند عتبات تصنيف مختلفة. علاوة على ذلك ، يقيس AUC المنطقة الواقعة تحت منحنى ROC جيث يعتبر مقياس للأداء العام للنموذج.

منحنى AUC - ROC | sciences24.com

مقياس Log-Loss

يعد مقياس Log-Loss ، المعروف أيضًا باسم فقد الانتروبيا المتقاطعة ، مقياس تقييم شائع الاستخدام لمسائل التصنيف. حيث يقيس أداء النموذج من خلال مقارنة احتمالاته المتوقعة مع تسميات الفئة الحقيقية. بناء على ذلك ، يقوم مقياس Log-Loss بمعاقبة النموذج على إجراءه تنبؤات غير صحيحة  ويوفر قياسًا مستمرًا لأداء النموذج.

باختصار ، يعد تقييم أداء نموذج التصنيف أمرًا بالغ الأهمية لضمان فعاليته و موثوقيته. تعد الدقة ،  الإنضباط ،  الاستدعاء ، درجة F1 ،  مصفوفة الارتباك ، منحنى ROC ، و مقياس Log-Loss ، من أكثر مقاييس التقييم شيوعًا في مسائل التصنيف. علاوة على ذلك ، يعتمد اختيار مقياس التقييم المناسب على المشكلة المحددة و أهداف النموذج.

Share on facebook
فيسبوك
Share on twitter
تويتر
Share on linkedin
لينكدإن
Share on whatsapp
واتساب

اترك تعليقاً

أفحص بحثك بالمجان

رفع الملف