قائمة مصطلحات التعلم الآلي (01): الدقة Accuracy

الدقة Accuracy

تعد دقة خوارزمية التصنيف في التعلم الآلي إحدى الطرق لقياس عدد المرات التي تصنف فيها الخوارزمية نقطة بيانات ما بشكل صحيح. الدقة هي عدد نقاط البيانات المتوقعة بشكل صحيح من بين جميع نقاط البيانات. بشكل أوضح ، يتم تعريفه على أنه

Machine Learning Accuracy: True vs. False Positive/Negative

Decoding the Confusion Matrix - KeyToDataScience

 

عدد العينات التي صنفها النموذج إيجابية و هي في الحقيقة إيجابية بالاضافة الى عدد العينات التي صنفها النموذج سلبية و هي في الحقيقة سلبية مقسومًا على عدد العينات الإيجابية الصحيحة والسلبية الصحيحة بالاضافة الى العينات الإيجابية الخاطئة و العينات السلبية الخاطئة كما هو موضح أعلاه. العينات السلبية الصحيحة أو العينات الإيجابية الصحيحة هي نقطة بيانات صنفتها الخوارزمية بشكل صحيح على أنها صحيحة أو خاطئة ، على التوالي. من ناحية أخرى ، فإن النتيجة الإيجابية أو السلبية الخاطئة هي نقطة بيانات صنفتها الخوارزمية بشكل غير صحيح. على سبيل المثال ، إذا صنفت الخوارزمية نقطة بيانات خاطئة على أنها صحيحة ، فسيكون ذلك إيجابيًا خاطئا. في كثير من الأحيان ، يتم استخدام الدقة جنبًا إلى جنب مع الدقة والإرجاع Precision and Recall، وهي مقاييس أخرى تستخدم نسبًا مختلفة من الإيجابيات / السلبيات الصحيحة / الخاطئة. توفر هذه المقاييس معًا نظرة مفصلة على كيفية تصنيف الخوارزمية لنقاط البيانات.

مثال

لنفترض أن عندنا خوارزمية تصنيف تحدد ما إذا كان البريد الإلكتروني بريدًا عشوائيًا أم لا. بعد تدريب الخوارزمية ، نريد أن نرى مدى أداء هذه الخوارزمية على عينة عشوائية من عشر رسائل بريد إلكتروني لم ترها من قبل. من بين العشر الرسائل ، أربع رسائل منها بريد عشوائي و ست رسائل منها ليست بريدًا عشوائيًا. تصنف الخوارزمية ثلاث رسائل على أنها رسائل غير مرغوب فيها ، اثنتان منها في الواقع رسائل غير مرغوب فيها ، وواحدة ليست بريدًا عشوائيًا. في الجدول أعلاه، تم تلوين العينات الإيجابية الصحيحة (رسائل البريد الإلكتروني التي تم تحديدها بشكل صحيح على أنها بريد عشوائي) بالإضافة إلى العينات السلبية الصحيحة (رسائل البريد الإلكتروني التي تم تحديدها بشكل صحيح على أنها ليست بريدًا عشوائيًا) ملونة باللون الأخضر ، بينما تم تلوين العينات الإيجابية الخاطئة (رسائل البريد الإلكتروني الغير عشوائية التي تم تصنيفها بشكل غير صحيح على أنها رسائل غير مرغوب فيها) بالإضافة إلى العينات السلبية الخاطئة (رسائل البريد الإلكتروني العشوائية التي تم تحديدها بشكل غير صحيح على أنها ليست رسائل غير مرغوب فيها) باللون الأحمر. هناك عينتان من العينات الإيجابية الصحيحة ، وخمس عينات من العينات السلبية الصحيحة، و عينتين من العينات السلبية الخاطئة ، و عينة واحدة من العينات الإيجابية خاطئة. باستخدام صيغة الدقة ، نحصل على: أن هذه الخوارزمية لديها دقة 70٪ في تصنيف رسائل البريد الإلكتروني في ما اذا كانت الرسائل غير مرغوب فيها أم لا.

Share on facebook
فيسبوك
Share on twitter
تويتر
Share on linkedin
لينكدإن
Share on whatsapp
واتساب

اترك تعليقاً

المشاركات الاخيرة

أحدث التعليقات

أفحص بحثك بالمجان

رفع الملف