خوارزمية أشجار القرار Decision Trees مقدمة , مميزات و عيوب هذه الخوارزمية -1

خوارزمية أشجار القرار Decision Trees هي خوارزمية تعلم الي خاضع للإشراف غير بارامترية تستخدم في مسائل التصنيف و التنبؤ. الهدف من هذه الخوارزمية هو إنشاء نموذج يتنبأ بقيمة المتغير المستهدف من خلال تعلم قواعد القرار البسيطة المستنبطة من ميزات البيانات. يمكن رؤية الشجرة على أنها تقريب ثابت متعدد الصيغ.

مميزات و عيوب خوارزمية أشجار القرار

مزايا الخوارزمية

  • سهلة الفهم والتفسير و يمكن ذلك من خلال تصور الأشجار. و ينتج عنها مجموعة من القواعد.
  • تتطلب القليل من الجهد في إعداد البيانات. غالبًا ما تتطلب التقنيات الأخرى عملية ضبط للبيانات، ويجب إنشاء متغيرات وهمية وإزالة القيم الفارغة. لاحظ مع ذلك أن هذه الخوارزمية لا تدعم القيم المفقودة.
  • قادرة على التعامل مع البيانات العددية والفئوية.
  • قادرة على التعامل مع المهام التي يكون فيها عدد المخرجات متعددة.
  • يمكن التحقق من صحة النموذج باستخدام الاختبارات الإحصائية. و هذا يجعل من الممكن حساب كفائة النموذج بدقة عالية.
  • تؤدي الخوارزمية أداءً جيدًا حتى لو تم انتهاك افتراضاتها إلى حد ما بواسطة النموذج الحقيقي الذي تم إنشاء البيانات منه.
  • تتبع هذه الخوارزمية نفس النهج الذي يتبعه البشر بشكل عام أثناء اتخاذ القرارات.
  • عدد المعلمات الفائقة المراد ضبطها تكاد تكون خالية.

عيوب الخوارزمية

  • يمكن إنشاء أشجار شديدة التعقيد لا تعمم البيانات بشكل جيد. و هذه المشكلة تسمى الافراط في التخصيص. آليات مثل التقليم -تقليم الشجرة- ، و تحديد الحد الأدنى لعدد العينات المطلوبة في عقدة ورقية ما أو تحديد أقصى عمق للشجرة ضرورية لتجنب هذه المشكلة.
  • يمكن أن تكون أشجار القرار غير مستقرة لأن الاختلافات الصغيرة في البيانات قد تؤدي إلى إنشاء شجرة مختلفة تمامًا. يتم تخفيف هذه المشكلة باستخدام أشجار القرار خلال المجموعة.
  • تنبؤات أشجار القرار ليست سلسة و لا مستمرة ، ولكنها تقديرات تقريبية ثابتة متعددة المستويات. لذلك ، فهذه الخوارزمية لا تجيد الاستقراء.
  • من المعروف أن مشكلة تعلم شجرة القرار المثلى هي – مشكلة كثيرة الحدود غير قطعية كاملة NP-complete problems – تحت عدة جوانب من الأمثل وحتى للمفاهيم البسيطة. وبالتالي ، فإن خوارزميات تعلم شجرة القرار العملية تستند إلى خوارزميات إرشادية heuristic algorithms مثل الخوارزمية الجشعة greedy algorithm حيث يتم اتخاذ القرارات المثلى مكانيا في كل عقدة. لا يمكن أن تضمن هذه الخوارزميات إرجاع شجرة القرار الأمثل بالعموم. يمكن التخفيف من ذلك من خلال تدريب عدة أشجار في مجموعة التعلم ، حيث يتم أخذ عينات عشوائية من الميزات و العينات مع الاستبدال.
  • هناك مفاهيم يصعب تعلمها لأن أشجار القرار لا تعبر عنها بسهولة ، مثل مشاكل XOR أو التكافؤ أو متعدد الإرسال.
  • ينشئ متعلمو شجرة القرار أشجارًا متحيزة إذا كانت بعض الفئات هي المسيطرة. لذلك يوصى بموازنة مجموعة البيانات قبل تدريبها مع شجرة القرار.
  • خوارزمية شجرة القرار بشكل عام ، تعطي دقة تنبؤ منخفضة لمجموعة البيانات مقارنة بخوارزميات التعلم الآلي الأخرى.
  • يعطي مصطلح Information gain في شجرة القرار ذات المتغيرات الفئوية استجابة متحيزة للسمات ذات العدد الأكبر من الفئات.
  • يمكن أن تصبح الحسابات معقدة عندما يكون هناك العديد من تصنيفات الفئة.

 

المراجع

Share on facebook
فيسبوك
Share on twitter
تويتر
Share on linkedin
لينكدإن
Share on whatsapp
واتساب

اترك تعليقاً

المشاركات الاخيرة

أحدث التعليقات

أفحص بحثك بالمجان

رفع الملف