قائمة مصطلحات التعلم الآلي (12): مصفوفة التقارب Affinity Matrix أو مصفوفة التشابه Similarity Matrix

ما هي مصفوفة التقارب؟

مصفوفة التقارب Affinity Matrix ، تسمى أيضًا مصفوفة التشابه Similarity Matrix ، هي تقنية إحصائية أساسية تُستخدم لتنظيم أوجه التشابه المتبادلة بين مجموعة من نقاط البيانات. التشابه Similarity مشابه لمصطلح المسافة ، حيث أن النقطتان المتماثلتان سيكون لهما درجة تشابه قدرها 1 ، في حين أن حساب المقياس سينتج عنه صفر. الأمثلة النموذجية لمقاييس التشابه هي تشابه جيب التمام cosine similarity و تشابه جاكارد Jaccard similarity. يمكن تفسير مقاييس التشابه هذه على أنها احتمالية كون نقطتين مرتبطات ببعض. على سبيل المثال ، إذا كانت نقطتا البيانات لهما إحداثيات قريبة ، فإن درجة تشابه جيب التمام cosine similarity (أو درجة “التقارب” ذات الصلة) ستكون أقرب بكثير إلى 1 من نقطتي بيانات بينهما مسافة كبيرة.

مصفوفة التشابه Similarity Matrix هي المفهوم المعاكس لمصفوفة المسافة distance matrix. تقيس عناصر مصفوفة التشابه أوجه التشابه الزوجي بين نقاط البيانات – كلما زاد التشابه بين نقطتين ، زادت قيمة المقياس.

على سبيل المثال ، غالبًا ما يمكن اعتبار مصفوفة الارتباط correlation matrix بمثابة مصفوفة تشابه Similarity Matrix للمتغيرات – لأنه من الطبيعي اعتبار أزواج المتغيرات صاحبة معامل الارتباط الأعلى أكثر تشابهًا مع بعضها البعض بخلاف الأزواج ذات معامل الارتباط الأقل.

لماذا تعتبر مصفوفة التقارب مهمة ؟

من خلال تعيين قيمة عددية لمفهوم التشابه ، تسمح مصفوفة التقارب لنموذج التعلم الآلي بمحاكاة المنطق البشري من خلال إجراء تخمينات مستنيرة حول ماهية المعلومات ذات الصلة ومدى تشابهها. بنفس القدر من الفائدة ، تسمح مصفوفة التشابه لنماذج التعلم الآلي بالعمل مع البيانات من مجموعات البيانات غير المرمزة unlabeled dataset – غير المسماة – أو ن مجموعات البيانات التالفة ذات الحدس البشري ، مما يؤدي إلى عدد لا يحصى من التطبيقات العملية في العديد من المجالات.

الاستخدامات العملية لمصفوفة التقارب

استرداد المعلومات الذكي – مصفوفة التشابه هي القوة الدافعة وراء محركات البحث الذكية التي تسحب معلومات إضافية ذات صلة لم تكن تعلم أنك بحاجة إليها.

الأبحاث الجينية المتقدمة – أدى اكتشاف ودراسة الصلات بين تركيبات الحمض النووي العشوائية ظاهريًا إلى اختراقات هائلة في العلوم الطبية والبحوث الصيدلانية.

التنقيب الفعال في البيانات – تسمح مصفوفة التشابه بالتعرف السريع والدقيق على أنماط العلاقة المخفية في أي قاعدة بيانات مليئة بالبيانات غير المرمزة unlabeled data – غير المسماة -. مفيد بشكل خاص لذكاء الأعمال وإنفاذ القانون وجميع أشكال البحث العلمي.

التعلم الآلي الذكي غير الخاضع للإشراف – إن إنشاء خوارزميات التعلم الآلي القادرة على اشتقاق البنية والمعنى من البيانات غير المنظمة “الخام” سيكون أمرًا مستحيلًا بدون مصفوفة تشابه لضمان الحد الأدنى من الدقة في ما تقوم الشبكة بتعليمه بنفسها. التقنيات المستخدمة في هذا المجال هي خوارزمية k-mean أو خوارزمية الجار الأقرب k حيث تعتمد هاتان الخوارزميتان بشكل كبير على اختيار دالة المسافة أو مقياس التقارب.

في هذا الفيديو شرح لمصفوفة التقارب بالاضافة إلى مصفوفة الإرتباط

Share on facebook
فيسبوك
Share on twitter
تويتر
Share on linkedin
لينكدإن
Share on whatsapp
واتساب

اترك تعليقاً

المشاركات الاخيرة

أحدث التعليقات

أفحص بحثك بالمجان

رفع الملف