الشبكات الخصومية التوليدية (GANs) Generative Adversarial Networks

الشبكات التوليدية الخصومية Generative Adversarial Networks (GANs) هي شبكة من شبكات التعلم الآلي التي أنشئت من قبل إيان جودفيلو وزملاؤه في عام 2014. حيث مبدأ عمل هذا النوع من الشبكات يتمحور في تنافس شبكتين عصبيتين مع بعضهما في لعبة الهدف منها التدرب على إنشاء بيانات مفبركة مشابهة للبيانات الحقيقية، يصعب على مراقب بشري أو آلي التفريق بينهما.

الشبكات التوليدية الخصومية GANs، هي نهج من مناهج النمذجة التوليدية generative modeling باستخدام أساليب التعلم العميق deep learning، مثل الشبكات العصبية التلافيفية (Convolutional Neural Networks (CNNs.

النمذجة التوليدية Generative modeling تعتبر نموذج من نماذج التعلم الآلي غير الخاضع للإشراف حيث تتضمن اكتشاف وتعلم الأنماط في بيانات الإدخال تلقائيًا بطريقة يمكن من خلالها استخدام النموذج لإنشاء أو إخراج أمثلة جديدة كان من الممكن استخلاصها من مجموعة البيانات الأصلية.

تعد الشبكات التوليدية الخصومية GANs طريقة مبتكرة لتدريب نموذج توليدي من خلال تأطير المشكلة على أنها مشكلة تعلم خاضعة للإشراف مع نموذجين فرعيين: نموذج المولد generator model الذي ندربه لتوليد أمثلة جديدة ، ونموذج المُميِّز discriminator model الذي يحاول تصنيف الأمثلة على أنها إما حقيقية (من المجال) أو وهمية (تم إنشاؤها). يتم تدريب النموذجين معًا في لعبة عدائية محصلتها صفر ، إلى أن يتم خداع نموذج المُميِّز discriminator model، مما يعني أن نموذج المولد generator model ينتج أمثلة معقولة يمكن من خلالها خداع نموذج المُميِّز discriminator model.

تعد شبكات GANs مجالًا مثيرًا للإهتمام ويتسارع بشكل ملحوظ ، حيث تفي بوعود النماذج التوليدية generator models في قدرتها على إنشاء أمثلة واقعية عبر مجموعة من مجالات الحياة ، وعلى الأخص في مهام التحويل مثل تحويل الصور من صور الصيف إلى صور شتاء أو تحويل صور النهار إلى صور ليل ، وفي توليد صور واقعية للأشياء ،للمشاهد ، و حتى للأشخاص حيث يصعب التمييز بين ما هو حقيقي و ما هو مزيف.

في هذا المقال ، سوف نتعرف سويا في شكل مقدمة على الشبكات التوليدية الخصومية GANs.

أتوقع بعد قراءة هذا المقال ستكون عندك معرفة بالأتي:

سياق الشبكات التوليدية الخصومية GANs ، بما في ذلك نبذة عن التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف supervised vs unsupervised learning والنمذجة التمييزية مقابل النمذجة التوليدية discriminative vs generative modeling.

الشبكات التوليدية الخصومية GANs هي بنية برمجية صممت لتدريب نموذج توليدي generative model تلقائيًا عن طريق معالجة المشكلة غير الخاضعة للإشراف على أنها مشكلة خاضعة للإشراف و لإستخدام كل من النموذج التوليدي والتمييزي.

توفر الشبكات التوليدية الخصومية GANs مسارًا لزيادة البيانات المعقدة الخاصة بالمجال وحل المشكلات التي تتطلب حلاً إنتاجيًا ، مثل التحويل -تحويل الصور-.

ما هي النماذج التوليدية Generative Models

في هذا القسم ، سنتعرف على النماذج التوليدية Generative Models، بالتعريج على نماذج التعلم الخاضع للإشراف مقابل نماذج التعلم غير الخاضع للإشراف بالإضافة إلى النمذجة التمييزية مقابل النمذجة التوليدية.

التعلم الخاضع للإشراف مقابل التعلم غير الخاضع للإشراف Supervised vs. Unsupervised Learning

تتضمن مشكلة التعلم الآلي النموذجية استخدام نموذج لعمل توقع ، على سبيل المثال النمذجة التنبؤية.

يتطلب هذا مجموعة بيانات تدريبية تُستخدم لتدريب نموذج ، يتألف من عدة أمثلة، تسمى عينات ، لكل منها متغيرات “فئة الإدخال” (X) وتسميات “فئة الإخراج” (Y). يتم تدريب النموذج من خلال عرض أمثلة على المدخلات ، وجعله يتنبأ بالمخرجات ، وتصحيح النموذج لجعل المخرجات أشبه بالمخرجات المتوقعة.

في نهج التعلم التنبؤي الخاضع للإشراف ، يتمثل الهدف في تعلم رسم الخرائط من المدخلات X إلى المخرجات Y ، بالنظر إلى مجموعة مصنفة من أزواج المدخلات والمخرجات .التعلم الآلي: من منظور احتمالي الصفحة 2 ، 2012.

يشار إلى هذا التصحيح للنموذج عمومًا على أنه شكل من أشكال التعلم الخاضع للإشراف supervised learning.

تتضمن مشاكل التعلم الخاضع للإشراف نوعين أساسيين التصنيف classification والانحدار regression، و من أمثلة خوارزميات التعلم الخاضع للإشراف خوارزمية الانحدار اللوجستي logistic regression و خوارزمية الغابة العشوائية random forest.

هناك نموذج آخر للتعلم حيث يتم إعطاء النموذج فقط متغيرات الإدخال (X) ولا تحتوي المشكلة على أي متغيرات إخراج (Y). يتم إنشاء النموذج عن طريق استخراج الأنماط في بيانات الإدخال. لا يوجد تصحيح للنموذج ، فالنموذج لا يتنبأ بأي شيء. وهذا النوع من التعلم الآلي machine learning هو نهج التعلم الوصفي descriptive learning أو التعلم غير الخاضع للإشراف Unsupervised Learning. هنا يتم تزويد النموذج بالمدخلات فقط ، والهدف هو العثور على “أنماط مثيرة للاهتمام” في البيانات. حيث تعتبر هذه المشكلة أقل تحديدًا، حيث لا يتم تحديد أنواع الأنماط التي يجب البحث عنها ، ولا يوجد مقياس خطأ واضح لاستخدامه (على عكس التعلم الخاضع للإشراف، حيث يمكننا مقارنة البيانات المتوقعة أو التي تم التنبؤ بـها بالبيانات المعطاه ل Y ). التعلم الآلي: من منظور احتمالي الصفحة 2 ، 2012.

تتضمن مشاكل التعلم غير الخاضع للإشراف التجميع أو العنقدة clustering و النمذجة التوليدية generative modeling، و من أمثلة خوارزميات التعلم غير الخاضع للإشراف خوارزمية K-means  و خوارزمية الشبكات التوليدية الخصومية GANs.

النمذجة التمييزية Discriminative modeling مقابل النمذجة التوليدية Generative modeling

في التعلم الخاضع للإشراف ، قد نكون مهتمين بتطوير نموذج للتنبؤ بتسمية الفصل في ضوء مثال على متغيرات الإدخال. بحيث تسمى مهمة النمذجة التنبؤية هذه بالتصنيف classification. يُشار أيضًا إلى التصنيف باسم النمذجة التمييزية discriminative modeling.

نستخدم بيانات التدريب للعثور على دالة مميزة f(x) ترسم كل x مباشرة على ملصق الفصل ، وبالتالي نجمع بين الاستدلال ومراحل القرار في مشكلة تعلم واحدة. كتاب التعرف على الأنماط والتعلم الآلي، صفحة 44، 2006.

وذلك لأن النموذج يجب أن يميز أمثلة متغيرات الإدخال عبر الفئات ؛ يجب أن يختار أو يتخذ قرارًا بشأن الفئة التي ينتمي إليها مثال معين. بالتناوب ، قد تكون النماذج غير الخاضعة للإشراف التي تلخص توزيع متغيرات الإدخال قادرة على استخدامها لإنشاء أمثلة جديدة في توزيع المدخلات. على هذا النحو ، يشار إلى هذه الأنواع من النماذج بالنماذج التوليدية generative models. على سبيل المثال ، قد يكون لمتغير واحد توزيع بيانات معروف ، مثل توزيع Gaussian. قد يكون النموذج التوليدي قادرًا على تلخيص توزيع البيانات هذا بشكل كافٍ ، ثم استخدامه لتوليد متغيرات جديدة تتناسب بشكل معقول مع توزيع متغير الإدخال input variable. و تُعرف المناهج التي تضع نموذجًا صريحًا أو ضمنيًا لتوزيع المدخلات والمخرجات بالنماذج التوليدية generative models، لأنه من خلال أخذ العينات منها ، من الممكن إنشاء نقاط بيانات تركيبية في مساحة الإدخال. كتاب التعرف على الأنماط والتعلم الآلي، صفحة 43، 2006.

في الواقع ، قد يكون النموذج التوليدي الجيد قادرًا على توليد أمثلة جديدة ليس فقط معقولة و لكن أحيانا لا يمكن تمييزها عن الأمثلة الحقيقية.

أمثلة على النماذج التوليدية generative models

يعد نموذج ال Naive Bayes مثالاً جيدا على النماذج التوليدية حيث تستخدم غالبًا كنموذج تمييزي discriminative model. على سبيل المثال ، يعمل نموذج ال Naive Bayes من خلال تلخيص التوزيع الاحتمالي لكل متغير – بيانات الإدخال و بيانات الإخراج. و عندما يتم إجراء تنبؤ ، يتم حساب احتمال كل نتيجة محتملة لكل متغير ، ثم يتم تجميع الاحتمالات المستقلة ، و يتم توقع النتيجة الأكثر احتمالية. عند استخدامها في الاتجاه المعاكس ، يمكن أخذ عينات من التوزيعات الاحتمالية لكل متغير لتوليد قيم ميزة جديدة معقولة (مستقلة).

تشمل الأمثلة الأخرى للنماذج التوليدية تخصيص Latent Dirichlet Allocation أو LDA و Gaussian Mixture Model أو GMM.

يمكن استخدام طرق التعلم العميق كنماذج توليدية generative models. هناك مثالان شائعان يشملان آلة بولتزمان المقيدة Restricted Boltzmann Machine RBM ، وشبكة الإيمان العميق Deep belief network DBN. أيضا هناك مثالان حديثان لخوارزميات النمذجة التوليدية للتعلم العميق ، وهما: المشفر المتنوع التلقائي Variational Autoencoder VAE ، و   الشبكات التوليدية الخصومية Generative Adversarial Network GAN.

ما هي الشبكات التوليدية الخصومية Generative Adversarial Network (GAN)؟

الشبكات التوليدية الخصومية GANs، هي نموذج توليدي قائم على التعلم العميق. بشكل عام ، تعد شبكات ال GANs بنية نموذجية لتدريب نموذج توليدي ، و غالبا ما يتم استخدام نماذج التعلم العميق في هذه البنية. تم نشر البنية الهيكلية ل شبكات GANs لأول مرة في الورقة العلمية التي نشرت عام 2014 من قبل إيان قودفيلو ، وآخرون تحت عنوان “الشبكة التوليدية الخصومية Generative Adversarial Network”. يمكن الإطلاع على محتوى المقالة هنا.

لاحقا تم إبتكار منهاج موحد سمى بالشبكات التوليدية الخصومية التلافيفية العميقة  Deep Convolutional Generative Adversarial Networks (DCGAN) ، الذي أدى إستخدامها إلى إنشاء نماذج أكثر استقرارًا. تم إضفاء الطابع الرسمي عليها لاحقًا من قبل أليك رادفورد بنشرها في ورقة علمية عام 2015 تحت عنوان “التمثيل غير الخاضع للإشراف للتعلم مع الشبكات التوليدية الخصومية التلافيفية العميقة”. يمكن الإطلاع على محتوى المقالة هنا.

تعتمد معظم الشبكات التوليدية الخصومية GANs اليوم على نحو ما على الاقل على بنية الشبكات التوليدية الخصومية التلافيفية العميقة DCGAN. برنامج NIPS التعليمي: شبكات الخصومة التوليدية ، 2016.

تتضمن بنية نموذج الشبكة التوليدية الخصومية GAN نموذجين فرعيين: نموذج المولد generative model لتوليد أمثلة جديدة ونموذج المميز discriminative model لتصنيف ما إذا كانت الأمثلة التي تم إنشاؤها حقيقية من المجال ، أو وهمية تم إنشاؤها بواسطة نموذج المولد generative model.

نموذج المولد generative model هو النموذج الذي يستخدم لتوليد أمثلة جديدة معقولة من مجال المشكلة. أما نموذج المُميِّز discriminative model فهو النموذج الذي يستخدم لتصنيف الأمثلة على أنها إما حقيقية (من المجال) أو وهمية (مُنشأة).
تعتمد الشبكات التوليدية الخصومية GANs على سيناريو نظري للعبة يجب أن تتنافس فيه شبكة نموذج المولد generator network ضد خصم. تنتج شبكة نموذج المولد generator network عينات مباشرة. يحاول خصمها، شبكة نموذج المُميِّز discriminator network، التمييز بين العينات المأخوذة من بيانات التدريب والعينات المأخوذة من المولد. كتاب التعلم العميق، صفحة 699، 2016.

نموذج المولد Generator Model

يأخذ نموذج المولد متجهًا عشوائيًا بطول ثابت fixed-length random vector كمدخل ويولد عينة بيانات في المجال. يتم رسم المتجه بشكل عشوائي من توزيع غاوس gaussian distribution، ويتم استخدام المتجه لبذر العملية التوليدية. بعد التدريب ، ستتوافق النقاط الموجودة في مساحة المتجه متعددة الأبعاد هذه مع نقاط في مجال المشكلة ، وتشكل تمثيلًا مضغوطًا لتوزيع البيانات.

يشار إلى مجال المتجه هذا على أنه فضاء كامن latent space، أو فضاء متجة vector space يتكون من متغيرات كامنة. المتغيرات الكامنة latent variable، هي تلك المتغيرات المهمة لمجال ولكن لا يمكن ملاحظتها بشكل مباشر. كتاب التعلم العميق، صفحة 67، 2016.

غالبًا ما نشير إلى المتغيرات الكامنة latent variables، أو الفضاء الكامن latent space، على أنها إسقاط أو ضغط لتوزيع البيانات. أي أن الفضاء الكامن latent space يوفر ضغطًا أو مفاهيم عالية المستوى للبيانات الأولية المرصودة مثل توزيع بيانات الإدخال. في حالة شبكات GANs ، يطبق نموذج المولد generator model المعنى على النقاط الموجودة في الفضاء الكامن latent space المختار ، بحيث يمكن توفير نقاط جديدة مستمدة من الفضاء الكامن إلى نموذج المولد كمدخلات واستخدامها لإنشاء أمثلة إخراج جديدة ومختلفة.

يمكن لنماذج التعلم الآلي أن تتعلم الفضاء الإحصائي الكامن statistical latent space للصور والموسيقى والقصص ، ويمكنها بعد ذلك أخذ عينات من هذا الفضاء ، وإنشاء أعمال فنية جديدة بخصائص مشابهة لتلك التي شاهدتها النماذج في بيانات التدريب الخاصة بها كل على حده. التعلم العميق باستخدام البايثون، الصفحة 270، 2017.

بعد التدريب ، يتم الاحتفاظ بنموذج المولد واستخدامه لتوليد عينات جديدة.

Example of the GAN Generator Model

مثال على النموذج المولد Generator Model ل GAN

نموذج المُميِّز discriminator model

يأخذ نموذج المُميِّز مثالاً من المجال كمدخل (حقيقي real أو مُنشأ generated) ويتنبأ بتسمية فئة ثنائية حقيقية real أو مزيفة -وهمية- fake (مُنشأة generated). تأتي العينات الحقيقية real samples من مجموعة بيانات التدريب training dataset بينما العينات المُنشأة أو المزيفة generated samples يتم إنشاؤها بواسطة نموذج المولد generator model. المُميِّز هو نموذج تصنيف عادي (و سهل الفهم).

بعد عملية التدريب ، يتم تجاهل نموذج المُميِّز discriminator model لأن التركيز على نموذج المولد generator model. في بعض الأحيان ، يمكن إعادة توجيه المولد generator نظرا لتعلمه كيفية استخراج الميزات بشكل فعال من الأمثلة في فضاء العينة. يمكن استخدام بعض أو كل طبقات الميزات في تطبيقات نقل التعلم transfer learning باستخدام نفس بيانات الإدخال أو ما شابهها.

أعتقد أن إحدى أفضل الطرق لبناء تمثيلات للصور هي تدريب الشبكات التوليدية الخصومية GANs، ثم إعادة استخدام أجزاء من شبكات المولد  generator networks و شبكات المميّز discriminator networks كمستخلصات للمهام الخاضعة للإشراف. تعلم التمثيل غير الخاضع للإشراف مع الشبكات التوليدية الخصومية التوليفية العميقة ، 2015.

Example of the GAN Discriminator Model

مثال على نموذج المميّز discriminator model ل GAN

الشبكات التوليدية الخصومية GANs كلعبة ثنائية اللاعبين

على الرغم من أن الخاصية المميزة لبنية الشبكات التوليدية الخصومية GAN هي أن تدريب النموذج التوليدي generative model يتم تأطيره كمشكلة تعلم خاضعة للإشراف الا أن النمذجة التوليدية Generative modeling تعتبر في حد ذاتها مشكلة تعلم غير خاضعة للإشراف Unsupervised Learning.

يتم تدريب النموذجين ، المولد و المُميِّز generator and discriminator، معًا. نموذج المولد generator model يولد مجموعة من العينات ، إلى جانب العينات الحقيقية real samples من المجال ، بحيث يتم تقديمها إلى نموذج المُميِّز discriminator model وتصنف على أنها حقيقية real أو مزيفة fake. يتم بعد ذلك تحديث نموذج المُميِّز discriminator model ليتحسن في التمييز بين العينات الحقيقية والمزيفة في الجولة التالية ، والأهم من ذلك ، يتم تحديث نموذج المولد generator model بناءً على مدى جودة أو عدم نجاح العينات المولدة في خداع نموذج المُميِّز discriminator model.

يمكننا أن نفكر في نموذج المولد generator model على أنه مزور ، يحاول جني أموال مزيفة، و  المُميِّز مثل رجل الشرطة discriminator model، يحاول السماح بالمال المشروع والقبض على النقود المزيفة. للنجاح في هذه اللعبة ، يجب أن يتعلم المزور كسب أموال لا يمكن تمييزها عن الأموال الحقيقية ، ويجب أن تتعلم شبكة المولدات إنشاء عينات مأخوذة من نفس التوزيع مثل بيانات التدريب. برنامج NIPS التعليمي: الشبكات التوليدية الخصومية، 2016.

وبهذه الطريقة ، يتنافس النموذجان ضد بعضهما البعض ، فهما متعارضان من منظور نظرية اللعبة ، ويلعبان لعبة محصلتها صفر. و نظرًا لأنه يمكن تحليل إطار عمل الشبكة التوليدية الخصومية GAN بشكل طبيعي باستخدام أدوات نظرية اللعبة ، فإننا نطلق على شبكات ال GAN “خصومية”. برنامج NIPS التعليمي: الشبكات التوليدية الخصومية، 2016.

في هذه الحالة ، تعني القيمة الصفرية أنه عندما يتعرف نموذج المُميِّز discriminator model على عينات حقيقية ومزيفة بنجاح ، تتم مكافأته بأنه لا يضطر إلى تغيير معلماتاته ، بينما يُعاقب نموذج المولد generator model بتحديث معلماته. و بالمقابل ، عندما يخدع نموذج المولد generator model نموذج المُميِّز discriminator model ، تتم مكافأته ،بأنه لا يضطر إلى تغيير معلماتاته ، بينما يُعاقب نموذج المُميِّز discriminator model بتحديث معلماته بإستمرار. عند حد معين ، يُنشئ المولد نسخًا متماثلة مثالية من مجال الإدخال في كل مرة ، ولا يمكن للمُميِّز التمييز بين القيم المنشأة و القيم الحقيقة ويتوقع “غير متأكد” (على سبيل المثال ، 50٪ للحقيقية و للمزيفة) في كل حالة. هذا مجرد مثال على النموذج المثالي لكن لا نحتاج للوصول إلى هذه النقطة للحصول على نموذج مولد جيد. الشكل أدناه يوضح الفكرة بشكل أوضح.
Example of the Generative Adversarial Network Model Architecture

بالتدريب يتم دفع نموذج المميّز لمحاولة تعلم التصنيف الصحيح للعينات على أنها حقيقية أو مزيفة. في نفس الوقت ، يحاول نموذج المولد خداع نموذج المميّز لدفعه للاعتقاد بأن عيناته حقيقية. عندما لا يقدر نموذج المميّز على تمييز العينات المنشأة من قبل نموذج المولد عن العينات الحقيقية ، ويخرج بنتائج 0.5 في كل تجربة عندئذ يمكن التخلص من نموذج المميّز. كتاب التعلم العميق ،صفحة 700 ، 2016.

الشبكات التوليدية الخصومية GAN و الشبكات العصبية التلافيفية CNN

تعمل الشبكات التوليدية الخصومية GAN عادةً مع بيانات الصورة وتستخدم الشبكات العصبية التلافيفية CNNs، كنماذج مولدات و كنماذج مميزات. قد يكون السبب في ذلك هو أن الإستخدام الأول للتقنية – شبكات ال CNNs- كان في مجال الرؤية الحاسوبية computer vision و بيانات الصور ، وبسبب التقدم الملحوظ الذي شوهد في السنوات الأخيرة باستخدام شبكات ال CNNs بشكل عام لتحقيق مهام الرؤية الحاسوبية مثل اكتشاف الأشياء object detection والتعرف على الوجوه face recognition. بالإضافة إلى ما ذلك ، القدرة الهائلة لشبكات CNNs على التقييم البصري لجودة المخرجات الناتجة

نمذجة بيانات الصورة تعني أن الفضاء الكامن latent space ، المدخلات inputs إلى نموذج المولد generator model  ، توفر تمثيلًا مضغوطًا لمجموعة الصور المستخدمة لتدريب النموذج. وهذا يعني أيضًا أن المولد يولد صورًا فوتوغرافية جديدة ، مما يوفر إخراجًا يمكن عرضه وتقييمه بسهولة من قبل المطورين أو مستخدمي النموذج.

الشبكات التوليدية الخصومية الشرطية Conditional GANs

من المميزات المهمة للشبكات التوليدية الخصومية GAN هو إمكانية استخدامها لتوليد المخرجات بشكل مشروط. يمكن تدريب النموذج التوليدي على توليد أمثلة جديدة من مجال الإدخال ، حيث يتم توفير المدخلات ، المتجه العشوائي من الفضاء الكامن ، مع إشتراط بعض المدخلات الإضافية.

يمكن أن يكون الإدخال الإضافي قيمة تصنيفية ، مثل ذكر أو أنثى في حالة توليد صور لأشخاص ، أو رقم ، في حالة إنشاء صور لأرقام مكتوبة بخط اليد.

يمكن تطوير الشبكات التوليدية الخصومية GANs إلى نموذج شرطي إذا كان كل من المولد generator والمميز discriminator مشروطًا ببعض المعلومات الإضافية يمكن ترميزها بالحرف Y. حيث يمكن أن تكون المعلومات الإضافية Y نوع من المعلومات المساعدة ، مثل تسميات الفصل class labels أو بيانات من طرائق أخرى. يمكننا إجراء التكييف عن طريق تغذية Y في كل من نموذج المميز و نموذج المولد كطبقة إدخال إضافية additional input layer. الشبكات التوليدية الخصومية المشروطة ، 2014.

يعتبر نموذج المميز discriminator model أيضًا مشروط، مما يعني أنه يتم تزويده بصور إدخال إما حقيقية أو مزيفة بالإضافة إلى المدخلات الإضافية. في حالة الإدخال الشرطي لنوع تسمية التصنيف classification label، يتوقع نموذج المميّز بعد ذلك أن يكون الإدخال من تلك الفئة ، مما يؤدي بدوره إلى تعليم نوذج المولد لتوليد أمثلة عن تلك الفئة من أجل خداع المميّز. بهذه الطريقة ، يمكن استخدام الشبكات التوليدية الخصومية المشروطة لتوليد أمثلة من مجال نوع معين.

إذا اتخذنا خطوة أخرى إلى الأمام ، يمكن أن تكون نماذج GANs مشروطة بمثال من المجال ، مثل صورة. و هذا يساعد كثيرا في تطوير تطبيقات الشبكات التوليدية الخصومية GANs مثل تحويل النص إلى صورة أو تحويل الصورة إلى صورة أخرى.

في حالة الشبكات التوليدية الخصومية GANs المشروطة لتحويل الصور مثل تحويل الصورة من النهار إلى الليل ، يتم تزويد نموذج المميز بأمثلة لصور ليلية حقيقية real و مولدة generated مشروطة بالإضافة إلى صور النهار الحقيقية كمدخلات. و يتم تزويد نموذج المولد بمتجه عشوائي من الفضاء الكامن مشروطة بالإضافة إلى صور نهارية حقيقية كمدخلات.

 

Example of a Conditional Generative Adversarial Network Model Architecture

لماذا تعتبر الشبكات التوليدية الخصومية GANs مهمة ؟

واحدة من أهم التطورات الرئيسية في استخدام تقنيات التعلم العميق في مجالات مثل مجال الرؤية الحاسوبية computer vision هي تقنية تسمى زيادة البيانات  data augmentation. ينتج عن زيادة البيانات data augmentation أداء أفضل للنماذج ، مما يؤدي إلى زيادة مهارة النموذج وتوفير تأثير تنظيمي ، مما يقلل من خطأ التعميم. تعمل هذه التقنية على إنشاء أمثلة جديدة و مصطنعة ولكنها معقولة من عينة مجال مشكلة الإدخال الذي يتم تدريب النموذج عليها.

تعتبر التقنيات بدائية في حالة بيانات الصورة ، لكن النمذجة التوليدية generative modeling الناجحة توفر طريق بديلة ومن المحتمل أن تكون أكثر تحديدًا للمجال لزيادة البيانات. في الواقع ، تعد زيادة البيانات نسخة مبسطة من النمذجة التوليدية ، على الرغم من أنه نادرًا ما يتم وصفها بهذه الطريقة.

… عملية توسيع فضاء العينة ببيانات كامنة latent data (غير ملحوظة unobserved) تسمى زيادة البيانات data augmentation. البيانات الكامنة latent data هي بيانات فعلية كان من المفروض ملاحظتها ولكنها مفقودة. عناصر التعلم الإحصائي، صفحة 276، 2016.

في المجالات المعقدة بكمية محدودة من البيانات ، توفر النمذجة التوليدية generative modeling مسارًا نحو مزيد من التدريب على النمذجة. حيث أن شبكات ال GANs شهدت نجاحًا كبيرًا في حالة الاستخدام هذه، في مجالات مثل التعلم المعزز العميق deep reinforcement learning.

هناك العديد من الأسباب البحثية التي تجعل شبكات GANs مثيرة للاهتمام ومهمة وتتطلب مزيدًا من الدراسة. من بين هذه الأسباب ،قدرة الشبكات التوليدية الخصومية GANs الناجحة على نمذجة البيانات متعددة الأبعاد ، ومعالجة البيانات المفقودة ، وقدرة شبكات GANs على توفير مخرجات متعددة الوسائط أو إجابات متعددة و معقولة.

ربما يكون التطبيق الأكثر إقناعًا للشبكات التوليدية الخصومية GANs في شبكات GANs المشروطة للمهام التي تتطلب توليد أمثلة جديدة. هنا ، يشير جودفيلو إلى ثلاثة أمثلة رئيسية:

  1. دقة الصورة الفائقة Image Super-Resolution. القدرة على إنشاء إصدارات عالية الدقة من الصور المدخلة.
  2. إنشاء فن جديد Creating Art. القدرة على إنشاء صور رائعة جديدة وفنية ، والرسومات ، والرسم ، وأكثر من ذلك.
  3. تحويل الصور Image-to-Image Translation. القدرة على تحويل الصور عبر المجالات ، مثل النهار والليل ، ومن الصيف إلى الشتاء ، الخ.

ربما يكون السبب الأكثر إلحاحًا في دراسة وتطوير واستخدام شبكات GAN على نطاق واسع هو نجاحها. تمكنت شبكات GAN من إنشاء صور واقعية للغاية بحيث لا يستطيع البشر معرفة أنها لأشياء ومشاهد وأشخاص غير موجودين في الحياة الواقعية.

المذهل ليس صفة كافية لقدرتهم ونجاحهم.

Example of the Progression in the Capabilities of GANs from 2014 to 2017

مثال على التقدم في قدرات شبكات GAN من 2014 إلى 2017.

 

المراجع

  1. المرجع الاول
  2. المرجع الثاني
  3. المرجع الثالث

 

Share on facebook
فاسبوك
Share on twitter
تويتر
Share on linkedin
لينكد إن
Share on whatsapp
واتساب

اترك تعليقاً

المشاركات الاخيرة

أحدث التعليقات

أفحص بحثك بالمجان

رفع الملف