لنعترف بأن التعلم الآلي أو تعلم الآلة يسمح لأجهزة الكمبيوتر بأداء المهام التي لا يستطيع الإنسان التعامل معها.
يعتمد التعلم الآلي، من قيادة المركبات إلى ترجمة الكلام والتحدث مع الروبوتات بطريقة إنسانية، على الذكاء الاصطناعي وإستخدام برامج وآلات لفهم الواقع المتشابك والغير متوقع والتحكُّم به.
ببساطة، التعلم الآلي يشير إلى العملية التي يتعلم فيها الكمبيوتر والأجهزة كيفية إجراء توقعات دقيقة عند استخدامهم للبيانات.
هذه التنبؤات يمكن أن تكون :
- هل الفاكهة الموجودة في الصورة تعتبر موز أم تفاح؟!
- يتمثل القدرة في التمييز بين الأفراد الذين يعبرون الشارع أمام سيارة ذاتية القيادة.
- يتعين علينا معرفة إذا كان استخدام تعبير "Book" يشير إلى كتاب ورقي أم إلى رغبة في حجز فنادق، حيث تحمل هذه الكلمة معانٍ مختلفة.
- يهدف تطبيق Gmail الجديد إلى معرفة إن كانت الرسائل الإلكترونية التي يتم استلامها مرغوبة فيها أم تحتاج إلى رد فوري عليها.
التمايز الأساسي بينه وبين البرامج التقليدية هو أن صانع البرنامج لم يقم بكتابة شفرة برمجية تُوجِّه البرنامج للتعرف على الاختلاف بين الموز والتفاح.
بدلاً من ذلك، تقوم طريقة برمجة البرامج التي تستخدم تقنية التعلم الآلي بتدريب الآلات والبرامج على التعرف بشكل دقيق على أنواع الفواكه، من خلال تزويدها بكمية كبيرة من البيانات وتدريبها على استخلاص معالم خاصة بهذه الفواكه.
إذاً، يعتبر البيانات أو حجم كبير من البيانات عاملًا رئيسيًا في تسهيل جعل التعلم الآلي أو الـ Machine Learning محتمل.
ما هي الاختلافات بين التعلم الآلي والذكاء الصناعي؟
يمكن أن يتم تحقيق الذكاء الاصطناعي بطرق مختلفة، وليس التعلم الآلي هو الوحيد المستخدم، ورغم نجاحه في الوقت الحالي، إلا أنه ليس سوى طريقة واحدة.
عند انطلاق مجال الذكاء الاصطناعي في الخمسينيات، كان التعريف للذكاء الاصطناعي هو الجهاز الذي يمكنه تأدية مهمة محددة تتطلب بشكل عادي القدرة المعرفية من قبل الإنسان لتأديتها.
سوف تظهر أنظمة الذكاء الاصطناعي في العموم بعض صفات مثل التخطيط والتعلم والتفكير وحل المشاكل وتمثيل المعارف، والإدراك، والحركة، والتلاعب، فضلاً عن الذكاء الاجتماعي والإبداع.
تعتمد على قواعد المعرفة المبرمجة مسبقًا وتستخدم لتحليل البيانات واتخاذ القرارات في مجالات مثل الطب والهندسة. يمكن أيضًا استخدام شبكات العصب الاصطناعي لتَحْلِيلَ بُنْيةِ التواريخِ، وشبكات الأشجار التقابلية للبحث عن أفضل سيناريو في تطوير نظام. يتم برمجة الحواسيب لتقليد سلوك الإنسان في مجال محدد، كنظام الطيار الآلي، من خلال وضع القواعد المناسبة.
ما هي الأنواع الرئيسية من التعلُم الآلي؟
ينقسم مجال التعلم الآلي عادة إلى فئتين رئيسيتين: التعلم المراقب والتعلم الذاتي.
ما هو التعلم تحت الإشراف؟
تضم هذه الفئة من الدروس تدريب الآلات بناءً على نماذج وأمثلة.
معينة من الأشياء مثل الحروف والأرقام بدقة عالية. فكلما تعرض النظام لمزيد من الأمثلة، كان أفضل أداء له في التنبؤ بالبيانات التي تم إدخالها في المستقبل. يتم استخدام البكسل والأشكال المختلفة التي ترتبط برقم معين، حيث يمكنها في النهاية أن تتعرف على الأرقام المكتوبة بخط اليد، وذلك يمكِّنها من إصدار قرارات دقيقة في التمييز بين أرقام مشابهة مثل 9 و 4، و6 و8.
على الرغم من ذلك، فإن تدريب هذه الأنظمة يتطلب بشكل عام كميات كبيرة جدًا من البيانات المصنفة، مع بعضها يحتاج إلى ملايين الأمثلة لإتقان وظيفة أو مهمة.
البيانات الضخمة التي يتم استخدامها لتدريب هذه النظم يمكن أن تكون ضخمة جدًا، حيث أصبح بالإمكان استخدام Google's Open Images Dataset والذي يتضمن حوالي تسعة ملايين صورة، وحاوية الفيديو المسماة بـ YouTube-8M والتي تتصل بسبعة ملايين فيديو تم اسماءها في ImageNet والآن يعُدُ ImageNet أحد قواعد البيانات المستخدََِِِامََّ كثيرًا. تتواصل زيادة حجم مجموعات بيانات التدريب من هذا النوع، وهي تحتوي على أكثر من 14 مليون صورة مصنفة سابقًا.
أعلنت فيسبوك مؤخرًا أنها جمعت 3.5 مليار صورة متاحة للجمهور على إينستاجرام، باستخدام علامات تصنيف الهشتاغ (HashTag) المرفقة بكل صورة كتسميات، وقد استخدم مليار من هذه الصور لتدريب نظام التعرف على الصور، وأدى ذلك إلى تحقيق مستويات قياسية من الدقة حول العالم، حيث بلغت نسبة الدقة 85.4% على المقسّم ImageNet.
غالبًا القيام بعمل كبير من جمع البيانات وتصنيفها باستخدام خدمات الحشد، التي توفرها العديد من المواقع مثل Amazon Mechanical Turk. يتم استخدام هذه الخدمات لتوفير وصول سريع وسهل إلى طاقة عاملة على مستوى عالمي تكلفة قليلة. تم إنشاء ImageNet بجهود 50000 شخص تقريباً على مدى فترة سنتين، حيث تم اختيارهم في الأساس من قبل شركة Amazon Mechanical Turk.
ما هو التعلم بدون إشراف؟
تستخدم خوارزميات التعلم الآلي الغير مراقب لتحديد التشابه بين البيانات وتصنيفها إلى فئات مختلفة، وذلك عن طريق تطبيق مقارنة بينها.
- Airbnbالشخص الذي يقوم بجمع الشقق المتاحة للكراء من الحي المجاور لك.
- تجميع أخبار جوجل عن مواضيع مشابهة بشكل يومي.
تم تصميم الخوارزمية سعيًا للعثور ببساطة على البيانات التي يمكن جمعها من خلال الشبه بينها، وليس لتحديد أنواع محددة من البيانات.
ما هو التعلم شبه المُشرَف عليه؟
يمكن أن يتقلص الأهمية المرتبطة بالمجموعات الضخمة والمُصنفة مسبقاً لتغذية أنظمة التعلُّم مع تقدُّم الوقت، نظراً لزيادة أهمية التعلُّم الذاتي.
النموذج لتصنيف البيانات الخام غير المصنّفة. تعد هذه التقنية مفيدة جدًا في حالة عدم توافر كمية كبيرة من البيانات المصنّفة لتدريب الأنظمة و تحسين أداء التصنيف. يتم استخدامها في مجالات مثل التحليل اللغوي الحاسوبي وتعلُّمِ الآلَةِ . يكمن النموذج المدرب جزئيًا في القدرة على تفريق البيانات التي لم يتم تصنيفها، والطريقة المستخدمة لذلك هي تسمية زائفة أو "pseudo-labelling". بعد ذلك، يتعلَّم النموذج من مزيج البيانات المصنفة والغير مصنّفة.
إذا أصبح عملية التعلم ذات المراقبة الذاتية فعالة مثل عملية التعلم الذي يتم تحت إشراف، فيمكن أن يصبح الوصول إلى كميات هائلة من قوة حاسوبية أكثر أهمية لإنجاح تدريب أنظمة التعلم الآلي بدلاً من الوصول إلى مجاميع كبيرة وفرزها.
ما هو التعلم التعزيزي؟
عليها والتعلم من تجربته بالتفاعل مع اللعبة، سيرتاب الشخص في مفهومه لكيفية التحكم في اللعبة، وكذلك في فهم القواعد والأشياء التي يجب عليه تجنبها. هذا هو المثال المثالي للتعلم التعزيزي، حيث يستغرق الأمر بدءً من المحاولات والخطأ إلى أن تصبح الممارسة نوعًا من ثانية للاعب. بمرور الوقت، سيكون أداء اللاعبين أفضل فيما يتعلق بالشاشة والنتائج داخل اللعبة.
تم اتخاذها للوصول إلى الفوز. يستخدم DeepMind تقنيات التعلم العميق والشبكات العصبية لتحسين مستواه في اللعبة، ولاحظ أن النظام قد تعلم بشكلٍ جيد جدًا في مجال لعبة "Atari 2600" التاريخية. يتم القيام بها في اللعبة باستنتاج النتيجة التي تحققها.
عندما يلعب المستخدم لفترة طويلة على نفس اللعبة، ينشئ النظام بشكل أساسي تصميمًا متكاملاً من الخطوات والإجراءات التي تسهِّل اجتيازها لإنهاء مستوى اللعبة بطريقة أفضل وأكثر نجاحًا ممَّا يستطيع عمله الإنسان.
لنلقي نظرة على آليات عمل كل نظام في مجال التعلم الآلي.
كيف يعمل التعلم الآلي تحت الإشراف؟
تبدأ العملية بتدريب الأجهزة باستخدام "Machine Learning" (نموذج التعلم الآلي)، وهو عبارة عن دالة رياضية يتم تعديلها بشكل مستمر، من خلال التكرار، لضبط طريقة عمل الأجهزة، حتى تصبح قادرة على إجراء تنبؤات دقيقة عند تزويدها بالبيانات الجديدة.
يتوجب عليك قبل بدء الاستعداد للتدريب، تحديد البيانات المطلوب جمعها وتحديد مميزاتها المهمة.
يتم توضيح مزايا البيانات في هذا الشرح من جوجل من خلال مثال يسهل فهمه، حيث يتم تدريب آلة التعلم الآلي للاستدلال على الفروق بين بيبسي وماء معدني، عبر نقطتين: حجم الشراب ولونه.
تُصنَّف كل مشروب إما كـ"بيبسي" أو "مياه"، ولاحقًا يتمُّ جمع البيانات المتعلقة بهذه الأنواع من خلال استخدام مقياس spectrometer لقياس لون المشروب، ومقياس hydrometer لتحديد محتواه.
هناك شيء مهم يجب أن يلاحظ و هو أن الكمية المتساوية من المعلومات تكون ذات أهمية.
يتم بعد ذلك تجزئة مجموعة البيانات المجمّعة إلى نسبة أكبر تصل إلى 70٪ للتدريب ونسبة أقل تصل إلى 30٪ للاختبار. وتُستخدم بيانات الاختبار هذه لاختبار النموذج المُدرَّب (الآلة أو البرنامج) من أجل تحديد مدى فعالية عمله في التطور من خلال بيانات العالم الحقيقي.
سيتم القيام بخطوة إعداد وتهيئة البيانات للآلة المدربة قبل بدء التدريب، تتضمن عمليات إزالة البيانات المكررة وتصحيح الأخطاء.
الخطوة التالية ستكون انتقاء نموذج ملائم لتعلّم الآلة من المجموعة الضخمة من البيانات المُتاحة. ولكلّ نموذج نقاط قوّة وضعفها التي تعتمد على نوع البيانات، فبعضها ملائم لتحليل الصور، بينما يُفضّل استخدام بعضها لتحديد النص، والبعض الآخر خصص للاستخدام في تحليل بيانات رقمية.
كيف يعمل التدريب على الآلة بتقنية تعلّم الآلة تحت إشراف، وكيف يتم ذلك في البرنامج؟
بشكل عام، ينطوي تدريب الآلات على تعليمها كيفية تعديل وظائفها بشكل ذاتي، وذلك من أجل القدرة على إجراء تنبؤات دقيقة للبيانات المتاحة لها. على سبيل المثال، كانت جوجل قد قامت بهذا الأمر سابقًا.
من بين الأساليب الفعالة لتوضيح عملية التدريب هو أخذ مثالٍ تطبيقي باستخدام نموذجٍ بسيط للتعلّم الآلي يُعرف باسم "الانحدار الخطِّي مع انحدار متدرِّج" (linear regression with gradient descent). في هذا المثال المقدَّم، يتم استخدام "نموذج التعلُّم الآلي" لتقدير عدد المثلَّجات التي ستباعُ وذلك استنادًا إلى درجة حرارة الجو.
يمكن تصوّر أنه يتم جمع جميع المعلومات السابقة حول مبيعات الآيس كريم ودرجات الحرارة الخارجية، وتنسيق هذه المعلومات مع بعضها البعض على شكل رسم بياني متشابك.
يمكن باستخدام درجة الحرارة الخارجية أن يتنبأ بكميات بيع كبيرة من الآيس كريم في المستقبل، حيث يتطلب ذلك وجود خط يمر عبر جميع النقاط كالرسم التوضيحي الموضح أدناه.
عند الانتهاء من ذلك، يمكن التنبؤ بمبيعات الآيس كريم في أي درجة حرارة بتحديد نقطة مرور الخط في درجة حرارة محددة وحساب إجمالي المبيعات المتوقعة عند تلك النقطة.
لماذا يعد التعلم الآلي مجالًا ناجحًا للغاية؟
على الرغم من أن مجال التعلم الآلي ليس جديدًا تمامًا، إلا أن المهتمين بهذا المجال ازدادوا بشكل كبير في الصناعات التكنولوجية الحديثة خلال الفترة الماضية.
يحدث هذا الانتشار بسبب نجاح تقنية التعلم العميق أو Deep learning في تحقيق إنجازات متعددة في مجالات مختلفة، بما في ذلك قدرة الأجهزة على الحديث والتواصل مثل الإنسان وتميزها باللغات المتعددة، كما يسهم التعلم العميق بشكل كبير في تطور علوم الحاسب.
يعود الفضل الأساسي لهذه الانجازات إلى موظفين اثنين.
- واحد من العوامل المهمة هي كمية المعلومات الضخمة المتاحة عبر الإنترنت، والتي يستطيع الباحثون استغلالها في تطوير أنظمة التعلم الآلي. تشمل هذه المعلومات صورًا وكلامًا وفيديوهات ونصوصًا.
- النقطة الأخرى المهمة هي سرعة المعالجات الهائلة التي تُقدم والتي تفِّعل بشكل كبير في هذه المجالات، بالإضافة إلى سرعات معالجة الرسومات الحديثة (GPUs)، التي يمكن ربطها ببعضها البعض في مجموعات لتشكيل مراكز لتساعد في تعلم الآلات.
مع تزايد استخدام التعلم الآلي بشكل متزايد وواسع، يقوم الشركات حاليًا بتصنيع أجهزة احترافية مخصصة لتشغيل وتدريب نماذج التعلم الآلي.
من بين أمثلة المعالجات المخصصة لتدريب الآلات هي وحدة معالجة تنسور (TPU) التابعة لـ جوجل، حيث يقدم أحدث نسخة منها سرعة فائقة في التعلم الآلي، والتي تتم إنشاؤها باستخدام مكتبة برامج تنسورفلاو TensorFlow الخاصة بجوجل.
تستطيع استخدام هؤلاء المعالجات لغايات التدريب، وليس فقط للآلات الموجودة في Google DeepMind و Google Brain، بل أيضاً في تعلم موقع الترجمة الشهير Google Translate وتحديد صور في موقع Google Photos. كذلك، تحتوي هذه الخدمة على إمكانية لإنشاء نماذج التعلم الآلي باستخدام TensorFlow Research وتتاح للجمهور. سحابة Google.
تم الكشف عن الجيل الثاني من هذه المعالجات في مؤتمر آي/أو لـ Google في شهر مايو من العام الماضي، حيث تم طرح مجموعة جديدة من أنظمة TPU التي تستطيع تدريب وتحسين الآلات.
ما هي الاستخدامات الممكنة لتقنية التعلم الآلي؟
الآن يتم استخدام أنظمة التعلم الآلي في كل مكان حولنا، وهي منتشرة واسعة الانتشار على الإنترنت في هذا الوقت.
يتم استعمال نظم التعلم الآلي للإشارة إلى السلع التي ربما ترغب بشراءها كخدمة على موقع Amazon، بالإضافة إلى الفيديو المطلوب المشاهدة على Netflix.
spam، وذلك باستخدام الذكاء الاصطناعي لتحليل نمط الرسائل وتحديد ما إذا كانت صالحة للاستلام في صندوق البريد الوارد أم لا. وهذه التقنيات المستخدمة في محرك البحث Google وفي Gmail تجعل عملية تصفح الإنترنت وإدارة بريدك الإلكتروني سهلة وفعالة. الرسائل غير المرغوب فيها.
يعد استخدام المساعدين الافتراضيين من بين أهم مظاهر القوة التي تحملها مجال التعلم الآلي حاليًا.
- Siri من Apple
- Alexa في Amazon
- مساعد Google
- Microsoft Cortana.
يعتمد كل منها بشكل كبير على تعلم الآليات المختلفة التي تساهم في التعرف على الأصوات المختلفة وزيادة فهمنا للغة التي نستخدمها، وذلك مع مساعدة هذه الآليات في الإجابة على الأسئلة والاستفسارات التي يطرحونها.
بدأت الاستفادة من هذه التقنية في مجالات أوسع بكثير، مثال على ذلك:
- تُستخدَم في المركبات الذاتية القيادة والطائرات بلا طيار، وروبوتات التسليم.
- يمكن استعمالها لتحليل الكلام ودراسة اللغة، بالإضافة إلى تطوير chatbots وروبوتات مساعِدة للإنسان.
- تعتمد في بعض دول مثل الصين التقنية التي تساعد على تمييز الوجوه.
- يساعد تحديد الأورام بالأشعة السينية المساعدة على اختيار المتخصص في الأشعة، وبذلك يستطيع الباحثون تحديد التسلسلات الجينية ذات الصلة بالأمراض وكذلك تحديد الجزيئات التي يمكن أن يتم استخدامها لإنتاج أدوية أفضل فائدة.
- استخدامها في إنترنت الأشياء
وأمثلة أخرى كثرة لا يمكن حصرها.
ما هي في النهاية أكثر برامج التدريب الجيدة التي يمكن البدء بها لبدء تعلّم هذا المجال؟
يوصي بشدة بالمبتدئين في تعلم أساسيات Machine Learning دورة تدريبية مقدمة من جامعة ستانفورد في سلسلة محاضرات مجانية على كورسيرا، وهي تنظمها منظمة العفو الدولية وأحد المؤسسين لـ Google Brain، برين أندرو نغ.
يتوفر درس مجاني آخر بمستوى عالٍ على الإنترنت، وهو مُُقدَّم من خلال EDX وجامعة كولومبيا للتعلم الآلي.
المصدر|zdnet