مخاطر تعلم الآلة المؤتمت وطريقة تفاديها

عندما طرحت خدمة "جوجل فلو ترندز" (Google Flu Trends) لأول مرة في عام 2009، شرح كبير الاقتصاديين لدى جوجل أنه يمكن استخدام توجهات البحث على الإنترنت في "توقع الحاضر". وكان منطقياً آنذاك استخراج الأنماط والرؤى المفيدة من البيانات واسعة النطاق لعمليات البحث على الإنترنت. فعلى كل حال، تبدأ الرحلات الرقمية لكثير من المستخدمين بعملية البحث على الإنترنت، وذلك يشمل 8 من كل 10 أشخاص يجرون بحثاً عن معلومات تتعلق بالصحة. إذن، ما المشكلة التي يمكن أن تقع؟ تتمتع الإجابة عن هذا السؤال بسمعة سيئة في مجتمعات الأعمال وعلوم البيانات. أغلقت خدمة "جوجل فلو" عام 2015 بعد أن بالغت توقعات البرنامج في تقدير مستويات الإصابة بالإنفلونزا بنسبة 100% تقريباً فيما يتعلق بالبيانات التي قدمتها مراكز مكافحة الأمراض. وسرعان ما اتهمت الانتقادات المشروع بأنه واجهة إعلانية لغطرسة البيانات الضخمة، وأنه مغالطة تقول إن من الممكن للاستنتاج الاستقرائي، الذي يتغذى على كميات هائلة من البيانات، أن يحل محل التحليل الاستنباطي التقليدي الذي توجهه الفرضيات البشرية.

وفي الآونة الأخيرة، انتقلت المؤسسات إلى تضخيم القوة التنبؤية من خلال إقران البيانات الضخمة بتعلم الآلة المؤتمت المعقد (autoML). يتم الترويج لنهج تعلم الآلة المؤتمت (autoML)، الذي يستعين بتعلم الآلة لتوليد تعلم آلة أفضل، على أنه يوفر الفرص "لتحقيق الديمقراطية في تعلم الآلة" من خلال السماح للشركات ذات الخبرة المحدودة في مجال علم البيانات بتطوير مسارات تحليلية قادرة على حل مشاكل الأعمال التجارية المعقدة. في إحدى مسابقات كاغل (Kaggle) للتوقعات أقيمت منذ بضعة أشهر فقط، تم وضع محرك تعلم الآلة المؤتمت لينافس بعضاً من أفضل علماء البيانات في العالم، وأنهى المسابقة في المرتبة الثانية بعد أن كان الأول معظم الوقت. ومع ذلك، أثارت هذه التطورات المخاوف بشأن غطرسة الذكاء الاصطناعي. ومن خلال تحويل تعلم الآلة إلى سلعة لتحسين العملية، يثير بروتوكول تعلم الآلة المؤتمت مرة أخرى أسئلة حول شكل التفاعل بين البيانات والنماذج والخبراء البشر. ماذا يعني كل هذا للإدارة في عالم قائم على الذكاء الاصطناعي؟

في مشروعنا الممول فيدرالياً (بمشاركة ريك نتماير ودونالد أدجروه)، نقوم بدراسة فعالية الكشف عن الأحداث السلبية عن طريق كميات كبيرة من المحتوى الرقمي الذي يولده المستخدمون. ومن الضروري أن تراقب الشركات في العديد من البيئات الأحداث السلبية المرتبطة بمنتجاتها أو خدماتها. كالتأثيرات الجانبية غير المعروفة للأدوية مثلاً، أو الألعاب التي تحمل خطورة تهدد الأطفال، أو المشاكل التي تؤدي إلى سحب السيارات من السوق. ويتشابه هدف المشروع إلى حد ما مع الهدف الأصلي لخدمة "جوجل فلو" (Google Flu)، وهو استخدام تعلم الآلة لتوليد إشارات دقيقة في الوقت المناسب لتعزيز الوعي بهذه الأحداث السلبية المحتملة. مثلاً، إذا كانت هناك آثار سلبية شديدة غير متوقعة لعقار ما، أو إذا كانت إحدى السيارات لا تعمل جيداً بسبب عيب محتمل، ستكون مجموعات مختلفة من أصحاب المصلحة مهتمة بتلقي هذه الإشارات في أقرب وقت ممكن، وذلك يشمل مصنّعي المنتجات والوكالات التنظيمية ومجموعات الدفاع عن المستهلك. تحلل نماذج التعلم العميق لدينا الملايين من أسئلة البحث على الإنترنت لمعرفة مدى عدم التناسب في ظهور منتجات معينة واقتران أحداث سلبية، مقارنة بالضوضاء الأساسية. فتضع النماذج قائمة مصنفة من إشارات الأحداث السلبية المحتملة كي يجرى عليها مزيد من البحث، على سبيل المثال، قد يعتبر اقتران كلمتي "بريوس" و"دواسة عالقة" إشارة لحدث سلبي محتمل.

في ضوء المخاطر المحتملة المرافقة لتطبيق الأساليب المتقدمة لتعلم الآلة على البيانات الواسعة لعمليات البحث على الإنترنت، استخدمنا ما نسميه تعلم الآلة المعزز ونرمز إليه برمز (augML). ومن أجل تكييف فكرة التعزيز بمقابل الأتمتة، يثري تعلم الآلة المعزز مفهوم تعلم الآلة المؤتمت عبر إبراز أهمية الخبراء والسياق والبيانات التكميلية. وينبغي على المدراء وعلماء البيانات الذين يسعون لتحسين قدرات تعلم الآلة بهذه الطريقة التفكير بما يلي:

1. تحويل عملية تطوير النموذج إلى عملية شبه مؤتمتة.

لقد زاد التقدم في تعلم الآلة من تعقيد كل من المهام المتعلقة ببناء النماذج التنبؤية وفرص تشغيل هذه المهام آلياً. ومن الأمثلة عن المهام التي غالباً ما يتم تنفيذها آلياً: بناء الميزات وتعديل عمليات التمثيل في تصميم النماذج وضبط المعايير، فكل منها محدد بدقة ويمكن توجيهه عن طريق مؤشرات الأداء الرئيسية لبناء النماذج. ومع تزايد تعقيد هذه المهام، يمكن أن تؤدي الأتمتة إلى زيادة الدقة من خلال دراسة البدائل والتركيبات بطريقة أكثر شمولاً. ولكن في المستقبل المنظور على الأقل، لا يمكن أن تحل الأتمتة محل معرفة الخبراء، بل من الأفضل استخدامها كأداة تكميلية للخبراء البشر كي يتمكنوا من المشاركة في المزيد من أنشطة القيمة المضافة التي تستفيد من مجموعة معارفهم في مجال العمل ومعارفهم التقنية. باختصار، نعتقد أن الأتمتة هي الأنسب لتعزيز أداء الخبراء لا لجسر فجوة الخبرات.

كشفت الدراسات التي أجريت بعد إيقاف خدمة "جوجل فلو" عن أهمية النظر في الرحلة الأشمل للمستخدم عند تحليل بيانات البحث. فكثير من عمليات البحث التي تضم كلمة "انفلونزا" ليست مرتبطة في الواقع بالتنبؤ بحالات انتشار المرض. إذ قد يستعلم المستخدمون عن مدى سوء موجة الإنفلونزا المتوقعة لهذا العام، أو قد تدفعهم الضجة الإعلامية إلى البحث عن معلومات بشأن لقاح الإنفلونزا. وبناء على هذه البيانات في مشروعنا للكشف عن الأحداث السلبية، تعمدنا تصميم نماذجنا كي تحتسب هدف البحث سواء كان استكشاف منتج أو بحث قبل الشراء أو استعلامات بعد الشراء أو غير ذلك. يقدم لنا كل نوع من البحث مستويات مختلفة من الإشارات فيما يخص الأحداث السلبية. وكانت عملية التوصل إلى أفضل بنية لتصميم التعلم العميق الذي نحاول إنجازه شبه مؤتمتة توجهها نظرة الخبراء إلى السلوكيات الأساسية التي يتم تحليلها، ويعززها تعلم الآلة.

2. وضع سياق تعلم الآلة باستخدام هندسة التمثيل.

يمكن وصف تعلم الآلة على المستوى الأساسي بأنه خوارزمية تتعلم الأنماط من البيانات، وهو أمر تكون الأساليب المتقدمة، كالتعلم العميق، بارعة فيه للغاية ضمن بيئات البيانات التي يتزايد تعقيدها وعدم انتظامها. إلا أن أسلوب تمثيل البيانات في الخوارزمية هو عامل غالباً ما يتم تجاهله رغم أهميته الكبيرة في بناء نماذج تعلم الآلة عالية الأداء. ويأتي هذا الثراء التمثيلي من دمج بنى ذات سياق محدد بدقة متعلقة بمشكلات معينة تم تصميمها حسب المشكلة المطروحة. ويتم إنجاز ذلك عن طريق الهندسة التمثيلية، وهي التخطيط المدروس للبيانات المنظمة وغير المنظمة لوضعها ضمن بنية بيانات مخصصة مفيدة.

لقد صممنا تمثيلاً مخصصاً للمستخدم كي نحتسب خصائص المستخدم الفردية في نماذج اكتشاف الأحداث السلبية. مثلاً، عند البحث عن أحداث سلبية للعقاقير، إذا كان بعض المستخدمين مصابين بالوسواس يجرون عمليات بحث متكررة للحصول على معلومات عن عقار معين وآثاره، فيمكن أن يقدموا إشارات أقل مصداقية لاكتشاف الأحداث السلبية. قد لا يكون هذا الأمر ظاهراً فعلاً بالنسبة لخوارزمية تعلم الآلة من دون تمثيل مبني بدقة يضيف السياق لعمليات البحث الفردية (يجري هذا الشخص عدداً غير اعتيادي من عمليات البحث عن هذه المواضيع). كما كانت هندسة التمثيل مستخدمة لإدراج سياق هدف بحث المستخدم الذي تحدثنا عنه آنفاً. وقد سمح تضمين هذا التمثيل المخصص لنماذجنا بإجراء معايرة أفضل لسياق البحث، ما أدى إلى مضاعفة عدد الأحداث السلبية الحقيقية التي تم اكتشافها وتقليل المعدلات الموجبة الخاطئة بنسبة 30%. بعبارة أخرى، كان هناك مجال متاح ليقوم الخبراء بتوجيه عملية تمثيل البيانات كي يتعلم النموذج منها، حتى بالنسبة لنماذج التعلم العميق المعقدة مثل التي كنا نستخدمها.

3. موازنة العمق مع الاتساع من خلال تثليث البيانات.

إن الأساليب المتقدمة في تعلم الآلة بارعة للغاية في كشف الأنماط في كل زاوية وركن من مجموعة بيانات معينة. ولكن أساليب تعلم الآلة المؤتمت عززت هذه الميزة أكثر عن طريق استخدام تقنية تعلم الانتقال، وهي تقنية في تعلم الآلة تقوم بتحسين الأنماط المأخوذة من مجموعة البيانات المستهدفة باستخدام رؤى من بيانات خارجية مماثلة. مثلاً، إذا أرادت شركة ما أن تستنتج مشاعر زبائنها باستخدام البرمجة اللغوية العصبية المطبقة على نصوص الاتصالات المأخوذة من مركز الاتصال، فيمكن لتعلم الآلة المؤتمت الاستفادة من بيانات نصوص مماثلة مأخوذة من شركات أخرى. ومع ذلك، يمكن أن يؤدي الاعتماد على نوع واحد من البيانات إلى فرط التخصيص أو فرط التعميم. في أحد مشاريعنا الأخرى الخاصة بتعلم الآلة في المؤسسات، نبين أنه يمكن للشركات تحقيق قدرة تنبؤية أفضل بكثير عن طريق دمج المصادر التكميلية بدلاً من استخلاص جميع الرؤى الممكنة من البيانات الأولية للشركة. بالنسبة إلى مشكلة مركز الاتصال، قد تتضمن البيانات التكميلية أشياء مثل التسجيلات الصوتية ومراجعات المنتجات واستبانات رضا الزبائن. في بعض النواحي، منحنا التقدم في تعلم الآلة شعوراً زائفاً بأن اقتران كميات كبيرة من البيانات بسحر تعلم الآلة هو كل ما يلزم، إلا أن تنوع البيانات وتكاملها مهم أيضاً.

وفي مشروعنا، أدركنا أنه بعد حد معين، كان وجود بيانات مزيد من عمليات البحث على الإنترنت على مدى فترة زمنية طويلة يتسبب بتناقص سريع في العائدات. لقد حققنا إنجازنا الكبير عندما تشاركنا مع شركة تجري حلقات مناقشة كبيرة على الانترنت مع الزبائن مع إخفاء هوية البيانات عند تقاطع خصائص المستخدم وعمليات البحث ونشاط تصفح الإنترنت. وكانت رؤية عمليات البحث التي تؤدي إلى زيارة فعلية لأنواع معينة من المواقع الإلكترونية أمراً حاسماً في فهم هدف عملية البحث الفردية. وبتحليل التفاعل بين عملية البحث التي يجريها المستخدم وأنشطة التصفح مع مرور الوقت تمكنا من احتساب تنوع المستخدمين. وقياساً بقدرات الاكتشاف الحالية، فإن هذه الإنجازات النابعة من تثليث البيانات أسفرت عن نماذج كانت قادرة على اكتشاف ثلاثة أضعاف الأحداث السلبية الحقيقية، بدقة أكبر بثلاثة أضعاف.

وقدمت لنا مفاهيم مثل الذكاء الاصطناعي القابل للتفسير والانحياز في الخوارزميات والخصوصية المدروسة دروساً بشأن حدود الذكاء الاصطناعي. وفي هذا السياق نفسه، يلزم إجراء مزيد من المناقشة بشأن كيفية زيادة قيمة تعلم الآلة المؤتمت إلى أقصى حد. ومن غير المرجح أن يؤدي تطبيق تعلّم الآلة المؤتمت بشكل عشوائي من دون ما يناسبه من خبرة وسياق وتكامل في البيانات إلى تحقيق النتائج المطلوبة. وفي مشروعنا، تمكنا من خلال دمج هذه المفاهيم من اكتشاف مئات من الأحداث السلبية للمنتج، كان من الصعب التعرف عليها قبل ثلاثة إلى أربعة أعوام وسطياً، وبنتائج إيجابية زائفة أقل بشكل ملحوظ. وباتباع نهج يعزز تعلم الآلة، تمكنا من تطوير إمكانات ذكاء اصطناعي قوية تتمتع بذكاء أكبر وصفات اصطناعية أقل.