لم تتجلّى الانتخابات الرئاسية في الولايات المتحدة بالطريقة التي تنبّأها الكثيرون. صحيح أننا نعرف بعضاً من أسباب فشل الاقتراع، ولكن مراقبة نتائج الاقتراع في الزمن الحقيقي لم يكن أمراً مثيراً للدهشة فحسب، بل كان مربكاً أيضاً. فقد تأرجحت التنبؤات ذهاباً وإياباً، وكان من الصعب معالجة المعلومات الواردة. إذاً، الأمر لم يقتصر على البيانات التي بدت خاطئة، بل على الطريقة التي تم تقديم تلك البيانات فيها.
في اليوم التالي لصدور نتائج الاقتراع، سألت زميلي سكوت بيريناتو خبير التصور البصري للبيانات، إذا كان قادراً على المساعدة في تفسير هذا الغموض. كيف تعاملنا معه، لماذا كان من الصعب فهمه، وما هو التحدي الكبير في تصور ذلك الغموض بشكل بصري؟
نيكول: ما الذي لاحظته حول طريقة إظهار توقعات الإنتخابات؟
سكوت: كان البث الحي لتوقعات صحيفة نيويورك تايمز الرئاسية محط أنظار الكثيرين، حيث يمكنهم رؤية سلسلة من المقاييس التي يتم تحديثها باستمرار (مقاييس نصف دائرية، مثل مقياس الغاز في سيارتك). الإبرة تنتقل لليسار حين تظهر البيانات أنّ هيلاري كلينتون لديها فرصة أكبر للفوز، ولليمين حين تظهر البيانات ذلك لدونالد ترامب. ولكن الإبرة أيضاً كانت تتحرك سريعاً ذهاباً وإياباً مما أظهر أنّ الاحتمالات الإحصائية للفوز تتغيّر بسرعة. ما سبب الكثير من القلق وأصبح الناس في حيرة. كانوا يحاولون تفسير ما يحدث في الانتخابات والسبب وراء تغيّر البيانات بشكل كبير في الزمن الحقيقي، وكان من الصعب جداً فهم ما يجري.
في الواقع، لم تتأرجح الإبرة لتمثيل الاحتمالات الإحصائية. بل كانت حركتها عبارة عن تأثير ثابت الترميز من المفترض أن يمثل عدم اليقين في التوقعات الإحصائية. لذلك، فإنّ محاولة إظهار التغييرات في الزمن الحقيقي خلال السباق كانت مشاركة جيدة، مع أخذ عدم اليقين في الحسبان. ولكن فشلت جهود التنفيذ لأن ذلك أوقع الناس في حيرة وتوتر – والإبرة المتحركة سريعاً لم تكن أفضل نهج بصري.
ما الذي نعنيه بعدم اليقين؟
عند التفكير في إظهار عدم اليقين يتوارد على أذهاننا نوعين منه. الأول هو عدم اليقين الإحصائي، الذي ينطبق حين أقول شيئاً من هذا القبيل، "هذه قيمي، وإحصائياً ثقتي فيها هي 95%". فكر في هامش الخطأ في صلب الانتخابات. إنّ الإحصائيون يستخدمون أشياء مثل مخطط الصندوق و المؤشر لتمثيل هذا الهامش. هناك الكثير من الاختلافات في هذه المخططات، وهي تعمل بشكل معقول، على الرغم من أنّ الأكاديميين يقومون بتجربة مناهج أخرى في بعض الأحيان، والجمهور العادي ليس معتاداً على هذه التصورات البصرية.
النوع الآخر من عدم اليقين هو عدم اليقين البياني. وهذا ينطبق عندما نكون لسنا على يقين أين تقع بياناتنا ضمن نطاق معين. بدلاً من وجود قيمة وثقة في هذه القيمة، يكون لدينا مجموعة من القيم الممكنة. لقد أعطاني صديق لي مؤخراً مجموعة من البيانات مع قيمتين. القيمة الأولى كانت "تقدير يتراوح من 1 في 2,000 إلى 1 في 4,500" والأخرى "تقدير يتراوح بين 1 في 5,500 إلى 1 في 8,000". ليس هناك وسيلة مقبولة أو صحيحة لتصور شيء من هذا القبيل بصرياً.
إنّ إيجاد طرق لتمثيل عدم اليقين بدقة وفعالية هي من أهم التحديات في تصور البيانات البصري في أيامنا هذه. ومن المهم أن نعرف أن تصور عدم اليقين بصرياً بشكل عام، وهو ما يصعب القيام به بشكل كبير.
لماذا؟
عندما تفكر في الأمر، تجد أن التصورات البصرية تجعل الأشياء مجردة - الأرقام والإحصاءات - وملموسة. أنت تمثل فكرة مثل "20%" بواسطة شيء كقضيب أو نقطة. إنّ نقطة على سطر تُمثل "20%" تبدو مؤكّدة جداً. كيف يمكنك بعد ذلك التعبير عن فكرة أنّ "5 مرات من أصل 100 ليست هي الإجابة الصحيحة، بل يمكن أن تكون كل هذه الإجابات الأخرى".
إذاً، هل هناك طرق جيدة من تصور عدم اليقين بصرياً مثل الذي ذكرت؟
الكثير من الناس لا يمثّلون عدم اليقين لديهم، وذلك لأنه أمر صعب. نحن لا نريد أن نفعل ذلك. إنّ عدم اليقين هو شيء من المهم أن نكون قادرين على إيصاله. على سبيل المثال، لننظر في الرعاية الصحية، حيث نتائج الرعاية قد تكون غير مؤكدة ولكنك تريد أن يفهم الناس قراراتهم. كيف يمكنك أن تبين لهم نطاق النتائج الممكن حدوثها، بدلاً من أن تُبيّن لهم ما هو الأكثر أو الأقل احتمالاً لأن يحدث؟ لنفترض أنّ هناك مرضاً مثل الإيبولا ونحن نريد أن نصيغ نموذجاً للسيناريوهات الأسوأ ولتلك المرجح حدوثها و للسيناريوهات الأفضل أيضاً. كيف يمكننا تمثيل هذه النتائج المختلفة؟ الأمر نفسه في مثال توقعات الطقس ونماذج الإعصار. يفكر محللو المخاطر وخبراء الاحتمالات في طريقة حل هذه المشاكل في كل وقت. إنه حتماً ليس بالأمر السهل.
إلا أنّ هناك عدداً من المناهج الأخرى. بعض الناس يستخدم القضبان لتمثيل نطاق عدم اليقين. البعض الآخر يستخدم خطوط متصلة لإظهار قيمة متوسطة معينة وخطوط منقطة في الأعلى والأسفل لإظهار الحدود العليا والدنيا. إنّ استخدام تشبع الألوان أو التدرجات هي وسيلة أخرى لإظهار كيف أنّ القيم أصبحت أقل احتمالاً ولكنها لا تزال في حيز الإمكان.
على رأس عدم اليقين، نحن نتعامل أيضاً مع الاحتمالات.
نعم، من الصعب لأدمغتنا إدراك الاحتمالات. عندما نقول أنّ شيئاً ما لديه فرصة 80% كي يحدث، فهو ليس بالأمر البسيط فهمه. لا يمكنك أن تشعر حقاً ما يعنيه احتمال 80%. أعني، يبدو أنّ ذلك الأمر سيحدث على الأرجح. ولكن الشيء المهم هو أن نتذكر أنه إذا لم يحدث ذلك، فهو لا يعني أنك كنت مخطئاً، بل يعني فقط أنّ احتمال 20% حدث بدلاً من ذلك.
تعتبر الاحصاءات غريبة. فحتى لو شعرنا وكأننا فهمنا ما تعنيه "فرصة 20%"، لا نفكّر فيها على أنها نفس الشيء مثل "1 من 5". نحن نميل إلى الإعتقاد بأنّ "1 من 5" تعني أنه من المرجح أن يحدث الأمر أكثر من " 20%". إضافة إلى ذلك "إنها أقل تجريداً. فإذا كنت أقول أنّ 1 من كل 5 أشخاص يرتكب جريمة، يتصوّر الناس هذا الشخص فعلاً. نحن "نتصور بسط الكسر". ولكن حين أقول "20%" لا يرتكبون الجريمة، فهي ليست بالمسألة التي تعمل بشكل فعلي. إنها مجرد إحصائية.
ماذا نفعل عندما تحدث فرصة الـ20% أو الـ10%؟
كيف يمكنك أن تقول لشخصٍ قد حدث معه أمر نادر الحصول، أنه استناداً إلى الإحتمال الذي قدمناه له كانت مشورتنا صحيحة فعلاً، على الرغم من أنّ الأمر لم يفلح معه؟ هذا أمر صعب للغاية، ومسؤولو الأمن وخبراء المخاطر يفكرون في الحل في كل الوقت. عندما تفكر في الأمر، تعلم أنّ الشركات تحتاج إلى تعلّم هذا لأنه من السهل بعد فوات الأوان أن يقول أحدهم "كانت لدينا نماذج خاطئة، حدث الشيء السيء المحتمل". هذا ليس صحيحاً! نحن كنّا منذ البداية نسعى لفكرة أنّ هناك فرصة ضئيلة أنّ شيئاً غير محبب قد يحدث. ومع ذلك، كبشر صعب عيلنا فهم الأمر واستيعابه.
هل لأننا نحاول أن نتعلق بأمل تحقيق نتيجة أكثر إيجابية؟
ذلك لأن الأشياء المحتمل حدوثها تحصل معظم الأوقات. عندما تحدث الأشياء غير المحتملة، نحن نسعى بجهد لاستيعاب وفهم ما حصل لأننا لم نكن نتوقع ذلك. لا أقول أنه ينبغي علينا أن نكون قد توقّعنا ذلك لأنه من غير المحتمل! ولكنه ما زال ممكناً. عندما تضرب الكوارث الطبيعية كثيراً ما نسمع الناس يقولون بعد ذلك "كانت عاصفة تأتي كل 100 سنة في العمر ولا يمكن لأحد أن يكون قد توقّع حدوثها". ليس صحيحاً! خبراء المخاطر يرَون دائماً أنها كانت مقبلة. لطالما كانت احتمالاً إحصائياً إلا أنه من غير المرجح حدوثها.
أنا أفهم الاحتمالات، ولكن لا يسعني إلا أن أشعر بالتضليل من التوقعات. ما الذي يفوتني ؟
ثلاثة أمور تحدث فيما يخص نماذج الانتخابات.
1) حتى إذا كان للمرشح فرصة 10% للفوز منذ 10 أيام وفي نهاية المطاف قد فاز، هذا لا يعني أنّ النموذج خاطئ. ببساطة هذا يعني أنّ الأمر غير المرجح قد حدث.
2) من الصعب أن يفهم الجمهور فكرة استخدام الاحتمالات لمعرفة من سيفوز في الانتخابات (استناداً إلى كونهم لديهم فرصة 80%)، لأننا نميل إلى التفكير في الانتخابات بثُنائية: "هذا الشخص سيفوز" مقابل "ذلك الشخص سيفوز".
3) نحن نعيد النظر في الاحتمالات كل يوم. وهي بطبيعة الحال يتم تحديثها. وعندما يقول أحد المرشحين شيئاً غبياً فإنّ احتمال فوزه ينخفض واحتمال فوز الآخر يرتفع. هذا يجعلنا نشعر بأنّ احتمالات الفوز هي رد فعل، وليست مضاربة.
لذلك نحن الجمهور العادي، ينتهي بنا الأمر ونحن نبحث في البيانات التي تخبرنا شيئاً عن تصرف المرشحين، وليس شيئاً عن من سيفوز على الأرجح. ويبدأ الشعور بالأمر أن يكون أشبه بنسبة تأييد عوضاً عن توقعات.
النقطة الأولى التي ذكرتها يجب أن تظهر في مجال الأعمال التجارية في كل وقت.
إنّ الانتخابات تجعل فكرة تصور عدم اليقين بصرياً في موضع التركيز، ولكن هذا تحدّ شائع بشكل متزايد في الشركات التي تبني عمليات علوم البيانات الخاصة بها. وبما أنّ علوم البيانات بدأت تأخذ حيزاً كبيراً من الأهمية بالنسبة للشركات، فإنّ المدراء بدأوا بالتعامل مع أنواع البيانات التي تُظهر نتائج متعدّدة محتملة، حيث يكون هناك عدم يقين إحصائي وعدم يقين بياني، وعليهم إبلاغ الأمور تلك لرؤسائهم. إذا كانت المعلومات لا تساعد رؤسائهم في فهم عدم اليقين، سوف ينظرون في المخططات ويقولون أنّ هذا هو الجواب بينما هو ليس إلا مجرد إحتمال. لا بأس أن نركّز على ما هو أرجح، ولكن لا نريد التخلي عن إظهار مجموعة من النتائج المحتملة.
على سبيل المثال، إذا كنت تبحث عن وسيلة لصوغ نموذج لعملية اعتماد العملاء وكنت تستخدم النماذج الإحصائية، عليك التأكد من إثبات ما يغلب على الظن حدوثه، ولكن أيضاً كيف أنّ هذه النتيجة هي واحدة من مجموعة من النتائج المحتملة بناء على النماذج الخاصة بك. يتوجب عليك أن تكون قادراً على إيصال ذلك لرئيسك بصرياً، أو سوف يسيء رئيسك في العمل أو العميل تفسير ما تقوله. إذا قال علماء البيانات لدينا فرصة 90% للنجاح إذا اعتمدنا هذا النموذج، ولكن بعد اعتماده لم يحدث النجاح، ينبغي لرئيسك أن يعرف أنك لم تكن مخطأً، كل ما حدث هو أنك فقط سقطت في الـ10%. لقد رميت النرد وحصلت على عيون الثعبان (أي رقم واحد على كل نرد) و هو أمر يحدث. من الصعب حقاً لأدمغتنا التعامل مع هذا الشيء وإيصاله، كما أنه يشكل تحديا هاماً للشركات التي تستثمر في النهج القائم على البيانات لأعمالها.