هل تفهم التباين في بياناتك؟

5 دقائق
التباين في البيانات

من السهل جداً على المدراء ملاحظة تباين الأمور في عالم الأعمال. تسفر بعض حملات التسويق مثلاً عن نتائج رائعة، بينما لا تؤدي الحملات المشابهة إلى نتائج مماثلة. وأحياناً تعمل سلاسل التوريد دون أي جهد يذكر، وفي أحيان أخرى تتعسر كل خطوة من خطوات العملية. كما تبدو الأرقام في بعض الأيام صحيحة، بينما تكون غير منطقية في أيام أخرى. إن التباين هو العدو الطبيعي للمدير، وهو ما يصعّب معرفة تفاصيل الأمور والتنبؤ بالصورة الصحيحة والقدرة على التحكم. فماذا عن التباين في البيانات أثناء العمل؟

لكن الوضع يجب ألا يكون كذلك. يساعد فرز التباين على توفير السياق اللازم واغتنام الفرص، ويساعد المدراء على الحفاظ على هدوئهم عند وقوع الأخطاء. لذلك على المدراء تعلم طريقة قياس التباين وفهم ما يخبرهم به عن وضع العمل وتحليله وتقليله عند الحاجة.

اقرأ أيضاً في المفاهيم الإدارية: ما هو الميزان التجاري؟

ومن ثم فإن نصيحتي للمدراء هي فهم التباين ومسبباته أيضاً. لأن هذا يوفر إطار العمل المطلوب ويشير إلى الفرص المتاحة ويساعدهم على المحافظة على هدوئهم عند وقوع الأخطاء. تأمل المثال التالي: يصور الرسم التوضيحي أدناه معدلات الخطأ في الأسابيع الثلاثة الأولى من عملية إعداد الفواتير:

معدلات الخطأ

بعد الأسبوع الثاني شعرت المديرة المسؤولة بالإحراج، هل يمكن أن يكون أداء فريقها ضعيفاً إلى هذه الدرجة؟ ثم تنفست الصعداء بعد الأسبوع الثالث. قد يكون معدل الخطأ مرتفعاً فعلاً ولكن على الأقل كان المسار في الاتجاه الصحيح! كانت توصي موظفيها أن "يعملوا بجد أكبر لخفض معدل الخطأ". وأخيراً بدؤوا ينصتون إليها!

للأسف لم يكن تفسيرها صحيحاً. فيما يلي المقاييس المستخدمة للأسابيع السبعة القادمة:

معدلات الخطأ الثانية

تبدد وهم هذه المديرة بحلول الأسبوع الثاني، حيث ارتفع معدل الخطأ أكثر! لقد أخطأت لأنها لم تفهم أن العمليات يمكن أن تتباين وبصورة كبيرة أيضاً!

التباين في البيانات

تؤكد هذه الصورة الموجزة على النقطة الأولى، التي تتمثل ببساطة في الاعتراف بأهمية التباين وضرورة أخذه بعين الاعتبار. وبصورة خاصة عليك أن تسأل دائماً "ما الأرقام التي تزيد أول تقل عن هذا الرقم"، وأن تفهم الآثار المترتبة على هذا السؤال. بعد الأسبوع الثالث في هذا المثال، كان مجال الحدين الأدنى والأعلى خمسين بالمائة ± ثمانية% (من 42% إلى 58%). "الدرجات الثمانية بالمائة" هي انحراف معياري بمقدار وحدتين، وهو مقياس للتباين يأتي شرحه المفصل فيما يلي. لو وضعت المديرة هذا الأمر في الحسبان لما كانت لتتعجل في نسب فضل التحسن الذي لم يكن حاصلاً أصلاً إلى نصائحها الموجهة للموظفين. بصفة عامة، عليك أن تفترض أن الاختلافات ضمن مجال الحدين الأدنى والأعلى ناتجة عن العشوائية، وأن تقاوم الرغبة في نسب الفضل إلى نفسك أو إلقاء اللوم على غيرك.

اقرأ أيضاً: هل تعتمد على الحدس أم البيانات في عملك؟

ومع تعمقك في الأرقام، من المهم أن تفهم مصادر التباين. على سبيل المثال، الكل يعرف أن بعض البالغين أطول من بعض، ومن السهل أيضاً ملاحظة أن الرجال في المتوسط أطول من النساء. ومن ثم، يعد النوع الاجتماعي أحد عناصر التباين في هذا المثال. وبالمثل، يعد الهولنديون عموماً أطول من غيرهم، والفلبينيون أقصر عادة. وبهذا تعد الجنسية مصدراً آخراً للتباين. من المهم فهم مصادر التباين هذه إن كنت تعمل في مجال الملابس؛ لكيلا ترسل الكثير من السراويل القصيرة إلى محلات الملابس في هولندا.

تزداد أهمية هذه المصادر كلما ازداد فهمك لمقاييس التباين. ففي النهاية، لا يمكنك إدارة شيء لا تستطيع قياسه! يسمى أهم مقياسَين للتباين "الانحراف المعياري" (σ) المذكور أعلاه، ومقياس "آر المربعة" (R2). لا تفزع من الأسماء غير المفهومة. وركز بدلاً من ذلك على تفسيرها.

اعتبر أن النطاق بين وحدة انحراف معياري (1σ) أدنى من المعيار المتوسط إلى وحدة انحراف معياري فوق المعيار المتوسط يشمل ثلثي العينة كاملة. ومن ثم، وكما يصور الرسم التوضيحي أدناه، تتراوح أطوال ثلثي النساء البالغات في الولايات المتحدة تقريباً بين 5 أقدام وبوصة واحدة، و5 أقدام و7 بوصات. كما يشمل النطاق الواقع بين قيمة وحدتي انحراف معياري (2σ) أدنى وأعلى المعيار المتوسط 95% من العينة، كما يصور الرسم البياني أيضاً. وهذا يعني أن 5% فقط من نساء الولايات المتحدة أقصر من 4 أقدام و10 بوصات أو أطول من 5 أقدام و9 بوصات. وبالمثل، يجب أن تتوقع المديرة المسؤولة عن عملية إعداد الفواتير أن تقع 95% من جميع المقاسات بين نسبتَي 42% و58%، وأن تؤكد على سوء فهمها نسبة 46% في الأسبوع الثالث.

وأخيراً، يشمل النطاق الواقع بين 3 وحدات انحراف معياري (3σ) أدنى وأعلى المعيار المتوسط جميع العينة باستثناء جزء بسيط منها.

أطوال النساء البالغات في الولايات المتحدة الأميركية

يمكن تفسير R2 على أنه "الجزء من التباين الناتج عن مصدر معين". يعرض الرسم البياني التالي أطوال الرجال والنساء معاً. لاحظ أن الرجال أطول بمقدار 5 بوصات في المتوسط، كما أن أطوالهم تُظهر تبايناً أعلى قليلاً. عند مقارنة الأطوال، يتضح جلياً اختلاف الرجال عن النساء. وفضلاً عن ذلك، تتباين بدرجة أكبر عينة الرجال والنساء مجتمعين. ولكن ما مقدار التباين الذي يفسره النوع الاجتماعي في هذه العينة كاملة؟ الجواب هو الثلث. إذاً يعد النوع الاجتماعي عاملاً مهماً، ولكن لدينا المزيد من التفاصيل. (ملاحظة: يتيح برنامج إكسل، وجداول بيانات جوجل، وبعض الحزم الإحصائية والتحليلية الجيدة؛ الإمكانات الحسابية اللازمة).

اقرأ أيضاً: يمكنك تحسين بيانات مبيعاتك بالقليل من التنظيم

يجب أن يكون هدف المدراء هو تحديد أكبر قدر ممكن من مصادر التباين المهمة. وقد أشرتُ مسبقاً إلى أن النوع الاجتماعي والجنسية هما اثنان من المصادر. وربما يكون العمر مصدراً ثالثاً، كما يمكن تحديد العديد من المصادر الأخرى. ولكل مصدر من هذه المصادر قيمة R2 الخاصة به، وكلما ازدادت قيمة 2R، ازدادت أهمية المصدر. حالما تجد مصدراً مهماً للتباين، ركز على خلق ميزة تجارية.

ومن المهم الإشارة إلى أنه يمكن تطبيق مقياس R2 على جميع النماذج. ومن ثم، يمكن حساب قيمة R2 لأكثر نماذج الطول تعقيداً. ومرة أخرى، كلما ازدادت قيمة R2 كان النموذج أفضل.

أطوال النساء والرجال

والآن لنعد إلى مثال معدل خطأ الفريق. عادة ما تُبنى حسابات قيمة الحدين الأدنى والأعلى على وحدتي انحراف معياري. وتعد "الدرجات الثمانية المئوية" ضمن نطاق "خمسين بالمائة ± ثمانية بالمائة" وحدتين من الانحراف المعياري. على المديرة المسؤولة في المثال السابق توقع وقوع 95% من جميع القياسات بين نسبتَي 42% و58%، وأن تؤكد على سوء فهمها نسبة 46% في الأسبوع الثالث.

يمكّن فهم الانحراف المعياري σ ومقياس R2 المدراء من تنبؤات أقوى وبسط السيطرة وتحسين الأداء. وبصورة عامة تستخدم أبسط التنبؤات نطاقاً يقع بين ثلاث وحدات انحراف معياري 3σ كحدود للبُعد عن المتوسط. في الرسم البياني التالي، أضفتُ هذه الحدود (وتسمى حدود التحكم العليا والسفلى، وهي معَنونة بالأحرف التالية "ucl" و"lcl") لخمسة أسابيع قادمة. بإمكان المديرة الآن التنبؤ بأمان بأن أداء العملية سيكون ضمن هذه الحدود في المستقبل المنظور، ما لم تتخذ خطوات فاعلة لتغييره.

معدل الخطأ في الفواتير

ولنكون واضحين، يجب ألا يرضى أي مدير بهذا المستوى من الأداء أو درجة التباين المرتبطة به، ولم تكن هذه المديرة كذلك. فقد تعمقت أكثر مع فريقها حتى وجدوا، ومن ثم أزالوا، اثنين من مصادر التباين. استغرق هذا العمل أسابيع، ونتج عنه المخطط أدناه.

تحسين عملية إعداد الفواتير

وما يجدر ذكره أن عمل هذه المديرة أصبح أكثر سهولة ابتداء من الأسبوع 24. فتحسن أداء العملية، وأُزيل ثلاثة أرباع التباين، ما سهل عملية التنبؤ بمستقبل أكثر إشراقاً.

اقرأ أيضاً: هل يعرف علماء البيانات في شركتك الغرض من عملهم؟

يضيف فهم التباين في البيانات جيداً أداة قوية إلى جعبة أدوات علم البيانات الخاصة بك. لذلك حاول أولاً تقييم مصادر التباين المهمة وقياسها وتحديدها. ثم تخلص من المصادر التي يمكنك إزالتها، وخذ المصادر المهمة بعين الاعتبار؛ لتحقيق ميزة تجارية. تهدف أفضل التقنيات وأكثرها شعبية في مجال علم البيانات إلى مساعدتك في تحقيق هذا الأمر تماماً، حتى وإن لم يكن ذلك واضحاً. على التباين ألا يكون عدوك، فأمامك الكثير من الفرص لتغيير ذلك.

اقرأ أيضاً: هل نجرؤ على الدخول إلى عصر البيانات؟

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

جميع الحقوق محفوظة لشركة هارفارد بزنس ببليشنغ، بوسطن، الولايات المتحدة الأميركية 2024 .

المحتوى محمي