جدد معلوماتك عن الدلالة الإحصائية

لا بدّ أنّك ترغب حين تقوم بإجراء تجربة أو تحليل بعض البيانات في معرفة ما إذا كانت نتائجك ذات دلالة أم لا. ولكن لعلك تدرك أنّ الأهمية العملية التطبيقية لا تعني بالضرورة امتلاك الثقة بأنّ النتيجة التي حصلت عليها لم تكن مجرد صدفة (وهذا ما نقصده بمعرفة الدلالة الإحصائية). وهذا التمييز هام، ومن المؤسف إساءة فهم مفهوم الدلالة الإحصائية وتطبيقه في مؤسسات الأعمال اليوم. ولأن عدداً متزايداً من الشركات تعتمد على البيانات من أجل اتخاذ قرارات هامة في العمل فإنه من الضروري أن يمتلك المدراء فهماً واضحاً وصحيحاً لهذا المفهوم.

ومن أجل فهم الدلالة الإحصائية بشكل أفضل وأدق أجريت هذا الحوار مع توم ريدمان، صاحب كتاب "الاعتماد على البيانات: كيف تستفيد من أهمّ عناصر العمل"، كما أنّه يقدم استشارات متخصصة لعدد من مؤسسات الأعمال بخصوص برامج البيانات وجودتها.

ما المقصود بالدلالة الإحصائية؟

يساعدنا مفهوم الدلالة الإحصائية على تحديد ما إذا كانت نتيجة ما عائدة إلى الصدفة أم أنّ عاملاً ما يقف وراءها. حين تكون النتيجة ذات دلالة وأهمية، فإنّ هذا يعني أنك تمتلك الثقة بأنها حقيقية، وأنّ الأمر ليس متعلقاً بكونك محظوظاً (أو غير محظوظ) في اختيار العينة.

وحين تقوم بتجربة ما أو استبيان أو تصويت أو تعمل على تحليل مجموعة من البيانات، فإنّك تأخذ عينة من مجتمع الدراسة، ولا تستطيع أن تأخذ بالاعتبار جميع البيانات من كافة أفراد مجتمع الدراسة. ولنأخذ مثالاً على حملة تسويق. لنفترض أنّك طورت مفهوماً جديداً وتريد معرفة إن كانت نتائج هذا المفهوم بالتسويق أفضل من الذي تمتلكه حالياً. من الطبيعي أنّك لن تكون قادراً على تطبيق هذا المفهوم الجديد مع جميع عملائك المستهدفين، ولذا فإنك ستختار عينة منهم.

وبينما تعرض النتائج، ترى أنّ الذين تعرفوا على الحملة الجديدة أنفقوا 10.17 دولار بالمتوسط، وهذا أكثر من 8.41 دولار وهو معدل إنفاق من لم يتعرفوا إلى الحملة الجديدة. وفي حين نعتبر أنّ هذه الزيادة التي كانت بمقدار 1.76 زيادة كبيرة، وربما مهمة، إلا أنّ الحظ كذلك، ربما لا يكون حالفك لأنك اخترت عينة لا تمثل مجتمع الدراسة، ولذا فقد لا يكون هنالك فرق بين الحملتين وأثرهما على توجهات الشراء لدى العملاء. وتُدعى هذه الحالة "خطأ اختيار العينة"، ولا بدّ أن تتنبه لهذا الخطأ في كل اختبار تقوم به كي لا يكون يمثّل مجتمع الدراسة بشكل كاف.

كما يلاحظ ريدمان وجود عاملين يساهمان في الوقوع في هذا الخطأ: حجم العينة، والاختلافات القائمة في مجتمع الدراسة. من الوضوح بمكان أنّ حجم العينة يؤثر في النتيجة. فكر مثلاً في قطعة النقد إذا رميتها 5 مرات أو 500 مرة، ستجد أنه كلما ازداد عدد المرات التي تلقيها بها ستنخفض معها احتمالية أن تظهر لك الصورة في معظم المرات. وكذلك الأمر في الدلالة الإحصائية، فحين تزداد عينة الدراسة حجماً ستقل احتمالية أن تكون النتائج التي حصلت عليها وليدة الصدفة وحسب. وعليه فإنك ستشعر بثقة أكبر بنتيجة الدراسة المتعلقة بحملة التسويق سابقة الذكر لو قمت بتجربتها مع 1,000 من الناس بدل الاكتفاء بـ25. لا شك أنّ تجربة الفكرة الجديدة مع عدد أكبر من الناس سيكلفك المزيد من الوقت والمال، ويجدر بك لذلك أن توازن بين الحاجة لعينة أكبر والميزانية المتوفرة لديك.

أما التباين في مجتمع الدراسة، فهو أمر يصعب فهمه، ولكن تطوير القدرة على التعرف إليه أمر في غاية الأهمية لجميع المدراء الذين يضطرون للتعامل مع البيانات. ولذا فإنه في حال اختيار عميل بشكل عشوائي، ستكون احتمالية أن ينفق بقدر قريب من المعدل عالية جداً. وعليه فإنّك ستتجنّب اختيار عيّنة تختلف بشكل كبير عن مجتمع الدراسة، وهذا يزيد في ثقتك بالنتائج التي تحصل عليها.

ويقترح ريدمان أن تقوم بتخطيط بياناتك وإنشاء رسوم بيانية من أجل تحليل البيانات بشكل أفضل، إذ ستساعدك الرسوم البيانية على تحديد مستوى التباين والكشف عن الخطأ في العينة إن وجد، والنتيجة هي زيادة الدلالة الإحصائية لدراستك.

ولا تختلف عملية تقييم الدلالة الإحصائية باختلاف الدراسة التي تقوم بها، فالإجراءات واحدة. ابدأ بتحديد فرضية العدم (null hypothesis) التي تحاول إبطالها من خلال الدراسة. ففي التجربة السابقة بخصوص حملة التسويق، قد تكون فرضية العدم هي: "العملاء لا يفضّلون حملتنا الجديدة مقارنة بالحملة القديمة". وقبل أن تبدأ عليك كذلك أن تضع فرضية بديلة، مثل: "في المعدل، العملاء يفضّلون الحملة الجديدة"، وأن تضع كذلك مستوى الدلالة المستهدفة. مستوى الدلالة هو تعبير عن مستوى ندرة نتائجك إذا افترضنا أنّ فرضية العدم صحيحة. وعادة ما يتم الإشارة إليها بالقيمة (P)، فكلما قلّت القيمة (P)، قلت احتمالية أن تكون النتيجة نابعة من مجرد الصدفة وحسب.

إنّ وضع الهدف وتفسير القيم الاحتمالية (P) قد تكون أمراً بالغ التعقيد. ويقول ريدمان إنّ هذا يعتمد بشكل كبير على ما تقوم بتحليله. فإن كنت تدرس الجزيء الأولي (بوزون هيغز)، فأنت تحتاج إلى قيمة احتمالية منخفضة جداً، قد تصل إلى 0,00001. أما إن كنت تريد معرفة إذا كانت استراتيجية تسويق أفضل من أخرى أو أنّ ريشة المثقب الجديدة التي صممها المهندس في الشركة أسرع من الريش القديمة، فإنه يمكن أن تكون القيمة الاحتمالية أعلى وأن تصل مثلاً إلى 0,25.

قد تلاحظ أنّ المدراء في الكثير من هذه الاختبارات يسقطون هاتين الخطوتين من حساباتهم ولا يكترثون بالدلالة الإحصائية حتى يحصلوا على النتائج النهائية، ولكن الإجراء العلمي الأفضل يشترط القيام بهاتين الخطوتين قبل المضي في التجربة.

بعد ذلك تقوم بجمع البيانات وإعداد رسوم بيانية بالنتائج، وتجري الإحصاءات وحساب القيمة (P) والتي تأخذ مقدار التباين وحجم العينة بعين الاعتبار. فإنّ كانت القيمة (P) أقل من القيمة المستهدفة فيمكنك حينها طرح فرضية العدم وتأخذ بالفرضية المقابلة، لأنّ هذا يعني أنّ احتمالية أن تكون النتائج التي توصلت إليها معللة بالصدفة قليلة.

كيف يتم حساب ذلك؟

إذا كنت مديراً فإنّك لن تقوم بحساب الدلالة الإحصائية بنفسك. يقول ريدمان إنّ هنالك العديد من البرامج الإحصائية التي تساعدك على معرفة الدلالة الإحصائية عند الحصول على النتائج. كما أنّ هنالك صيغة في مايكروسوفت إكسل وعدد من البرمجيات الأخرى التي تساعدك على حساب الدلالة الإحصائية.

إلا أنّه من المفيد أن تكون لديك معرفة بالعملية التي وصفناها في ما سبق، وذلك لتتمكن من فهم وتفسير النتائج. يقول ريدمان إنّ على المدراء ألا يثقوا بأي نموذج إن كانوا لا يفهمون طريقة عمله.

كيف تستفيد الشركات من معرفة الدلالة الإحصائية؟

تستخدم الشركات الدلالة الإحصائية لفهم مدى تأثير النتائج على التجربة أو الاستبيان أو الاستطلاع الذي يقومون به وكيف تنعكس على القرارات التي يقومون بها. على سبيل المثال، إن كان المدير يقوم بدراسة تتعلق بالتسعير ليحدد أفضل سعر لمنتجه الجديد، فإنّه سيقوم بحساب الدلالة الإحصائية، بمساعدة محلل إحصائي مختص، كي يرى إن كانت النتائج ستؤثر على قراره في تحديد السعر النهائي.

لاحظ أنّ حملة التسويق الجديدة التي تحدثنا عنها هنا، ربما حققت ارتفاعاً في معدل المبيعات بمقدار 1.67 دولار (أكثر من 20 في المئة) وهذه دلالة عملية مهمة بلا شك. فإنّ كانت القيمة P 0.03، فإنّ النتيجة ذات دلالة إحصائية أيضاً، ويجب عليك حينها أن تعتمد الحملة الجديدة. ولكن إذا كانت القيمة P 0.2 فإنّ النتيجة ليست ذات دلالة إحصائية، ومع ذلك، يمكنك المضي قدماً في اعتماد الاستراتيجية الجديدة باعتبار الدلالة العملية المتعلقة بارتفاع معدل المبيعات، ولكن مع بذل مزيد من الحرص والدقة.

ولكن ماذا لو كان الفرق الحاصل في المبيعات لا يتجاوز بضعة سنتات؟ إذا كانت القيمة P 0.2 فإنك تختار الإبقاء على الاستراتيجية القديمة أو تفكر في اعتماد استراتيجية جديدة. ولكن حتى لو كانت قيمة الدلالة 0.03 والنتيجة ذات دلالة إحصائية مهمة على الرغم من صغرها، فإنّ قرارك في هذه الحالة سيعتمد على عوامل أخرى، مثل النظر في تكلفة تطبيق الاستراتيجية الجديدة.

هنالك مفهوم آخر مرتبط بمفهوم الدلالة الإحصائية يعرف باسم مجال الثقة (confidence interval). ولنأخذ مثالاً على استطلاع آراء في مجال السياسة. فلنفترض وجود مرشحين اثنين، المرشح (أ) والمرشح (ب). تقوم المؤسسة المختصة باستطلاع آراء 1,000 من المنتخبين المحتملين. يقول 49 في المئة من المشاركين في الاستطلاع أنّهم سيصوتون للمرشح (أ)، أما بقية أفراد العينة، سيصوتون للمرشح (ب). وتشير الشركة التي أجرت الاستطلاع إنّ هامش الخطأ يبلغ +/- 3 في المئة.

حسب ريدمان، فإنّه نسبة 49 في المئة +/- 3 في المئة تشير إلى مجال من الثقة يصل إلى 95 في المئة من حجم المنتخبين الذين سيصوتون للمرشح (أ). ولكن العجيب هو أنّ معظم الناس يفسرون هذا بأنّ هنالك فرصة تبلغ 95 في المئة بأنّ النسبة التي سيحصل عليها المرشح (أ) من الأصوات هي بين 46 في المئة و 52 في المئة، ولكن هذا ليس صحيحاً. فالمعنى الذي نخرج به من هذه النسبة هو أنّ المؤسسة لو أجرت الاستطلاع أكثر من مرة، فإنّ هنالك فرصة تبلغ 95 في المئة بالحصول على نفس النتائج.

إن أصابتك هذه الجملة الأخيرة بدوار في رأسك، فلا تقلق، لست وحدك. يقول ريدمان إنّ تفسير هذا الأمر "دقيق حد الجنون، حتى أنّ أكثر المدراء بل والباحثين المختصين يستصعبون تحديده". ولكنه يرى أنّ التفسير الأكثر عملية لهذه النسبة هو ألا نتسرع في الحكم ونقول إنّ فوز المرشح (ب) أمر مضمون، أو أنّ المرشح (ب) متقدم بالضرورة على المرشح (أ)، ذلك لأنّ هذه النسبة ليست ذات دلالة إحصائية. سيختلف التفسير العملي بطبيعة الحال لو كانت هنالك نسبة 70 في المئة من المشاركين في الاستطلاع قالوا إنهم سيصوتون للمرشح (ب) وسيكون هامش الخطأ هنا 3 في المئة.

إنّ السبب الذي يجعل المدراء يهتمون بالدلالة الإحصائية هو رغبتهم في معرفة ما يجب عليهم القيام به على أرض الواقع في ضوء النتائج التي يخرجون منها من العمليات الإحصائية. ولكن ما يراه ريدمان هو أنّ مفاهيم مجال الثقة واختبار الفرضيات قد صممت لتستخدم في مجالات العلوم، وذلك لمعرفة إن كانت نظرية ما ستصمد خلال الزمن. ولكن حتى لو كانت الدلالة الإحصائية في تجربة ما غير مهمة، فيمكن أن تبقى ذات أثر وأهمية بالنسبة لك ولشركتك. من جهة أخرى، إن كنت تعمل مع مجموعات ضخمة من البيانات، يمكن أن تحصل على نتائج ذات دلالة إحصائية ولكنها في الوقت ذاته ليست مهمة من الناحية العملية، كأن نقول إنّ مجموعة من العملاء سيكون لديها ميل بمقدار 0.000001 في المئة للحملة (أ) مقارنة بالحملة (ب). ولذا، لا يجدر بك أن تهتم بدقة نتائجك حد الهوس، وإنّما عليك أن تفكر بأبعاد هذه النتائج على القرار الذي تسعى لاتخاذه، وترى إن كان اختلاف النتائج سيجعلك تغير قرارتك.

ما الأخطاء التي يقوم بها الناس عند التعامل مع الدلالة الإحصائية؟

يحذرنا ريدمان من كون الدلالة الإحصائية مفهوماً عسيراً على الفهم، وأنّ الناس كثيراً ما يسيئون فهمه. ويقول: "لم أواجه الكثير من المواقف التي كان يتوجب على المدراء أن يفهموا بها الدلالة الإحصائية بشكل معمق، ولكن عليهم مع ذلك أن يعرفوا كيفية تجنب إساءة استخدام هذا المفهوم".

لا شك أنّ مختصي تحليل البيانات لا يحتكرون فهم كلمة "الدلالة" بل عادة ما نستخدم هذا المصطلح في مجال الأعمال للإشارة إلى أنّ النتيجة ذات أهمية من الناحية الاستراتيجية. ولا شك في أنّ اعتماد مصطلحات دقيقة هو من أهم الممارسات الواجب اتباعها عند الحديث عن نتائج تحليل البيانات. وإن كنت ترغب في مناقشة ما إذا كانت لنتيجة ما آثار معينة على استراتيجيتك أو قراراتك، فلا بأس من استخدام كلمة "دلالة"، ولكن إن كنت تريد أن تعرف ما إذا كان أمر ما ذات دلالة إحصائية (وعليك عادة أن تعرف هذا)، فإنّ عليك أن تكون دقيقاً في اللغة التي تستخدمها. ففي المرة التالية التي تنظر فيها إلى نتائج استبيان أو تجربة ما، يتوجب عليك أن تسأل عن الدلالة الإحصائية إن كان المختص بإجراء التحليل لم يأت على ذكرها في التقرير.

تذكر أنّ اختبارات الدلالة الإحصائية تساعدك على تجنب الوقوع في أخطاء العينة، كما أنّها تساعدك في رأي ريدمان على تجنب ما هو أسوأ من ذلك، وهو الخطأ خارج العينة (non-sampling error) أي الأخطاء التي تشتمل على انحرافات حصلت على البروتوكولات التجريبية أو الإجرائية، كأن يقدّم المشاركون في الاستبيان معلومات كاذبة، أو أن تضيع البيانات، أو أن يتم ارتكاب بعض الأخطاء أثناء عمليات التحليل، وهذه الحالات كما يرى ريدمان هي التي تضع بين أيدينا نتائج مشوشة. يقول ريدمان: هنالك الكثير مما يمكن أن يحدث بين وقت التخطيط للاستبيان أو التجربة حتى حين حصولك على النتائج. إنني أحرص على أن تكون البيانات الخام التي جمعتها موثوقة أكثر من حرصي على معرفة عدد الأشخاص الذين شملتهم الدراسة". إنّ البيانات الصحيحة والتحليل الدقيق لها أكثر أهمية من الدلالة الإحصائية.

يتوجب عليك أن تذكر دائماً التطبيق العملي للنتائج التي تحصل عليها وعليك ألا تُلح كثيراً على وضع مجال صارم للثقة. يقول ريدمان: "ينطوي التقليد العلمي على تحيز حين يقرر إن النتائج لا تكون قابلة للنشر إلا إذا كانت القيمة P 0.05 أو أقل. ولكن العديد من القرارات، كتحديد استراتيجية التسويق في الشركة مثلاً، لن تكون بحاجة للحصول على هذا المستوى المنخفض من مجال الثقة. ففي عالم الأعمال كما يرى ريدمان هنالك معايير أخرى أكثر أهمية من الدلالة الإحصائية. والسؤال المهم الذي علينا أن نطرحه هو: "هل النتيجة التي حصلنا عليها تشكل فرقاً في السوق، ولو لفترة قصيرة من الوقت؟".

إنّ النتائج تعطيك قدراً ضخماً من المعلومات حسب ريدمان ولكنه يقول أيضاً: "إنني أشجع على استخدام الإحصاءات، ولكن عليك أن تستخدم معها دوماً الحكم الصحيح".