يوضح آدم سميث في كتابه "ثروة الأمم" (The Wealth of Nations) كيف يشكل تقسيم العمل المصدر الرئيس لزيادة الإنتاجية مستخدماً كمثال خط التجميع في مصنع دبابيس: "يقوم شخص واحد بتوجيه السلك المعدني، ويعمل آخر على جعله مستقيماً، ويقوم شخص ثالث بقطعه، ومن ثمّ يعمل رابع على تدبيب رأسه". مع التخصص في العمل بناء على الوظيفة، سيمتلك كلّ عامل مهارات كبيرة في مهمة محددة، ما يؤدي إلى زيادة كفاءة العمليات، وستزداد نتائج كلّ عامل بأضعاف مضاعفة بحيث يصبح المصنع أكثر كفاءة في إنتاج الدبابيس. فما علاقة ذلك بموضوع موظفي علم البيانات ضمن الشركات؟
متطلبات موظفي علم البيانات
لا يزال تقسيم العمل هذا بحسب الوظيفة متأصّلاً فينا حتى في هذه الأيام، حيث نسرع إلى تنظيم فرقنا تبعاً لذلك، وعلم البيانات ليس استثناءً، ولا حتى موظفي علم البيانات أيضاً. تتطلب القدرة المتكاملة في الأعمال الخوارزمية عدة وظائف، ولذلك تنشئ الشركات عادة فرقاً من المتخصصين: علماء أبحاث ومهندسو بيانات ومهندسون في تقنية تعلم الآلة وعلماء استدلال سببي وغيرهم. وينسّق مدير المنتجات عمل الاختصاصيين، مع عمليات تسلّم وتسليم للمهام بطريقة تشبه مصنع الدبابيس: "يتولّى شخص توفير مصادر البيانات، وآخر يضع نماذج لها، وثالث يطبّقها، ورابع يقيسها"، وهكذا دواليك.
اقرأ أيضاً: ما هي الدول التي تقود اقتصاد البيانات؟
للأسف، يجب ألا نعمل على تحسين فرق علم البيانات لدينا من أجل تحقيق مكاسب في الإنتاجية؛ ولكن هذا ما تفعله عندما تعرف ما الذي تنتجه – سواء كان الدبابيس أو شيئاً آخر - وهنا أنت تسعى فقط إلى تحقيق كفاءة إضافية، فهدف خطوط التجميع هو التنفيذ. نحن نعرف بالضبط ما الذي نريده - دبابيس كما في مثال آدم سميث - ولكن يمكننا أيضاً التفكير في أيّ منتج أو خدمة تشتمل المتطلّبات فيهما على جميع جوانب المنتج وسلوكه تماماً، بحيث يكمن دور العمال في تنفيذ تلك المتطلبات بأكبر قدر ممكن من الكفاءة.
ولكن الهدف من علم البيانات ليس في التنفيذ، بل في تعلّم قدرات عميقة جديدة في مجال الأعمال وتطويرها. المنتجات والخدمات الخوارزمية مثل أنظمة التوصيات، وأدوات إشراك العملاء، وتصنيف تفضيلات الأنماط، ومطابقة الحجم، وأنظمة تصميم الأنماط، ومحسّنات الخدمات اللوجستية، وتحديد التوجّهات الموسمية، وغيرها الكثير، كلّها لا يمكن تصميمها مسبقاً بل ينبغي تعلّمها. إذ لا توجد مخططات أولية لاتّباعها بل هناك قدرات جديدة غير متيّقن منها. والمعامِلات، والنماذج، وأنواع النماذج، والمعلَمات الفائقة، وجميع العناصر التي تحتاجها، يجب تعلّمها من خلال التجريب، والتجربة والخطأ، والتكرار. في حالة صنع الدبابيس، تحصل عمليات التعلّم والتصميم مقدّماً قبل البدء بصنعها، وفي حالة علم البيانات أنت تتعلّم فوراً وليس مقدّماً.
في مصنع الدبابيس، حيث يأتي التعلم أولاً، لا نتوقّع ولا نريد من العمال أن يرتجلوا في أي جانب من جوانب المنتج باستثناء إنتاجه على نحو أكثر كفاءة. يُعتبر التنظيم بحسب الوظيفة هنا أمراً منطقياً نظراً لأنّ التخصص في المهام يؤدّي إلى كفاءة العمليات واتّساق الإنتاج (مهما كان المنتج النهائي).
سلبيات التخصص في المنتجات
ولكن عندما يكون المنتج لا يزال قيد التطوير ويكون الهدف هو التعلّم، فإنّ التخصّص يعرقل أهدافنا بعدّة طرق:
1. التخصّص يزيد من تكاليف التنسيق
تتمثّل هذه التكاليف في تلك التي تتراكم بسبب الوقت الذي تقضيه في التواصل والمناقشة والتبرير وتحديد أولويات العمل التي ينبغي إنجازها؛ وهي تتوسّع أفقياً مع ازدياد عدد الأشخاص المعنيين (فكما علّمنا ريتشارد هاكمان، ينمو عدد العلاقات (ع) كعدد وظائف الأعضاء (و) في هذه المعادلة: ع = (و^2 - و)/2، في حين تنطوي كلّ علاقة على بعض تكاليف التنسيق). عندما يتمّ تنظيم علماء البيانات بحسب الوظيفة، ومع الحاجة إلى الكثير من الأخصائيين في كلّ خطوة، ومع كلّ تغيير، ومع كلّ عملية تسليم، وغيرها، فإنّ تكاليف التنسيق ترتفع كثيراً. على سبيل المثال، سيكون على المتخصصين في النمذجة الإحصائية الذين يرغبون في تجريب ميزات جديدة أن ينسقوا مع مهندسي البيانات الذين يعملون على زيادة مجموعات البيانات، في كلّ مرة يريدون تجربة شيء جديد. وبالمثل، فإنّ كلّ نموذج جديد خضع للتدريب يعني أنّ مصمّم النموذج سيحتاج إلى شخص للتنسيق معه من أجل نشر نموذجه. تأتي تكاليف التنسيق بمثابة ضريبة على عملية التكرار، ما يجعلها صعبة ومكلفة أكثر، وأكثر احتمالاً لثني الموظفين عن الاستكشاف، وهذا ما يمكن أن يعيق عملية التعلّم.
اقرأ أيضاً: ما نوع علماء البيانات الذين تحتاج إليهم؟
2. التخصّص يزيد من وقت الانتظار
الوقت المهدور بين العمل والآخر يُعتبر أخطر من تكاليف التنسيق، فبينما يمكن قياس تكاليف التنسيق عادة بالساعات - أي الوقت المستغرق لعقد الاجتماعات والمناقشات وتصميم المراجعات - تُقاس أوقات الانتظار بالأيام أو الأسابيع أو الأشهر! تصعب مواءمة الجداول الزمنية للمتخصصين بحسب الوظائف بما أنّه لا بدّ لكلّ واحد منهم الالتزام بعدد من المبادرات، فقد يستغرق تنظيم اجتماع من ساعة واحدة لمناقشة التغييرات عدّة أسابيع.
ومتى جرت مواءمة العمل الفعلي مع التغييرات ينبغي أيضاً جدولته في سياق عدة مشاريع أخرى تتنافس للحصول على وقت الموظفين المتخصصين. وقد تبقى الأعمال مثل إجراء تغييرات في الرموز البرمجية أو الأبحاث، والتي تتطلّب بضع ساعات أو أيام، غير منجزة لفترة أطول قبل أن تتوفر الموارد، بما يؤدي إلى خفوت التكرار والتعلّم حتّى ذلك الحين.
3. التخصّص يجعل السياق أضيق
يؤدي تقسيم العمل إلى الحدّ من التعلّم عن طريق مكافأة الناس على الالتزام بالمسلك المحدّد لهم. على سبيل المثال، فإنّ عالم الأبحاث الذي رُسم له أن يبقى في حدود شغله سيركّز طاقته على تجريب خوارزميات من أنواع مختلفة: الانحدار والشبكات العصبية والغابات العشوائية (وهي خوارزمية تعلّم تعمل عن طريق بناء الكثير من أشجار القرار في وقت التدريب)، وغيرها. يمكن لخيارات الخوارزمية الجيدة أن تؤدي بالتأكيد إلى تحسينات إضافية، ولكن هناك الكثير من الأمور التي يمكن تحقيقها من أنشطة أخرى مثل دمج مصادر البيانات الجديدة. وبالمثل، قد تطوّر نموذجاً يستنفد كلّ جزء من القوة التفسيرية الملازمة للبيانات، ومع ذلك قد تكمن الفرصة الأكبر في تغيير هدف الوظيفة أو تخفيف بعض القيود، غير أنّه يصعب تحقيق هذا الأمر أو تنفيذه عندما تكون الوظيفة في العمل محدودة. فنظراً لأنّ عالم الأبحاث متخصّص في تحسين الخوارزميات، فمن غير المرجّح أن يتابع أي شيء آخر حتى إذا كان ينطوي على فوائد كبيرة.
اقرأ أيضاً: ما سبب إخفاق البيانات في إصلاح المنظومة التعليمية الأميركية؟
يمكن أن تظهر أعراض محددة عندما يعمل فرق علماء البيانات مثل مصانع الدبابيس، على سبيل المثال: يُعتبر "انتظار التغيرات في تدفق البيانات" و"انتظار موارد مهندس تعلّم الآلة" من العقبات الشائعة. ومع ذلك، أعتقد أنّ التأثير الأكثر خبثاً يكمن في ما لا تسمعه، لأنّه لا يمكنك أن تندم على ما لم تتعلّمه بعد. التنفيذ التام للمتطلبات والشعور بالرضا الناجم عن تحقيق كفاءة العمليات يمكن أن يخفيا حقيقة مؤلمة، وهي أنّ المؤسّسة لا تدرك عمليات التعلّم القيّمة التي تفقدها.
ولكن الحل لهذه المشكلة يتمثل بطبيعة الحال في التخلص من مصنع الدبابيس وليس من موظفي علم البيانات في الشركات. فمن أجل تشجيع التعلّم والتكرار، ينبغي جعل أدوار علم البيانات عمومية أكثر مع مسؤوليات واسعة لا تنحصر بوظيفة فنية، أي تنظيم علماء البيانات بحيث يكونون في الوضع الأمثل للتعلّم. وهذا يعني توظيف "علماء بيانات متكاملين" – عموميين – يمكن أن يؤدوا وظائف متنوعة: من وضع التصوّر مروراً بالنمذجة وصولاً إلى التنفيذ والقياس. من المهمّ الإشارة إلى أنّني لا أقترح أن يؤدي توظيف علماء بيانات متكاملين إلى توظيف عدد أقلّ من الأشخاص بشكل عام، بل أقترح فقط أنّه عندما يتمّ تنظيمهم بطريقة مختلفة تكون حوافزهم متوافقة على نحو أفضل مع مكاسب التعلّم مقابل الكفاءة. على سبيل المثال، لنقل أنّ لديك فريق من ثلاثة أشخاص ينشئون ثلاث قدرات في مجال الأعمال. في مصنع الدبابيس، سيكرس كل أخصائي ثلث ما لديه لكلّ قدرة لأنّه لا يمكن لأيّ شخص آخر القيام بعمله. وفي حالة الوظيفة المتكاملة، سيكرّس كل أخصّائي نفسه تماماً لإحدى القدرات بما يزيد من النطاق والتعلّم.
تتدنّى تكاليف التنسيق مع وجود عدد أشخاص أقلّ ضمن حلقة العمل، فالموظّف العمومي غير المتخصّص يتحرّك بسلاسة بين المهام، ويزيد من تدفق البيانات لإضافة المزيد منها، ويجرّب ميزات جديدة في النموذج، وينشر إصدارات جديدة للإنتاج من أجل القياس السببي، ويكرّر الخطوات بسرعة توازي سرعة توصّله إلى أفكار جديدة. وبالطبع يؤدّي الموظف صاحب المهارات العامة وظائف مختلفة بالتسلسل وليس بالتوازي – فهو شخص واحد يعمل على هذه الأمور في نهاية المطاف. ومع ذلك، عادة ما يأخذ القيام بالعمل جزءاً بسيطاً فقط من وقت الانتظار الذي يستغرقه موظّف متخصص لتوفير أحد الموارد، ما يؤدي تالياً إلى انخفاض وقت التكرار.
قد لا يكون صاحب المهارات العامة بارعاً مثل الموظّف المتخصّص في وظيفة واحدة، ولكنّنا هنا لا نسعى إلى التميز الوظيفي أو إضفاء تحسينات تدريجية صغيرة بل إلى التعلّم واكتشاف القدرات الجديدة في مجال الأعمال بفضل تأثير التغيير المرحلي. مع السياق الكامل للحل الشامل، يرى الموظّف صاحب المهارات العامة الفرص التي لن يراها الموظّف المتخصّص في مجال ضيّق، فهو يمتلك المزيد من الأفكار ويجرّب المزيد من الأمور. يعني هذا أنّه سيفشل في أحيان كثيرة أيضاً، ولكن ستكون تكلفة الفشل منخفضة بينما تكون فوائد التعلّم مرتفعة، كما أنّ هذا التباين يدعم التكرار السريع ويكافئ على التعلّم.
تجدر الإشارة إلى أنّ هذا الكمّ من الاستقلالية والتنوّع في المهارات الممنوحة لعلماء البيانات المتكاملين يعتمدان إلى حدّ كبير على افتراض وجود منصّة بيانات قوية للعمل. فقاعدة البيانات جيدة البناء تريح علماء بيانات من تعقيدات النقل بالحاويات (أي إنشاء نسخ افتراضية نم نظام التشغيل من خلال إنتاج حاويات تتشارك فيها النواة مع النظام المضيف)، والمعالجة التلقائية الموزعة، وغيرها من مفاهيم الحاسوب المتطورة الأخرى. بالإضافة إلى التجريد الذي تضفيه قاعدة البيانات القوية، يمكن لهذه الأخيرة توفير واجهات برمجية سلسة في البنية التحتية للتجريب، وأتمتة عمليات الرصد والتنبيه، وتوفير عمليات تحجيم تلقائي، وإتاحة تصوير مرئي لعمليات تنقيح النتائج الخوارزمية. صمم هذه المكونات وصنعها مهندسون متخصصون في منصات البيانات، ولكن لنكن واضحين، لا يعني هذا تسليم علماء البيانات الأمر إلى فريق منصّة البيانات، فعالم البيانات هو المسؤول عن كافة الرموز البرمجية التي توضع لكي تعمل على المنصّة.
انجذبت أنا أيضاً في إحدى المرات إلى تقسيم العمل بناء على الوظائف من خلال اجتذاب الكفاءات العملية، ولكنني اكتشفت عن طريق التجربة والخطأ (التي لا توجد طريقة أفضل منها للتعلّم) أنّ الأدوار العامة تسهّل التعلّم والابتكار وتوفّر الأنواع الصحيحة لتوسيع نطاق الميزات: لاكتشاف الكثير من القدرات في مجال الأعمال وبنائها أكثر من التركيز على النهج المتخصّص. (ثمّة طريقة فعّالة لمعرفة المزيد عن هذا المفهوم الذي يفاضل بين التنظيم والتعلم من التجربة والخطأ، وهي قراءة كتاب إيمي إدموندسن "العمل الجماعي: كيف تتعلم المؤسّسات وتبتكر وتتنافس في اقتصاد المعرفة" (Teaming: How Organizations Learn, Innovate, and Compete in the Knowledge Economy)).
يوجد بعض الاعتبارات المهمة التي قد تجعل مقاربة التنظيم أكثر قابلية للتطبيق أو أقل في بعض الشركات. فعملية التكرار هذه تفترض تكلفة منخفضة للتجربة والخطأ، فإذا كانت تكلفة الخطأ مرتفعة قد تحتاج إلى التفكير مجدداً في الأمر (على سبيل المثال، لا يُنصح باستخدام هذا المفهوم في الطب أو التصنيع). بالإضافة إلى ذلك، إذا كنت تتعامل مع بيتابايتات أو إكسابايتات من البيانات، فقد يكون للتخصص في هندسة البيانات ما يبرّره. وإذا كان الحفاظ على قدرة في مجال الأعمال على الإنترنت وإبقاؤها متاحةً أكثر أهمّية من تحسينها، فقد يفوق التميّز الوظيفي التعلّم. وأخيراً، يعتمد نموذج علم البيانات المتكامل على افتراض وجود موظفين ممتازين، وهذا ليس مستحيلاً بل يمكن العثور عليهم كما يمكن تدريبهم ليصبحوا كذلك. ولكن مع ارتفاع الطلب عليهم، يجب عليك من أجل جذبهم والاحتفاظ بهم دفع رواتب تنافسية، وتوفير قيم عمل قوية في الشركة، وتوفير عمل مثير للاهتمام. لذلك، احرص على أن تكون ثقافة شركتك تدعم ما سبق.
مع كل ما قيل سابقاً حول موظفي علم البيانات في الشركات، أعتقد أنّ نموذج عالم البيانات المتكامل يوفّر انطلاقة أفضل. ابدأ معهم، ومن ثمّ انتقل بوعي (على مضض) نحو تقسيم العمل بحسب الوظيفة فقط عندما يكون ذلك ضرورياً بشكل واضح.
ثمة سلبيات أخرى للتخصص الوظيفي، فهو يمكن أن يؤدي إلى غياب المساءلة وفقدان الشغف لدى العمال. حتى أنّ آدم سميث نفسه ينتقد تقسيم العمل، ويشير إلى أنّه يؤدّي إلى تبلّد المواهب – أي أنّ العمال يصبحون جاهلين وضيّقي الأفق لأنّ أدوارهم تقتصر على عدد قليل من المهام المتكرّرة. كما أنّ التخصّص قد يساهم في زيادة كفاءة في العمليات غير أنّه ليس من المرجّح أن يلهم العمّال.
على النقيض من ذلك، توفّر أدوار الموظفين ذوي المهارات العامة كلّ ما يحفّز الرضا الوظيفي: الاستقلالية والإتقان والغرض. تكمن الاستقلالية في عدم اعتماد الموظّف على شخص آخر لتحقيق النجاح، ويتمثّل الإتقان في معرفتهم للقدرة في مجال الأعمال تماماً، في حين يتمثّل الغرض في أنّ لديهم صلة مباشرة بالأثر الذي يتركونه على الأعمال. وإذا نجحنا في زيادة حماس موظفي علم البيانات لعملهم وإحداث تأثير كبير على الشركة، ستنجح بقية الأمور بطبيعة الحال.
اقرأ أيضاً: ما الأخطاء التي ترتكبها الشركات عند توظيف البيانات في مجال التنوع؟