عام 2012، وصفت مجلة هارفارد بزنس ريفيو مهنة علماء البيانات، في مقالة نشرتها، باعتبارها "المهنة الأكثر جاذبية في القرن الواحد والعشرين"، ويمكن القول أيضاً إنها الأكثر غموضاً. ولتوظيف عالم البيانات المناسب في المكان المناسب، من المهم التمييز بين فئاتهم المختلفة عبر الكثير من الفروق. وبالطبع، فإنّ أي محاولة لجمع علماء البيانات ضمن خانات مختلفة فقط هو، بلا شك، تبسيط مبالغ فيه. ومع ذلك، أرى جدوى من التمييز بين المخرجات التي يخلقونها، فيخلق النوع الأول من علماء البيانات مخرجات للاستخدام البشري في شكل توصيات تتعلق بالمنتج والاستراتيجية، وهم العلماء الذين يسهلون عملية اتخاذ القرار، وسنطلق عليهم اختصاراً اسم "علماء القرار". ويخلق النوع الآخر مخرجات للاستخدام الآلي من قبيل النماذج وبيانات التدريب والخوارزميات، ويسمّون "علماء النمذجة".
أنواع علم البيانات
1. علم البيانات للاستخدام البشري:
مستهلكو هذه المخرجات هم صنّاع القرار من مسؤولين تنفيذيين أو مدراء منتجات أو مصممين أو حتى أطباء؛ فهم يريدون استخلاص استنتاجات من البيانات بغرض اتخاذ قرارات من قبيل أي محتوى سيصرح بنشره، أو أي مبيعات يجب متابعتها، أو أي دواء أقل احتمالاً للتسبب في الحساسية، أو أي تصاميم صفحات الويب سيفضي إلى المزيد من التفاعل أو المزيد من عمليات الشراء، أو أي رسائل إلكترونية تسويقية ستحقق إيرادات أعلى، أو أي جزء محدد من منتجات تجربة مستخدم دون المستوى الأمثل ويحتاج إلى المزيد من الاهتمام. ويعمل هؤلاء العلماء على تحديد المقاييس وتصميمها وتطبيقها، وتنفيذ التجارب وتفسيرها، وإنشاء لوحات متابعة، واستخلاص الاستنتاجات السببية، وتقديم توصيات من النمذجة والقياس.
اقرأ أيضاً: ترتيب البلدان والقطاعات الصناعية حسب المهارات في مجالات التكنولوجيا والبيانات والأعمال
2. علم البيانات للاستخدام الآلي:
مستهلكو هذه المخرجات هي أجهزة الكمبيوتر التي تستهلك البيانات في شكل بيانات تدريب ونماذج وخوارزميات. ومن أمثلة منتجات العمل التي يقدمها هؤلاء العلماء، أنظمة التوصية التي توصي بالقميص الذي يمكن أن يعجب الزبون، أو بالدواء الذي يجب على الطبيب أخذه بعين الاعتبار في وصفته الطبية استناداً إلى وظيفة مصممة على نحو أمثل من قبيل تعظيم عدد نقرات المرضى على المنتج أو تخفيض معدلات العودة إلى المستشفى. واستناداً إلى الخلفية الهندسية لهؤلاء العلماء، فإنّ منتجات العمل هذه تُرسل مباشرة إلى نظام الإنتاج، أمّا في حال كانت نماذج أولية، فإنها تسلّم إلى مهندسي البرمجيات؛ للمساعدة في تطبيقها وتحسينها وتوسيع نطاقها.
3. علماء البيانات (نادرو الوجود):
القادرون على برمجة كل من الواجهات الأمامية والبنية التحتية للتطبيقات (full stack data scientists)، وهم موجودون بالفعل على الرغم من صعوبة العثور عليهم.
في معظم المؤسسات، من المنطقي أن يتخصص علماء البيانات في نوع أو آخر من البرمجة، ولكنهم يُعتبرون أشخصاً فضولين يشعرون بسطوعهم من خلال قدرتهم على العمل الإبداعي. وتتحقق المنافع، لهم وللمؤسسة التي يعملون فيها، عبر منحهم المرونة للعمل على المشاريع التي تتطلب انخراطهم "بنوعيهم". (تعرض الفقرة الجانبية مزيداً من التفاصيل حول مدى اختلاف نوعي علماء البيانات، ليس فيما يتعلق بمهاراتهم والعمل الذي يقدمونه فحسب، بل أيضاً فيما يتعلق بالأطراف التي يتشاركون معها، والمقاييس التي تحدد نجاحهم).
علماء القرار مقابل علماء النمذجة
من يستهلك مخرجات العمل؟
علماء البيانات التي تصنع القرار: البشر.
علماء النمذجة: الآلات.
ما هي المخرجات؟
علماء صناعة القرار: لوحات المتابعة، والعروض التقديمية، والمذكرات، والمقاييس الجديدة، والنماذج التنبؤية لتوجيه صنع القرار، وتحليل الفرص من أجل تحديد ما يجب الاستثمار فيه أو جعله أولوية، وتقارير حول نتائج التجارب تتضمن التوصيات.
علماء النمذجة: النماذج وبيانات التدريب والخوارزميات.
ما هي مقاييس النجاح؟
علماء القرار: عملية صنع القرار المطورة في المؤسسة.
علماء النمذجة: التحسينات المباشرة في المنتج أو العمل من الشفرة البرمجية المتقدمة والمنقولة.
ما هي الأمثلة على هذا؟
علماء صناعة القرار: أي محتوى سيصرح بنشره، أو أي مبيعات يجب متابعتها، أو أي دواء أقل احتمالاً للتسبب في الحساسية، أو أي تصاميم صفحات الويب سيفضي إلى المزيد من التفاعل أو المزيد من عمليات الشراء، أو أي رسائل إلكترونية تسويقية ستحقق إيرادات أعلى، أو أي جزء محدد من منتجات تجربة مستخدم دون المستوى الأمثل ويحتاج إلى المزيد من الاهتمام.
اقرأ أيضاً: تعرف على الوجه الآخر للبيانات الكبيرة في الإدارة
علماء النمذجة: أنظمة التوصية التي توصي بالقميص الذي يمكن أن يعجب الزبون، أو بالدواء الذي يجب على الطبيب أخذه بعين الاعتبار في وصفته الطبية استناداً إلى وظيفة مصممة على نحو أمثل من قبيل تعظيم عدد نقرات المرضى على المنتج أو تخفيض معدلات العودة إلى المستشفى.
ما هي المهارات المطلوبة؟
علماء صناعة القرار: مهارات في مجال الإحصاء والتجربة والتفكير التحليلي، ومهارات التواصل والتعاون للعمل مع الشركاء التقنيين وغير التقنيين، ومعرفة بلغات البرمجة النصية والاستعلام (مثل بايثون، وآر، وإس كيو إل)، ومن الناحية المثالية، يجب أن تكون دراسته الرسمية هي في مجال علوم الكمبيوتر.
علماء النمذجة: مهارات في مجال علوم الكمبيوتر، وتعلم الآلة، وصياغة الشفرة البرمجية على مستوى الإنتاج، ومهارات تواصل قوية للعمل مع الشركاء التقنيين وغير التقنيين.
من هم شركاؤهم الرئيسون في العمل؟
علماء صناعة القرار: صنّاع القرار (المسؤولون التنفيذيون وقادة الشركة ومدراء المنتجات) ومهندسو البيانات والبرمجيات المسؤولون عن التطبيقات التي تولّد البيانات.
علماء النمذجة: مهندسو البنية التحتية للتطبيقات، ومدراء المنتجات (من أجل تحديد ما يجب تحسينه)، وزملاء آخرون من علماء النمذجة الذين يشاركون علماء التقنيات، وعلماء القرار حول الخصائص التي يجب أخذها بالاعتبار، ومجموعات البيانات التي يجب استخدامها.
نظرة متفحصة إلى الأدوار الوظيفية في مجال البيانات
في عمليات البيانات الأكبر والأكثر تعقيداً، يُعتبر وجود المزيد من الأدوار التي ترعى التفاصيل الدقيقة أمراً حيوياً، وإليك فيما يلي خمسة مجالات رئيسة تساهم في عمليات علم البيانات. في المؤسسات الصغيرة، يعمل شخص واحد عادة على تغطية العديد من هذه الأدوار، وفي الفِرق الأكبر قليلاً فإنّ كل دور قد يغطيه شخص أو اثنين، أما فيما يتعلق بالأعمال الكبرى فقد يغطي كل دور فريق كامل. تغطي هذه الأدوار عملية إنشاء البيانات والحفاظ عليها واستخدامها، وهي إضافة إلى علماء البيانات الذين ذكرناهم أعلاه (علماء القرار وعلماء النمذجة).
- البنية التحتية للبيانات: تتضمن استيعاب البيانات، وتوافرها، والعمليات المتعلقة بها، وكيفية الوصول إليها، وبيئات التشغيل من أجل دعم سير العمل لعلماء البيانات، مثل تشغيل منصة كافكا (Kafka)، وتطبيقات هادوب (Hadoop).
- هندسة البيانات: تتضمن تحديد مخططات البيانات اللازمة لدعم ضرورات القياس والنمذجة وفلترة البيانات وجمعها، واستخلاص البيانات وتحويلها وتحميلها (ETL)، وإدارة مجموعات البيانات.
- جودة البيانات وإدارتها: تشمل أدوات ضمان صحة البيانات وتبويبها ومتابعتها وموثوقيتها ووحدتها، وعمليات هذه الأدوات وإرشاداتها. وهذا يشمل أدوات لتعقب أصل البيانات وأمنها.
- هندسة تحليلات البيانات: وتنطوي على تمكين علماء البيانات من صب تركيزهم على التحليلات بغرض توسيع نطاقها عبر تطبيقات التحليلات للاستخدام الداخلي، مثل، مكتبات برمجيات التحليلات، وسير عمل الإنتاج، والخدمات الصغيرة التحليلية.
- مدير منتج البيانات: وهو دور ينطوي على خلق منتجات للمستهلكين الداخليين لغاية استخدامها في نطاق سير عملهم من أجل تمكين دمج المقاييس التي ولدّها علماء البيانات. ومن الأمثلة على ذلك: منفذ لقراءة نتائج اختبارات إيه/بي، أو أداة لتحليل الفشل، أو لوحة متابعة تمكّن بيانات الخدمة الذاتية وتشخص الأسباب الجذرية للتغييرات في المقاييس أو أداء النموذج.
أي من علماء البيانات عليك توظيفه؟
إذاً، أي نوع من علماء البيانات ينبغي عليك توظيفه؟ للإجابة عن هذا السؤال، حدد أولاً المرحلة التي فيها مؤسستك فيما يتعلق بعمليات البيانات، وثانياً اسأل حول مدى حيوية البيانات بالنسبة إلى منتجك. فإذا كنت تقود مؤسسة صغيرة ناشئة وتريد توظيف أول عالم بيانات، فحاول تعيين شخص يمكنه تغطية أكبر عدد من تلك الأدوار، أي عالم البيانات (نادر الوجود)، والقادر على برمجة كل من الواجهات الأمامية والبنية التحتية للتطبيقات. وإذا كانت مؤسستك أكبر، أو كانت متقدمة أكثر في عمليات البيانات، فستعتمد الإجابة أكثر على مدى حيوية البيانات بالنسبة إلى منتجك. أما إذا كان منتجك سيعتمد على تعلم الآلة منذ بدايته، فأنت بحاجة إلى الاستعانة بأصحاب الخبرة في مجال تعلم الآلة في أول عملية توظيف، أو أن تكون تلك سمة لدى أول قائد ستعينه. وفي المقابل، إذا كنت تتطلع إلى تحديد فرص المنتج أو إلى تحسين عملية اتخاذ القرارات العامة على مستوى المؤسسة، فإنك ستحتاج إلى شخص مدرّب أكثر في مجال علم اتخاذ القرار، والتحليلات الوصفية والتنبؤية، والإحصاءات، وشخص يمكنه ترجمة كيفية استخدام البيانات عبر فريق القيادة والشركاء غير التقنيين.
اقرأ أيضاً: تحديد أولويات مهارات البيانات التي تحتاجها شركتك باستخدام مصفوفة 2×2
أخيراً، إذا لم يكن لديك بيانات داخلية في شكل قابل للاستهلاك أو في شكل منطقي، فستحتاج إلى عالم بيانات ذي خلفية متينة بما فيه الكفاية في مجال الهندسة أو علوم الكمبيوتر، حتى يمكنه العمل مع المهندسين من أجل توجيه البيانات التي يجب تتبعها ومعرفة كيفية استخدامها قبل أن يتمكنوا من بدء عملهم.
كيف تنظم العملية؟
كُتب الكثير مسبقاً حول كيفية تنظيم وظائف علم البيانات. وربما تتمثل أهم نقطة في أنه إذا كان علم البيانات هو أحد عناصر التفاضل الاستراتيجية للمؤسسة، فإنّ رئيس وحدة علم البيانات يجب أن يقدم تقاريره على النحو المثالي إلى الرئيس التنفيذي. وإذا لم يكن ذلك ممكناً، فيجب أن يقدم تقاريره على الأقل إلى شخص على علم بأصول وضع استراتيجية للبيانات ولديه رغبة في الاستثمار فيها من أجل إعطائها حقها من الاهتمام. يشمل علم البيانات على طائفة من المهارات الخاصة به، وعلى نظام لسير العمل، وعلى أدوات، وعلى عمليات الدمج والثقافة. وإذا كان علم البيانات يشكل أهمية معينة بالنسبة إلى المؤسسة، فيفضل عدم طمره تحت قسم من أقسام المؤسسة أو دمجه مع ثقافة مختلفة.
السؤال الكبير الآخر هو ما إذا كان سيتم تضمين علم البيانات في خطوط العمل المختلفة، وما هي السبل لتحقيق ذلك؟ هناك ثلاثة نماذج أساسية، وهي: النموذج المتمركز في فريق واحد لعلوم البيانات، أو النموذج الموزع على نطاق خطوط العمل، أو النموذج الذي هو عبارة عن مزيج بين الاثنين، فيكون لديك فريق مركزي يقدم تقاريره إلى رئيس واحد. ولكن فعلياً اعمل على جمع فرق علماء البيانات وتضمينهم في وحدات الأعمال على المدى الطويل. وما لم تتضمن عمليات البيانات في مؤسستك عدة مئات من الموظفين، فمن الواضح تماماً في هذه المرحلة أنّ النموذج الهجين هو الأكثر فاعلية. (أما إذا وصلت إلى هذا النطاق، فإنّ النموذج الموزع بالكامل قد يكون منطقياً، لكن قلة قليلة من الشركات تعمل بهذا الأسلوب).
في النموذج الهجين، فإنّ المركزية في هيكلية تقديم التقارير تمكّن علماء البيانات من التطور وتسلق سلم وظيفي مخصص لهم، وتمكنهم أيضاً من النمو وإجراء تقييم لهم مقابل نظرائهم، وتضمن مشاركة أفضل الممارسات وتسهلها من خلالهم، لأنهم، ببساطة، ليسوا معزولين عن البقية. (يُعتبر إنشاء مجموعة الأقران هذه أمراً جوهرياً، لأن علماء البيانات هم أشخاص يرغبون في النمو والتعلم من بعضهم البعض). وينجم عن هيكل تنظيم تقديم التقارير تمكين القائد من تعزيز التنقل الداخلي بسهولة أكبر عبر مجموعات الأعمال، لأن عملية التلقيح عبر الشركة هذه عادة ما تكون ذات فائدة كبيرة.
وفي الوقت نفسه، فإنّ التضمين داخل مجموعات الأعمال يمكّن علماء البيانات من إثبات أنفسهم كخبراء في هذا المجال ضمن مجموعة العمل، إضافة إلى تطوير علاقة مع شركاء العمل كجزء أساسي من الفريق. كما ستوفر هذه الشراكة لعلماء البيانات سياق عمل غني يمكنهم من تحقيق التأثير الأمثل من خلال الفهم الفعلي وتوجيه أولويات العمل التي يجب تناولها باستخدام البيانات، وكيفية إتمام ذلك.
ما الذي يحتاجه علماء البيانات لإحراز النجاح؟
رغم اختلاف تخصصات أو مهمات الأنواع المختلفة من علماء البيانات، إلا أنّ هناك بعض الأمور التي يحتاجون إليها جميعاً لبلوغ النجاح؛ إنهم بحاجة إلى شركاء عمل يمكنهم مساعدتهم في الاندماج في خط العمل الرئيس وخط الإنتاج. وهم بحاجة أيضاً إلى شركاء فيما يتعلق بالبيانات، مثل مهندسي تطبيقات البرمجيات، ومهندسي البنية التحتية للبيانات، الذين يساعدون في ضمان أنّ أدوات البيانات الأساسية وتغذية البيانات اللازمة صحيحة وكاملة ومتاحة. وهم بحاجة إلى قادة لديهم الاستعداد للاستثمار في الأسس اللازمة لعملهم، بما في ذلك جودة البيانات وإدارتها وعرضها، وتنظيم منصات الوصول، وبناء ثقافة تسعى لأن تكون البيانات جزءاً من عملية تطوير الأعمال والمنتجات. والسر الذي يكمن وراء تحقيق هذا هو إتاحة الوقت المناسب (وهو ما يستهان به غالباً) ضمن عملية تطوير البيانات والقياس. إذ كثيراً ما تنظر فرق المنتجات والبرمجة إلى البيانات وعمليات القياس على أنها شيء يمكن "إضافته" بسرعة في النهاية.
نصيحة أخيرة لمن هو بصدد توظيف علماء البيانات: ابحث عن الأشخاص الذين يعشقون حل المشكلات وليس الذين يفضلون العمل على حلول أو طرائق محددة، وابحث أيضاً عن الأشخاص المتعاونين للغاية. وبغض النظر عن نوع عالم البيانات الذي ستعينه، لكي تضمن نجاحه يجب أن يكون قادراً على العمل جنباً إلى جنب مع طائفة متنوعة من المهام الوظيفية الأخرى، من المهندسين إلى مدراء المنتجات والمسوقين والفرق التنفيذية. وأخيراً، ابحث عن الأشخاص الذين يتمتعون بدرجة عالية من النزاهة؛ فنحن كمجتمع لدينا مسؤولية اجتماعية فيما يتعلق باستخدام البيانات لأجل الخير وبكثير من الالتزام، لهذا يتحمل علماء البيانات مسؤولية إدارة البيانات داخل المؤسسة التي يعملون بها وخارجها.
اقرأ أيضاً: التجارب المستقبلية للأدوية سوف تفضي إلى تقديم بيانات أفضل ومراقبة مستمرة