مستودع البيانات Data Warehouse

ما هو مستودع البيانات؟

مستودع البيانات (Data Warehouse .DW): مجموعة ضخمة من البيانات المنطقية يتم تجميعها من مختلف مصادر البيانات الخاصة بالشركة. يُقاس حجم مستودعات البيانات بالتيرابايت (Terabyte)، وتعرّف ايضاً بأنها عبارة عن نموذج لقاعدة بيانات ضخمة تعزز قدرات المدراء لتحليل البيانات وبسرعة كبيرة من أبعاد مختلفة.

يعود ظهور هذا المصطلح إلى بداية سبعينيات القرن الماضي، لكن تجسيد الفكرة في أرض الواقع كان في عام 1988 من طرف فريق من الباحثين 1988 في شركة “آي بي إم” (IBM) الذين لم ينجحوا في المحاولة الأولى، ثم نجح فريق آخر ببناء نموذج متكامل لمستودعات البيانات بين عامي 1989 و1991.

اسُخدم أول مستودع بيانات في مجال البنوك والتأمينات عام 1997، وكان هذا المستودع من ابتكار الباحث “شون” (Sean).

خصائص مستودع البيانات

تتميز مستودعات البيانات بتقنيات تساعد في تحليل كمّ كبير من البيانات بواسطة تحليلات معقدة وإنشاء جداول افتراضية ذات أبعاد متعددة.

مقالات قد تهمك:

الفرق بين مستودعات البيانات وقواعد البيانات

يمكن تلخيص أهم الإختلافات التي تميّز مستودعات البيانات (DM) عن قواعد البيانات (DB) فيما يلي:

  • يتم تحديث مستودعات البيانات بطريقة دورية ( أسبوعياً أو شهرياً أو فترة أخرى)، بينما يتم تحديث قواعد البيانات بصفة مستمرة طوال الوقت. 
  • تُستخدم البيانات الموجودة في مستودعات البيانات للإطلاع فقط، بينما يتم تدقيق وتصحيح البيانات الموجودة في قواعد البيانات.
  • تستخدم مخرجات قواعد البيانات لدعم القرارات، بينما تُستخدم مخرجات مستودعات البيانات لمعرفة تأثير القرارات وتحليل الاستجابة لما بعد اتخاذها.

خطوات بناء مستودع البيانات

تنطوي عملية بناء مستودع البيانات على مجموعة خطوات تتمثل في التالي:

  • تحديد الغايات المراد تحقيقها من المستودعات، سواء غاية الشركة أو القسم الذي سيجمع المستودع بياناته.
  • جمع المعلومات حول الأساليب والمقاييس المستخدمة لقياس النجاح، وأنواع تحليل البيانات التي تجريها الشركة وعدد مرات إجرائها، والبيانات المستخدمة لذلك.
  • تحليل المعلومات السابقة وتحديد مصادر البيانات، وأنواع البيانات، وحجم المعلومات، بالإضافة إلى جودتها، ومواعيد تحديثها، ونمذجة البيانات وترتيبها.
  • تنطوي المرحلة قبل الأخيرة على إطلاق مستودع البيانات.
  • في النهاية يتطلب المستودع المتابعة وإجراء الصيانة دورياً.

أنواع مستودعات البيانات

توجد ثلاثة أنواع من مستودعات البيانات وهي:

  • مستودع بيانات المؤسسة (Enterprise Data Warehouse): يتضمن هذا المستودع بيانات تكون متاحة على مستوى المؤسسة.
  • مخزن البيانات التشغيلية (Operational Data Store): تجمع هذه المستودعات البيانات مثل البيانات الخاصة بقوى العمل أو مبيعات العملاء، وتخزنها وتعالجها، وتربطها بمستودع بيانات المؤسسة.
  • سوق البيانات (Data Mart): يركز هذا النوع من المستودعات على تخزين المعلومات الخاصة بقسم محدد في الشركة أو خط عمل محدد، على سبيل المثال بيانات قسم إدارة الشؤون المالية.

اقرأ أيضاً: