ما هي البيانات الضخمة؟
البيانات الضخمة (Big Data): مجموعة ضخمة من البيانات تشمل صوراً وأرقاماً وتسجيلات صوتية وغيرها من البيانات الخام، وتكون هذه البيانات في معظم الأحيان معقدة ويصعب تحليلها باستخدام وسيلة أو أداة تحليل واحدة فقط. ويعرّف معهد ماكنزي البيانات الضخمة على أنها: مجموعة من البيانات التي تمتلك حجماً يصعب تخزينه أو تحليله أو إدارته بواسطة قواعد البيانات التقليدية.
فهم البيانات الضخمة
تتميز البيانات ضخمة بعدة سمات؛ أهمها الحجم وسرعة تدفقها وتنوعها، أي تكون أشكالها متنوعة بين الصور والأرقام والتسجيلات الصوتية وغيرها.
لا يمكن استخراج البيانات الضخمة من أجهزة شخصية بسيطة، وإنما يكمن مصدرها في منصات عملاقة مثل وسائل التواصل الاجتماعي، فمواقع مثل فيسبوك أو تويتر، يمكن أن تضم بيانات ضخمة لملايين المستخدمين.
تعد هادوب (Hadoop) من أفضل أدوات التعامل مع البيانات الضخمة، وهي مكتبة مفتوحة المصدر مناسبة للتعامل مع البيانات الضخمة المتنوعة والسريعة، وتستخدم شركات كبرى خدمة هادوب. على سبيل المثال، تستخدم لينكد إن الشبكة الاجتماعية المتخصصة بالوظائف والعمل، خدمة هادوب من أجل توليد أكثر من 100 مليار مقترح على المستخدمين أسبوعياً.
أنواع البيانات الضخمة
تُصنف البيانات الضخمة إلى ثلاثة أنواع، وهي:
- البيانات المنظمة: هي البيانات التي يمكن تخزينها والوصول إليها ومعالجتها وتكون موجودة في مخطط منظم أو جدولي، ما يسهل التحليل والفرز، وهي ذات قيمة عالية للغاية، وتتيح جمع البيانات من مواقع مختلفة في قاعدة البيانات بسرعة.
- البيانات غير المنظمة: أي بيانات ذات شكل أو بنية غير معروفة أو محددة مسبقاً ويصعب تفسيرها أو تحليلها بواسطة قواعد البيانات القياسية أو نماذج البيانات، مثل مصدر بيانات غير متجانس يحتوي على مجموعة من الملفات النصية البسيطة والصور ومقاطع الفيديو.
- البيانات شبه المنظمة: هي مزيج من كلا شكلي البيانات المنظم وغير المنظم، هذا يعني أنها ترث بعض خصائص البيانات المنظمة ولكنها مع ذلك تحتوي على معلومات تفشل في الحصول على بنية محددة ولا تتوافق مع قواعد البيانات العلائقية أو الهياكل الرسمية لنماذج البيانات، مثل البيانات الممثلة في ملف إكس إم إل (XML).
استخدامات البيانات الضخمة
تُستخدم البيانات الضخمة في مجالات متنوعة مثل التأمين، والبنوك والأوراق المالية، والاتصالات والإعلام والترفيه، ومقدمي الرعاية الصحية، والتعليم، والتصنيع، والطاقة. وعموماً تعتمد معظم الشركات مشاريع البيانات الضخمة بهدف تحسين تجربة العملاء، وخفض التكلفة، وتوجيه التسويق بطريقة أفضل، وزيادة كفاءة العمليات الحالية.
- يمكنك الاطلاع على: لماذا لن تحول البيانات الضخمة وتعلم الآلة دون حدوث أزمة مالية أخرى؟.
أمثلة على البيانات الضخمة
يوجد عدد كبير من الأمثلة على البيانات الضخمة، ومنها:
- يمكن لأنظمة تحديد المواقع اكتشاف الاختناقات المرورية في المنطقة التي يفحصها المستخدم واقتراح البدائل؛
- تراقب الساعات الذكية معدل ضربات القلب لملايين المستخدمين وتحدد الأنماط التي يمكنها توقع أمراض القلب والأوعية الدموية والوقاية منها؛
- تخطط مستشعرات الرطوبة في حقول المحاصيل وتيرة الري، وتجمع بياناتها مع تنبؤات الطقس؛
اقرأ أيضاً: