البيانات الضخمة (Big Data): مجموعة ضخمة من البيانات تشمل صوراً وأرقاماً وتسجيلات صوتية وغيرها من البيانات الخام، وتكون هذه البيانات في معظم الأحيان معقدة ويصعب تحليلها باستخدام وسيلة أو أداة تحليل واحدة فقط. ويعرّف معهد ماكنزي البيانات الضخمة على أنها: مجموعة من البيانات التي تمتلك حجماً يصعب تخزينه أو تحليله أو إدارته بواسطة قواعد البيانات التقليدية.
تتميز البيانات ضخمة بعدة سمات؛ أهمها الحجم وسرعة تدفقها وتنوعها، أي تكون أشكالها متنوعة بين الصور والأرقام والتسجيلات الصوتية وغيرها.
لا يمكن استخراج البيانات الضخمة من أجهزة شخصية بسيطة، وإنما يكمن مصدرها في منصات عملاقة مثل وسائل التواصل الاجتماعي، فمواقع مثل فيسبوك أو تويتر، يمكن أن تضم بيانات ضخمة لملايين المستخدمين.
تعد هادوب (Hadoop) من أفضل أدوات التعامل مع البيانات الضخمة، وهي مكتبة مفتوحة المصدر مناسبة للتعامل مع البيانات الضخمة المتنوعة والسريعة، وتستخدم شركات كبرى خدمة هادوب. على سبيل المثال، تستخدم لينكد إن الشبكة الاجتماعية المتخصصة بالوظائف والعمل، خدمة هادوب من أجل توليد أكثر من 100 مليار مقترح على المستخدمين أسبوعياً.
تُصنف البيانات الضخمة إلى ثلاثة أنواع، وهي:
تُستخدم البيانات الضخمة في مجالات متنوعة مثل التأمين، والبنوك والأوراق المالية، والاتصالات والإعلام والترفيه، ومقدمي الرعاية الصحية، والتعليم، والتصنيع، والطاقة. وعموماً تعتمد معظم الشركات مشاريع البيانات الضخمة بهدف تحسين تجربة العملاء، وخفض التكلفة، وتوجيه التسويق بطريقة أفضل، وزيادة كفاءة العمليات الحالية.
يوجد عدد كبير من الأمثلة على البيانات الضخمة، ومنها:
اقرأ أيضاً: