البيانات الضخمة (Big Data): عبارة عن مجموعة كبيرة من البيانات والتي تتضمن معلومات وصوراً وأرقاماً وتسجيلات صوتية وغيرها، وهذه البيانات غالباً ما تكون معقدة بحيث يصعب تحليلها باستخدام وسيلة أو أداة واحدة فقط.

تتميز هذه البيانات بكونها ضخمة وبالتالي لا يمكن أن تتوفر في أجهزتنا الخاصة، بل يمكن أن تكون في منصات وسائل التواصل الاجتماعي مثلاً، أي أن موقعاً كفيسبوك أو تويتر، يمكن أن يتضمن بيانات ضخمة، كونه يحتوي على الملايين من الحسابات العائدة لأشخاص.

يجب أن تتوفر عدة عوامل لاعتبار البيانات ضخمة، أهمها الحجم وسرعة تدفقها وتنوعها، أي تكون أشكالها متنوعة بين الصور والأرقام والتسجيلات الصوتية وغيرها. 

هناك نوعان من البيانات، البعض منظم والآخر غير منظم،  أما عن استخدامها، فإنها تستخدم في العديد من المجالات، لأنها تتضمن إجابات عن أسئلة كثيرة، ولذلك فهي مستخدمة في القطاع الصحي والمصرفي والصناعي وغيرها. 

يعرف معهد ماكنزي البيانات الضخمة على أنها مجموعة من البيانات التي تمتلك حجماً يصعب تخزينه أو تحليله أو إدارته بواسطة أدوات قواعد البيانات التقليدية. 

تعد هادوب (Hadoop) من أفضل تقنيات التعامل مع البيانات الضخمة، وهي مكتبة مفتوحة المصدر مناسبة للتعامل مع البيانات الضخمة المتنوعة والسريعة، وتستخدم شركات كبرى خدمة هادوب، مثلاً هناك لينكد إن الشبكة الاجتماعية المتخصصة بالوظائف والعمل تستخدم الخدمة من أجل توليد أكثر من 100 مليار مقترح على المستخدمين أسبوعياً.

أرسل لنا اقتراحاتك لتطوير محتوى المفاهيم

error: المحتوى محمي !!