علم البيانات (Data Science): هو علم مستند إلى البيانات؛ يجمع بين الخبرة في مجال معين ومهارات البرمجة، ومعرفة الرياضيات والإحصاء؛ لاستخراج معلومات مفيدة من كميات كبيرة من البيانات المعقدة أو الضخمة.
صاغ مصطلح علم البيانات عالم الحاسوب الدنماركي "بيتر ناور" (Peter Naur) عام 1974، ليكون بديلاً عن مصطلح "علوم الكمبيوتر"؛ الذي كان شائعاً قبل ذلك.
يتألف علم البيانات من أربع مكونات أساسية:
يفيد علم البيانات في عمليات صنع القرار ضمن العديد من التخصصات منها؛ التعدين، والإحصاءات، والتعلم الآلي، والتحليلات، والبرمجة، وذلك من خلال تحليل البيانات لاستخراج المعلومات القيّمة منها، وتحويلها إلى ميزة تجارية يمكن أن تساعد في اكتشاف الاحتيال باستخدام خوارزميات التعلم الآلي المتقدمة ومنع أي خسائر مالية كبيرة، وتتيح إجراء تحليل المشاعر لقياس ولاء العملاء للعلامة التجارية.
يركز علم البيانات على إيجاد ارتباطات ذات مغزى بين مجموعات البيانات الكبيرة، في حين يُسعى تحليل البيانات إلى الكشف عن تفاصيل الرؤى المستخرجة. ويعدّ تحليل البيانات أحد فروع علم البيانات الذي يركز على إيجاد إجابات أكثر تحديداً للأسئلة التي يطرحها علم البيانات.
اقرأ أيضاً: