تمت عملية الاشتراك بنجاح

إغلاق

عذراً، أنت مشترك مسبقاً بالنشرة البريدية

إغلاق
اشترك

الاستمرار بالحساب الحالي

سجل الدخول الآن للاستماع الى المقال
تعد البيانات السيئة العدو رقم واحد لانتشار التعلم الآلي واستخدامه المربح. وفي ما بقيت الملاحظة المليئة بالسخرية حول البيانات: "أدخل القمامة، تحصل على القمامة"، تقض مضاجع المحللين وصنّاع القرارات لأجيال متتالية، إلا أنها تطلق إنذاراً خاصاً بالنسبة للتعلم الآلي. فمتطلبات الجودة بالنسبة للتعلم الآلي مرتفعة وقاسية جداً، وهنا تطل البيانات السيئة برأسها القميء مرتين– مرة عندما تستخدم البيانات التاريخية لتعليم النموذج التنبؤي، ومرة أخرى عندما تستخدم البيانات الجديدة كمدخل للنموذج لكي يخرج علينا بتنبؤات وقرارات مستقبلية.
ولتعليم وتدريب النموذج التنبؤي بشكل صحيح، يتعين على البيانات التاريخية أن تحقق معايير جودة واسعة النطاق وعالية المستوى. فمن جهة، يجب أن تكون البيانات صحيحة: أي دقيقة، وموسومة بشكل صحيح، وخالية من التكرار، وما إلى ذلك؛ ومن جهة أخرى يتعين عليك أيضاً أن تستخدم البيانات الصحيحة – أي استخدام كم وافر من البيانات غير المنحازة ذات الصلة بالطيف الكامل للمدخلات التي يهدف المرء إلى تطوير النموذج التنبؤي على أساسها. وغالباً ما تركز جهود ضمان الجودة على أحد هذين المعيارين دون الآخر، غير أنّ تعلم الآلة يتطلب التركيز على كليهما معاً.
اقرأ أيضاً: أنظمة مكافحة الاحتكار ومنع الشركات من جمع كم هائل من البيانات
ومع ذلك نجد اليوم
look

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

جميع الحقوق محفوظة لشركة هارفارد بزنس ببليشنغ، بوسطن، الولايات المتحدة الاميركية 2022