تمت عملية الاشتراك بنجاح

إغلاق

عذراً، أنت مشترك مسبقاً بالنشرة البريدية

إغلاق
facebook
twitter
whatsapp
email
linkedin
messenger
تعد البيانات السيئة العدو رقم واحد لانتشار التعلم الآلي واستخدامه المربح. وفي ما بقيت الملاحظة المليئة بالسخرية حول البيانات: "أدخل القمامة، تحصل على القمامة"، تقض مضاجع المحللين وصنّاع القرارات لأجيال متتالية، إلا أنها تطلق إنذاراً خاصاً بالنسبة للتعلم الآلي. فمتطلبات الجودة بالنسبة للتعلم الآلي مرتفعة وقاسية جداً، وهنا تطل البيانات السيئة برأسها القميء مرتين– مرة عندما تستخدم البيانات التاريخية لتعليم النموذج التنبؤي، ومرة أخرى عندما تستخدم البيانات الجديدة كمدخل للنموذج لكي يخرج علينا بتنبؤات وقرارات مستقبلية.
ولتعليم وتدريب النموذج التنبؤي بشكل صحيح، يتعين على البيانات التاريخية أن تحقق معايير جودة واسعة النطاق وعالية المستوى. فمن جهة، يجب أن تكون البيانات صحيحة: أي دقيقة، وموسومة بشكل صحيح، وخالية من التكرار، وما إلى ذلك؛ ومن جهة أخرى يتعين عليك أيضاً أن تستخدم البيانات الصحيحة – أي استخدام كم وافر من البيانات غير المنحازة ذات الصلة بالطيف الكامل للمدخلات التي يهدف المرء إلى تطوير النموذج التنبؤي على أساسها. وغالباً ما تركز جهود ضمان الجودة على أحد هذين المعيارين دون الآخر، غير أنّ تعلم الآلة يتطلب التركيز على كليهما معاً.
اقرأ أيضاً: أنظمة مكافحة الاحتكار ومنع الشركات من جمع كم هائل من البيانات
ومع ذلك نجد اليوم

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

جميع الحقوق محفوظة لشركة هارفارد بزنس ببليشنغ، بوسطن، الولايات المتحدة الاميركية - 2021

اترك تعليق

قم بـ تسجيل الدخول لتستطيع التعليق
avatar
  شارك  
التنبيه لـ
error: المحتوى محمي !!