facebook
twitter
whatsapp
email
linkedin
messenger
تعد البيانات السيئة العدو رقم واحد لانتشار التعلم الآلي واستخدامه المربح. وفي ما بقيت الملاحظة المليئة بالسخرية حول البيانات: "أدخل القمامة، تحصل على القمامة"، تقض مضاجع المحللين وصنّاع القرارات لأجيال متتالية، إلا أنها تطلق إنذاراً خاصاً بالنسبة للتعلم الآلي. فمتطلبات الجودة بالنسبة للتعلم الآلي مرتفعة وقاسية جداً، وهنا تطل البيانات السيئة برأسها القميء مرتين– مرة عندما تستخدم البيانات التاريخية لتعليم النموذج التنبؤي، ومرة أخرى عندما تستخدم البيانات الجديدة كمدخل للنموذج لكي يخرج علينا بتنبؤات وقرارات مستقبلية.
إعلان: أفضل استثمار في رمضان، افتح أبواباً من النمو والفرص واحصل على خصم رمضان التشجيعي 40% لتستثمر فيما يساعدك على بناء نفسك وفريقك ومؤسستك، تعرف على ميزات الاشتراك.

ولتعليم وتدريب النموذج التنبؤي بشكل صحيح، يتعين على البيانات التاريخية أن تحقق معايير جودة واسعة النطاق وعالية المستوى. فمن جهة، يجب أن تكون البيانات صحيحة: أي دقيقة، وموسومة بشكل صحيح، وخالية من التكرار، وما إلى ذلك؛ ومن جهة أخرى يتعين عليك أيضاً أن تستخدم البيانات الصحيحة – أي استخدام كم وافر من البيانات غير المنحازة ذات الصلة بالطيف الكامل للمدخلات التي يهدف المرء إلى تطوير النموذج التنبؤي على أساسها. وغالباً ما تركز جهود ضمان الجودة على أحد هذين المعيارين دون الآخر، غير أنّ تعلم

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

ﺟﻣﯾﻊ اﻟﺣﻘوق ﻣﺣﻔوظﺔ ﻟﺷرﻛﺔ ھﺎرﻓﺎرد ﺑزﻧس ﺑﺑﻠﯾﺷﻧﻎ، ﺑوﺳطن، اﻟوﻻﯾﺎت اﻟﻣﺗﺣدة اﻷﻣﯾرﻛﯾﺔ - 2021

اترك تعليق

قم بـ تسجيل الدخول لتستطيع التعليق
avatar
  شارك  
التنبيه لـ
error: المحتوى محمي !!