تمت عملية الاشتراك بنجاح

إغلاق

عذراً، أنت مشترك مسبقاً بالنشرة البريدية

إغلاق

وفّر 50٪ من خلال الاشتراك السنوي في مجرة واحصل على تصفح لا محدود لأفضل محتوى عربي على الإنترنت.

اشترك الآن
content_cookies111:string(2096) "{"id":194446,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/%D8%A7%D9%84%D9%85%D9%81%D8%A7%D9%87%D9%8A%D9%85-%D8%A7%D9%84%D8%A5%D8%AF%D8%A7%D8%B1%D9%8A%D8%A9\/%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA-%D8%BA%D9%8A%D8%B1-%D9%85%D9%86%D8%B8%D9%85%D8%A9\/","REDIRECT_W3TC_SSL":"_ssl","REDIRECT_W3TC_ENC":"_gzip","REDIRECT_STATUS":"200","W3TC_SSL":"_ssl","W3TC_ENC":"_gzip","HTTP_HOST":"hbrarabic.com","HTTP_ACCEPT_ENCODING":"gzip","HTTP_X_FORWARDED_FOR":"35.175.191.46","HTTP_CF_RAY":"80ffaa440ce35872-FRA","HTTP_X_FORWARDED_PROTO":"https","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_CDN_LOOP":"cloudflare","HTTP_CF_CONNECTING_IP":"35.175.191.46","HTTP_CF_IPCOUNTRY":"US","HTTP_X_FORWARDED_HOST":"hbrarabic.com","HTTP_X_FORWARDED_SERVER":"hbrarabic.com","HTTP_CONNECTION":"Keep-Alive","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"
Apache\/2.4.52 (Debian) Server at hbrarabic.com Port 80<\/address>\n","SERVER_NAME":"hbrarabic.com","SERVER_ADDR":"172.18.0.3","SERVER_PORT":"80","REMOTE_ADDR":"35.175.191.46","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"[email protected]","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"53780","REDIRECT_URL":"\/\u0627\u0644\u0645\u0641\u0627\u0647\u064a\u0645-\u0627\u0644\u0625\u062f\u0627\u0631\u064a\u0629\/\u0628\u064a\u0627\u0646\u0627\u062a-\u063a\u064a\u0631-\u0645\u0646\u0638\u0645\u0629\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1696278226.6476,"REQUEST_TIME":1696278226,"argv":[],"argc":"0","HTTPS":"on"},"user_ip":"35.175.191.46","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
check_post_to_show:object(stdClass)#2450 (13) {
  ["is_valid"]=>
  int(1)
  ["global_remaining_posts_to_view"]=>
  int(0)
  ["remaining_posts_to_view"]=>
  int(0)
  ["number_all_post"]=>
  int(0)
  ["number_post_read"]=>
  int(0)
  ["exceeded_daily_limit"]=>
  int(0)
  ["is_watched_before"]=>
  int(0)
  ["user_agent"]=>
  string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)"
  ["user_ip"]=>
  string(13) "35.175.191.46"
  ["user_header"]=>
  object(stdClass)#2440 (47) {
    ["SERVER_SOFTWARE"]=>
    string(22) "Apache/2.4.52 (Debian)"
    ["REQUEST_URI"]=>
    string(186) "/%D8%A7%D9%84%D9%85%D9%81%D8%A7%D9%87%D9%8A%D9%85-%D8%A7%D9%84%D8%A5%D8%AF%D8%A7%D8%B1%D9%8A%D8%A9/%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA-%D8%BA%D9%8A%D8%B1-%D9%85%D9%86%D8%B8%D9%85%D8%A9/"
    ["REDIRECT_W3TC_SSL"]=>
    string(4) "_ssl"
    ["REDIRECT_W3TC_ENC"]=>
    string(5) "_gzip"
    ["REDIRECT_STATUS"]=>
    string(3) "200"
    ["W3TC_SSL"]=>
    string(4) "_ssl"
    ["W3TC_ENC"]=>
    string(5) "_gzip"
    ["HTTP_HOST"]=>
    string(13) "hbrarabic.com"
    ["HTTP_ACCEPT_ENCODING"]=>
    string(4) "gzip"
    ["HTTP_X_FORWARDED_FOR"]=>
    string(13) "35.175.191.46"
    ["HTTP_CF_RAY"]=>
    string(20) "80ffaa440ce35872-FRA"
    ["HTTP_X_FORWARDED_PROTO"]=>
    string(5) "https"
    ["HTTP_CF_VISITOR"]=>
    string(22) "{\"scheme\":\"https\"}"
    ["HTTP_USER_AGENT"]=>
    string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)"
    ["HTTP_ACCEPT"]=>
    string(63) "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"
    ["HTTP_ACCEPT_LANGUAGE"]=>
    string(14) "en-US,en;q=0.5"
    ["HTTP_CDN_LOOP"]=>
    string(10) "cloudflare"
    ["HTTP_CF_CONNECTING_IP"]=>
    string(13) "35.175.191.46"
    ["HTTP_CF_IPCOUNTRY"]=>
    string(2) "US"
    ["HTTP_X_FORWARDED_HOST"]=>
    string(13) "hbrarabic.com"
    ["HTTP_X_FORWARDED_SERVER"]=>
    string(13) "hbrarabic.com"
    ["HTTP_CONNECTION"]=>
    string(10) "Keep-Alive"
    ["PATH"]=>
    string(60) "/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"
    ["SERVER_SIGNATURE"]=>
    string(73) "
Apache/2.4.52 (Debian) Server at hbrarabic.com Port 80
" ["SERVER_NAME"]=> string(13) "hbrarabic.com" ["SERVER_ADDR"]=> string(10) "172.18.0.3" ["SERVER_PORT"]=> string(2) "80" ["REMOTE_ADDR"]=> string(13) "35.175.191.46" ["DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["REQUEST_SCHEME"]=> string(4) "http" ["CONTEXT_PREFIX"]=> NULL ["CONTEXT_DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["SERVER_ADMIN"]=> string(20) "[email protected]" ["SCRIPT_FILENAME"]=> string(23) "/var/www/html/index.php" ["REMOTE_PORT"]=> string(5) "53780" ["REDIRECT_URL"]=> string(66) "/المفاهيم-الإدارية/بيانات-غير-منظمة/" ["GATEWAY_INTERFACE"]=> string(7) "CGI/1.1" ["SERVER_PROTOCOL"]=> string(8) "HTTP/1.1" ["REQUEST_METHOD"]=> string(3) "GET" ["QUERY_STRING"]=> NULL ["SCRIPT_NAME"]=> string(10) "/index.php" ["PHP_SELF"]=> string(10) "/index.php" ["REQUEST_TIME_FLOAT"]=> float(1696278226.6476) ["REQUEST_TIME"]=> int(1696278226) ["argv"]=> array(0) { } ["argc"]=> string(1) "0" ["HTTPS"]=> string(2) "on" } ["content_user_category"]=> string(4) "paid" ["content_cookies"]=> object(stdClass)#2442 (3) { ["status"]=> int(0) ["sso"]=> object(stdClass)#2456 (2) { ["content_id"]=> int(1469) ["client_id"]=> string(36) "e2b36148-fa88-11eb-8499-0242ac120007" } ["count_read"]=> NULL } ["is_agent_bot"]=> int(1) }

بيانات غير منظمة

بيانات غير منظمة (Unstructured Data): تُسمى أيضاً "بيانات غير مهيكلة"، وهي بيانات غير منظمة ولا مرتبة سواء كانت في شكل جداول أو صور. ويعد تنظيم هذه البيانات غير المنظمة جزءاً من مهمة عالم البيانات حتى يتسنى له تحليلها. وتقدم اللغة الطبيعية أو النص أوضح مثال على ذلك. أحد الأساليب الشائعة لتحويل البيانات النصية إلى بيانات منظمة هو استعراضها كعدد كلمات، بحيث تُحول "القطة طاردت الفأر" إلى "(القطة،1)، (طاردت،1)، (الفأر،1). يسمى هذا نموذج حقيبة الكلمات، وهو يتيح لنا مقارنة النصوص وحساب المسافات بينها ودمجها في مجموعات. ويقدم نموذج حقيبة الكلمات أداء مدهشاً للعديد من التطبيقات العملية، إذ يكمن جزء من العملية في تحويل البيانات النصية إلى أرقام بحيث يمكننا إدخالها إلى النماذج التنبؤية، كما تسمح هذه الأساليب بتحليل الميول (هل النص إيجابي أم سلبي أم محايد؟) وتصنيف النص (هل المقال خبري أم ترفيهي أم رياضي؟)، وذلك من بين أشياء أخرى كثيرة. وللحصول على مثال حديث لتصنيف النص، راجع النموذج الأولي "نيوزي" (Newsie) لشركة "كلاوديرا فاست فوروارد لابس" (Cloudera Fast Forward Labs).

 

error: المحتوى محمي !!