لماذا لم يكن ظهور شركة ديب سيك مفاجئاً؟

6 دقيقة
شركة ديب سيك
أناضول/ غيتي إميدجيز

فاجأت شركة ديب سيك (DeepSeek) الصينية الناشئة في مجال الذكاء الاصطناعي العديد من المراقبين في الشهر الماضي عندما كشفت عن نموذجها الجديد في 20 يناير/كانون الثاني، إذ ينافس هذا النموذج نماذج شركات الذكاء الاصطناعي الأميركية الرائدة مثل شركتي أوبن أيه آي (OpenAI) وميتا (Meta) على الرغم من أنه أصغر حجماً وأكثر كفاءة وأقل تكلفة سواء في التدريب أو التشغيل.

وعلى الرغم من ذلك، فنجاح هذه الشركة الصينية كان متوقعاً وفقاً لنظرية الإدارة، ولا سيما نظرية الابتكار المزعزع؛ إذ يركز الابتكار المزعزع في جوهره على تقديم البدائل المنخفضة التكلفة، التي قد لا تكون متطورة، ولكن أداءها مقبول ويلبي احتياجات العديد من المستخدمين. ويبدو أن هذا هو الأسلوب الذي اتبعته شركة ديب سيك لإحداث هذا الأثر الذي تحدى بعض الافتراضات الأساسية في قطاع الذكاء الاصطناعي في الولايات المتحدة وأدى إلى انخفاض أسهم شركات التكنولوجيا والطاقة نتيجة لذلك.

إذا كانت نظرية الإدارة تساعد في تفسير ما حدث، فإنها تقدم أيضاً رؤى ثاقبة حول التطورات المحتملة في المستقبل. استناداً إلى نظريات التغير التكنولوجي، نسلّط الضوء على الآثار المترتبة على هذه الزعزعة بالنسبة للشركات العالمية؛ إذ يواجه قادة هذه الشركات تحدياً يتمثل في اتخاذ القرار المناسب بشأن الاعتماد على النماذج اللغوية الكبيرة الصينية أو الأميركية أو الإبقاء على الخيارات مفتوحة وعدم اتخاذ قرار نهائي بشأن الالتزام بنموذج معين.

الاختلافات بين النماذج اللغوية الكبيرة الصينية والأميركية

من المهم الإشارة أولاً إلى أن النماذج اللغوية الكبيرة الصينية تختلف عن نظيراتها الأميركية في جانبين رئيسيين:

1) تستخدم الشركات الصينية غالباً أجهزة أقل تكلفة وتستفيد من بنية مفتوحة المصدر لخفض التكاليف، 2) يركز العديد من النماذج اللغوية الكبيرة (LLMs) الصينية على تطبيقات مخصصة لمجالات محددة وليس للمهام العامة. وعلى الرغم من ذلك، فإن نماذج مثل ديب سيك-آر 1 (DeepSeek-R1) تبرز بوصفها نماذج استدلال أكثر شمولية وقادرة على التعامل مع مجموعة أوسع من المهام.

تُدرَّب النماذج اللغوية الكبيرة الأميركية عادة على مجموعات من وحدات معالجة الرسومات المتطورة التي تتضمن عشرات الآلاف من أحدث الرقائق التي تصممها شركة إنفيديا (NVIDIA)، ما يتطلب استثماراً رأسمالياً هائلاً وبنية تحتية سحابية ضخمة. في المقابل، يعتمد معظم النماذج اللغوية الكبيرة الصينية على التدريب الموزع باستخدام مجموعة من وحدات معالجة الرسوميات الأقل كفاءة، ويعود ذلك جزئياً إلى القيود المفروضة على تصدير الرقائق المتطورة. لكن على الرغم من ذلك، فإن هذه النماذج تحقق أداءً تنافسياً، وإن لم يكن متطوراً، من خلال اعتماد بنية أكثر كفاءة، فنرى على سبيل المثال أن البنى التي تستخدمها شركة ديب سيك في نماذجها، وتشمل بنية "الانتباه الكامن المتعدد الرؤوس" (MLA) وبنية "مزيج الخبراء" (MOE)، صُممت لتقليل استهلاك الذاكرة، ما يسمح باستخدام موارد الحوسبة بكفاءة أكبر.

كما يؤدي تبنّي قواعد الرموز البرمجية المفتوحة المصدر دوراً حاسماً في تطوير النماذج اللغوية الكبيرة  الصينية. أُصدر كل من نموذجي ديب سيك -في 3 (DeepSeek-V3)، وهو النموذج الأساسي الذي يدعم أحدث نظام استدلالي، وديب سيك- آر 1 بموجب رخصة معهد ماساتشوستس للتكنولوجيا (MIT) المفتوحة المصدر. يتيح هذا الترخيص المرن والمتساهل تبنّي النموذج على نطاق واسع، من خلال السماح للمستخدمين باستخدام البرمجيات وتعديلها وتوزيعها بحرية، ويشمل ذلك الاستخدامات لأغراض تجارية، مع وجود قيود محدودة جداً. تتجلى ميزة هذه البنية الفعالة والنهج المفتوح المصدر بوضوح عند مقارنة تكاليف التدريب؛ إذ بلغت تكلفة تدريب نموذج ديب سيك-في 3 5.6 ملايين دولار فقط، في حين أنفقت شركات الذكاء الاصطناعي الأميركية مثل أوبن أيه آي وألفابت مبالغ تتراوح بين 40 مليون دولار و200 مليون دولار على تدريب نماذجها اللغوية الكبيرة.

بالإضافة إلى ذلك، على الرغم من أن النماذج الأميركية تركز على معالجة الاستعلامات العامة المدرّبة على مجموعات بيانات واسعة من مصادر عالمية، فإن العديد من النماذج اللغوية الكبيرة الصينية مصممة أيضاً لتحقيق دقة عالية في مجالات محددة. تعمل شركات التكنولوجيا الصينية العملاقة، مثل علي بابا (Alibaba) وتينسنت (Tencent) وبايدو (Baidu) وبايت دانس (ByteDance)، بالإضافة إلى الشركات الناشئة مثل شركة ديب سيك على توفير تطبيقات موجهة لقطاعات محددة تعتمد على نماذجها اللغوية الكبيرة المدمجة بعمق في المنظومات الرقمية الصينية.

باختصار، تعتمد النماذج اللغوية الكبيرة الصينية على أجهزة أقل تقدماً وتركز في البداية على تطبيقات متخصصة وأقل تعقيداً وشمولية تتطلب قدرات حاسوبية أقل، ويعني ذلك أن العديد من النماذج اللغوية الكبيرة الصينية منخفضة التكلفة. على سبيل المثال، تبلغ تكلفة استخدام نموذج كوين بلس (Qwen plus) التابع لشركة علي بابا ونموذج دوباو 1.5-برو (Doubao 1.5-pro) التابع لشركة بايت دانس أقل من 0.30 دولاراً لكل مليون وحدة أساسية من النص (توكن)، مقارنة بأكثر من 60 دولاراً لنموذج أو 1 (O1) الذي طوّرته شركة أوبن أيه آي ونموذج كلود 3.5 أوبس (Claude 3.5 Opus) الذي طوّرته شركة أنثروبيك (Anthropic).

هذا تطبيق واضح على نظرية الزعزعة، وهو يشبه الزعزعة التي تسببت بها مصانع الصلب الصغيرة للمصانع التقليدية الضخمة قبل عقود. تشير نظرية الزعزعة إلى أن التكنولوجيا التي تكون أقل كفاءة وتطوراً في بدايتها (مثل فرن القوس الكهربائي المستخدم في صناعة الفولاذ) والتي تكون مصممة لأداء مهام محددة ومنخفضة الجودة (مثل إنتاج الصلب المستخدم في قضبان التسليح المنخفضة الجودة) تشكّل تهديداً للمنتجين الذين يتميزون يجودة منتجاتهم في السوق (مثل مصانع الصلب التقليدية المتكاملة) الذين ينصب تركيزهم الوحيد على العملاء ذوي المتطلبات العالية الذين يوفرون هوامش ربح أكبر (مثل العملاء الذين يشترون صفائح الصلب العالية الجودة). يعمل المبتكرون على تحسين جودة منتجاتهم تدريجياً وباستمرار، ثم تبدأ الشركات القائمة بالانسحاب وفقدان حصتها السوقية شيئاً فشيئاً لصالحهم.

تشير نظرية الزعزعة إلى أن ظهور شركات مثل ديب سيك وتطورها كان متوقعاً، بل إنه من المتوقع أيضاً ظهور مبتكرين آخرين في الأشهر المقبلة. وبالتالي، يمكن أن تشكّل النماذج اللغوية الصغيرة (SLMs)، التي تستخدم بيانات وموارد أقل وتنتج محتوى أقل جودة، تحدياً لكل من النماذج اللغوية الأميركية والصينية في الأشهر المقبلة.

ما هي الخطوات القادمة؟

يطرح ظهور شركة ديب سيك سؤالاً في أروقة مجالس الإدارة حول العالم، وهو: هل يجب على الشركات أن تستثمر في ترخيص النماذج اللغوية الكبيرة الأميركية أم الصينية؟ أم الاعتماد على كليهما؟ في هذا السياق، يمكن الاستفادة من الرؤى الإدارية السابقة، ولا سيما تلك المتعلقة بالتنويع التكنولوجي.

تتمثل إحدى فوائد استخدام نماذج لغوية كبيرة متعددة داخل المؤسسة في تنويع المخاطر، فعند استخدام نماذج لغوية كبيرة متنوعة، يمكننا تخفيف آثار انقطاع الخدمة أو المشاكل التقنية لدى أحد مزودي النماذج. على سبيل المثال، إذا تعطّلت خدمة النموذج اللغوي الذي تقدمه شركة أوبن أيه آي لسبب ما، فمن الممكن أن تواصل أعمالها باستخدام نموذج من مزود آخر.

من المزايا الأخرى لاستخدام نماذج متعددة هي إمكانية الجمع بين النماذج المختلفة؛ إذ تستخدم النماذج المتنوعة خوارزميات مختلفة، وبالتالي، فإنها تقدم إجابات مختلفة عن السؤال نفسه. أظهرت الدراسات أن الجمع بين نماذج متعددة ومصادر تنبؤ مختلفة، وهو نهج أطلق عليه الباحثون اسم "التجميع" (Ensembling)، يؤدي غالباً إلى نتائج أفضل، ولا سيما في المهام المعقدة والغامضة. في الواقع، تسهم منصات مثل أوبن راوتر (Openrouter)، وهي شركة أميركية تأسست حديثاً لتجميع نماذج الذكاء الاصطناعي، في تقديم واجهة متكاملة تتيح للمستخدمين مقارنة أكثر من 180 نموذجاً من حيث الأداء والتكلفة على الفور ومقابل رسوم رمزية.

ومن ناحية أخرى، تتمثل إحدى فوائد العمل مع مورّد واحد في تقليل التكاليف الإدارية وتحسين فهم إمكانات كلا الطرفين في هذه الشراكة. في حين يؤدي استخدام نماذج متعددة إلى زيادة المخاطر المتعلقة بخصوصية البيانات وأمنها؛ إذ ربما يتطلب الأمر مشاركة البيانات مع عدة مزودين. وعلى الرغم من أن العديد من هذه المخاوف يشمل النماذج اللغوية الكبيرة جميعها، حتى الأميركية منها، فالوصول إلى البيانات ومشاركتها بين الدول، بين الولايات المتحدة والصين مثلاً، مع وجود أطر تنظيمية مختلفة في كل دولة، سيزيد من مستوى صعوبة التعامل مع البيانات. قد يكون هذا الأمر أكثر تعقيداً في التطبيقات الحساسة والمهمة مثل الرعاية الصحية.

تشير نظريات الإدارة السابقة حول التغيير والتنويع التكنولوجي إلى خيار ثالث يتجاوز الاعتماد على مصدر واحد أو أكثر، وهو الحوكمة التعاونية (Plural Governance) التي تتضمن الجمع بين المورّدين الخارجيين والمطورين الداخليين للاستفادة من التكنولوجيا الناشئة. في الواقع، لطالما أكدت الأبحاث السابقة في علم الاقتصاد أن احتمالية الاستفادة من ظهور تكنولوجيات جديدة تزداد عندما تستثمر الشركات داخلياً في تطوير رأس مال بشري متخصص. وفيما يتعلق بالنماذج اللغوية، من الممكن أن يتضمن ذلك استخدام النماذج اللغوية الكبيرة الأميركية في المهام العامة (مثل تطوير بوت بحث للاستشاريين أو المحامين في شركات الخدمات المهنية)، في حين يمكن الاستفادة من النماذج اللغوية الكبيرة الصينية لتنفيذ مهام محددة متعلقة بالشركة (مثل تطوير بوت تدريب في قسم الموارد البشرية الذي يساعد على إعداد الموظفين الجدد).

بالإضافة إلى ذلك، قد يسهم استخدام نموذج لغوي كبير منخفض التكلفة ومفتوح المصدر ويحتاج إلى متطلبات بيانات تدريب أقل، حتى لو كان أقل كفاءة من النماذج المغلقة المصدر، في السماح للشركات بتطوير نماذج مخصصة تناسب احتياجاتها. بمرور الوقت، من المرجح أن تؤدي هذه النماذج الأقل تكلفة وجودة إلى زعزعة النماذج الأعلى تكلفة، تماماً مثلما فعلت مصانع الصلب الصغيرة مع المصانع التقليدية المتكاملة عبر شرائح السوق كافة.

حتى مع المخاوف التي تتعلق بخصوصية البيانات وأمنها، وبغض النظر عن الجدل الذي حصل مؤخراً حول حظر تطبيق تيك توك (TikTok) في الولايات المتحدة، فإن تجاهل النماذج اللغوية الكبيرة الأميركية للتهديد الذي تشكّله النماذج الصينية سيكون مخاطرة كبيرة. إذ يجب على الشركات الأميركية التي تعمل في هذا المجال أن تدرك على الأقل خطر ظهور مبتكرين محليين يستخدمون النماذج اللغوية الصغيرة إلى جانب أساليب أخرى. كما يمكن أن تحاول الشركات الأميركية الكبرى التي تعمل في مجال الذكاء الاصطناعي أن تزعزع نفسها بنفسها على الرغم من أن الأبحاث تشير إلى أن الزعزعة الذاتية صعبة للغاية. على سبيل المثال، طوّرت شركة جنرال إلكتريك (GE) جهازاً محمولاً للتصوير بالموجات فوق الصوتية لينافس الأجهزة الأكثر تكلفة في السوق. قد يجد معظم شركات الذكاء الاصطناعي الأميركية صعوبة في التحرر من النماذج اللغوية الكبيرة ذات التكلفة العالية والانتقال إلى الاستثمار في نماذج لغوية كبيرة ذات تكلفة منخفضة ولكنها ذات كفاءة كافية بسبب مغالطة التكلفة الغارقة المتعلقة بالاستثمارات السابقة في الرقائق والأجهزة وبيانات التدريب الباهظة الثمن، التي أصبح جزء منها تكاليف غارقة في هذه المرحلة، إلى جانب الحوافز المرتبطة ببيع حلول ذات هامش ربح مرتفع.

أما بالنسبة للشركات العالمية التي تستخدم النماذج اللغوية الكبيرة، فإن الزعزعة في هذا المجال تفتح الباب أمام الاستثمار في المهارات الداخلية وتطوير نماذج مخصصة تناسب احتياجات الشركات، ما قد يؤدي إلى استخدام موجّه وأكثر دقة وخفض التكاليف وزيادة العائد على الاستثمار.

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

جميع الحقوق محفوظة لشركة هارفارد بزنس ببليشنغ، بوسطن، الولايات المتحدة الأميركية 2025.

المحتوى محمي