من الكتب إلى الموسيقى: هل يسرق الذكاء الاصطناعي إبداعات البشر؟

7 دقيقة
حقوق التأليف
فريق عمل هارفارد بزنس ريفيو/أنسبلاش/أيه آي

وفقاً لتقرير القطاع الذي صدر مؤخراً، أسهمت القطاعات الإبداعية "الأساسية"، ولا سيما تلك التي تنتج الكتب والبرمجيات الترفيهية والمطبوعات الدورية والأفلام والموسيقى المسجلة والبرامج التلفزيونية وألعاب الفيديو، بمبلغ 1.8 تريليون دولار في الناتج المحلي الإجمالي للولايات المتحدة عام 2021.

يمثل هذا المبلغ نحو 8% من الاقتصاد الأميركي؛ ما يعني وفقاً لتقارير عديدة أن استخدام شركات الذكاء الاصطناعي التوليدي المواد غير المرخصة والمحمية بحقوق التأليف من تلك القطاعات لتدريب نماذجها ليس مسألة عابرة. وفقاً لقادة القطاعات والأبحاث الأكاديمية، حلت أدوات الذكاء الاصطناعي التوليدي بالفعل محل الموظفين في مجالات مهمة أخرى من الاقتصاد، وليس غريباً أن تحل هذه الأدوات محل الفنانين المبدعين. هذا ما دفع أصحاب الحقوق في هذه القطاعات لرفع أكثر من 40 قضية في المحاكم الفيدرالية ضد شركات الذكاء الاصطناعي التوليدي لأنها تدرب نماذجها باستخدام مواد غير مرخصة ومحمية بحقوق التأليف.

في وقت مبكر من شهر يوليو/تموز 2025، أصدرت محكمتان في المنطقة الشمالية من ولاية كاليفورنيا أول قرارين حول هذه القضايا، ولم يكن أي منهما يصب في مصلحة أصحاب الحقوق تماماً.

في القضية الأولى، التي تحمل اسم "بارتز ضد أنثروبيك" وتتضمن دعوى رفعها 3 مؤلفين ضد شركة أنثروبيك، قرر القاضي ويليام ألسوب أن تدريب نماذج الذكاء الاصطناعي التوليدي باستخدام المواد المحمية بحقوق التأليف هو استخدام عادل؛ ما يعني أن إجراءه دون دفع التعويضات لأصحاب الحقوق ممكن. قال ألسوب: "مثل أي قارئ يطمح إلى أن يكون كاتباً، دربت شركة أنثروبيك نموذجها باستخدام هذه المواد ليس لنسخها أو استبدالها بسرعة، بل لحل مشكلة واجهتها ولتحويل المواد إلى مواد مختلفة".

في القضية الثانية، التي تحمل اسم "كادري ضد ميتا" وتتضمن دعوى رفعها 13 مؤلفاً ضد شركة ميتا، اتخذ القاضي فنسنت تشابريا موقفاً مختلفاً؛ إذ توصل إلى أن الاستخدام غير المرخص للمواد المحمية بحقوق التأليف في عملية التدريب ليس استخداماً عادلاً على الأرجح، لأن المحتوى الذي يولده النموذج اللغوي الضخم يختلف اختلافاً جوهرياً عن الإبداعات التي يتوصل إليها البشر. قال تشابريا معللاً: "استخدام الكتب لتعليم الأطفال الكتابة بعيد كل البعد عن استخدام الكتب لتطوير منتج يستطيع فرد واحد استخدامه لتوليد عدد هائل من الأعمال المنافسة خلال وقت أقصر بكثير وبنسبة أقل بكثير من الإبداع".

بصفتنا خبيرين في دراسة التحول الرقمي، فقد ركزنا كثيراً على هذه المسألة. على سبيل المثال، شاركنا مؤخراً في اجتماع طاولة مستديرة ضم 10 خبراء اقتصاديين عقده مكتب حقوق التأليف الأميركي لدراسة تأثيرات الذكاء الاصطناعي التوليدي في سياسة حقوق التأليف. ندرك أن القرارين السابقي الذكر غير حاسمين، ولا شك في أن المدعين سيرفعون قضيتي استئناف أمام الدائرة التاسعة ثم المحكمة العليا. لكن إلى حين حدوث ذلك، نعتقد أن هناك بالفعل العديد من الدروس المستفادة من هذين القرارين حول تأثيرات الذكاء الاصطناعي التوليدي في الأعمال، وهي دروس مفيدة للقادة في كل من القطاعات الإبداعية وشركات الذكاء الاصطناعي التوليدي.

دروس لأصحاب الحقوق

إذا كنت من أصحاب الحقوق، فيمكنك اتخاذ عدة خطوات لحماية أعمالك في هذه الفترة.

إزالة المواد المحمية بحقوق التأليف من مجموعات التدريب.

ليس غريباً أن تعتقد أنك خسرت المعركة بالفعل؛ إذ قد تظن أن إزالة المحتوى المحمي بحقوق التأليف من مجموعات التدريب الخاصة بأحد النماذج اللغوية الضخمة مستحيلة بمجرد إدخاله فيها. لكن في الواقع، هذا ليس صحيحاً. عندما تطلق شركات الذكاء الاصطناعي التوليدي إصدارات جديدة رئيسية من هذه النماذج (كما حدث عندما أصدرت أوبن أيه آي نموذج تشات جي بي تي 4 بعد سلفه، تشات جي بي تي 3)، فإنها تعيد تدريب النموذج الجديد باستخدام مجموعة التدريب بأكملها عادة. يمنح ذلك الشركة الفرصة لإزالة المواد المحمية بحقوق التأليف من مجموعة التدريب، ويمنح صاحب الحق الفرصة للحصول على أمر من المحكمة يقضي بإزالة هذه المواد.

إنفاذ الحقوق ضد شركات الذكاء الاصطناعي التوليدي التي تستخدم المواد المحمية بحقوق التأليف دون ترخيص.

إذا كنت تعتقد أن هناك شركة تستخدم المحتوى الذي تملكه لتدريب أحد النماذج اللغوية الضخمة دون ترخيص، فيمكنك الانضمام إلى قائمة المدعين الذين يزيد عددهم على 40 مدعياً رفعوا دعاوى قضائية لحماية حقوقهم القانونية. هذا إجراء مناسب ولا سيما بالنظر إلى أن بعض قرارات المحكمة الأخيرة تقدم ما يمكن أن نعده مجموعة من القواعد العامة التي يستطيع المدعون تطبيقها مستقبلاً في المحاججة لصالح قضاياهم. تنص هذه القواعد على إقناع المحكمة بأنه من الممكن استخدام نماذج الذكاء الاصطناعي التوليدية لقطع مصادر رزق الفنانين أنفسهم الذين تطلب منهم الشركات تدريب تلك النماذج مجاناً. إقناع المحاكم بهذا ليس سهلاً، ولكنه خيار متاح.

ترخيص المواد عندما يكون ذلك ملائماً.

رخص أكثر من 70 من أصحاب الحقوق، منهم شركات مثل هاربر كولينز ويونيفرسال ميوزك وريديت وشتر ستوك ومجلات مثل وول ستريت جورنال، محتواهم بما يسمح لشركات الذكاء الاصطناعي التوليدي استخدامه للتدريب. إذا لم ترخص المحتوى الذي تملكه بعد، فيمكنك متابعة صفقات الترخيص الآن، ربما من خلال إنشاء مجموعات البيانات المنسقة والمصممة خصوصاً لتدريب نماذج محددة (ما سيجعلها جذابة بالنسبة لمطوري الذكاء الاصطناعي). المشكلة في توقيع هذه التراخيص هو أنك ستتفاوض في وضع غير موات بالنظر إلى أن المحاكم تميل حالياً إلى الحكم على استخدام المواد المحمية بحقوق التأليف على أنه استخدام عادل. ما سيمنحك الأفضلية هو انتقاء وقت الترخيص بعناية وتوخي الحذر؛ فقد تكون شركات الذكاء الاصطناعي التوليدي أكثر استعداداً حالياً للدفع مقابل ترخيص المحتوى مما ستكون عليه بعد أن تمر القضايا عبر المحاكم، كما أنها قد تكون أكثر استعداداً لدفع ثمن مجموعة البيانات المنظمة والموثوقة والمنسقة بدلاً من التي قد تحصل عليها من خلال استخراج البيانات من صفحات الإنترنت آلياً وعلى نحو عشوائي.

إزالة المحتوى المحمي بحقوق التأليف من شبكة الويب المفتوحة.

هناك العديد من شركات الملكية الفكرية التي تتيح محتواها للجمهور بطرق تتوافق مع نماذج أعمالها؛ هناك حالات تشمل مختلف أنواع الملكية الفكرية توفر فيها الشركات المحتوى "مجاناً" لدعم نماذج العمل القائمة على الإعلانات، كما هي الحال فيما يتعلق بمقاطع الأفلام المدعومة بالإعلانات التي يمكنك مشاهدتها في موقع يوتيوب. تتبع بعض الشركات أيضاً نموذج المحتوى المجاني ثم المدفوع "فريميوم تو بريميوم"، الذي تعرض الشركات وفقه على المستهلكين المحتوى المجاني وتوفر أيضاً خيار الدفع مقابل طرق ملائمة أكثر لتلقي المحتوى أو مجموعة أكثر اكتمالاً منه. من الأمثلة على ذلك المقالات المجانية (5-10 مقالات عادة) التي تقدمها بعض المواقع الإلكترونية شهرياً قبل طلب الاشتراك من القراء. ربما كانت هذه الاستراتيجيات منطقية قبل صعود الذكاء الاصطناعي التوليدي، لكن القواعد تغيرت الآن، ومن المنطقي أن تعيد الموازنة بين فوائد إتاحة المحتوى الذي تملكه في الويب المفتوح وأضرار استخدام هذه المواد المحمية بحقوق التأليف لتدريب النماذج اللغوية الضخمة دون موافقتك، ولا سيما أن بعضاً من أكبر صفقات الترخيص شملت المحتوى المحمي بالاشتراك المدفوع، ما جعل استخراجه آلياً صعباً بالنسبة لشركات الذكاء الاصطناعي التوليدي.

حماية المحتوى المحمي بحقوق التأليف في شبكة الويب المفتوحة.

بالحديث عن استخراج البيانات من صفحات الإنترنت آلياً، يجب أن يسعى أصحاب الحقوق أيضاً إلى حماية ملكيتهم الفكرية التي لم يزيلوها من شبكة الويب المفتوحة. هناك العديد من الطرق التي يمكن اتباعها لفعل ذلك، لكنها ليست خالية من العيوب. يستطيع أصحاب الحقوق استخدام ملف يحمل اسم "robots.txt"، الذي يبين لأدوات استخراج البيانات من الويب التي تعمل بالذكاء الاصطناعي أن استخراج محتوى الموقع غير مسموح. لن تنجح هذه الطريقة إلا إذا كان النموذج اللغوي الضخم يتبع القواعد في هذا الملف، لكنها تمثل نقطة بداية. تستطيع شركات استضافة المواقع حظر أدوات استخراج البيانات، كما أنه من الممكن وضع سياسات التسييل التي تنطبق على وكلاء الذكاء الاصطناعي الذين يسعون للوصول إلى أجزاء من المحتوى الذي تملكه. أخيراً، هناك أدوات ناشئة، مثل غليز و نايت شيد، تحمي الملكية الفكرية الصورية المتاحة للجمهور من الاستخدام في تدريب نماذج الذكاء الاصطناعي التوليدي.

دروس لشركات الذكاء الاصطناعي التوليدي

إذا كنت قائداً في إحدى شركات الذكاء الاصطناعي التوليدي، فقد تعتقد أنك لن تضطر إلى تغيير أي من ممارساتك بالنظر لقرارات المحاكم الأخيرة. لكن ذلك قد يكون خطأ. إليك ما يجب أخذه في الاعتبار وفعله بينما تصل المحاكم إلى قراراتها النهائية.

أخذ المخاطر المالية في الاعتبار.

على الرغم من أن القاضي ألسوب استنتج أن استخدام البيانات المحمية بحقوق التأليف لتدريب نموذج شركة أنثروبيك اللغوي الضخم هو استخدام عادل، فإنه أرفق هذا الاستنتاج بمحذور مهم ينص على أنه لا يمكن الحصول على البيانات المحمية بحقوق التأليف من خلال النسخ غير القانوني. قال ألسوب: "النسخ غير القانوني للمواد التي يمكن الحصول عليها بطرق أخرى هو بطبيعته انتهاك لا يمكن تبريره حتى لو حول الطرف الناسخ هذه المواد إلى مواد مختلفة مباشرة". يعني ذلك أن استخدام المحتوى المنسوخ بطريقة غير قانونية ينطوي على مخاطر مالية كبيرة. بموجب قانون "17 U.S.C. § 504" في الولايات المتحدة، يمكن منح أصحاب حقوق التأليف تعويضات قانونية تصل إلى 30 ألف دولار لكل مادة منتهكة، وما يصل إلى 150 ألف دولار إذا حكمت المحكمة بأن الانتهاك كان متعمداً. استنتج ألسوب أن أنثروبيك استخدمت 7 ملايين كتاب منسوخ بطريقة غير قانونية لإعداد بيانات التدريب، وأمر الشركة أن تمثل للمحاكمة بسبب "استخدام المواد المنسوخة بطريقة غير قانونية لإنشاء مكتبة أنثروبيك المركزية والأضرار الناتجة عن ذلك، سواء كانت فعلية أو قانونية (بما في ذلك الأضرار المتعمدة)". يمثل احتمال دفع غرامة بسبب هذه الأضرار خطراً مالياً كبيراً، علماً أن المبلغ قد يصل إلى 1.05 تريليون دولار (7 ملايين كتاب مضروب بـ 150 ألف دولار لكل كتاب). أنثروبيك ليست الشركة الوحيدة التي تواجه هذه المشكلة؛ إذ بينت عملية الكشف في قضية كادري ضد ميتا أن هذه الأخيرة استخدمت ما لا يقل عن 82 تيرابايت من بيانات الكتب المنسوخة بطريقة غير قانونية لتدريب نماذجها. هناك أيضاً دعاوى قضائية أخرى، مثل تريمبلاي ضد أوبن أيه آي وأونان ضد داتا بريكس، يزعم المدعون فيها أن الشركات استخدمت "مكتبات خفية" منسوخة بطريقة غير قانونية للتدريب.

توقيع التراخيص.

بالنظر إلى هذه المخاطر المالية، يجب أن تأخذ الشركات في الاعتبار توقيع تراخيص مع أصحاب الحقوق، ولا سيما أن القضايا الأخيرة قد تشجعهم على بيع المحتوى في المستقبل القريب.

تصميم أدوات الانسحاب التي تتيح لأصحاب الحقوق إخفاء المحتوى من مجموعات بيانات التدريب أو إزالته.

في مواجهة الدعاوى القضائية التي رفعها أصحاب الحقوق، طورت شركات مثل يوتيوب وفيسبوك أدوات تمكن أصحاب الحقوق من إزالة المحتوى الذي يملكونه من منصاتها. يجب أن تأخذ شركات الذكاء الاصطناعي التوليدي في الاعتبار تطوير أدوات مشابهة في هذه الفترة.

إعادة النظر في فوائد جمع المزيد من البيانات غير المرخصة ومخاطره القانونية.

أصدرت مؤخراً مؤسسة إلوثر.أيه آي، المتخصصة في أبحاث الذكاء الاصطناعي، مجموعة بيانات بسعة 8 تيرابايت تحمل اسم "كومون بايل في 0.1"، وهي تزعم أن المجموعة تتألف بأكملها من المحتوى المفتوح المصدر أو المرخص. تدعي الشركة أيضاً أنها عندما استخدمت المجموعة لتدريب نماذجها اللغوية الضخمة، كان أداء النماذج مماثلاً لأداء النماذج التي تدربت باستخدام البيانات غير المرخصة والمحمية بحقوق التأليف. كتب مطورو الشركة في منشور على مدونتها أن بحثهم يشير إلى أن "الفكرة الشائعة التي تنص على أن النصوص غير المرخصة تحسن الأداء غير مبررة". لسنا قادرين على التحقق من هذه الادعاءات على نحو مستقل، لكن بالنظر إلى المخاطر القانونية المرتبطة باستخدام المحتوى غير المرخص (المنسوخ بطريقة غير قانونية في الكثير من الأحيان) والمحمي بحقوق التأليف، ربما من المحبذ أن تعيد شركات الذكاء الاصطناعي التوليدي النظر فيما إن كانت الفوائد الهامشية لاستخدام المواد غير المرخصة والمحمية بحقوق التأليف تستحق التعرض للمخاطر القانونية والمالية.

يتمتع الذكاء الاصطناعي التوليدي بالقدرة على تحقيق فوائد كبيرة ومتنوعة للقطاعات والمجتمع، لكن تحقيق هذه الفوائد سيتطلب إنشاء شراكات أكثر رصانة وشفافية بين شركات التكنولوجيا وقطاعات الإبداع. وفقاً للبيانات الحالية، نحن نخاطر بخسارة المؤلفين والموسيقيين والمبرمجين وصانعي الأفلام الذين ألفوا المحتوى الثمين الذي يمثل أساس القيمة الحالية والمستقبلية لمخرجات الذكاء الاصطناعي التوليدي.

تنويه: يمكنكم مشاركة أي مقال من هارفارد بزنس ريفيو من خلال نشر رابط المقال أو الفيديو على أي من شبكات التواصل أو إعادة نشر تغريداتنا، لكن لا يمكن نسخ نص المقال نفسه ونشر النص في مكان آخر نظراً لأنه محمي بحقوق الملكية الدولية. إن نسخ نص المقال بدون إذن مسبق يعرض صاحبه للملاحقة القانونية دولياً.

جميع الحقوق محفوظة لشركة هارفارد بزنس ببليشنغ، بوسطن، الولايات المتحدة الأميركية 2025.

المحتوى محمي