لم تعد مهام الذكاء الاصطناعي التوليدي مقتصرة على صياغة رسائل البريد الإلكتروني وما إلى ذلك، بل بات يحكم سوق العمل. يتنافس ملايين الموظفين في المنصات، مثل فايفر وفري لانسر وأب وورك، على الوظائف بناءً على الأجور الساعية، ومع تزايد تأثير الذكاء الاصطناعي في توصيات التسعير، يواجه القادة في مجال الأعمال سؤالاً مهماً جداً: هل تتخذ نماذج اللغة الضخمة قرارات التسعير هذه على نحو عادل؟ أم إنها ترسخ التحيزات وأوجه عدم الإنصاف نفسها التي تعانيها أسواق العمل منذ زمن طويل؟
أجرينا في دراسة حديثة تجربة واسعة النطاق دربنا فيها ثمانية نماذج لغوية كبيرة مستخدمة على نطاق واسع باستخدام 60 ألف ملف تعريفي للموظفين المستقلين، وطلبنا من كل نموذج تقديم توصية بالأجر الساعي. اختبرنا بعد ذلك أثر تغيير الأوامر النصية في التحيز المحتمل للنتائج؛ إذ طلبنا من النماذج أن تأخذ في الاعتبار سمات معينة لا تتعلق بالمهارة مثل النوع الاجتماعي والموقع والعمر أو تتجاهلها. ولدنا عبر هذه الخيارات المتنوعة نحو 4 ملايين قرار حول الأجور باستخدام الذكاء الاصطناعي من خلال أوامر واجهة برمجة التطبيقات النصية.
البحث بإيجاز
النطاق: استخدمنا 60 ألف ملف تعريفي من إحدى الأسواق الرائدة في ست فئات؛ وهي المحاسبة ومسك الدفاتر، والتطوير البرمجي الشامل، والمساعدة الافتراضية العامة، وتحليلات البيانات، والتصميم الرسمي، والتسويق عبر مواقع التواصل الاجتماعي. تضمن كل ملف تعريفي الخدمات والمهارات والخبرة والموقع.
النماذج: وجهنا الأوامر النصية إلى ثمانية نماذج، وهي جي بي تي-4 أو وجي بي تي 4.0-ميني وجيميناي 1.5 فلاش وجيميناي 2.5 فلاش وكلود 3.7 سونيت وجي بي تي-5 ميني وديب سيك-آر 1 ولاما 3.1 405 بي. نص الأمر النصي الأساسي على تقديم توصية بالأجر الساعي بالدولار الأميركي بناءً على تفاصيل الملف التعريفي.
التصميم: أنشأنا نسخاً مكررة مضبوطة تغيرت فيها سمة واحدة لا تتعلق بالمهارات في كل مرة، وهي النوع الاجتماعي أو المنطقة الجغرافية أو السن، مع الحفاظ على المحتوى الآخر دون تغيير. قدمنا بعد ذلك أوامر نصية مختلفة بثلاث صياغات، نصت الأولى على أن تأخذ النماذج في الاعتبار السمة المعنية، بينما نصت الثانية على أن تتجاهل النماذج هذه السمة، وفرضت الثالثة موقفاً صارماً وصريحاً.
النتائج
الذكاء الاصطناعي يضخم الأجور:
عبر مختلف الفئات، منحت النماذج توصيات بأجور ساعية أعلى للموظفين المستقلين مقارنة بالتوصيات التي قدمها البشر. بلغ متوسط الأجر الساعي الذي حدده البشر 23.60 دولاراً في الساعة، بينما كانت التوصيات التي قدمتها النماذج أعلى بكثير؛ إذ إنها تراوحت تبعاً للنموذج بين 30 دولاراً في الساعة إلى نحو 46 دولاراً في الساعة.
يمثل هذا التضخم في الأجور مفارقة استراتيجية؛ إذ قد يبدو للوهلة الأولى مفيداً للموظفين المستقلين، لكن ارتفاع الأسعار لا يؤدي بالضرورة إلى نتائج أفضل. إذا رفض العملاء الأسعار المتضخمة، فقد يقل عدد الفرص المتاحة للموظفين. بالنسبة للشركات الباحثة عن موظفين، يعني هذا التضخم أن اعتماد أدوات تحديد الأجور القائمة على الذكاء الاصطناعي قد يؤدي عن غير قصد إلى ارتفاع تكاليف التوظيف أو تشويش توقعات السوق.
النماذج ليست متحيزة ضد المرأة:
تمحور أحد الأسئلة الرئيسية التي طرحناها حول إن كان الذكاء الاصطناعي سيقلل الأجور الساعية للموظفات الإناث مقارنة بالموظفين الذكور. ما يثير الدهشة هو أن نماذج الذكاء الاصطناعي لم تفعل ذلك. في الواقع، لم نلحظ فجوة كبيرة في الأجور بين الجنسين عبر مئات الآلاف من الاختبارات. حتى عندما حثثنا النماذج صراحة على أخذ النوع الاجتماعي في الاعتبار، لم نلحظ أي فجوة في الأجور بين الجنسين. لم تولد نماذج الذكاء الاصطناعي تفاوتات في الأجور بين الجنسين إلا في ظل تعليمات شديدة التحيز، كما أنها أفرطت عندها في تعويض النساء بمنحهن أجوراً أعلى من أجور الرجال.
هذه نتيجة إيجابية نادرة. على الأقل فيما يتعلق بالنوع الاجتماعي، قد تكون نماذج الذكاء الاصطناعي الحالية مضبوطة بطريقة تجعلها تتجنب التمييز القائم على النوع الاجتماعي.
الموقع الجغرافي يولد التحيز:
من ناحية أخرى، أدى تغيير الموقع الجغرافي إلى تغيير التوصيات. لنأخذ ملفين تعريفيين متطابقين يعود أحدهما لشخص من الولايات المتحدة بينما يعود الآخر لشخص من الفلبين. بلغ متوسط الأجر الموصى به للموظف الأميركي 71 دولاراً، بينما بلغ نظيره للموظف الفلبيني 33 دولاراً فقط، أي أقل بأكثر من 50%.
ما يثير الدهشة أكثر هو أنه عندما غيرنا موقع الموظف الفلبيني نفسه إلى "الولايات المتحدة"، تضاعف الأجر الموصى به. تكرر هذا النمط في عدة بلدان؛ إذ أوصت النماذج بأجور أعلى للموظفين من المناطق الثرية مقارنة بأقرانهم المؤهلين بالقدر نفسه ولكن من المناطق ذات الدخل المنخفض.
ما يثير الاهتمام هو أننا تمكنا من تغيير هذه النتيجة باستخدام الأوامر النصية الاستراتيجية. عندما وجهنا تعليمات صريحة للنماذج تنص على عدم أخذ الموقع الجغرافي في الاعتبار، تقلصت الفوارق بمقدار كبير. في بعض الحالات، انخفضت الفجوة في الأجور بين الموظفين المستقلين المقيمين في الولايات المتحدة والفلبين بنسبة تجاوزت 50%.
التحيز العمري صب في صالح الموظفين الأكبر سناً:
لاحظنا أن السن مصدر آخر للتحيز؛ إذ كان أجر الموظف المستقل البالغ من العمر 60 عاماً أعلى بنسبة 46% تقريباً من أجر الموظف المستقل البالغ من العمر 22 عاماً، وأعلى بنسبة 8.1% من الموظف المستقل البالغ من العمر 37 عاماً الذي يتمتع بالملف التعريفي نفسه. لكن على عكس حالة الموقع الجغرافي، لم يحدث تغييرنا للأوامر النصية أثراً كبيراً؛ إذ لم يؤد إخبار النموذج بتجاهل عامل السن إلى سد الفجوة.
يشير هذا إلى أن الافتراضات المتعلقة بالعمر قد تكون متأصلة بعمق في بيانات التدريب، ما يجعل التخلص منها من خلال صياغة الأوامر النصية صعباً.
ما هي حدود أثر الأوامر النصية؟
توصلنا إلى إحدى أهم الرؤى المطمئنة من خلال اختبار الطرق المختلفة لتوجيه النماذج. عندما طلبنا من هذه النماذج تجاهل الموقع، تقلصت الفوارق بنسبة كبيرة؛ إذ تقلصت الفجوة في الأجور بين الولايات المتحدة والفلبين من أكثر من 100% إلى 25% فقط في بعض الحالات.
أما فيما يتعلق بالسن، فلم نلاحظ أن تغيير صياغة الأوامر النصية يغير النتائج. يسلط ذلك الضوء على فكرة مهمة للقادة، وهي أن الأوامر النصية تحكم سلوك نماذج الذكاء الاصطناعي، ولكن في مواقف معينة فقط. الحد من بعض التحيزات أسهل من الحد من غيرها. بالنسبة للمنصات والشركات الباحثة عن موظفين، يعني ذلك أن صياغة الأوامر النصية ليست مجرد تفصيل تقني، وإنما أداة حوكمة تعزز جوانب عدم المساواة أو تزيلها.
ماذا عن الموظفين غير المستقلين؟
أجرينا أيضاً دراسة متابعة استكشفنا فيها إن كانت هذه النتائج تنطبق على حالة الأجور السنوية في الوظائف ذات الدوام الكامل بدلاً من الأجور الساعية للموظفين المستقلين. لاحظنا وجود الأنماط نفسها تقريباً فيما يتعلق بالنوع الاجتماعي والموقع الجغرافي؛ إذ إن نماذج الذكاء الاصطناعي لا تعاني التحيز المنهجي ضد المرأة، ولكنها تولد باستمرار توصيات متفاوتة على أساس الموقع الجغرافي.
من ناحية أخرى، كانت النتائج فيما يتعلق بمسألة العمر معكوسة. في حين أن الأجور الساعية للموظفين المستقلين البالغين من العمر 60 عاماً كانت أعلى من الأجور الساعية لأقرانهم في أواخر الثلاثينيات وأوائل العشرينيات من عمرهم، منحت النماذج الموظفين بدوام كامل في أواخر الثلاثينيات من عمرهم أجوراً أعلى مقارنة بالفئتين العمريتين الأخريين. ينص أحد التفسيرات المحتملة على أن الذكاء الاصطناعي ينظر للأجور بطريقة مختلفة اعتماداً على علاقة العمل (العمل المستقل مقابل العمل بدوام كامل). بالنسبة للموظفين المستقلين، قد ينظر الذكاء الاصطناعي إلى الأجور على أنها نفقات عابرة (بدلاً من تكون استثماراً في علاقة عمل طويلة الأجل)، ويعمل على أساس أن الخبرة الأكبر تستوجب منح أجور أعلى. أما بالنسبة للموظفين بدوام كامل، فالأجور هي نوع من الاستثمار. من المحتمل أن ينظر الذكاء الاصطناعي إلى الموظفين في منتصف أعمارهم (37 عاماً) على أنهم يتمتعون بالخبرة وطول العمر في الوقت نفسه، ما يجعلهم أنسب للشركات الباحثة عن موظفين. يبين هذا التمييز الدقيق أيضاً أن نماذج اللغة الضخمة قادرة على الفصل بين العمر والخبرة في العمل، ما يشير إلى أنها لا تحاكي القواعد التي يطبقها البشر فقط، بل تحاكم اعتماداً على السياق بطرق تستوجب التدقيق.
ما هي تبعات نتائج البحث على الموظفين المستقلين والشركات والمنصات؟
يجب أن يعرف الموظفون المستقلون أن الأجور الساعية التي يوصي بها الذكاء الاصطناعي قد تكون متضخمة. يستطيع هؤلاء استخدام هذا التضخيم على أنه ورقة مساومة، لكنه قد يعرضهم للخطر إذا أصبحت الأجور التي يطالبون فيها أعلى من أن تمنحهم الشركات إياها. في الأسواق العالمية، قد يكون من الملائم أن يعيد الموظفون المقيمون خارج البلدان المتقدمة النظر بكمية بيانات الموقع التي يكشفون عنها.
يجب أن تتعامل الشركات الباحثة عن موظفين مع الأجور التي يولدها الذكاء الاصطناعي على أنها توصيات استشارية وليست موثوقة. وإلا فستخاطر بمنح بعض الموظفين أجوراً مفرطة الارتفاع ومنح بعضهم الآخر أجوراً أخفض من اللازم منهجياً بناءً على سمات لا علاقة لها بمهاراتهم.
تواجه المنصات التي تدمج الذكاء الاصطناعي في محركات التسعير الخاصة بها خيارات صعبة تتعلق بالتصميم. عندما تبدو التقييمات المعتمدة على الذكاء الاصطناعي تمييزية، ستحتاج هذه المنصات إلى تطبيق آليات الحوكمة المتعددة مثل تدقيق الأوامر النصية والامتثال لمتطلبات الشفافية، وربما اعتراضات الموظفين.
يجب على صانعي السياسات تذكر أن عملية التسعير القائمة على نماذج اللغة الضخمة منحازة. الفوارق القائمة على الموقع الجغرافي والسن تبين الحاجة إلى وضع قوانين تحكم هذه العملية. اشتراط الإفصاح عن الأوامر النصية وتوضيح السمات المحمية من التحيز وفرض الشفافية في التعامل مع الموظفين من الآليات الوقائية المطروحة.
لم تعد مهام الذكاء الاصطناعي التوليدي مقتصرة على أتمتة كتابة النصوص؛ إذ بات يحدد الرواتب ويؤثر في سبل العيش وقابلية الوصول إلى الفرص. إذا لم تخضع هذه الأنظمة للضبط، فقد تؤدي إلى ترسيخ جوانب عدم المساواة على مستوى العالم أو حتى توسيع نطاقها. الخلاصة بسيطة ولكنها مهمة: يكون تحديد الأجور القائم على الذكاء الاصطناعي عادلاً أكثر فقط إذا كان مصمماً ليكون عادلاً وخاضعاً للقوانين التي تضمن ذلك.