التوليد المحسن بالاسترجاع Retrieval-Augmented Generation. RAG

2 دقيقة

ما المقصود بالتوليد المحسن بالاسترجاع؟

التوليد المحسن بالاسترجاع (Retrieval-Augmented Generation. RAG): يسمى بالعربية أيضاً التوليد المعزز بالاسترداد، وهو مصطلح يستخدم في مجال التكنولوجيا ويشير إلى العملية التي تُستخدم لتحسين ما تنتجه النماذج اللغوية الكبيرة.

تاريخ استخدام التوليد المحسن بالاسترجاع

يعود تاريخ البدء باستخدام تقنيات الاسترجاع إلى سبعينيات القرن الماضي ولكنها استخدمت على نطاق ضيق إذ كانت موجودة في نظم الأسئلة والأجوبة المحددة. ومع تقدم خدمات محركات البحث على الإنترنت في تسعينيات القرن الماضي زاد الاهتمام بتقنيات الاسترجاع التي أصبحت تلعب دوراً أساسياً في تحسين البحث والإجابة. ولم يظهر إطار عمل التوليد المحسن بالاسترجاع حتى تسارع تطور تقنيات الذكاء الاصطناعي في بداية القرن الحالي، وأصبح من الممكن دمج قدرات الذكاء الاصطناعي على توليد النتائج مع تقنيات الاسترجاع، وفي عام 2020 ظهرت تقنية التوليد المحسن بالاسترجاع نهجاً شاملاً يعزز قدرات النماذج اللغوية بالاتصال بمصادر خارجية لتحسين دقة الإجابات.

ما النماذج اللغوية الكبيرة؟

يُقصد بالنماذج اللغوية الكبيرة؛ أحد أنواع نماذج الذكاء الاصطناعي التوليدي، التي تكون قادرة على فهم المحتوى المكتوب الذي يعرض عليها وأداء عدة مهام أخرى مثل إنتاج محتوى جديد منه وتلخيصه والتنبؤ بتتمة الجمل غير المكتملة وتحليل مشاعر كاتب النص. ويستخدم العديد من روبوتات الدردشة النماذج اللغوية الكبيرة، وخاصة تشات جي بي تي.

بصفة عامة، فإن النماذج اللغوية الكبيرة تكون مزودة مسبّقاً بكميات كبيرة من البيانات، ومن ثم تتعرف هذه النماذج على البيانات وتبدأ بفهم العلاقات بين الكلمات والمفاهيم، ومن ثم تقدم الاستجابة التي يطلبه منها المستخدم.

مقالات قد تهمك:

آلية عمل التوليد المحسن بالاسترجاع

تنطوي آلية عمل إطار عمل التوليد المحسن بالاسترجاع على ثلاث مراحل تتمثل في الآتي:

  • مرحلة التغذية: يعمل المستخدم في هذه المرحلة على تقديم مجموعة من المصادر الخارجية للنظام الذي يستخدم النماذج اللغوية الكبيرة (على سبيل المثال تشات جي بي تي).
  • مرحلة استرجاع المعلومات: في هذه المرحلة تُستخدم خوارزميات البحث للبحث في المصادر الخارجية بحثاً عن مقتطفات أو معلومات ذات صلة بسؤال المستخدم.
  • مرحلة توليد المحتوى: تولد النماذج اللغوية الكبيرة الموجودة في النظام نصوصاً جديدة مستفيدة من المصادر الخارجية.

فوائد التوليد المحسن بالاسترجاع

تعتمد النماذج اللغوية الكبيرة على أداء ما يطلب منها بالاعتماد على قاعدة البيانات التي تصل إليها، لكن التوليد المحسن بالاسترجاع يُعد إطار عمل لتحسين نتائج النماذج اللغوية الكبيرة وتعزيز دقتها وموثوقيتها واتساقها، وتلافي تقديمها معلومات عشوائية.

ومن جهة أخرى، يعد إطار العمل هذا وسيلة تساعد مستخدمي الذكاء الاصطناعي لتوليد النصوص في التأكد من صحة المعلومات، لأن المستخدم هو من قدّم المصادر ويمكنه الرجوع إليها للتأكد.

اقرأ أيضاً: