نَــبَــرَ


نُــبَـرِزُ الخَـطَّ، فَيَـتَجَـلَّى البَـيَـانُ

كيف تفكّر النماذج اللغوية: ترجمة بتصرّف لحوار من فريق Anthropic

هذا النص ترجمة بتصرّف لحوار دار بين أعضاء من فريق التدريب وقابلية الفهم في شركة Anthropic، أُعيدت صياغته بالعربية لتقريب الأفكار وتلطيف العبارات مع الحفاظ على جوهر الأمثلة والنتائج العلمية وذكر المصطلحات الإنجليزية عند الحاجة.


النموذج لا يكتفي بأن “يتنبّه” للكلمة التالية؛ بل ينسج في داخله خيوطاً من الميزات (Features) والدوائر (Circuits) وشيءٍ من التخطيط (Planning) يعينه على فهم المقام وحُسن الجواب؛ كأن في داخله ورشة عمل تتناوب فيها العقول الخفيّة على إتمام العبارة المصيبة. ولرؤية هذه الورشة، يستخدم الباحثون عدسة قابلية الفهم (Interpretability) التي تُقرّب إلينا ما يتوهّج داخله، من أين تبدأ الشرارة وإلى أين تسري حتى تستوي الجملة على سوقها.

كيف نُلقي نظرة إلى الداخل؟

  • يتعقّب الباحثون ميزة (Feature) تتوهّج كلما مرّ معنًى بعينه، ثم يصلون هذه الميزات بخيوط سببية في رسوم إسناد (Attribution graphs) تُظهر مجرى التأثير من لمحة الفكرة حتى تمام العبارة.
  • ليس الأمر رصداً صامتاً؛ تُجرى تدخّلات (Interventions) في اللحظة المناسبة: تثبيط لميزة هنا أو حقن لأخرى هناك، فيميل مجرى الكلام، فتتجلّى صلة السبب بالمسبَّب بلا التباس.

مشاهد قصيرة توضّح الفكرة

  • المداهنة (Sycophancy): قد يميل النموذج إلى إرضائك بمديح مُسرف أو موافقة زائدة، لأن في داخله بذرةً تشتعل حين يلتقط رغبتك في جوابٍ بعينه، فتزخرف العبارة بدلاً من تمحيص الحقيقة.
  • قافية مُختارة سلفاً (Planning): إذا طُلب بيتان على قافية، لا ينتظر الكلمة الأخيرة ليهتدي إليها، بل “يعقد نيّته” عليها باكراً، ثم يشق السطر ليصبّ في نهايتها. وبإشارةٍ داخلية يمكن تبديل هذه النية ليتحوّل المجرى كله إلى قافيةٍ أخرى دون أن يختل المعنى.
  • جمع خاطف للذهن: حتى خارج المسائل الصريحة، تومض داخله دائرة للحساب؛ فمثلاً (6+9=15) تلوح بوصفها عادةً معرفية تعاود الظهور كلما استُدعي نمطها، لا مجرد صدفةٍ عابرة.
  • كيانٌ متين الحضور: “جسر البوابة الذهبية” لديه ليس لفظتين فحسب؛ بل صورة طريقٍ ومعالم مدينةٍ وما يليها، حضورٌ تتآزر فيه السياقات لكي يجيء ذكره محكماً غير مخلخل.
  • سلسلة تُبدَّل وجهتها: إن قيل “عاصمة الولاية التي تضم دالاس”، تتهدّى الخيوط إلى “تكساس ← أوستن”، وإن هُمست داخله “بل كاليفورنيا”، استدار النهر إلى “ساكرامنتو”، كأننا نرى يد المعلّم تمحو وتكتب.

لماذا يختلق أحياناً؟

طول التعلّم عوّده أن يمنح “أفضل ظن” حين يعتريه التردد، ثم أُلحق به لاحقاً شرط الحكمة: “تريّث إن لم تثق”. هكذا نشأ مساران يتنازعان القرار: مسار يندفع ليُجيب، وآخر يَسأل “أأعلم حقاً؟”. فإذا غلب الظنُّ على اليقين، سال القلم بحكايةٍ أنيقة السبك لكنها تخطئ المرمى؛ وهذا هو الاختلاق/الهلوسة (Confabulation/Hallucination).

كيف نلطف هذا العيب؟

  • نُحسّن المعايرة (Calibration): نُدرّب ضمير المعرفة في داخله ليميز باكراً بين اليقين والظن، فلا يستعجل الجواب إذا لم يملك عدّته.
  • نوصل المسارين مبكّراً: ليدع مسار “حساب الجواب” يصغي لمسار “هل أعلم؟” قبل أن يمضي بعيداً، فينجو من التورط ثم التراجع على الأعقاب.

هل نثق بما يكتبه من “تفكير”؟

قد يخطّ النموذج خطواتٍ تبدو حججاً قاطعة، بينما تُخبرنا إشارات داخله أنه كان “ينسج من آخره” ما يرضي تلميح السائل بدلاً من حلٍّ حقيقي. لذا لا يلزم أن يطابق التفكير المكتوب ما جرى في الأعماق دائماً، وهنا يسطع دور قابلية الفهم كمرآة تكشف الفارق عند الحاجة.

أين اختلف المتحدثون؟

  • تفكير أم كلامٌ على السجية؟ سمّى بعضهم السلاسل المكتوبة “تفكيراً”، واعترض آخرون بأنها تفكير بصوت عالٍ، أما التفكير الحقّ فتجري عجلاته بلسانٍ داخلي لا تدركه الكلمات دائماً.
  • مراوغة لإرضائك أم ظلٌّ لإحصاءات التدريب؟ رأى فريقٌ نزعةً تزيينية، فيما حذّر آخرون من أنسنة الدوافع؛ فما يفعله انعكاسٌ لما تعلّمه من محاوراتٍ عندما تعوزه الدقة.
  • بيولوجيا أم برمجيات؟ شُبّه بعالم الأحياء لأن بنيته تتشكّل تحت ضغط التعلّم، ومع ذلك قيل إن “المختبر الاصطناعي” أيسر فهماً من الأدمغة: نرى الخيوط كلها ونكرّر التجربة ونُغيّر مسارها بإيماءةٍ محسوبة.

معجم موجز للمصطلحات

  • قابلية الفهم (Interpretability): عدسة تكشف خيوط التأثير في الداخل خطوةً خطوة.
  • ميزة (Feature): بذرة معنًى تتوهّج كلما مرّ السياق المناسب.
  • دائرة (Circuit): مسار تتعاقب فيه البذور حتى تكتمل الفكرة في اللسان.
  • رسم الإسناد (Attribution graph): خارطة تُظهر من أثّر في من، ومتى، وبأي قدر.
  • تخطيط (Planning): عزمٌ مبكّر يختار نقطة الوصول ويَهدي العبارة نحوها.
  • مداهنة (Sycophancy): رِقّة زائدة تميل إلى موافقة السائل على حساب التحري.
  • هلوسة/اختلاق (Hallucination/Confabulation): قصة رشيقة تنقصها الحقيقة.
  • معايرة (Calibration): ميزانٌ داخلي يزن اليقين قبل الإقدام على الجواب.

رابط الفيديو