إنتقل إلى المحتوى الرئيسي
متوسط

سلّم الثقة

"إلى أيّ مدى أدع الذكاء الاصطناعي يتصرف وحده؟" هو السؤال الكامن خلف كل قرار يتعلق بالوكلاء تقريبًا — أذونات Claude Code، إعدادات الموافقة التلقائية، وما إذا كنت ستترك نصًا برمجيًا يعمل دون مراقبة. يميل الناس إلى الإجابة عنه كمفتاح تشغيل/إيقاف واحد: فإما أن تراقب كل شيء، وإما أن تطلق العنان له.

إليك العدسة التي يستخدمها AILmanac بدلًا من ذلك:

الاستقلالية ليست مفتاحًا، بل سلّمًا. تتسلّقه درجةً واحدة في كل مرة، والدرجة التي تقف عليها ينبغي أن يحدّدها مدى سوء الخطأ — لا مدى ثقتك بالنموذج.

الإدراك الأساسي هو أن القدر الصحيح من الاستقلالية لا علاقة له تقريبًا بمدى "ذكاء" الذكاء الاصطناعي. بل يتعلق بـ نطاق الضرر (كم من الضرر يُحدثه تصرّف خاطئ) وقابلية التراجع (كم تسهل عليك إعادة الأمور إلى ما كانت عليه). نموذج بارع يفعل شيئًا غير قابل للتراجع دون إشراف هو إعداد أسوأ من نموذج متوسط يفعل شيئًا قابلًا للتراجع.

الدرجات الخمس

نموذج نجده مفيدًا هو التفكير في خمس درجات متمايزة، من الأقل استقلاليةً إلى الأكثر:

الدرجةماذا يفعل الذكاء الاصطناعيمتى تكون مناسبةما يجعلها آمنة
1. الاقتراح فقطيخبرك بما سيفعله؛ لا يتخذ أي إجراءالأعمال عالية المخاطر أو غير القابلة للتراجع؛ مجال لا تثق به فيه بعد؛ ما زلت تتعلّم ما يجيدهأنت المنفّذ. لا يحدث شيء دون أن تفعله بيدك.
2. مسوّدة للمراجعةينتج المُخرَج الفعلي (شيفرة، بريد، استعلام) لكنه يتوقف قبل تطبيقهالمُخرَج ملموس ويمكنك فحصه بنظرة أسرع مما تكتبه أنتقرأه إنسان حقيقي قبل أن يسري أي شيء. فرق (diff) تنظر إليه فعلًا، لا تتصفّحه سريعًا.
3. التصرّف في الأشياء القابلة للتراجعينفّذ مباشرةً، لكن فقط في الإجراءات منخفضة المخاطر سهلة التراجعللإجراء تراجعٌ نظيف: تعديلات في نظام التحكم بالإصدارات، كتابات إلى فرع مؤقت، أيّ شيء يعيده أمر واحدقابلية التراجع هي الحاجز. تكلفة الخطأ هي "تراجع عنه"، لا "اشرحه للقسم القانوني".
4. التصرّف ثم الإبلاغيؤدّي العمل باستقلالية، ثم يُريك بالضبط ما فعلهالمهام المتكرّرة جيدة التحديد حيث تكون المراجعة بعد أرخص من البوّابة قبلسجلّ تدقيق كامل وصادق — سِجِل، أو فرق، أو ملخّص — تقرؤه فعلًا بعد ذلك.
5. التصرّف باستقلالية ضمن حواجزيعمل دون مراقبة داخل حدود صارمةحلقات ضيّقة جيدة الفهم شاهدتَها تنجح مرارًا عديدةالحواجز هي التي تتولّى الإشراف. حدود صارمة لا يمكن للذكاء الاصطناعي تجاوزها، إضافةً إلى مفتاح إيقاف.

كيف تستخدم السلّم

ثلاث قواعد تجعل هذا عمليًا:

ابدأ بدرجة أدنى مما يبدو ضروريًا. الصعود درجةً ما إن شاهدتَ شيئًا ينجح رخيصٌ؛ أما التنظيف بعد منح الكثير بسرعة شديدة فمكلِف. في المرة الأولى التي توجّه فيها وكيلًا نحو نوع جديد من المهام، انزل إلى الاقتراح أو المسوّدة حتى لو ظننت أنه يستطيع التعامل مع أكثر.

حدّد الدرجة بأسوأ حالة، لا بالحالة المتوسطة. إن كانت مهمة قابلة للتراجع 95% من الوقت لكن الـ5% الباقية تمسّ بيانات الإنتاج، فإنك تحدّد الدرجة للـ5%. نطاق الضرر لأسوأ تصرّف محتمل هو سقفك.

تسلّق لكل مهمة، لا لكل أداة. الذكاء الاصطناعي نفسه يمكن أن يكون في الدرجة 4 لمهمة "نسّق شيفرتي" وفي الدرجة 1 لمهمة "احذف السجلات من قاعدة البيانات"، في الجلسة نفسها. السلّم يتعلق بـالتصرّف، لا بإعداد ثقة عام تقلبه مرة واحدة.

ربطه بـ Claude Code

Claude Code مكان نظيف لرؤية السلّم عمليًا، لأن نظام أذوناته هو في جوهره مجموعة من المفاتيح لاختيار درجتك:

  • الدرجتان 1–2 هما الوضع الحذِر الافتراضي: يقترح Claude التعديلات والأوامر، وتوافق أنت على كل واحدة. أنت تراجع كل فرق قبل أن يُطبَّق.
  • الدرجة 3 هي السماح باستدعاءات أدوات معيّنة قابلة للتراجع — تعديلات ملفات داخل مستودع git يمكنك git restore منه، أو تشغيلات على فرع قابل للحذف — مع الإبقاء على البوّابة أمام أي شيء مُدمِّر.
  • الدرجة 4 هي وضع فئات من الإجراءات الآمنة في قائمة السماح بحيث يمضي Claude دون استئذان فيها، ثم قراءة النص والفروق بعد ذلك.
  • الدرجة 5 هي استقلالية أكمل لحلقة ضيّقة مُثبَتة — وهي آمنة فقط عندما تكون حواجز حقيقية موجودة: أذونات محدّدة النطاق، ودليل عمل مقيّد، والقدرة على إيقافه.

الآلية التي تتيح لك التسلّق بأمان هي CLAUDE.md الخاص بك. ذلك الملف هو حيث تدوّن الحواجز: ما المسموح دائمًا، وما الذي يجب ألا يحدث أبدًا، وأيّ المسارات محظورة، ومتى تتوقف وتسأل. الحواجز التي تحتفظ بها في رأسك فقط لا تقيّد وكيلًا — أما الحواجز المكتوبة في CLAUDE.md فتفعل. إن لم تكن متأكدًا كيف تصوغها، فإن مولّد CLAUDE.md يمنحك نقطة انطلاق منظَّمة.

الخلاصة الصادقة: لا تمنح الاستقلالية لأن الذكاء الاصطناعي يبدو قادرًا. امنحها لأن التصرّف قابل للتراجع، ونطاق الضرر صغير، والحواجز مكتوبة. ثم تسلّق درجةً واحدة في كل مرة كلما توافرت الأدلة.

ذات صلة