سلّم الثقة
"إلى أيّ مدى أدع الذكاء الاصطناعي يتصرف وحده؟" هو السؤال الكامن خلف كل قرار يتعلق بالوكلاء تقريبًا — أذونات Claude Code، إعدادات الموافقة التلقائية، وما إذا كنت ستترك نصًا برمجيًا يعمل دون مراقبة. يميل الناس إلى الإجابة عنه كمفتاح تشغيل/إيقاف واحد: فإما أن تراقب كل شيء، وإما أن تطلق العنان له.
إليك العدسة التي يستخدمها AILmanac بدلًا من ذلك:
الاستقلالية ليست مفتاحًا، بل سلّمًا. تتسلّقه درجةً واحدة في كل مرة، والدرجة التي تقف عليها ينبغي أن يحدّدها مدى سوء الخطأ — لا مدى ثقتك بالنموذج.
الإدراك الأساسي هو أن القدر الصحيح من الاستقلالية لا علاقة له تقريبًا بمدى "ذكاء" الذكاء الاصطناعي. بل يتعلق بـ نطاق الضرر (كم من الضرر يُحدثه تصرّف خاطئ) وقابلية التراجع (كم تسهل عليك إعادة الأمور إلى ما كانت عليه). نموذج بارع يفعل شيئًا غير قابل للتراجع دون إشراف هو إعداد أسوأ من نموذج متوسط يفعل شيئًا قابلًا للتراجع.
الدرجات الخمس
نموذج نجده مفيدًا هو التفكير في خمس درجات متمايزة، من الأقل استقلاليةً إلى الأكثر:
| الدرجة | ماذا يفعل الذكاء الاصطناعي | متى تكون مناسبة | ما يجعلها آمنة |
|---|---|---|---|
| 1. الاقتراح فقط | يخبرك بما سيفعله؛ لا يتخذ أي إجراء | الأعمال عالية المخاطر أو غير القابلة للتراجع؛ مجال لا تثق به فيه بعد؛ ما زلت تتعلّم ما يجيده | أنت المنفّذ. لا يحدث شيء دون أن تفعله بيدك. |
| 2. مسوّدة للمراجعة | ينتج المُخرَج الفعلي (شيفرة، بريد، استعلام) لكنه يتوقف قبل تطبيقه | المُخرَج ملموس ويمكنك فحصه بنظرة أسرع مما تكتبه أنت | قرأه إنسان حقيقي قبل أن يسري أي شيء. فرق (diff) تنظر إليه فعلًا، لا تتصفّحه سريعًا. |
| 3. التصرّف في الأشياء القابلة للتراجع | ينفّذ مباشرةً، لكن فقط في الإجراءات منخفضة المخاطر سهلة التراجع | للإجراء تراجعٌ نظيف: تعديلات في نظام التحكم بالإصدارات، كتابات إلى فرع مؤقت، أيّ شيء يعيده أمر واحد | قابلية التراجع هي الحاجز. تكلفة الخطأ هي "تراجع عنه"، لا "اشرحه للقسم القانوني". |
| 4. التصرّف ثم الإبلاغ | يؤدّي العمل باستقلالية، ثم يُريك بالضبط ما فعله | المهام المتكرّرة جيدة التحديد حيث تكون المراجعة بعد أرخص من البوّابة قبل | سجلّ تدقيق كامل وصادق — سِجِل، أو فرق، أو ملخّص — تقرؤه فعلًا بعد ذلك. |
| 5. التصرّف باستقلالية ضمن حواجز | يعمل دون مراقبة داخل حدود صارمة | حلقات ضيّقة جيدة الفهم شاهدتَها تنجح مرارًا عديدة | الحواجز هي التي تتولّى الإشراف. حدود صارمة لا يمكن للذكاء الاصطناعي تجاوزها، إضافةً إلى مفتاح إيقاف. |
كيف تستخدم السلّم
ثلاث قواعد تجعل هذا عمليًا:
ابدأ بدرجة أدنى مما يبدو ضروريًا. الصعود درجةً ما إن شاهدتَ شيئًا ينجح رخيصٌ؛ أما التنظيف بعد منح الكثير بسرعة شديدة فمكلِف. في المرة الأولى التي توجّه فيها وكيلًا نحو نوع جديد من المهام، انزل إلى الاقتراح أو المسوّدة حتى لو ظننت أنه يستطيع التعامل مع أكثر.
حدّد الدرجة بأسوأ حالة، لا بالحالة المتوسطة. إن كانت مهمة قابلة للتراجع 95% من الوقت لكن الـ5% الباقية تمسّ بيانات الإنتاج، فإنك تحدّد الدرجة للـ5%. نطاق الضرر لأسوأ تصرّف محتمل هو سقفك.
تسلّق لكل مهمة، لا لكل أداة. الذكاء الاصطناعي نفسه يمكن أن يكون في الدرجة 4 لمهمة "نسّق شيفرتي" وفي الدرجة 1 لمهمة "احذف السجلات من قاعدة البيانات"، في الجلسة نفسها. السلّم يتعلق بـالتصرّف، لا بإعداد ثقة عام تقلبه مرة واحدة.
ربطه بـ Claude Code
Claude Code مكان نظيف لرؤية السلّم عمليًا، لأن نظام أذوناته هو في جوهره مجموعة من المفاتيح لاختيار درجتك:
- الدرجتان 1–2 هما الوضع الحذِر الافتراضي: يقترح Claude التعديلات والأوامر، وتوافق أنت على كل واحدة. أنت تراجع كل فرق قبل أن يُطبَّق.
- الدرجة 3 هي السماح باستدعاءات أدوات معيّنة قابلة للتراجع — تعديلات ملفات داخل مستودع git يمكنك
git restoreمنه، أو تشغيلات على فرع قابل للحذف — مع الإبقاء على البوّابة أمام أي شيء مُدمِّر. - الدرجة 4 هي وضع فئات من الإجراءات الآمنة في قائمة السماح بحيث يمضي Claude دون استئذان فيها، ثم قراءة النص والفروق بعد ذلك.
- الدرجة 5 هي استقلالية أكمل لحلقة ضيّقة مُثبَتة — وهي آمنة فقط عندما تكون حواجز حقيقية موجودة: أذونات محدّدة النطاق، ودليل عمل مقيّد، والقدرة على إيقافه.
الآلية التي تتيح لك التسلّق بأمان هي CLAUDE.md الخاص بك. ذلك الملف هو حيث تدوّن الحواجز: ما المسموح دائمًا، وما الذي يجب ألا يحدث أبدًا، وأيّ المسارات محظورة، ومتى تتوقف وتسأل. الحواجز التي تحتفظ بها في رأسك فقط لا تقيّد وكيلًا — أما الحواجز المكتوبة في CLAUDE.md فتفعل. إن لم تكن متأكدًا كيف تصوغها، فإن مولّد CLAUDE.md يمنحك نقطة انطلاق منظَّمة.
الخلاصة الصادقة: لا تمنح الاستقلالية لأن الذكاء الاصطناعي يبدو قادرًا. امنحها لأن التصرّف قابل للتراجع، ونطاق الضرر صغير، والحواجز مكتوبة. ثم تسلّق درجةً واحدة في كل مرة كلما توافرت الأدلة.