द ट्रस्ट लैडर
"मुझे AI को कितना सिर्फ करने देना चाहिए?" लगभग हर एजेंट फैसले के पीछे यही सवाल है — Claude Code की अनुमतियाँ, ऑटो-अप्रूव सेटिंग्स, किसी स्क्रिप्ट को बिना निगरानी चलने देना या नहीं। लोग इसका जवाब अक्सर एक ही चालू/बंद स्विच की तरह देते हैं: या तो आप हर चीज की चौकीदारी करते हैं, या आप इसे खुला छोड़ देते हैं।
इसके बजाय यहाँ एक नजरिया है जिसे AILmanac इस्तेमाल करता है:
स्वायत्तता कोई स्विच नहीं है, यह एक सीढ़ी है। आप इसे एक बार में एक पायदान चढ़ते हैं, और जिस पायदान पर आप खड़े हैं वह इस बात से तय होना चाहिए कि कोई गलती कितनी बुरी होगी — न कि इस बात से कि आप मॉडल पर कितना भरोसा करते हैं।
मुख्य अंतर्दृष्टि यह है कि स्वायत्तता की सही मात्रा का इस बात से लगभग कोई लेना-देना नहीं है कि AI कितना "स्मार्ट" है। यह ब्लास्ट रेडियस (एक गलत कार्रवाई कितना नुकसान करती है) और पलटने योग्यता (आप उसे कितनी आसानी से वापस पलट सकते हैं) के बारे में है। एक शानदार मॉडल जो बिना निगरानी कोई न पलटने योग्य काम कर रहा है, वह एक औसत दर्जे के मॉडल से बुरा सेटअप है जो एक पलटने योग्य काम कर रहा है।
पाँच पायदान
एक मॉडल जो हमें उपयोगी लगता है वह है पाँच अलग पायदानों के बारे में सोचना, सबसे कम से सबसे ज्यादा स्वायत्तता तक:
| पायदान | AI क्या करता है | यह कब उचित है | इसे क्या सुरक्षित बनाता है |
|---|---|---|---|
| 1. सिर्फ सुझाव | आपको बताता है कि वह क्या करेगा; कोई कार्रवाई नहीं करता | ऊँचे-दाँव या न पलटने योग्य काम; एक क्षेत्र जिसमें आप अभी इस पर भरोसा नहीं करते; आप अभी भी सीख रहे हैं कि यह किसमें अच्छा है | आप ही निष्पादक हैं। आपके खुद हाथ से किए बिना कुछ नहीं होता। |
| 2. समीक्षा के लिए मसौदा | असली कलाकृति (कोड, ईमेल, क्वेरी) बनाता है पर उसे लागू करने से पहले रुक जाता है | आउटपुट ठोस है और आप उसे खुद लिखने से ज्यादा तेजी से उस पर नजर डाल सकते हैं | कोई असली इंसान कुछ भी प्रभावी होने से पहले पढ़ता है। एक डिफ जिसे आप सचमुच देखते हैं, सरसरी निगाह नहीं डालते। |
| 3. पलटने योग्य चीजों पर कार्रवाई | सीधे निष्पादित करता है, पर सिर्फ कम-दाँव, आसानी से पलटने योग्य कार्रवाइयों पर | कार्रवाई का एक साफ अनडू है: वर्जन कंट्रोल में संपादन, किसी स्क्रैच ब्रांच पर लिखना, कुछ भी जो एक ही कमांड से वापस पलट जाए | पलटने योग्यता ही रोक-बाड़ है। गलती की कीमत "इसे अनडू कर दो" है, "इसे लीगल को समझाओ" नहीं। |
| 4. कार्रवाई फिर रिपोर्ट | काम स्वायत्त रूप से करता है, फिर आपको ठीक-ठीक दिखाता है कि उसने क्या किया | दोहराव वाले, अच्छी तरह दायरे में बँधे काम जहाँ बाद में समीक्षा करना पहले रोक लगाने से सस्ता है | एक पूरा, ईमानदार ऑडिट ट्रेल — एक लॉग, एक डिफ, एक सारांश — जिसे आप सचमुच बाद में पढ़ते हैं। |
| 5. रोक-बाड़ के भीतर स्वायत्त कार्रवाई | कड़ी सीमाओं के भीतर बिना निगरानी चलता है | संकीर्ण, अच्छी तरह समझे गए लूप जिन्हें आपने कई बार सफल होते देखा है | रोक-बाड़ ही निगरानी करती है। कड़ी सीमाएँ जिन्हें AI पार नहीं कर सकता, साथ ही एक किल स्विच। |
सीढ़ी को कैसे इस्तेमाल करें
तीन नियम इसे व्यावहारिक बनाते हैं:
जरूरत से एक पायदान नीचे से शुरू करें। एक बार किसी चीज को काम करते देख लेने के बाद एक पायदान चढ़ना सस्ता है; बहुत जल्दी बहुत ज्यादा दे देने के बाद सफाई करना महँगा है। पहली बार जब आप किसी नए तरह के काम पर एजेंट लगाते हैं, तो भले ही आपको शक हो कि यह ज्यादा संभाल सकता है, सुझाव या मसौदा तक गिर जाएँ।
पायदान सबसे बुरे मामले से तय करें, औसत मामले से नहीं। अगर कोई काम 95% समय पलटने योग्य है पर बाकी 5% प्रोडक्शन डेटा को छूता है, तो आप पायदान 5% के लिए तय करते हैं। सबसे बुरी संभव कार्रवाई का ब्लास्ट रेडियस ही आपकी छत है।
प्रति-काम चढ़ें, प्रति-टूल नहीं। वही AI एक ही सेशन में "मेरा कोड फॉर्मेट करो" के लिए पायदान 4 पर और "डेटाबेस से रिकॉर्ड डिलीट करो" के लिए पायदान 1 पर हो सकता है। सीढ़ी कार्रवाई के बारे में है, किसी वैश्विक भरोसा सेटिंग के बारे में नहीं जिसे आप एक बार पलटते हैं।
इसे Claude Code से मिलाना
Claude Code सीढ़ी को काम करते देखने की एक साफ जगह है, क्योंकि इसकी अनुमति प्रणाली अनिवार्य रूप से आपका पायदान चुनने के डायल्स का एक सेट है:
- पायदान 1–2 डिफॉल्ट सतर्क रुख है: Claude संपादन और कमांड प्रस्तावित करता है, और आप हर एक को मंजूर करते हैं। आप हर डिफ की समीक्षा उसके लागू होने से पहले कर रहे होते हैं।
- पायदान 3 विशिष्ट पलटने योग्य टूल कॉल्स की अनुमति देना है — किसी git रिपो के भीतर फाइल संपादन जिसे आप
git restoreकर सकते हैं, किसी फेंकने लायक ब्रांच पर रन — जबकि किसी भी विनाशकारी चीज पर अभी भी रोक लगाए रखना। - पायदान 4 सुरक्षित कार्रवाइयों की श्रेणियों को allow-list करना है ताकि Claude उन पर बिना पूछे आगे बढ़े, फिर बाद में ट्रांसक्रिप्ट और डिफ पढ़ना।
- पायदान 5 एक संकीर्ण, सिद्ध लूप के लिए अधिक पूर्ण स्वायत्तता है — और यह तभी सुरक्षित है जब असली रोक-बाड़ें मौजूद हों: दायरे में बँधी अनुमतियाँ, एक प्रतिबंधित वर्किंग डायरेक्टरी, और इसे रोकने की क्षमता।
जो तंत्र आपको सुरक्षित रूप से चढ़ने देता है वह आपका CLAUDE.md है। वह फाइल वह जगह है जहाँ आप रोक-बाड़ों को लिखते हैं: क्या हमेशा अनुमत है, क्या कभी नहीं होना चाहिए, कौन से पाथ सीमा से बाहर हैं, कब रुककर पूछना है। जो रोक-बाड़ें आप सिर्फ अपने दिमाग में रखते हैं वे किसी एजेंट को बाँधती नहीं — CLAUDE.md में लिखी रोक-बाड़ें बाँधती हैं। अगर आपको यकीन नहीं कि उन्हें कैसे शब्दबद्ध करें, तो CLAUDE.md जनरेटर आपको एक संरचित शुरुआती बिंदु देता है।
ईमानदार सारांश: स्वायत्तता इसलिए न दें कि AI सक्षम लगता है। इसे इसलिए दें कि कार्रवाई पलटने योग्य है, ब्लास्ट रेडियस छोटा है, और रोक-बाड़ें लिखी हुई हैं। फिर जैसे-जैसे सबूत आते हैं, एक बार में एक पायदान चढ़ें।