मुख्य कंटेंट तक स्किप करें
मध्यम

द ट्रस्ट लैडर

"मुझे AI को कितना सिर्फ करने देना चाहिए?" लगभग हर एजेंट फैसले के पीछे यही सवाल है — Claude Code की अनुमतियाँ, ऑटो-अप्रूव सेटिंग्स, किसी स्क्रिप्ट को बिना निगरानी चलने देना या नहीं। लोग इसका जवाब अक्सर एक ही चालू/बंद स्विच की तरह देते हैं: या तो आप हर चीज की चौकीदारी करते हैं, या आप इसे खुला छोड़ देते हैं।

इसके बजाय यहाँ एक नजरिया है जिसे AILmanac इस्तेमाल करता है:

स्वायत्तता कोई स्विच नहीं है, यह एक सीढ़ी है। आप इसे एक बार में एक पायदान चढ़ते हैं, और जिस पायदान पर आप खड़े हैं वह इस बात से तय होना चाहिए कि कोई गलती कितनी बुरी होगी — न कि इस बात से कि आप मॉडल पर कितना भरोसा करते हैं।

मुख्य अंतर्दृष्टि यह है कि स्वायत्तता की सही मात्रा का इस बात से लगभग कोई लेना-देना नहीं है कि AI कितना "स्मार्ट" है। यह ब्लास्ट रेडियस (एक गलत कार्रवाई कितना नुकसान करती है) और पलटने योग्यता (आप उसे कितनी आसानी से वापस पलट सकते हैं) के बारे में है। एक शानदार मॉडल जो बिना निगरानी कोई न पलटने योग्य काम कर रहा है, वह एक औसत दर्जे के मॉडल से बुरा सेटअप है जो एक पलटने योग्य काम कर रहा है।

पाँच पायदान

एक मॉडल जो हमें उपयोगी लगता है वह है पाँच अलग पायदानों के बारे में सोचना, सबसे कम से सबसे ज्यादा स्वायत्तता तक:

पायदानAI क्या करता हैयह कब उचित हैइसे क्या सुरक्षित बनाता है
1. सिर्फ सुझावआपको बताता है कि वह क्या करेगा; कोई कार्रवाई नहीं करताऊँचे-दाँव या न पलटने योग्य काम; एक क्षेत्र जिसमें आप अभी इस पर भरोसा नहीं करते; आप अभी भी सीख रहे हैं कि यह किसमें अच्छा हैआप ही निष्पादक हैं। आपके खुद हाथ से किए बिना कुछ नहीं होता।
2. समीक्षा के लिए मसौदाअसली कलाकृति (कोड, ईमेल, क्वेरी) बनाता है पर उसे लागू करने से पहले रुक जाता हैआउटपुट ठोस है और आप उसे खुद लिखने से ज्यादा तेजी से उस पर नजर डाल सकते हैंकोई असली इंसान कुछ भी प्रभावी होने से पहले पढ़ता है। एक डिफ जिसे आप सचमुच देखते हैं, सरसरी निगाह नहीं डालते।
3. पलटने योग्य चीजों पर कार्रवाईसीधे निष्पादित करता है, पर सिर्फ कम-दाँव, आसानी से पलटने योग्य कार्रवाइयों परकार्रवाई का एक साफ अनडू है: वर्जन कंट्रोल में संपादन, किसी स्क्रैच ब्रांच पर लिखना, कुछ भी जो एक ही कमांड से वापस पलट जाएपलटने योग्यता ही रोक-बाड़ है। गलती की कीमत "इसे अनडू कर दो" है, "इसे लीगल को समझाओ" नहीं।
4. कार्रवाई फिर रिपोर्टकाम स्वायत्त रूप से करता है, फिर आपको ठीक-ठीक दिखाता है कि उसने क्या कियादोहराव वाले, अच्छी तरह दायरे में बँधे काम जहाँ बाद में समीक्षा करना पहले रोक लगाने से सस्ता हैएक पूरा, ईमानदार ऑडिट ट्रेल — एक लॉग, एक डिफ, एक सारांश — जिसे आप सचमुच बाद में पढ़ते हैं।
5. रोक-बाड़ के भीतर स्वायत्त कार्रवाईकड़ी सीमाओं के भीतर बिना निगरानी चलता हैसंकीर्ण, अच्छी तरह समझे गए लूप जिन्हें आपने कई बार सफल होते देखा हैरोक-बाड़ ही निगरानी करती है। कड़ी सीमाएँ जिन्हें AI पार नहीं कर सकता, साथ ही एक किल स्विच।

सीढ़ी को कैसे इस्तेमाल करें

तीन नियम इसे व्यावहारिक बनाते हैं:

जरूरत से एक पायदान नीचे से शुरू करें। एक बार किसी चीज को काम करते देख लेने के बाद एक पायदान चढ़ना सस्ता है; बहुत जल्दी बहुत ज्यादा दे देने के बाद सफाई करना महँगा है। पहली बार जब आप किसी नए तरह के काम पर एजेंट लगाते हैं, तो भले ही आपको शक हो कि यह ज्यादा संभाल सकता है, सुझाव या मसौदा तक गिर जाएँ।

पायदान सबसे बुरे मामले से तय करें, औसत मामले से नहीं। अगर कोई काम 95% समय पलटने योग्य है पर बाकी 5% प्रोडक्शन डेटा को छूता है, तो आप पायदान 5% के लिए तय करते हैं। सबसे बुरी संभव कार्रवाई का ब्लास्ट रेडियस ही आपकी छत है।

प्रति-काम चढ़ें, प्रति-टूल नहीं। वही AI एक ही सेशन में "मेरा कोड फॉर्मेट करो" के लिए पायदान 4 पर और "डेटाबेस से रिकॉर्ड डिलीट करो" के लिए पायदान 1 पर हो सकता है। सीढ़ी कार्रवाई के बारे में है, किसी वैश्विक भरोसा सेटिंग के बारे में नहीं जिसे आप एक बार पलटते हैं।

इसे Claude Code से मिलाना

Claude Code सीढ़ी को काम करते देखने की एक साफ जगह है, क्योंकि इसकी अनुमति प्रणाली अनिवार्य रूप से आपका पायदान चुनने के डायल्स का एक सेट है:

  • पायदान 1–2 डिफॉल्ट सतर्क रुख है: Claude संपादन और कमांड प्रस्तावित करता है, और आप हर एक को मंजूर करते हैं। आप हर डिफ की समीक्षा उसके लागू होने से पहले कर रहे होते हैं।
  • पायदान 3 विशिष्ट पलटने योग्य टूल कॉल्स की अनुमति देना है — किसी git रिपो के भीतर फाइल संपादन जिसे आप git restore कर सकते हैं, किसी फेंकने लायक ब्रांच पर रन — जबकि किसी भी विनाशकारी चीज पर अभी भी रोक लगाए रखना।
  • पायदान 4 सुरक्षित कार्रवाइयों की श्रेणियों को allow-list करना है ताकि Claude उन पर बिना पूछे आगे बढ़े, फिर बाद में ट्रांसक्रिप्ट और डिफ पढ़ना।
  • पायदान 5 एक संकीर्ण, सिद्ध लूप के लिए अधिक पूर्ण स्वायत्तता है — और यह तभी सुरक्षित है जब असली रोक-बाड़ें मौजूद हों: दायरे में बँधी अनुमतियाँ, एक प्रतिबंधित वर्किंग डायरेक्टरी, और इसे रोकने की क्षमता।

जो तंत्र आपको सुरक्षित रूप से चढ़ने देता है वह आपका CLAUDE.md है। वह फाइल वह जगह है जहाँ आप रोक-बाड़ों को लिखते हैं: क्या हमेशा अनुमत है, क्या कभी नहीं होना चाहिए, कौन से पाथ सीमा से बाहर हैं, कब रुककर पूछना है। जो रोक-बाड़ें आप सिर्फ अपने दिमाग में रखते हैं वे किसी एजेंट को बाँधती नहीं — CLAUDE.md में लिखी रोक-बाड़ें बाँधती हैं। अगर आपको यकीन नहीं कि उन्हें कैसे शब्दबद्ध करें, तो CLAUDE.md जनरेटर आपको एक संरचित शुरुआती बिंदु देता है।

ईमानदार सारांश: स्वायत्तता इसलिए न दें कि AI सक्षम लगता है। इसे इसलिए दें कि कार्रवाई पलटने योग्य है, ब्लास्ट रेडियस छोटा है, और रोक-बाड़ें लिखी हुई हैं। फिर जैसे-जैसे सबूत आते हैं, एक बार में एक पायदान चढ़ें।

संबंधित