AI एजेंट्स विफलताओं से कैसे सीखते और सुधरते हैं

विफलता जानकारी है

जब कोई AI एजेंट कार्य पूरा करने की कोशिश करता है और विफल होता है, तो विफलता ख़ुद मूल्यवान जानकारी रखती है। API ने 429 लौटाया (रेट लिमिटेड), जो एजेंट को धीमा होने का संकेत देता है। मॉडल ने अमान्य JSON उत्पन्न किया, जो एजेंट को फ़ॉर्मेट सत्यापन जोड़ने का संकेत देता है। फ़ाइल अपेक्षित पथ पर नहीं मिली, जो एजेंट को ऑपरेट करने से पहले पथ सत्यापित करने का संकेत देता है।

जो एजेंट विफलताओं को निपटान योग्य घटनाओं की तरह मानते हैं, वे वही ग़लतियाँ दोहराते हैं। जो एजेंट विफलताओं को कैप्चर करके उनसे सीखते हैं, वे क्रमशः अधिक विश्वसनीय बनते हैं। फ़र्क़ इस बात का है कि क्या विफलता कहीं ऐसी जगह दर्ज होती है जहाँ एजेंट बाद में संदर्भ ले सके।

विफलताओं का वर्गीकरण

सभी विफलताएँ बराबर नहीं हैं, और एजेंट की प्रतिक्रिया प्रकार पर निर्भर होनी चाहिए। क्षणिक विफलताओं (नेटवर्क टाइमआउट, रेट लिमिट, अस्थायी सेवा बाधाएँ) को बैकऑफ के साथ रीट्राई ट्रिगर करना चाहिए। स्थायी विफलताओं (अमान्य क्रेडेंशियल, ग़ायब अनुमतियाँ, असमर्थित ऑपरेशन) को अलग तरीक़ा या एस्केलेशन ट्रिगर करना चाहिए। तार्किक विफलताओं (एजेंट की योजना ग़लत थी, निष्पादन नहीं) को पुनर्योजना ट्रिगर करनी चाहिए।

वर्गीकरण इसलिए मायने रखता है क्योंकि विफलता पर ग़लत प्रतिक्रिया चीज़ों को बदतर बनाती है। स्थायी विफलता पर रीट्राई समय बर्बाद करता है। क्षणिक विफलता के बाद पुनर्योजना अच्छी योजना बर्बाद करती है। क्षणिक विफलता को एस्केलेट करना मनुष्य को अनावश्यक रूप से परेशान करता है।

विफलता ज्ञान आधार बनाना

सबसे प्रभावी पैटर्न विफलताओं को खोजने योग्य प्रारूप में संग्रहीत करता है: क्या आज़माया गया, क्या ग़लत हुआ, मूल कारण क्या था, और अंततः क्या काम किया। कार्य आज़माने से पहले, एजेंट इस ज्ञान आधार में समान पिछली विफलताओं को खोजता है और तदनुसार अपना तरीक़ा समायोजित करता है।

"पिछली बार जब मैंने इस API को 1MB से बड़े पेलोड के साथ कॉल करने की कोशिश की, तो टाइमआउट हो गया। समाधान रिक्वेस्ट को छोटे टुकड़ों में बैच करना था।" यदि यह एजेंट के मेमोरी सिस्टम में है, तो वह बड़े पेलोड को सक्रिय रूप से बैच कर सकता है—विफल होने और फिर वर्कअराउंड का पता लगाने के बजाय।

फ़ीडबैक लूप

एजेंट विफलताओं पर मानवीय फ़ीडबैक विशेष रूप से मूल्यवान है क्योंकि यह वह "क्यों" प्रदान करता है जो एजेंट ख़ुद से शायद न पहचान पाए। "वह विफल हुआ क्योंकि हमारे स्टेजिंग एनवायरनमेंट को VPN एक्सेस चाहिए" वह संदर्भ है जिसे एजेंट ट्रायल और एरर से नहीं खोज सकता। इस फ़ीडबैक को कैप्चर करना और भविष्य के कार्यों के लिए एजेंट को उपलब्ध कराना सीखने का लूप पूरा करता है।

कुछ एजेंट फ़्रेमवर्क में अंतर्निहित फ़ीडबैक तंत्र शामिल हैं जहाँ उपयोगकर्ता विफल कार्यों पर एनोटेट कर सकते हैं। यह एनोटेशन एजेंट की दीर्घकालिक मेमोरी का हिस्सा बन जाता है, भविष्य में समान स्थितियों को संभालने में सुधार लाता है।

ग़लत सबक़ से बचना

एजेंट विफलताओं से ग़लत सबक़ भी सीख सकते हैं। यदि कोई API कॉल अस्थायी समस्या के कारण एक बार विफल हो, तो एजेंट को उस API से स्थायी रूप से बचना नहीं चाहिए। विफलता ज्ञान को समाप्ति तिथियाँ या आत्मविश्वास स्तर चाहिए। "यह API तीन महीने पहले अस्थिर था" "यह API पाँच मिनट पहले विफल हुआ" से कम प्रासंगिक है।

AI एजेंट्स विफल कार्य प्रयासों से कैसे सीखते हैं

विफलता जानकारी है

विफलताओं का वर्गीकरण

विफलता ज्ञान आधार बनाना

फ़ीडबैक लूप

ग़लत सबक़ से बचना

संबंधित पठन