What Is Ensemble Learning: एन्सेम्बल लर्निंग क्या है?, जानें एन्सेम्बल लर्निंग मेथड

Safalta Experts Published by: Nikesh Kumar Updated Mon, 27 Dec 2021 06:50 PM IST

Source: Safalta

एन्सेम्बल लर्निंग वह प्रक्रिया है जिसके द्वारा कई मॉडल, जैसे क्लासिफायर या विशेषज्ञ, एक विशेष कम्प्यूटेशनल इंटेलिजेंस समस्या को हल करने के लिए रणनीतिक रूप से उत्पन्न और संयुक्त होते हैं। एन्सेम्बल लर्निंग का उपयोग मुख्य रूप से एक मॉडल के प्रदर्शन (वर्गीकरण, भविष्यवाणी, फ़ंक्शन सन्निकटन, आदि) में सुधार करने के लिए किया जाता है, या किसी गरीब के दुर्भाग्यपूर्ण चयन की संभावना को कम करता है।
पहनावा सीखने के अन्य अनुप्रयोगों में मॉडल द्वारा किए गए निर्णय के लिए एक विश्वास प्रदान करना, इष्टतम (या इष्टतम के निकट) सुविधाओं का चयन करना, डेटा फ्यूजन, वृद्धिशील शिक्षा, गैर-स्थिर शिक्षा और त्रुटि-सुधार शामिल हैं। यह लेख पहनावा सीखने के वर्गीकरण से संबंधित अनुप्रयोगों पर केंद्रित है, हालांकि, नीचे वर्णित सभी सिद्धांत विचारों को आसानी से कार्य सन्निकटन या भविष्यवाणी प्रकार की समस्याओं के लिए सामान्यीकृत किया जा सकता है।

मशीन लर्निंग एल्गोरिदम क्या होती है, जानें इनके प्रकार और उपयोग

एन्सेम्बल लर्निंग कैसे काम करता है?

मान लें कि आप एक मशीन लर्निंग मॉडल विकसित करना चाहते हैं जो पिछले वर्षों से आपके द्वारा एकत्र किए गए ऐतिहासिक डेटा के आधार पर आपकी कंपनी के लिए इन्वेंट्री स्टॉक ऑर्डर की भविष्यवाणी करता है। आप एक अलग एल्गोरिदम का उपयोग करके ट्रेन चार मशीन लर्निंग मॉडल का उपयोग करते हैं: रैखिक प्रतिगमन, समर्थन वेक्टर मशीन, एक प्रतिगमन निर्णय वृक्ष, और एक बुनियादी कृत्रिम तंत्रिका नेटवर्क। लेकिन बहुत अधिक बदलाव और कॉन्फ़िगरेशन के बाद भी, उनमें से कोई भी आपकी वांछित 95 प्रतिशत भविष्यवाणी सटीकता प्राप्त नहीं करता है। इन मशीन लर्निंग मॉडल को "कमजोर शिक्षार्थी" कहा जाता है क्योंकि वे वांछित स्तर तक अभिसरण करने में विफल होते हैं।
 
एन्सेम्बल मेथड-
मशीन लर्निंग एनसेम्बल के लिए, आपको यह सुनिश्चित करना होगा कि आपके मॉडल एक-दूसरे से स्वतंत्र हों (या यथासंभव एक-दूसरे से स्वतंत्र हों)। ऐसा करने का एक तरीका अलग-अलग एल्गोरिदम से अपना पहनावा बनाना है, जैसा कि ऊपर दिए गए उदाहरण में है।
 
एक और एन्सेम्बल मेथड एक ही मशीन लर्निंग एल्गोरिदम के उदाहरणों का उपयोग करना और उन्हें विभिन्न डेटा सेटों पर प्रशिक्षित करना है। उदाहरण के लिए, आप 12 रैखिक प्रतिगमन मॉडल से बना एक एन्सेम्बल बना सकते हैं, प्रत्येक आपके प्रशिक्षण डेटा के सबसेट पर प्रशिक्षित होता है।

फ्रंट एंड डेवलपर कैसे बनें और इसके लिए कौन से स्किल्स सीखें
 
कुछ सामान्य रूप से उपयोग में लाये जाने वाली एन्सेम्बल तकनीकें इस प्रकार है-
 
1.बैगिंग( Bagging) :  बैगिंग सिमिलर लर्नर को स्मॉल सैंपल पॉपुलेशन पर लागु करने की कोशिश करता है और फिर सभी प्रडिक्सन का मिन लेता है। सामान्यीकृत बैगिंग में, आप अलग-अलग  पॉपुलेशन पर अलग-अलग लर्नर का उपयोग कर सकते हैं। जैसा कि आप उम्मीद कर सकते हैं, इससे हमें विचरण त्रुटि को कम करने में मदद मिलती है।
 
2. बूस्टिंग: बूस्टिंग एक पुनरावृत्त तकनीक है जो पिछले वर्गीकरण के आधार पर एक अवलोकन के वजन को समायोजित करती है। यदि किसी अवलोकन को गलत तरीके से वर्गीकृत किया गया था, तो यह इस अवलोकन के वजन को बढ़ाने की कोशिश करता है और इसके विपरीत। सामान्य रूप से बूस्टिंग पूर्वाग्रह त्रुटि को कम करता है और मजबूत भविष्य कहनेवाला मॉडल बनाता है। हालांकि, वे कभी-कभी प्रशिक्षण डेटा पर फिट हो सकते हैं।
 
3. स्टैकिंग : यह मॉडलों के संयोजन का एक बहुत ही रोचक तरीका है। यहां हम विभिन्न लर्नर के आउटपुट को संयोजित करने के लिए एक लर्नर का उपयोग करते हैं। यह हमारे द्वारा उपयोग किए जाने वाले संयोजन लर्नर के आधार पर पूर्वाग्रह या विचरण त्रुटि में कमी ला सकता है।
 
वोटिंग और एवरेजिंग बेस्ड एनसेम्बल मेथड्स-
 
वोटिंग और औसत दो सबसे आसान पहनावा तरीके हैं। वे दोनों समझने और लागू करने में आसान हैं। वोटिंग का उपयोग वर्गीकरण के लिए किया जाता है और औसत का उपयोग प्रतिगमन के लिए किया जाता है।

2022 में सीखने के लिए सर्वश्रेष्ठ प्रोग्रामिंग भाषाएँ
 
दोनों विधियों में, पहला कदम कुछ प्रशिक्षण डेटासेट का उपयोग करके कई वर्गीकरण/प्रतिगमन मॉडल बनाना है। प्रत्येक आधार मॉडल एक ही प्रशिक्षण डेटासेट और एक ही एल्गोरिथ्म के विभिन्न विभाजनों का उपयोग करके, या अलग-अलग एल्गोरिदम के साथ एक ही डेटासेट का उपयोग करके, या किसी अन्य विधि का उपयोग करके बनाया जा सकता है। निम्नलिखित पायथन-एस्क स्यूडोकोड विभिन्न एल्गोरिदम के साथ एक ही प्रशिक्षण डेटासेट के उपयोग को दर्शाता है।
 
एक से अधिक मशीन लर्निंग मॉडल स्टैकिंग-
 
स्टैकिंग, जिसे स्टैक्ड सामान्यीकरण के रूप में भी जाना जाता है, एक एन्सेम्बल विधि है जहां मॉडल को किसी अन्य मशीन लर्निंग एल्गोरिदम का उपयोग करके जोड़ा जाता है। मूल विचार मशीन लर्निंग एल्गोरिदम को प्रशिक्षण डेटासेट के साथ प्रशिक्षित करना है और फिर इन मॉडलों के साथ एक नया डेटासेट तैयार करना है। फिर इस नए डेटासेट का उपयोग कॉम्बिनर मशीन लर्निंग एल्गोरिथम के लिए इनपुट के रूप में किया जाता है।

2022 में सर्टिफाइड माइक्रोसॉफ्ट एक्सेल प्रोफेशनल कैसे बनें
 
बूटस्ट्रैप एग्रीगेशन-

निष्कर्ष-
 
यद्यपि एन्सेम्बल विधियाँ आपको परिष्कृत एल्गोरिदम तैयार करके और उच्च सटीकता के साथ परिणाम उत्पन्न करके मशीन सीखने की प्रतियोगिताओं को जीतने में मदद कर सकती हैं, यह अक्सर उन उद्योगों में पसंद नहीं किया जाता है जहाँ व्याख्यात्मकता अधिक महत्वपूर्ण है। बहरहाल, इन विधियों की प्रभावशीलता निर्विवाद है, और उपयुक्त अनुप्रयोगों में उनके लाभ जबरदस्त हो सकते हैं। स्वास्थ्य देखभाल जैसे क्षेत्रों में, मशीन लर्निंग एल्गोरिदम की सटीकता में सुधार की थोड़ी सी मात्रा भी वास्तव में मूल्यवान हो सकती है।

एक सफल डेटा एनालिटिक्स करियर कैसे बनाएं