What Is Ensemble Learning: एन्सेम्बल लर्निंग क्या है?, जानें एन्सेम्बल लर्निंग मेथड

Safalta Experts Published by: Nikesh Kumar Updated Mon, 27 Dec 2021 06:50 PM IST

एन्सेम्बल लर्निंग वह प्रक्रिया है जिसके द्वारा कई मॉडल, जैसे क्लासिफायर या विशेषज्ञ, एक विशेष कम्प्यूटेशनल इंटेलिजेंस समस्या को हल करने के लिए रणनीतिक रूप से उत्पन्न और संयुक्त होते हैं। एन्सेम्बल लर्निंग का उपयोग मुख्य रूप से एक मॉडल के प्रदर्शन (वर्गीकरण, भविष्यवाणी, फ़ंक्शन सन्निकटन, आदि) में सुधार करने के लिए किया जाता है, या किसी गरीब के दुर्भाग्यपूर्ण चयन की संभावना को कम करता है। पहनावा सीखने के अन्य अनुप्रयोगों में मॉडल द्वारा किए गए निर्णय के लिए एक विश्वास प्रदान करना, इष्टतम (या इष्टतम के निकट) सुविधाओं का चयन करना, डेटा फ्यूजन, वृद्धिशील शिक्षा, गैर-स्थिर शिक्षा और त्रुटि-सुधार शामिल हैं। यह लेख पहनावा सीखने के वर्गीकरण से संबंधित अनुप्रयोगों पर केंद्रित है, हालांकि, नीचे वर्णित सभी सिद्धांत विचारों को आसानी से कार्य सन्निकटन या भविष्यवाणी प्रकार की समस्याओं के लिए सामान्यीकृत किया जा सकता है।

Source: Safalta



मशीन लर्निंग एल्गोरिदम क्या होती है, जानें इनके प्रकार और उपयोग

Free Demo Classes

Register here for Free Demo Classes

एन्सेम्बल लर्निंग कैसे काम करता है?

मान लें कि आप एक मशीन लर्निंग मॉडल विकसित करना चाहते हैं जो पिछले वर्षों से आपके द्वारा एकत्र किए गए ऐतिहासिक डेटा के आधार पर आपकी कंपनी के लिए इन्वेंट्री स्टॉक ऑर्डर की भविष्यवाणी करता है। आप एक अलग एल्गोरिदम का उपयोग करके ट्रेन चार मशीन लर्निंग मॉडल का उपयोग करते हैं: रैखिक प्रतिगमन, समर्थन वेक्टर मशीन, एक प्रतिगमन निर्णय वृक्ष, और एक बुनियादी कृत्रिम तंत्रिका नेटवर्क। लेकिन बहुत अधिक बदलाव और कॉन्फ़िगरेशन के बाद भी, उनमें से कोई भी आपकी वांछित 95 प्रतिशत भविष्यवाणी सटीकता प्राप्त नहीं करता है। इन मशीन लर्निंग मॉडल को "कमजोर शिक्षार्थी" कहा जाता है क्योंकि वे वांछित स्तर तक अभिसरण करने में विफल होते हैं।
 
एन्सेम्बल मेथड- मशीन लर्निंग एनसेम्बल के लिए, आपको यह सुनिश्चित करना होगा कि आपके मॉडल एक-दूसरे से स्वतंत्र हों (या यथासंभव एक-दूसरे से स्वतंत्र हों)। ऐसा करने का एक तरीका अलग-अलग एल्गोरिदम से अपना पहनावा बनाना है, जैसा कि ऊपर दिए गए उदाहरण में है।
 
एक और एन्सेम्बल मेथड एक ही मशीन लर्निंग एल्गोरिदम के उदाहरणों का उपयोग करना और उन्हें विभिन्न डेटा सेटों पर प्रशिक्षित करना है। उदाहरण के लिए, आप 12 रैखिक प्रतिगमन मॉडल से बना एक एन्सेम्बल बना सकते हैं, प्रत्येक आपके प्रशिक्षण डेटा के सबसेट पर प्रशिक्षित होता है।

फ्रंट एंड डेवलपर कैसे बनें और इसके लिए कौन से स्किल्स सीखें
 
कुछ सामान्य रूप से उपयोग में लाये जाने वाली एन्सेम्बल तकनीकें इस प्रकार है-
 
1.बैगिंग( Bagging) :  बैगिंग सिमिलर लर्नर को स्मॉल सैंपल पॉपुलेशन पर लागु करने की कोशिश करता है और फिर सभी प्रडिक्सन का मिन लेता है। सामान्यीकृत बैगिंग में, आप अलग-अलग  पॉपुलेशन पर अलग-अलग लर्नर का उपयोग कर सकते हैं। जैसा कि आप उम्मीद कर सकते हैं, इससे हमें विचरण त्रुटि को कम करने में मदद मिलती है।
 
2. बूस्टिंग: बूस्टिंग एक पुनरावृत्त तकनीक है जो पिछले वर्गीकरण के आधार पर एक अवलोकन के वजन को समायोजित करती है। यदि किसी अवलोकन को गलत तरीके से वर्गीकृत किया गया था, तो यह इस अवलोकन के वजन को बढ़ाने की कोशिश करता है और इसके विपरीत। सामान्य रूप से बूस्टिंग पूर्वाग्रह त्रुटि को कम करता है और मजबूत भविष्य कहनेवाला मॉडल बनाता है। हालांकि, वे कभी-कभी प्रशिक्षण डेटा पर फिट हो सकते हैं।
 
3. स्टैकिंग : यह मॉडलों के संयोजन का एक बहुत ही रोचक तरीका है। यहां हम विभिन्न लर्नर के आउटपुट को संयोजित करने के लिए एक लर्नर का उपयोग करते हैं। यह हमारे द्वारा उपयोग किए जाने वाले संयोजन लर्नर के आधार पर पूर्वाग्रह या विचरण त्रुटि में कमी ला सकता है।
 
वोटिंग और एवरेजिंग बेस्ड एनसेम्बल मेथड्स-
 
वोटिंग और औसत दो सबसे आसान पहनावा तरीके हैं। वे दोनों समझने और लागू करने में आसान हैं। वोटिंग का उपयोग वर्गीकरण के लिए किया जाता है और औसत का उपयोग प्रतिगमन के लिए किया जाता है।

2022 में सीखने के लिए सर्वश्रेष्ठ प्रोग्रामिंग भाषाएँ
 
दोनों विधियों में, पहला कदम कुछ प्रशिक्षण डेटासेट का उपयोग करके कई वर्गीकरण/प्रतिगमन मॉडल बनाना है। प्रत्येक आधार मॉडल एक ही प्रशिक्षण डेटासेट और एक ही एल्गोरिथ्म के विभिन्न विभाजनों का उपयोग करके, या अलग-अलग एल्गोरिदम के साथ एक ही डेटासेट का उपयोग करके, या किसी अन्य विधि का उपयोग करके बनाया जा सकता है। निम्नलिखित पायथन-एस्क स्यूडोकोड विभिन्न एल्गोरिदम के साथ एक ही प्रशिक्षण डेटासेट के उपयोग को दर्शाता है।
 
एक से अधिक मशीन लर्निंग मॉडल स्टैकिंग-
 
स्टैकिंग, जिसे स्टैक्ड सामान्यीकरण के रूप में भी जाना जाता है, एक एन्सेम्बल विधि है जहां मॉडल को किसी अन्य मशीन लर्निंग एल्गोरिदम का उपयोग करके जोड़ा जाता है। मूल विचार मशीन लर्निंग एल्गोरिदम को प्रशिक्षण डेटासेट के साथ प्रशिक्षित करना है और फिर इन मॉडलों के साथ एक नया डेटासेट तैयार करना है। फिर इस नए डेटासेट का उपयोग कॉम्बिनर मशीन लर्निंग एल्गोरिथम के लिए इनपुट के रूप में किया जाता है।

2022 में सर्टिफाइड माइक्रोसॉफ्ट एक्सेल प्रोफेशनल कैसे बनें
 
बूटस्ट्रैप एग्रीगेशन-

निष्कर्ष-
 
यद्यपि एन्सेम्बल विधियाँ आपको परिष्कृत एल्गोरिदम तैयार करके और उच्च सटीकता के साथ परिणाम उत्पन्न करके मशीन सीखने की प्रतियोगिताओं को जीतने में मदद कर सकती हैं, यह अक्सर उन उद्योगों में पसंद नहीं किया जाता है जहाँ व्याख्यात्मकता अधिक महत्वपूर्ण है। बहरहाल, इन विधियों की प्रभावशीलता निर्विवाद है, और उपयुक्त अनुप्रयोगों में उनके लाभ जबरदस्त हो सकते हैं। स्वास्थ्य देखभाल जैसे क्षेत्रों में, मशीन लर्निंग एल्गोरिदम की सटीकता में सुधार की थोड़ी सी मात्रा भी वास्तव में मूल्यवान हो सकती है।

एक सफल डेटा एनालिटिक्स करियर कैसे बनाएं
 

Related Article

Exploring the Growing Need for Green Jobs and Their Demand

Read More

Importance of Upskilling for High-Package Jobs in India

Read More

Mastering the UGC NET: A Comprehensive Preparation Guide

Read More

Exploring Graphic Design: Courses, Skills, Salary, and Career Paths

Read More

Graphic Design : टॉप 10 ग्राफिक डिजाइन कॅरिअर, सैलरी और वैकेंसी, जानें यहां

Read More

Debunking Common Myths About Digital Literacy

Read More

The Top 100 SaaS Companies to Know In 2024

Read More

Digital marketing course in Coimbatore

Read More

Optimising Performance: Best Practices for Speeding Up Your Code

Read More