मशीन लर्निंग एल्गोरिदम क्या होती है, जानें इनके प्रकार और उपयोग
एन्सेम्बल लर्निंग कैसे काम करता है?
मान लें कि आप एक मशीन लर्निंग मॉडल विकसित करना चाहते हैं जो पिछले वर्षों से आपके द्वारा एकत्र किए गए ऐतिहासिक डेटा के आधार पर आपकी कंपनी के लिए इन्वेंट्री स्टॉक ऑर्डर की भविष्यवाणी करता है। आप एक अलग एल्गोरिदम का उपयोग करके ट्रेन चार मशीन लर्निंग मॉडल का उपयोग करते हैं: रैखिक प्रतिगमन, समर्थन वेक्टर मशीन, एक प्रतिगमन निर्णय वृक्ष, और एक बुनियादी कृत्रिम तंत्रिका नेटवर्क। लेकिन बहुत अधिक बदलाव और कॉन्फ़िगरेशन के बाद भी, उनमें से कोई भी आपकी वांछित 95 प्रतिशत भविष्यवाणी सटीकता प्राप्त नहीं करता है। इन मशीन लर्निंग मॉडल को "कमजोर शिक्षार्थी" कहा जाता है क्योंकि वे वांछित स्तर तक अभिसरण करने में विफल होते हैं।एन्सेम्बल मेथड-
एक और एन्सेम्बल मेथड एक ही मशीन लर्निंग एल्गोरिदम के उदाहरणों का उपयोग करना और उन्हें विभिन्न डेटा सेटों पर प्रशिक्षित करना है। उदाहरण के लिए, आप 12 रैखिक प्रतिगमन मॉडल से बना एक एन्सेम्बल बना सकते हैं, प्रत्येक आपके प्रशिक्षण डेटा के सबसेट पर प्रशिक्षित होता है।
फ्रंट एंड डेवलपर कैसे बनें और इसके लिए कौन से स्किल्स सीखें
कुछ सामान्य रूप से उपयोग में लाये जाने वाली एन्सेम्बल तकनीकें इस प्रकार है-
1.बैगिंग( Bagging) : बैगिंग सिमिलर लर्नर को स्मॉल सैंपल पॉपुलेशन पर लागु करने की कोशिश करता है और फिर सभी प्रडिक्सन का मिन लेता है। सामान्यीकृत बैगिंग में, आप अलग-अलग पॉपुलेशन पर अलग-अलग लर्नर का उपयोग कर सकते हैं। जैसा कि आप उम्मीद कर सकते हैं, इससे हमें विचरण त्रुटि को कम करने में मदद मिलती है।
2. बूस्टिंग: बूस्टिंग एक पुनरावृत्त तकनीक है जो पिछले वर्गीकरण के आधार पर एक अवलोकन के वजन को समायोजित करती है। यदि किसी अवलोकन को गलत तरीके से वर्गीकृत किया गया था, तो यह इस अवलोकन के वजन को बढ़ाने की कोशिश करता है और इसके विपरीत। सामान्य रूप से बूस्टिंग पूर्वाग्रह त्रुटि को कम करता है और मजबूत भविष्य कहनेवाला मॉडल बनाता है। हालांकि, वे कभी-कभी प्रशिक्षण डेटा पर फिट हो सकते हैं।
3. स्टैकिंग : यह मॉडलों के संयोजन का एक बहुत ही रोचक तरीका है। यहां हम विभिन्न लर्नर के आउटपुट को संयोजित करने के लिए एक लर्नर का उपयोग करते हैं। यह हमारे द्वारा उपयोग किए जाने वाले संयोजन लर्नर के आधार पर पूर्वाग्रह या विचरण त्रुटि में कमी ला सकता है।
वोटिंग और एवरेजिंग बेस्ड एनसेम्बल मेथड्स-
वोटिंग और औसत दो सबसे आसान पहनावा तरीके हैं। वे दोनों समझने और लागू करने में आसान हैं। वोटिंग का उपयोग वर्गीकरण के लिए किया जाता है और औसत का उपयोग प्रतिगमन के लिए किया जाता है।
2022 में सीखने के लिए सर्वश्रेष्ठ प्रोग्रामिंग भाषाएँ
दोनों विधियों में, पहला कदम कुछ प्रशिक्षण डेटासेट का उपयोग करके कई वर्गीकरण/प्रतिगमन मॉडल बनाना है। प्रत्येक आधार मॉडल एक ही प्रशिक्षण डेटासेट और एक ही एल्गोरिथ्म के विभिन्न विभाजनों का उपयोग करके, या अलग-अलग एल्गोरिदम के साथ एक ही डेटासेट का उपयोग करके, या किसी अन्य विधि का उपयोग करके बनाया जा सकता है। निम्नलिखित पायथन-एस्क स्यूडोकोड विभिन्न एल्गोरिदम के साथ एक ही प्रशिक्षण डेटासेट के उपयोग को दर्शाता है।
एक से अधिक मशीन लर्निंग मॉडल स्टैकिंग-
स्टैकिंग, जिसे स्टैक्ड सामान्यीकरण के रूप में भी जाना जाता है, एक एन्सेम्बल विधि है जहां मॉडल को किसी अन्य मशीन लर्निंग एल्गोरिदम का उपयोग करके जोड़ा जाता है। मूल विचार मशीन लर्निंग एल्गोरिदम को प्रशिक्षण डेटासेट के साथ प्रशिक्षित करना है और फिर इन मॉडलों के साथ एक नया डेटासेट तैयार करना है। फिर इस नए डेटासेट का उपयोग कॉम्बिनर मशीन लर्निंग एल्गोरिथम के लिए इनपुट के रूप में किया जाता है।
2022 में सर्टिफाइड माइक्रोसॉफ्ट एक्सेल प्रोफेशनल कैसे बनें
बूटस्ट्रैप एग्रीगेशन-
निष्कर्ष-
यद्यपि एन्सेम्बल विधियाँ आपको परिष्कृत एल्गोरिदम तैयार करके और उच्च सटीकता के साथ परिणाम उत्पन्न करके मशीन सीखने की प्रतियोगिताओं को जीतने में मदद कर सकती हैं, यह अक्सर उन उद्योगों में पसंद नहीं किया जाता है जहाँ व्याख्यात्मकता अधिक महत्वपूर्ण है। बहरहाल, इन विधियों की प्रभावशीलता निर्विवाद है, और उपयुक्त अनुप्रयोगों में उनके लाभ जबरदस्त हो सकते हैं। स्वास्थ्य देखभाल जैसे क्षेत्रों में, मशीन लर्निंग एल्गोरिदम की सटीकता में सुधार की थोड़ी सी मात्रा भी वास्तव में मूल्यवान हो सकती है।
एक सफल डेटा एनालिटिक्स करियर कैसे बनाएं