Machine Learning System - मशीनी अधिगम किसे कहते है?

Rate this post

क्या आपको पता है कि आज ऐसी मशीनें या ऐसे सॉफ्टवेयर उपलब्ध हैं जो खुद से सीखकर काम करते हैं? जी हाँ। यह सच है। आज ऐसी अनेक प्रणालियाँ उपलब्ध हैं, जो एक सीमित डाटा के आधार पर स्वयं सीखती हैं और अपने रास्ते खुद तय करती हैं। ऐसी प्रणालियों (systems) को मशीनी अधिगम प्रणाली (Machine learning system) या डाटा-चालित प्रणाली (Data-driven system) कहते हैं।

इस मशीन में ऐसे Algorithm दिए जाते हैं, जो पहले कुछ डाटा के आधार पर काम करना सीखते हैं और बाद में ऐसे इनपुट को भी अपने अनुभव के आधार पर हल करने का प्रयास करते हैं जो उन्हें बिल्कुल पहली बार मिला हो। कुछ दिए गए डाटा के आधार पर मशीनों द्वारा स्वयं सीखने की यही प्रक्रिया ‘ मशीनी अधिगम’ (Machine learning) कहलाती है।

चलिए अब हम आपको थोड़ा विस्तार से बताते हैं कि Machine learning / मशीनी अधिगम क्या होता है?

Outlines of this Article –

What is machine learning?
What is machine learning algorithms?
Machine learning tutorial.
Machine learning types.
Machine learning definition.

Contents show

मशीनी अधिगम किसे कहते है?

मशीनी अधिगम का शाब्दिक अर्थ है- ‘ मशीन द्वारा सीखना’ अर्थात् ‘ मशीन द्वारा खुद से सीखना’। मशीनी अधिगम वह प्रक्रिया है जिसके अंतर्गत कुछ सीमित नियमों और उदाहरणों के आधार पर मशीन को नए परिवेश में कार्य करने के योग्य बनाया जाता है। इस कार्य को संपन्न करने के लिए लिखे जाने वाले एल्गोरिद्म ‘ मशीनी अधिगम एल्गोरिद्म’ (Machine learning algorithm) कहलाते हैं।

मशीनी अधिगम की Wikipedia में परिभाषा इस प्रकार से दी गई है- ” Machine learning explores the study and construction of algorithms that can learn from and make predictions on data-Such algorithms operate by building a model from example inputs in order to make data-driven predictions or decisions, rather than following strictly static program instructions.”

950 के दशक से ही इस दिशा में प्रयास आरंभ हो चुके थे मशीनीअधिगम ( Machine learning ) शब्द का प्रयोग सर्वप्रथम आर्थर सेम्यूल (Arthur Samuel) द्वारा 1959 में ‘ Some Studies in Machine Learning Using the
Game of Checkers’ में किया गया जो IBM के जर्नल ऑफ रिसर्च एंड डेवलेपमेंट में प्रकाशित हुआ था।

इसके बाद से जैसे-जैसे कंप्यूटर में कार्य करने तथा संग्रह करने की क्षमता का विकास हुआ है, वैसे-वैसे मशीनी अधिगम प्रणालियों के विकास में भी तेजी आई है।

मशीनी अधिगम कंप्यूटर में सांख्यिकीय संसाधन (Statistical Processing) से जुड़ा एक क्षेत्र है। इसमें डाटा के
आधार पर काम करने और निर्णय लेने वाले Algorithm का विकास किया जाता है। सांख्यिकीय उपागम (Statistical
approach) को डाटा-चालित अभिगम (Data-driven approach) भी कहते हैं।

इसमें मशीन डाटा से वैसे ही सीखती है, जैसे हम अपने दैनिक जीवन में नए-नए अनुभवों से सीखते हैं हम जितनी बार कोई काम (Task-T) करते हैं उतनी बार कुछ-न-कुछ नया सीखते हैं। सीखने की प्रक्रिया में प्राप्त इस ज्ञान को अनुभव (Experience-E) कहा जाता है। हर बार काम (Task-T) करने से अनुभव (Experience -E) की प्राप्ति होती है, जिससे हमारे निष्पादन (Performance ‘P’) में बढ़ोत्तरी होती है। डाटा-चालित अभिगम (Data-driven approach) में यही बात मशीन पर भी लागू होती है। इसे निम्नलिखित प्रकार से व्यक्त कर सकते हैं-

The machine learns Experience ‘ E’ with Task ‘ T’ and improves Performance ‘ P’.

इसके लिए मशीन को विभिन्न चरणों में डाटा के आधार पर कई चरणों में प्रशिक्षण दिया जाता है। इन चरणों को प्रशिक्षण चरण कहते हैं। यह बिल्कुल वैसे ही है जैसे हमें किसी नए ज्ञान को सिखाने के लिए पहले शिक्षण किया जाता है।

हम गणित में कुछ सूत्र सीखते हैं और उनके आधार पर कुछ प्रश्नों को हल करते हैं और उनसे मिले अनुभव के आधार पर बिल्कुल नए प्रश्नों को हल करते हैं। इसी प्रक्रिया के आधार पर मशीनी अधिगम प्रणालियाँ काम करती हैं। एक ‘ सामान्य सिस्टम’ में आगे उल्लिखित अनिवार्य अंग होते हैं: इनपुट, प्रोसेस तथा आउटपुट। किंतु एक मशीनी अधिगम प्रणाली की प्रक्रिया इससे थोड़ी भिन्न होती है।

यह प्रणाली इनपुट और आउटपुट दोनों को अनुभव के लिए लेती है। इसमें बीच में लर्निंग एल्गोरिदम होते हैं जो इनपुट या आउटपुट डाटा के आधार पर नई समस्याओं को हल करने की तकनीकें प्राप्त करते हैं। उदाहरण के लिए हम एक ऐसे प्रोग्राम की कल्पना कर सकते हैं जिसे किसी परीक्षा में उत्तीर्णांक ‘ न पता हो और अंकपत्रों के आधार पर इसे सीख रहा हो। वह प्रोग्राम कैसे काम करेगा पहले अंकपत्र (Mark sheet) में 20 अंकों पर ‘ अनुत्तीर्ण’ (fail) प्राप्त हुआ।

इससे प्रोग्राम जान गया कि 20 और इससे कम प्राप्त होने का अर्थ ‘ अनुत्तीर्ण ‘ है। इसके बाद दूसरे अंकपत्र में 80 अंकों पर पास दिखा। अब प्रोग्राम जान गया कि 80 और इससे अधिक नंबर पाने का अर्थ’ उत्तीर्ण है। इसी तरह 100-1000 अंकपत्रों में ’39 अंकों पर ‘ अनुत्तीर्ण’, ’40 अंकों पर ‘ उत्तीर्ण’ का डाटा मिल जाता है। इस प्रक्रिया में प्रोग्राम हर बार पुराने नियम छोड़कर नए नियम लेगा और इस प्रकार वास्तविक निर्णय तक पहुँच जाएगा।

इसी तरह बड़े डाटा पर सीखकर मशीनी अधिगम प्रणालियाँ काम करती हैं। डाटा के आधार पर सीखने की अपनी सीमाएँ हैं। कई बार गलत सीखने की संभावनाएँ भी बनी रहती हैं। इसीलिए मशीनी अधिगम प्रणालियों का मूल्यांकन आवश्यक होता है।

मशीनी अधिगम प्रणालियों की विकास प्रक्रिया में प्रशिक्षण चरण (training phases) के बाद मूल्यांकन चरण (evaluation phase) होता है। इसमें मशीन की क्षमता एवं गुणवत्ता का मूल्यांकन किया जाता है।

मशीनी अधिगम के प्रकार

मशीनी अधिगम प्रणाली को मिलने वाले इनपुट की प्रकृति के आधार पर इसके मुख्यतः दो भेद किए जाते हैं-

पर्यवेक्षित अधिगम (Supervised learning)

इसमें प्रणाली को पर्यवेक्षक द्वारा उदाहरण इनपुट और इच्छित आउटपुट दिए जाते हैं। इसमें प्रशिक्षण चरण में पूर्वनिर्धारित डाटा दिया जाता है, जिसे लेबलीकृत डाटा (labeled data) कहते हैं। इस डाटा में इनपुट ऑब्जेक्ट और उसके आउटपुट मूल्य दोनों दिए जाते हैं। (नोट-आउटपुट मूल्य को सुपरवाइजरी सिग्नल भी कहा जाता है।)

इनपुट और आउटपुट की मैपिंग के आधार पर प्रणाली अधिगम नियमों को सीखती है और प्रत्येक प्रशिक्षण डाटा के आधार पर एक अनुमानित प्रकार्य प्रदान करती है। इसकी कई विधियाँ हैं, जिनमें से तीन अधिक प्रसिद्ध हैं-

अर्घ-निर्देशित अधिगम (Semi-supervised learning) : इसमें प्रशिक्षण चरण में कुछ डाटा लेबलीकृत डाटा होता है और कुछ अलेबलीकृत डाटा होता है।
गतिशील अधिगम (Active learning) : इसमें मशीन काम करते हुए बीच-बीच में मानव प्रयोक्ताओं से पृच्छाओं (queries) के माध्यम से सीखती रहती है।
पुनरसंबलन अधिगम (Reinforcement learning) : इसके अंतर्गत प्रोग्राम को इस तरह से डिजाइन
किया जाता है कि जब जब समस्या आती है तब उसी समय वह आई हुई समस्या के अनुसार कदम उठाता है।

अपर्यवेक्षित अधिगम (Unsupervised learning)

इसमें प्रोग्राम को कोई लेबलीकृत इनपुट नहीं दिया जाता। यह अलेबलीकृत डाटा में छुपी हुई संरचनाओं के आधार पर ही आउटपुट प्रदान करता है। ऐसी प्रणालियों का मूल्यांकन भी अपेक्षाकृत कठिन होता है।

मशीनी अधिगम के अनुप्रयोग क्षेत्र

आज कंप्यूटर से जुड़े अनेक क्षेत्रों में मशीनी अधिगम तकनीकों का प्रयोग किया जा रहा है। इनमें से कुछ प्रमुख इस प्रकार हैं-

गेम डिजाइनिंग : आज हम कंप्यूटर या मोबाइल में जो भी ऐसे गेम खेलते हैं जिनमें कंप्यूटर को भी अपनी ओर से कदम उठाना हो, जैसे- क्रिकेट, शतरंज आदि तो उनमें कौन-सी चालें चलेगा, इसकी डिजाइनिंग में मशीनी अधिगम बहुत अधिक प्रयोग होता है।

प्रकाशिक अक्षर अभिज्ञान (OCR) : टाइप किए हुए या लिखे हुए अक्षरों की पहचान का कार्य प्रकाशिक अक्षर अभिज्ञान ‘ (Optical Character Recognition) कहलाता है। इसके लिए भी मशीनी अधिगम तकनीकों का प्रयोग किया जाता है।

श्रेणीकरण प्रणाली (Ranking System) : उपयोगिता या उद्देश्य विशेष के अनुसार विभिन्न चीजों को क्रम से रखना श्रेणीकरण है। इसमें भी मशीनी अधिगम तकनीकें काम आती हैं। यह मुख्य रूप से खोज इंजन (Search Engine) से जुड़ा पक्ष है।

उदाहरण के लिए आप गूगल में’ हिंदी गीत ‘ टाइप करके सर्च बटन को क्लिक करते हैं तो 50 लाख से अधिक परिणाम आते हैं। अब इनमें पहले, दूसरे, तीसरे अथवा अंतिम स्थान पर किन परिणामों को रखा जाए, इसके निर्धारण में मशीनी अधिगम तकनीकें उपयोगी होती हैं।

स्वचलित कार (Automatic Cars) : गूगल और अन्य कई कंपनियों द्वारा स्वचलित कारों का तेजी से विकास किया जाता है। इनमें आगे और पीछे कैमरे लगे रहते हैं और उनसे मिलने वाली तस्वीरों का बहुत तेजी से विश्लेषण कार में लगे एक कंप्यूटर द्वारा किया जाता है। उन्हीं के आधार पर कार अपने परिवेश का अनुमान लगाती है और आगे बढ़ती है या निर्णय लेती है। इसमें मशीनी अधिगम तकनीक ही काम आती.

रोबोटिक्स (Robotics) : आज जीवन के अनेक क्षेत्रों में रोबोटों का भिन्न-भिन्न प्रकार से प्रयोग किया जा रहा है औद्योगिक संस्थानों से लेकर अन्य ग्रहों उपग्रहों अन्वेषण में रोबोटों की महती भूमिका है। इनमें परिवेश के आधार पर निर्णय लेने के लिए मशीनी अधिगम तकनीकें आधारभूत रूप से कार्य करती हैं।

संदर्भ-सूची :

SOCIAL MEDIA LINKS

Twitter: CLICK HERE
Instagram: CLICK HERE
Facebook: CLICK HERE

Also Read –

Must Read –