सर्च इंजन क्या है और यह कैसे काम करता है? (What is Search Engine in Hindi)
सर्च इंजन एक वेब आधारित टूल या सॉफ्टवेयर है, जो इंटरनेट यूजर्स को वर्ल्ड वाइड वेब पर जानकारी खोजने में मदद करता है। उदाहरण के लिए, Google, Bing, Yahoo, Baidu और Yandex लोकप्रिय खोज इंजन हैं। जब उपयोगकर्ता सर्च बार में कोई शब्द टाइप करता है, तो उसे कीवर्ड कहा जाता है। इन कीवर्ड्स और कीवर्ड्स के आधार पर सर्च इंजन यूजर के सामने वेब रिजल्ट्स की एक लंबी लिस्ट दिखाते हैं।
सर्च इंजन हमें वेबसाइट लिंक, इमेज और वीडियो के रूप में जो परिणाम दिखाता है, उस पेज को सर्च इंजन रिजल्ट पेज (SERP) कहा जाता है। उदाहरण के लिए हमारी वेबसाइट के इस पेज पर पहुंचने से पहले आपने गूगल सर्च इंजन पर “What is a search engine” लिखकर सर्च किया होगा। इस मामले में, सर्च इंजन शब्द एक कीवर्ड है। जिससे सर्च इंजन यह पता लगा लेते हैं कि यूजर्स किस बारे में जानना चाहते हैं।
शेष वाक्य को एक कुंजी वाक्यांश कहा जाता है, जो Google या अन्य खोज इंजन को सर्वोत्तम मिलान परिणाम दिखाने में मदद करता है। तो कुल मिलाकर सर्च इंजन एक ऐसी सर्विस है, जिसे हम इंटरनेट के जरिए एक्सेस कर पाते हैं। यह उपयोगकर्ता की क्वेरी के आधार पर सूचना डेटाबेस से उस जानकारी को खोजता है और अपने एल्गोरिदम का उपयोग करके ऐसे परिणाम हमारे सामने रखता है। जिसमें हमें अपने प्रश्नों का सटीक परिणाम मिल सके।
प्रमुख खोज इंजन (search engine in hindi)
इंटरनेट आज के समय में हमारे दैनिक जीवन का एक महत्वपूर्ण हिस्सा है और सर्च इंजन इंटरनेट की रीढ़ है। आप इंटरनेट पर हर जानकारी को सर्च इंजन के माध्यम से एक्सेस कर सकते हैं। तो आइए अब आपको भारत के कुछ लोकप्रिय सर्च इंजनों के बारे में बताते हैं, जिनका इस्तेमाल आप भी कर रहे होंगे।
इसमें कोई शक नहीं कि Google दुनिया में सबसे ज्यादा इस्तेमाल किया जाने वाला सर्च इंजन है। गूगल में प्रति सेकेंड लगभग 63000 सर्च होते हैं। ज़रा सोचिए, प्रति सेकंड कितनी बार सर्च किया जाता है, तो दैनिक और पूरे साल की संख्या कितनी होगी? इस संख्या के आधार पर देखा जाए तो Google में प्रति वर्ष लगभग 2 ट्रिलियन सर्च होते हैं। Google की शुरुआत 1997 में अमेरिकी कंप्यूटर वैज्ञानिक लैरी पेज और सर्गेई ब्रिन ने की थी।
सर्च इंजन मार्केट शेयर में Google का लगभग 92.81% हिस्सा है, Google की लोकप्रियता का सबसे बड़ा कारण इसका इंफॉर्मेशन डेटाबेस है, कुछ भी सर्च करें आपको तुरंत जवाब मिल जाएगा।
Bing
बिंग माइक्रोसॉफ्ट द्वारा बनाया गया है। माइक्रोसॉफ्ट के सीईओ स्टीव बाल्मर ने इसकी शुरुआत साल 2009 में की थी। बिंग लोकप्रिय सर्च इंजन की लिस्ट में गूगल के बाद दूसरे नंबर पर आता है। माइक्रोसॉफ्ट ने बिंग को अपने पुराने सर्च इंजन लाइव सर्च और एमएसएन सर्च से बदल दिया। बिंग को अक्सर Google के प्रतिस्पर्धी के रूप में देखा जाता है।
लेकिन हकीकत में इन दोनों में कोई तुलना नहीं है। सर्च इंजन मार्केट शेयर में करीब 2.38% की हिस्सेदारी के साथ बिंग दूसरे नंबर पर है।
Yahoo
याहू दुनिया के सबसे बड़े सर्च इंजन में भी जाना-पहचाना नाम है। याहू सर्च इंजन और पोर्टल होने के अलावा और भी कई सेवाएं प्रदान करता है। इनमें से याहू मेल सबसे प्रसिद्ध है। गूगल की तुलना में याहू उतना तेज और सटीक परिणाम नहीं दिखा पाता है और शायद इसीलिए यह सर्च इंजन जितना बेहतर नहीं है।
AOL.COM
एओएल एक अमेरिकी वेब पोर्टल और ऑनलाइन सेवा प्रदाता कंपनी है। वैसे तो भारत में AOL सर्च इंजन का ज्यादा इस्तेमाल नहीं होता, लेकिन हिंदी सर्च के हिसाब से यह एक बेहतरीन सर्च इंजन है। इसमें लाखों हिंदी वेबसाइट और ब्लॉग मौजूद हैं, जो आपको हिंदी भाषा में जानकारी प्रदान करते हैं। सर्च इंजन मार्केट में इसकी हिस्सेदारी करीब 0.06% मानी जाती है।
Yandex
यांडेक्स को रूस के सबसे लोकप्रिय सर्च इंजन का दर्जा प्राप्त है। यांडेक्स रूस में वैसे ही प्रसिद्ध है जैसे भारत में गूगल छाया है। इसे 1997 में Arkady Valozh और Arkady Borkovsky द्वारा शुरू किया गया था। सर्च इंजन के अलावा, यह कई अन्य सेवाएं भी प्रदान करता है। भारत में इसकी बाजार हिस्सेदारी सिर्फ 0.01% है। यांडेक्स पर जानकारी ढूँढना उतना ही आसान है जितना कि Google पर।
सर्च इंजन कैसे काम करता है
आइए समझते हैं कि सर्च इंजन क्या है? लेकिन इससे भी ज्यादा दिलचस्प बात यह है कि सर्च इंजन कैसे काम करते हैं? जब भी आप सर्च बॉक्स में कोई कीवर्ड या की फ्रेज टाइप करके सर्च करते हैं। तो यह हमें सटीक परिणाम कैसे दिखा सकता है? यह काम सर्च इंजन द्वारा तीन चरणों में किया जाता है। जिसमें क्रॉलिंग पहला, इंडेक्सिंग दूसरा और रिट्रीवल तीसरा चरण है।
1) Search Engine Crawling
क्रॉलिंग एक खोज प्रक्रिया है, जिसमें खोज इंजन द्वारा नई या पुरानी वेबसाइट को स्कैन किया जाता है। इस कार्य को करने के लिए रोबोट (जिसे क्रॉलर और स्पाइडर भी कहा जाता है) का उपयोग किया जाता है। ये मकड़ियां किसी वेबसाइट के कंटेंट को उसके लिंक के जरिए ढूंढती हैं। उनका काम वेबसाइट को स्कैन करना और वेबसाइट के हर पेज के बारे में विवरण एकत्र करना है।
स्पाइडर वेब पेज के टाइटल, यूआरएल इमेज, कीवर्ड्स को स्कैन करते हैं और पता लगाते हैं कि वेब पेज किस बारे में है। अगर उस पेज में कई अन्य वेब पेजों के लिंक मिलते हैं, तो स्पाइडर उस लिंक की मदद से अगले पेज पर पहुंच जाते हैं और उसे स्कैन करना शुरू कर देते हैं। इसी तरह यह ऑटोमेटेड बॉट लिंक्स के जरिए लाखों वेबपेजों को स्कैन करता रहता है। कुछ बुद्धिजीवियों की माने तो गूगल क्रॉलर एक सेकंड में हजारों वेब पेजों को स्कैन कर सकता है।
2) Search Engine Indexing
एक बार जब क्रॉलर किसी भी वेब पेज को स्कैन कर लेता है, उसके बाद इंडेक्सिंग की प्रक्रिया शुरू होती है। क्रॉल किए गए डेटा को डेटाबेस में संग्रहीत किया जाता है। इस डेटाबेस केंद्र पर पर्याप्त संख्या में सर्वर रखे जाते हैं, जो क्रॉलर द्वारा बनाए जा रहे वेब पेज की सभी प्रतियों को संग्रहीत करते हैं। वेब पेजों के इस भंडार को इंडेक्स कहा जाता है।
यह वह डेटा है जिसे आप खोज इंजन में जानकारी खोजते समय खोज परिणाम के रूप में देखते हैं। यह डेटा और वेब पेजों के एक समूह को व्यवस्थित करने की प्रक्रिया है ताकि खोज इंजन आपकी खोज क्वेरी के लिए प्रासंगिक परिणाम तुरंत खोज सकें।
3) Search Engine Ranking और Retrieval
तीसरा और अंतिम चरण रैंकिंग है। इसमें सर्च इंजन हमारे द्वारा सर्च की गई क्वेरी को प्रोसेस करता है और ऐसे प्रासंगिक पेज हमारे सामने रखता है, जिसमें हमारे सवाल का सही जवाब मिल सके। हम जिस वेब पेज को सर्च रिजल्ट में सबसे ज्यादा देखते हैं, वह सर्च इंजन के हिसाब से आपकी क्वेरी के लिए सबसे ज्यादा प्रासंगिक है। अब सवाल यह है कि Google या कोई अन्य सर्च इंजन यह कैसे तय करता है कि पहले नंबर पर रैंक किया गया वेब पेज दूसरे नंबर से बेहतर है।
इसके लिए Ranking Algorithm का इस्तेमाल किया जाता है। प्रत्येक खोज इंजन की एक अलग रैंकिंग पद्धति हो सकती है। सभी सर्च इंजन अपने एल्गोरिदम को गुप्त रखते हैं, ताकि कोई भी वेब निर्माता उन एल्गोरिदम का उपयोग करके गलत तरीके से सामने न आ सके। लेकिन वेब निर्माता SEO (Search Engine Optimization) का बेहतर उपयोग करके अपने वेब पेज को दूसरों से आगे लाने की कोशिश करते हैं।
सर्च इंजन के प्रकार (Types of search engine in Hindi)
सर्च इंजन आज हमारे लिए जानकारी खोजने का एक बेहतरीन टूल बन गया है। किसी विषय के बारे में जानने के लिए आपको संसाधन खोजने की आवश्यकता नहीं है, बस उस विषय को सर्च इंजन पर डालें, आपके पास इसके बारे में जानकारी देने वाली सभी वेबसाइटें होंगी। आप जिस जानकारी की तलाश कर रहे हैं उसे खोजने के लिए विभिन्न प्रकार के खोज इंजन हैं।
सर्च इंजन को निम्नलिखित तीन श्रेणियों में वर्गीकृत किया गया है।
- Crawler Based Search Engines
- Directories
- Hybrid Search Engine
1. Crawler
सभी क्रॉलर आधारित सर्च इंजन डेटाबेस में नई सामग्री को क्रॉल और इंडेक्स करने के लिए स्पाइडर, क्रॉलर, रोबोट और बॉट प्रोग्राम का उपयोग करते हैं। खोज परिणामों में किसी भी वेबसाइट को दिखाने से पहले यह चार चरणों का पालन करता है, क्रॉल करना, अनुक्रमण करना, प्रासंगिकता की गणना करना और परिणाम प्राप्त करना। इस प्रकार का सर्च इंजन सबसे उपयोगी होता है।
Crawler Based Search Engine Example:
Google
Bing
Yahoo
2. Directories
वेब निर्देशिका, जिसे हम विषय निर्देशिका के रूप में भी जानते हैं, एक प्रकार की निर्देशिका प्रणाली है। इसमें कैटेगरी के आधार पर वेबसाइटों की सूची दी जाती है और वेबसाइट किस बारे में है इसका संक्षिप्त विवरण भी दिया गया है। वेबसाइट का स्वामी स्वयं इन निर्देशिकाओं में अपनी वेबसाइट प्रस्तुत करता है। इन निर्देशिकाओं में एक खोज बॉक्स भी है। जिस पर अपना प्रश्न डालने से आपको उन वेबसाइटों के लिंक मिल जाएंगे जो इस बारे में जानकारी दे रहे हैं। इस प्रकार का सर्च इंजन पूरी तरह से मानव संचालित होता है।
Directory-Based Search Engine Example:
Yahoo Directory
DMOZ
BOTW
3. Hybrids
यह क्रॉलर और डायरेक्टरी आधारित सर्च इंजन का मिश्रण है। Google या अन्य क्रॉलर आधारित खोज इंजन क्रॉलर को प्राथमिक प्रणाली के रूप में और निर्देशिकाओं को दूसरी प्रणाली के रूप में उपयोग करते हैं। इस श्रेणी में आने वाले सर्च इंजन आपको अपने परिणामों में क्रॉलर और निर्देशिका दोनों से वेबपेज का विवरण दिखा सकते हैं। यह एक अच्छा विकल्प है, जहां आप एक ही सर्च इंजन पर मानव संचालित परिणाम और क्रॉलर परिणाम प्राप्त कर सकते हैं।
लेकिन आजकल मानव आधारित निर्देशिकाएं लुप्त होती जा रही हैं, जिसके कारण अब हाइब्रिड सर्च इंजन पूरी तरह से क्रॉलर आधारित हो गए हैं।
Hybrid Based Search Engine:
Yahoo
Google
Final Words
तो दोस्तों आपको हमारी पोस्ट कैसी लगी! शेयरिंग बटन पोस्ट के नीचे इसे अपने दोस्तों के साथ शेयर करना न भूलें। इसके अलावा अगर बीच में कोई परेशानी हो तो कमेंट बॉक्स में पूछने में संकोच न करें। आपकी सहायता कर हमें खुशी होगी। हम इससे जुड़े और भी पोस्ट लिखते रहेंगे। तो अपने मोबाइल या कंप्यूटर पर हमारे ब्लॉग “various info: Education and Tech” को बुकमार्क (Ctrl + D) करना न भूलें और अपने ईमेल में सभी पोस्ट प्राप्त करने के लिए हमें अभी सब्सक्राइब करें।
अगर आपको यह पोस्ट अच्छी लगी हो तो इसे अपने दोस्तों के साथ शेयर करना ना भूलें। आप इसे व्हाट्सएप, फेसबुक या ट्विटर जैसी सोशल नेटवर्किंग साइटों पर साझा करके अधिक लोगों तक पहुंचने में हमारी सहायता कर सकते हैं। शुक्रिया!