वेब ट्रैफिक
वेब ट्रैफिक, एक वेबसाइट के लिए आगंतुकों द्वारा भेजे गए और प्राप्त किए गए डेटा की राशि है। यह इंटरनेट ट्रैफिक का एक बड़ा हिस्सा है। इसे आगंतुकों की संख्या और उनके द्वारा खोले गए पृष्ठों की संख्या के आधार पर निर्धारित किया जाता है। साइटें, आवक और जावक ट्रैफिक पर नज़र रखती हैं ताकि यह पता रहे कि उनकी साइट के कौन से पृष्ठ लोकप्रिय हैं या क्या कोई स्पष्ट रुझान दिख रहा है, जैसे कि किसी विशेष देश में किसी विशेष पृष्ठ को देखा जा रहा है। इस ट्रैफिक पर नज़र रखने के कई ज़रिये हैं और एकत्रित डेटा का इस्तेमाल साईट को संरचित करने, सुरक्षा समस्याओं को उजागर करने या बैंडविड्थ की संभावित कमी को इंगित करने में किया जाता है - सभी वेब ट्रैफिक स्वागत योग्य नहीं होते।
वर्धित वेब ट्रैफिक (आगंतुकों) के बदले, कुछ कंपनियां विज्ञापन योजनाओं की पेशकश करती हैं, जिसके तहत साइट की स्क्रीन पर स्थान के लिए भुगतान किया जाता है। साइटें अक्सर, खोज इंजन में शामिल होकर और खोज इंजन अनुकूलन के माध्यम से अपने ट्रैफिक में वृद्धि करने की कोशिश करती हैं।
वेब ट्रैफिक विश्लेषण
वेब विश्लेषिकी, एक वेबसाइट के लिए आगंतुकों के व्यवहार का मापन करता है। एक वाणिज्यिक संदर्भ में, यह विशेष रूप से यह मापन करता है कि वेबसाईट का कौन सा पहलू इंटरनेट मार्केटिंग के व्यावसायिक लक्ष्यों की दिशा में काम करता है; उदाहरण के लिए, कौन से लैंडिंग पृष्ठ लोगों को खरीद के लिए प्रोत्साहित करते हैं। वेब विश्लेषिकी सॉफ्टवेयर और सेवाओं के उल्लेखनीय विक्रेताओं में शामिल हैं: वेबट्रेंड्स, कोरेमेट्रिक्स, ओम्नीचर और गूगल एनालिटिक्स.
वेब ट्रैफिक का मापन
वेब साइटों और व्यक्तिगत पृष्ठों या साईट के भीतर किसी हिस्से की लोकप्रियता को जानने के लिए वेब ट्रैफिक का मापन किया जाता है।
वेब ट्रैफिक का विश्लेषण वेब सर्वर लॉग फाइल में पाए जाने वाले ट्रैफिक आंकड़ों को देख कर किया जा सकता है, जो सभी प्रयुक्त पृष्ठों की एक स्वतः उत्पन्न सूची होती है। जब कोई फ़ाइल पेश की जाती है तो एक हिट उत्पन्न होता है। पृष्ठ को अपने आप में एक फ़ाइल माना जाता है, लेकिन छवियां भी फाइलें हैं, इस प्रकार 5 छवियों वाला पृष्ठ 6 हिट (5 छवियां और वह पृष्ठ) उत्पन्न कर सकता है। एक पेज व्यू तब उत्पन्न होता है जब एक आगंतुक वेब साइट के भीतर किसी भी पृष्ठ का अनुरोध करता है - एक आगंतुक हमेशा कम से कम एक पेज व्यू को उत्पन्न करेगा (मुख्य पृष्ठ) और कई अधिक भी कर सकता है।
वेब साईट से बाहर के अनुप्रयोगों की निगरानी से ट्रैफिक को वेब साईट के प्रत्येक पृष्ठ में एचटीएमएल (HTML) कोड का एक छोटा टुकड़ा डालने से रिकॉर्ड किया जा सकता है।
वेब ट्रैफिक को कभी कभी पैकेट स्निफिंग द्वारा मापा जाता है और इस प्रकार ट्रैफिक आंकड़े के यादृच्छिक नमूने प्राप्त किये जाते हैं जिनसे फिर सम्पूर्ण इंटरनेट प्रयोग में वेब ट्रैफिक के बारे में जानकारी निकाली जाती है।
वेब ट्रैफिक की निगरानी करते समय निम्नलिखित प्रकार की जानकारियों पर गौर किया जाता है:
- आगंतुकों की संख्या।
- प्रति आगंतुक पेज व्यू की औसत संख्या - एक उच्च संख्या यह दर्शाएगी कि औसत आगंतुक साइट के गहरे अंदर जाते हैं, संभवतः क्योंकि वे इसे पसंद करते हैं या इसे उपयोगी पाते हैं।
- औसत विज़िट (यात्रा) की अवधि - एक प्रयोक्ता के विज़िट की कुल लंबाई. एक नियम के रूप में, वे जितना अधिक समय खर्च करते हैं उतना ही आपकी कंपनी में रुचि रखते हैं और संपर्क करने के लिए प्रवण हैं।
- औसत पृष्ठ अवधि - कितनी देर तक एक पेज को देखा जाता है। जितना अधिक पृष्ठों को देखा जाता है उतना ही बेहतर यह आपकी कंपनी के लिए होता है।
- डोमेन कक्षाएं - वेबपेज और सामग्री वितरित करने के लिए आवश्यक आईपी पते के सभी स्तरों की जानकारी।
- व्यस्त समय - साईट देखने का सबसे लोकप्रिय समय यह बताएगा कि प्रचार अभियान करने के लिए कौन सा समय बेहतरीन हो सकता है और रखरखाव के काम के लिए कौन सा समय सबसे आदर्श होगा.
- सर्वाधित अनुरोधित पृष्ठ - सबसे लोकप्रिय पृष्ठ
- सर्वाधित अनुरोधित प्रवेश पृष्ठ - प्रवेश पृष्ठ वह होता है जिसे एक आगंतुक सबसे पहले देखता है और इससे पता चलता है कि कौन से पृष्ठ हैं जो आगंतुकों को सबसे अधिक आकर्षित कर कर रहे हैं।
- सर्वाधिक अनुरोधित निकास पृष्ठ - सर्वाधिक अनुरोधित निकास पृष्ठों से खराब पृष्ठ को जानने में मदद मिलती है, टूटी कड़ियां या निकास पृष्ठों में लोकप्रिय बाह्य लिंक हो सकता है।
- शीर्ष मार्ग - एक मार्ग उन पृष्ठों का अनुक्रम है जिसे आगंतुकों द्वारा प्रवेश से लेकर निकासी तक देखा जाता है, जिसके तहत शीर्ष मार्ग उस मार्ग की पहचान है जिसके माध्यम से ज्यादातर ग्राहक साइट से गुज़रते हैं।
- सन्दर्भदाता; मेजबान लिंक के (स्पष्ट) स्रोत की निगरानी रख सकता है और यह निर्धारित कर सकता है कि कौन सी साइटें किसी विशेष पृष्ठ के लिए सबसे अधिक ट्रैफिक पैदा कर रही हैं।
अलेक्सा इंटरनेट जैसी वेब साइटें, ट्रैफिक रैंकिंग और आंकड़े पेश करती है जो उन लोगों पर आधारित होते हैं जो अलेक्सा टूलबार का उपयोग करते हुए साइटों का प्रयोग करते हैं। इसके साथ कठिनाई यह है कि यह किसी साइट के लिए ट्रैफिक की पूरी तस्वीर नहीं लेता है। बड़ी साइटें आमतौर पर नीलसन नेटरेटिंग्स (Nielsen NetRatings) जैसी अन्य कंपनियों की सेवाएं लेती हैं, लेकिन उनकी रिपोर्ट केवल सदस्यता से ही उपलब्ध होती हैं।
वेब ट्रैफिक का नियंत्रण
एक वेब साइट द्वारा अनुभव किए गए ट्रैफिक की मात्रा इसकी लोकप्रियता का एक माप है। आगंतुकों के आंकड़े का विश्लेषण करके, साइट की कमियों को देखना और उन क्षेत्रों में सुधार करना संभव है। एक साइट की लोकप्रियता और उसका प्रयोग करने वाले लोगों की संख्या में वृद्धि करना (या, कुछ मामलों में कमी करना) भी संभव है।
सीमित अभिगम
पासवर्ड द्वारा साइट के कुछ भागों की रक्षा करना कभी-कभी महत्वपूर्ण होता है, जिससे केवल अधिकृत लोग ही विशेष अनुभागों या पृष्ठों का इस्तेमाल कर पाते हैं।
कुछ साइट व्यवस्थापकों ने अपने पृष्ठ को कुछ विशिष्ट ट्रैफिक के लिए प्रतिबंधित करने का चुनाव किया है, जैसे कि भौगोलिक स्थान के आधार पर। अमेरिकी राष्ट्रपति जॉर्ज डब्लू. बुश के पुनर्चुनाव की अभियान साइट (GeorgeWBush.com) को साइट पर एक हमले की खबर के बाद 25 अक्टूबर 2004 को अमेरिका से बाहर के सभी इंटरनेट उपयोगकर्ताओं के लिए अवरुद्ध कर दिया गया।[१]
वेब सर्वर के अभिगम को सीमित करना भी संभव है, कनेक्शन की संख्या और प्रत्येक कनेक्शन द्वारा प्रसारित बैंडविड्थ के आधार पर. अपाचे HTTP सर्वर पर, इसे लिमिटिपकोन (limitconn) मॉड्यूल व अन्य द्वारा पूरा किया जाता है।
वेब साइट ट्रैफिक बढ़ाना
खोज इंजन में किसी साईट को रखकर और विज्ञापन की खरीद द्वारा वेब ट्रैफिक को बढ़ाया जा सकता है, जिसमें थोक ईमेल, पॉप अप एड्स और अंतर-पृष्ठ विज्ञापन शामिल है। वेब ट्रैफिक को गैर- इंटरनेट आधारित विज्ञापन की खरीद द्वारा भी बढ़ाया जा सकता है।
यदि एक वेब पेज किसी खोज के प्रथम पृष्ठ में सूचीबद्ध नहीं है, तो किसी व्यक्ति द्वारा इसे खोजे जाने की संभावना काफी कम हो जाती है (विशेषकर यदि वहां पहले पृष्ठ पर अन्य प्रतियोगिता है)। बहुत कम ही लोग पहले पृष्ठ के बाद आगे जाते हैं और आगे के पृष्ठों तक जाने वाले लोगों का प्रतिशत काफी कम है। फलस्वरूप, खोज इंजन पर उचित स्थान हासिल करना उतना ही महत्वपूर्ण है जितना खुद वेब साइट।
ऑर्गेनिक ट्रैफिक
वेब ट्रैफिक जो खोज इंजन या निर्देशिका में गैर-भुगतान सूचिबद्धन से आता है उसे सामान्यतः "ऑर्गेनिक" ट्रैफिक के रूप में जाना जाता है। ऑर्गेनिक ट्रैफिक को उत्पन्न करने या बढ़ाने के लिए वेब साईट को डाइरेक्टरी, खोज इंजन, गाइड (जैसे कि यल्लो पेजेस और रेस्तरां गाइड) और पुरस्कार साइटों में शामिल किया जा सकता है।
ज्यादातर मामलों में वेब ट्रैफिक को बढ़ाने का सबसे अच्छा तरीका है इसे प्रमुख खोज इंजनों के साथ पंजीकृत करना. सिर्फ पंजीकृत करने से ट्रैफिक की गारंटी नहीं मिलती, क्योंकि खोज इंजन पंजीकृत वेब साइटों को "क्रॉल" करते हुए काम करता है। इन क्रौलिंग प्रोग्रामों (क्रॉलर) को "स्पाइडर" या "रोबोट" के रूप में भी जाना जाता है। क्रौलर, पंजीकृत मुख पृष्ठ पर शुरू होता है और आमतौर पर उन हाइपरलिंक्स का अनुगमन करता है जिन्हें यह पाता है, ताकि वेब साइट (आंतरिक लिंक्स) के भीतर पृष्ठों तक पहुंच सके। क्रौलर उन पृष्ठों के बारे में जानकारी एकत्र करने लगता है और उसे खोज इंजन के डेटाबेस में उनका संग्रहण और अनुक्रमण करता है। हर मामले में, वे पृष्ठ यूआरएल और पृष्ठ शीर्षक को अनुक्रमित करते हैं। अधिकांश मामलों में वे वेब पेज हेडर (मेटा टैग) और पृष्ठ की एक निश्चित मात्रा को क्रमबद्ध करते हैं। इसके बाद, जब एक खोज इंजन उपयोगकर्ता, किसी विशेष शब्द या वाक्यांश की खोज करता है, तो खोज इंजन डेटाबेस में खोजता है और परिणाम उत्पन्न करता है, जो आमतौर पर खोज इंजन एल्गोरिदम के अनुसार प्रासंगिकता के अनुसार छांटा जाता है।
आमतौर पर, शीर्ष ऑर्गेनिक परिणाम, वेब उपयोगकर्ताओं की अधिकांश क्लिक हासिल करते हैं। कुछ अध्ययन के अनुसार साँचा:fix, शीर्ष परिणाम को 5% और 10% के बीच क्लिक हासिल होता है। बाद के प्रत्येक परिणाम को पिछले परिणाम की तुलना में 30% और 60% के बीच क्लिक हासिल होता है। इससे यह पता चलता है कि शीर्ष परिणामों में प्रदर्शित होना महत्वपूर्ण है। कुछ कंपनियों हैं जो खोज इंजन विपणन में विशेषज्ञ हैं। हालांकि, वेबमास्टरों के लिए यह आम होता जा रहा है कि उन्हें "बॉयलर-रूम" कंपनियों द्वारा संपर्क किया जाता है, बिना किसी वास्तविक ज्ञान के कि कैसे परिणाम प्राप्त किये जाते हैं। पे-पर-क्लिक के विपरीत, खोज इंजन विपणन का आमतौर पर मासिक या वार्षिक भुगतान किया जाता है और अधिकांश खोज इंजन कंपनियां विशिष्ट परिणामों का वादा नहीं कर सकती जिसके लिए उन्हें भुगतान किया जाता है।
वेब पर सूचना की उपलब्ध अपार मात्रा की वजह से, खोजे गए सभी पृष्ठों की समीक्षा और अनुक्रमण को पूरा करने के लिए क्रॉलर कई दिन, सप्ताह या महीनों का समय ले सकता है। उदाहरण के लिए, गूगल ने यथा 2004, आठ बीलियन पृष्ठों को अनुक्रमित किया था। यहां तक कि सैकड़ों या हज़ारों सर्वरों द्वारा पृष्ठों की स्पाइडरिंग पर काम करने के बावजूद एक पूर्ण पुनः अनुक्रमण में समय लगता है। यही कारण है कि कुछ वेब साइटों में हाल ही में अद्यतन पृष्ठ, खोज इंजन पर खोज करते समय तुरंत नहीं मिलते हैं।
ट्रैफिक अधिभार
अत्यधिक वेब ट्रैफिक, किसी वेब साईट के लिए अभिगम को नाटकीय रूप से धीमा या रोक भी सकता है। यह इस वजह से होता है क्योंकि सर्वर जितने अनुरोध संभाल सकता है उससे कहीं अधिक फ़ाइल अनुरोध उसे मिलते हैं और हो सकता है जानबूझकर कोई हमला हो या बस अधिक लोकप्रियता की वजह से हो सकता है। कई सर्वरों वाली बृहद पैमाने की वेब साइटें, अक्सर आवश्यक ट्रैफिक का सामना कर सकती हैं और इसकी अधिक संभावना है कि छोटी सेवाएं ट्रैफिक अधिभार से प्रभावित होती हैं।
डिनायल ऑफ़ सर्विस हमला
डिनायल ऑफ़ सर्विस हमले (DOS हमला) ने एक दुर्भावनापूर्ण हमले के बाद वेब साइटों को बंद होने के लिए विवश किया, जिसके तहत इन वेब साइटों को इतने अनुरोधों से भर दिया जितना वे संभाल नहीं सकते थे। बृहद पैमाने के डिनायल ऑफ़ सर्विस हमले का समर्थन करने के लिए वायरस का भी इस्तेमाल किया गया।
आकस्मिक लोकप्रियता
प्रचार में आकस्मिक विस्फोट के कारण वेब ट्रैफिक अधिभार उत्पन्न हो सकता है। मीडिया में कोई खबर, एक तीव्र प्रसारित ईमेल या किसी लोकप्रिय साइट से एक लिंक इस तरह की आगंतुक बाढ़ का कारण हो सकती है (कभी-कभी इसे स्लैशडॉट प्रभाव या डिग या रेडिट प्रभाव कहा जाता है)।
इन्हें भी देखें
- वेब ट्रैफिक उत्पत्ति मॉडल
सन्दर्भ
- मलाकिंसी, आंद्रेई; डोमिनिक, स्कॉट और हर्त्रिक, टॉम (1 मार्च 2001). आईबीएम में "वेब ट्रैफिक मापन" - 1 जनवरी 2005 को पुनः प्राप्त
- मचलिस, शेरोन (17 जून 2002). ComputerWorld.com पर "वेब साइट ट्रैफिक मापन" - 1 जनवरी 2005 को पुनः प्राप्त
- वार्ड, मार्क (5 मई 2003). "एक अच्छा विचार रखने के खतरे" - एक बीबीसी समाचार स्वतंत्र पत्रकार ग्लेन फ्लाईसमन के मामले में देखिये जब उनकी साईट मेकसेन्ट्रल से जुड़ गई - 7 जुलाई 2005 को पुनः प्राप्त, लिंक अब काम नहीं करती है।