सांख्यिकी
सांख्यिकी गणित की वह शाखा है जिसमें आँकड़ों का संग्रहण, प्रदर्शन, वर्गीकरण और उसके गुणों का आकलन क्षेत्रों में लागू है - अकादमिक अनुशासन (academic disciplines), इस से प्राकृतिक विज्ञान, सामाजिक विज्ञान, मानविकी, सरकार और व्यापार आदि।
सांख्यिकीय तरीकों को डेटा के संग्रह के संग्रहण अथवा वर्णन के लिए इस्तेमाल किया जा सकता है। इसे वर्णनात्मक सांख्यिकी (descriptive statistics) कहा जाता है। इसके अतिरिक्त, डेटा में पैटर्न को इस तरह से मॉडल किया जा सकता है कि वह निष्कर्षों की यादृच्छिकता और अनिश्चितता का कारण बने और फिर इस प्रक्रिया को उस विधि, या जिस जनसंख्या का अध्ययन किया जा रहा हो, उसके बारे में अनुमान लगाने के लिए किया जाता है। इसे अनुमानित सांख्यिकी (inferential statistics) कहा जाता है। वर्णनात्मक तथा अनुमानित सांख्यिकी, दोनों में व्यावहारिक सांख्यिकी सम्मिलित है। एक और विद्या है - गणितीय सांख्यिकी (mathematical statistics), जो विषय के सैद्धान्तिक आधार से सम्बन्ध रखती है। आप किरण किसी श्रेणी में पदों के बेकरार को प्रदर्शित करता है जबकि विषमता का संबंध उसकी आकृति की विशिष्टताओं से होता है अन्य शब्दों में अवकरण हमें श्रेणी की संरचना के बारे में बताता है जबकि विषमता हमें वक्र की आकृति के बारे में बताता है अपकिरण हमें श्रेणी के पदों के मानक रूप में स्वीकृत अन्य किसी पद के व्यक्तिगत अंतरों की ओर संकेत करता है विषमता विचलनों की दशा की ओर संकेत करता है अब करण द्वितीय श्रेणी के माध्यम पर आधारित है
परिचय
सांख्यिकी (Statistics) सभ्यता की गति में अंकों का योगदान बड़ा ही महत्वपूर्ण रहा है और अंक पद्धति के विकास का बहुत बड़ा श्रेय भारत को प्राप्त है। मनुष्य के ज्ञान की प्रत्येक शाखा अंकों की ऋणी है।
सांख्यिकी का विज्ञान भी बहुत कुछ काम अंकों से लेता है, जिन्हें "आँकड़े" कहते हैं, परंतु इन अंकों के कुछ विशिष्ट लक्षण होते हैं। स्टैटिस्टिक्स शब्द की व्युत्पत्ति का पता लगाते समय इसके नाम में आज तक हुए अनेक क्रांतिकारी परिवर्तनों को जानकर आश्चर्य होता है। प्राचीन काल में राज्यों के तुलनात्मक वर्णन के लिए स्टैटिस्टिक्स शब्द का प्रयोग होता था, जिसमें अंकों या आँकड़ों का कोई स्थान ही नहीं होता था। स्टैटिस्टिक्स शब्द का मूल लैटिन शब्द स्टैटस (इतालवी भाषा "स्टैटी", जर्मन "स्टैटिस्टिक्स"") है, जिसका अर्थ है 'राजनीतिक राज्य'। 18वीं शती तक इस शब्द का अर्थ किसी राज्य की विशेषताओं का विवरण था। अतएव कुछ प्राचीन लेखकों ने स्टैटिस्टिक्स को राज्य विज्ञान के नाम से निरूपित किया है। क्रमश: इस शब्द को मात्रात्मक सार्थकता प्राप्त हुई और दो विभिन्न अर्थों में इसका प्रयोग चलता रहा। एक ओर यह अंकों से निरूपित "जन्म और मृत्यु आँकड़े" जैसे तथ्यों से और दूसरी ओर अंकात्मक आँकड़ों से उपयोगी निष्कर्ष निकालने के विधि निकाय, अर्थात् विज्ञान से संबंधित था। 19वीं शती के अंतिम काल से हमें "उज्ज्वल, सामान्य, मद" आदि शीर्षकों में बच्चों की सांख्यिकी जैसे विवरण मिलते हैं, जिनसे इस ज्ञान शाखा की परिमाणोन्मुखता (quantitative direction) स्पष्ट होती है।
इस प्रकार हम देखते हैं कि वैज्ञानिक पद्धति की विशिष्ट शाखा के रूप में सांख्यिकी का सिद्धांत अपेक्षाकृत अभिनव उपज है। इसका मूल रूप लाप्लास और गाउस की कृतियों में ढूँढ़ा जा सकता है, लेकिन इसका अध्ययन 19वीं शती के चौथे चरण में जाकर समृद्ध हुआ। गाल्टन और कार्ल पियर्सन के प्रभाव से इस विज्ञान में विलक्षण प्रगति हुई और आगामी तीन दशकों में इस विज्ञान की आधार शिलाएँ सदृढ़ हो गईं। यह कह देना उचित है कि दिन-दिन नए नए क्षेत्रों में प्रयुक्त होने वाले इस विषय की इमारत अभी तेजी से बनन की स्थिति में है। शोध कार्य, वह भी विशेषत: सांख्यिकी के गणितीय सिद्धांत में, ऐसी तेजी से हो रहा है और नए तथ्य ऐसी तीव्र गति से सामने आ रहे हैं कि उन सबकी जानकारी रखना भी कठिन हो रहा है। मानव ज्ञान और क्रिया के विविध क्षेत्रों में इस विषय की प्रयुक्ति दिन-दिन बढ़ रही है और बड़ी उपयोगी सिद्ध हो रही है।
बाह्य विश्व की उलझी हुई जटिलताओं से नियमों के परिचालन का ज्ञान प्राप्त करना विज्ञान के प्रमुख उद्देश्यों में से है, जिससे कुछ मौलिक सिद्धांतों के आधार पर विविध प्राकृतिक घटनाओं की व्याख्या की जा सके। इन नियमों के परिचालन के ज्ञान से हमें "कारण" और "प्रभाव" के संबंध में जानकारी होती है। किसी सुनियोजित प्रयोग में हम प्राय: कारणों की जटिल पद्धति के स्थान पर सरल पद्धति की स्थापना कर सकते हैं, जिसमें एक बार में एक ही कारण से परिस्थिति का विचरण कराया जाता है। यह संभवत: आदर्श स्थिति है और बहुत से क्षेत्रों में इस प्रकार का प्रयोग संभव नहीं है। उदाहरण के लिए, प्रेक्षक सामाजिक तथ्यों का प्रयोग नहीं कर सकता और उसे उन परिस्थितियों को, जो उसके वश में नहीं हैं, ज्यों का त्यों लेकर चलना पड़ता है।
सांख्यिकी अनेक कारणों से प्रभावित आँकड़ों से संबंधित है। कारणों के जंजाल से एक के अतिरिक्त बाकी सभी कारणों को छाँटकर सुलझाना प्रयोगों का उद्देश्य है। यह सभी स्थितियों में संभव न होने के कारण विश्लेषण के लिए सांख्यिकी में कारण समूह के प्रभावाधीन आँकड़ों को स्वीकार किया जाता है और आँकड़ों से ही यह भी जानने की कोशिश की जाती है कि कौन-कौन से कारण महत्व के हैं और इनमें से प्रत्येक कारण के परिचालन से प्रेक्षित प्रभाव पर किसका कितना असर पड़ा है। इसी में हमारे ज्ञान की इस शाखा की विलक्षण और विशिष्ट शक्ति है, जिससे इसकी समृद्धि हुई है और यह प्राय: सर्वव्यापक हो गई है।
उदाहरणार्थ, मान लें कि गेहूँ की उपज पर विभिन्न खादों का प्रभाव हमें ज्ञात करना है। इसके लिए यह पर्याप्त नहीं है कि खादों की संख्या के बराबर भूखंड चुनकर, प्रत्येक भूखंड में एक-एक खाद के उपचार से फसल उगाई जाए और उपज में जो अंतर हो, उसे खाद के प्रभाव का मापक मान लिया जाए; क्योंकि यह सिद्ध किया जा सकता है कि एक ही खाद के प्रभाव से भिन्न-भिन्न भूखंडों में उपज भिन्न होती है। भूखंडों में उपज की भिन्नता के कारण अनेक होते हैं। विभिन्न मात्रा में खाद के प्रभाव का अध्ययन किया जाए, अर्थात् विभिन्न तलों, विभिन्न फार्मों और विभिन्न वर्षों में प्रयोग किए जाएँ, तो अध्ययन और भी जटिल हो जाता है। लेकिन "विचरण का विश्लेषण" (Analysis of Variance) नामक विशिष्ट सांख्यिक विधि के द्वारा, जिसका मुख्य श्रेय आर.ए. फिशर (R.A. Fisher) को है, हम समग्र विचरण को खंडित करके, भिन्न-भिन्न कारणों से विचरण निकालकर, वैध निष्कर्षों पर पहुँच सकते हैं। आजकल कृषि के अतिरिक्त कई दूसरे क्षेत्रों में भी इस प्रविधि का प्रयोग हो रहा है।
व्यष्टि का अध्ययन न करके, समष्टि नाम से अभिहित समूह या समुदाय का अध्ययन करना सांख्यिकी विज्ञान और मौलिक धारणा है। इसकी परिभाषा हम वैज्ञानिक पद्धति की उस शाखा के रूप में कर सकते हैं जो गिनकर या मापकर प्राप्त समष्टिगत गुणों का, जैसे किसी मनुष्य वर्ग की ऊँचाई या भार से, किसी खास घान में निर्मित धातु दंडों की तनाव सामर्थ्य जैसी प्राकृतिक घटनाओं के आँकड़ों से, या संक्षेप में आवृत्ति क्रिया (repetitive operation) से प्राप्त किसी भी प्रयोगात्मक आँकड़े का अध्ययन करती है।
अत: सांख्यिकीविद् का पहला कर्त्तव्य आँकड़ों का संग्रह करना है। यह वह स्वयं कर सकता है, या अन्य उद्देश्य से एकत्रित दूसरे आँकड़ों का प्रयोग कर सकता है। पहले प्रकार के आँकड़ों पर प्रधान और दूसरे प्रकार के आँकड़ों को गौण कहते हैं। आँकड़ों के प्रयोग कर किसी परिणाम पर पहुँचने के पूर्व, उनकी विश्वसनीयता की जाँच कर लेनी चाहिए।
सांख्यिकीय अध्ययन का दूसरा कदम एकत्रित आँकड़ों का वर्गीकरण और सारणीकरण है। यदि प्रेक्षणों की संख्या अधिक है, तो आँकड़ों का वर्गीकरण अभीष्ट ही नहीं, आवश्यक भी है। संघनन करते समय कुछ मात्रा में सूचनाओं का त्याग करना पड़ता है। किंतु मस्तिष्क वृहद् अंक राशि का अर्थ समझने में असमर्थ होता है। अत: आँकड़ों से निरूपित तथ्य का अधिमूल्यन करने के लिए संघनन आवश्यक है। संघनन के बाद आँकड़ों को बारंबारता-बंटन-सारणी के रूप में निरूपित करते हैं।
इस सारणी से निरूपक संख्याओं को, जो एकल संख्याएँ होती हैं, पहचानना सरल है और माध्य (mean), माध्यमिक (median), बहुलक (mode) आदि से आँकड़ों की केंद्रीय प्रवृत्ति तथा मानक विचलन (standard deviation) द्वारा आँकड़ों के अपकिरण और विचरण आदि गुणों को निरूपित करते हैं।
आँकड़ों को वक्र रेखाचित्रों, चित्रलेखों (pictograms) आदि द्वारा भी प्रस्तुत किया जा सकता है और इस प्रकार के प्रस्तुतीकरण से प्राय: मस्तिष्क को आँकड़ों की व्याख्या, भविष्यवाणी, अनुमान और अंत में पूर्वानुमान (forecasting)। कुछ सांख्यिकीविद् पूर्वानुमान को सांख्यिकीविद् का कर्तव्य नहीं मानते, लेकिन अधिकांश मानते हैं।
किसी जनसंख्या की समष्टि के अध्ययन में, प्रत्येक सदस्य का अलग-अलग अध्ययन, संख्या की विपुलता और श्रम तथा लागत के अपव्यय के कारण, व्यावहारिक नहीं ठहरता। अत: जन समुदाय के संबंध में ज्ञान प्राप्त करने के लिए, हम सदस्यों के चयन का, जिन्हें प्रतिदर्श कहते हैं, अध्ययन करते हैं। प्रतिदर्श मूल समष्टि की जानकारी प्रदान करता है। सूचना निरपेक्ष निश्चितता के रूप में हो, ऐसी आशा नहीं की जा सकती। इसे प्राय: संभाविता के रूप में ही प्रकट करते हैं। सांख्यिकी के इस भागको आगणन (estimation), कहते हैं।
सांख्यिकीविद् को कुछ प्राथमिक कार्यों के लिए, जैसे संचयन, वर्गीकरण, सारणीकरण, लेखाचित्रीय उपस्थापन (presentation) आदि के लिए विशिष्ट प्रशिक्षण के साथ ही प्रारंभिक गणित की भी आवश्यकता होती है और बाद में आगणन, अनुमान और पूर्वानुमान के लिए उच्च गणित और संभाविता के सिद्धांत की सहायता लेनी पड़ती है।
अर्थशास्त्र, समाज विज्ञान और वाणिज्य के क्षेत्रों में, बेरोजगारी बढ़ रही है या घट रही है, भवनों की कमी है और यदि है, तो किस सीमा तक, कुपोषण हो रहा है या नहीं, शराबबंदी से अपराधों में कमी हुई है या नहीं, आदि प्रश्नों का समाधान सांख्यिकी के द्वारा होता है।
जनन विज्ञान, जीव विज्ञान और कृषि में सांख्यिकीय विधियों का प्रयोग अब अनिवार्य हो चला है। जीव विज्ञान में एक नई शाखा जीव सांख्यिकी निकली है, जिसके अंतर्गत जीव विज्ञानीय विचरणों का सांख्यिकी अध्ययन किया जाता है।
कुछ प्रागैतिहासिक नरखोपड़ियाँ किसी एक मानव विज्ञान के जाति की हैं या दो विभिन्न जातियों की, मानव विज्ञान के इस दु:साध्य प्रश्न का हल निकालने में कार्ल पियर्सन ने सर्वप्रथम सांख्यिकी का प्रयोग किया था।
मनोविज्ञान और शिक्षा के क्षेत्र में व्यावसायिक प्रशिक्षण के लिए, मानव मस्तिष्क का अध्ययन करते समय, बुद्धि, विशेष योग्यता और अभिरुचि आदि के संदर्भ में सांख्यिकीय तकनीकी की सहायता ली जाती है।
चिकित्सा के क्षेत्र में सांख्यिकीय आँकड़े और विधियाँ दोनों ही परम उपयोगी हैं। महामारी विज्ञान (epidemiology) और जन स्वास्थ्य में आँकड़ों की आवश्यकता पड़ती है और किसी नई औषधि या टीके (inoculation) की दक्षता का पता लगाने के लिए आयुर्वेज्ञानिक अनुसंधान में सांख्यिकीय विधियों के ज्ञान की आवश्यकता होती है।
ज्योतिष, बीमा और मौसम विज्ञान, सांख्यिकी की लाभप्रद युक्तियों के अन्य क्षेत्र हैं। सांख्यिकी का प्रयोग यदाकदा साहित्य में भी हुआ है। कुछ समय पूर्व तक ऐसी धारणा थी कि भौतिकी, रसायन और इंजीनियरी में सांख्यिकी की कोई आवश्यकता नहीं है। इन यथार्थ विज्ञानों में सांख्यिकीय सिद्धांतों के प्रयोग से सचमुच बहुत बड़ी क्रांति हुई है। सांख्यिकीय गुण नियंत्रण, जो उत्पादन इंजीनियरी के अंतर्गत सांख्यिकीय विधियों का अनुकूलन है, इसी क्रांति की देन है। बाढ़ नियंत्रण, सड़क सुरक्षा, टेलीफोन, यातायात आदि की समस्याओं में सांख्यिकीय प्रणालियों का प्रयोग सफल रहा है।
भविष्य में सांख्यिकी का और भी व्यापक प्रसार संभव है। कुछ विषयों के लिए यह मौलिक महत्व के विचार और कुछ के लिए अनुसंधान की शक्तिशाली विधियाँ, प्रदान करती है। बिना विषय खंडन की आशंका के कहा जा सकता है कि सांख्यिकी सर्वव्यापी विषय बनता जा रहा है।
सांख्यिकीय पद्धतियां
प्रायोगिक तथा अवलोकन हेतु अध्ययन
सांख्यिकीय अनुसंधान परियोजना के लिए छानबीन करने का साझा ध्येय है आपद (causality) और विशेषतया भविष्यवक्ताओं के मूल्यों में परिवर्तन, अथवा स्वतंत्र चरों (independent variable) का अनुक्रिया अथवा आश्रित चरों (dependent variable) पर क्या प्रभाव पड़ता है, इसके बारे में निष्कर्ष निकालना.अनियत सांख्यिकीय अध्ययन के दो प्रमुख प्रकार हैं, प्रयोगात्मक अध्ययन और अवलोकन अध्ययन.अध्ययन के दोनों प्रकार में, एक स्वतंत्र चर (या चरों) के मतभेदों का, एक आश्रित चर के व्यवहार पर असर का अवलोकन किया जाता है। दोनों प्रकार के बीच का अंतर इस बात पर निहित है कि वास्तविक अध्ययन को कैसे आयोजित किया जाता है। निहित है। कोई भी बहुत प्रभावी हो सकता है।
एक प्रयोगात्मक अध्ययन में सम्मिलित है, इसके अंतर्गत की प्रणाली का माप, इस प्रणाली से छेड़छाड़ और उसी प्रक्रिया का प्रयोग कर, अतिरिक्त माप लेना, यह निर्धारित करने के लिए की क्या प्रणाली से छेड़छाड़ ने माप के मूल्यों में संशोधन किया हैइसके विपरीत, एक पर्यवेक्षणीय अध्ययन में प्रयोगात्मक हेरफेर शामिल नहीं है। इसके बजाय, डेटा एकत्रित किया जाता है और भविष्यवक्ताओं और प्रतिक्रिया के बीच के सह सम्बन्ध कि जाँच की जाती है।
एक प्रायोगिक अध्ययन का एक उदाहरण है प्रसिद्ध हावथोर्न प्रभाव (Hawthorne studies), जिसने पश्चिमी इलेक्ट्रिक कंपनी के हावथोर्न संयंत्र में कार्य परिवेश को बदलने का प्रयास किया। शोधकर्ता यह जानना चाहते थे कि क्या रोशनी में वृद्धि से श्रमिकों द्वारा असेम्बली लाइन (assembly line) पर की गई उत्पादकता में वृद्धि होगी। शोधकर्ताओं ने सबसे पहले तो इस प्लांट की उत्पादकता को नापकर, वहां के एक हिस्से की रोशनी में संशोधन किया और यह जाँच की, कि क्या रोशनी में परिवर्तन का उत्पादकता पर कोई प्रभाव पड़ा.यह उल्लेखनीय है कि वास्तव में, उत्पादकता (प्रयोगात्मक शर्तों के तहत) बेहतर निकली। (देखो हावथोर्न प्रभाव (Hawthorne effect)। ) हालांकि, इस अध्ययन की आज, प्रयोगात्मक प्रक्रियाओं में त्रुटियों के लिए आलोचना की जाती है, विशेष रूप से, नियंत्रण समूह (control group) की कमी और अंधेपन (blindness) के कारण।
पर्यवेक्षणीय अध्ययन का एक उदाहरण है, जो धूम्रपान और फेफड़े के कैंसर के बीच सहसंबंध का अन्वेषण करता है। इस प्रकार के अध्ययन में आम तौर पर, एक सर्वेक्षण की मदद से, जिस क्षेत्र में दिलचस्पी हो, उसके आंकडों को इकठ्ठा कर, उनका सांख्यिकीय विश्लेषण किया जाता है। इस मामले में, शोधकर्ताओं ने धूम्रपान करने वालों और न करने वाले, दोनों के आंकडों को इकट्ठा किया होगा, शायद केस-कंट्रोल अध्ययन (case-control study), के माध्यम से और फिर प्रत्येक समूह में फेफड़ों के कैंसर के मामलों की संख्या ढूंढी होगी।
एक प्रयोग के बुनियादी कदम हैं;
- अनुसंधान की योजना, जिसमें शामिल हैं, सूचना स्रोत तय करना, अनुसन्धान के विषय का चयन, तथा प्रस्तावित अनुसंधान की विधि और नैतिक विचार.
- प्रयोगों के डिजाइन (Design of experiments) केंद्रित होगा सिस्टम मॉडल पर और स्वतंत्र और आश्रित चरों की अंतःक्रिया पर.
- विस्तृत जानकारी को छुपाते हुए, टिप्पणियों के संग्रह का सार् निकालना (Summarizing a collection of observations), जिसमें उनकी समानताओं को चिन्हित किया गया हो। (वर्णनात्मक आँकड़े (Descriptive statistics))
- दुनिया के बारे में अवलोकन पर टिप्पणियों (the observations tell) के बारे में आम सहमति तक पहुंचना .(सांख्यिकी निष्कर्ष (Statistical inference))
- दस्तावेजीकरण / अध्ययन के परिणाम प्रस्तुत करना।
सांख्यिकीय तकनीक
अनुसंधान (research)अवलोकन (observation) के लिए कुछ ज्ञात सांख्यिकीय परीक्षण (test) और प्रक्रियाएं (procedure) हैं:
- विद्यार्थी के t-परीक्षण (Student's t-test)
- चाई-वर्ग परीक्षण (chi-square test)
- भिन्नता का विश्लेषण (Analysis of variance) (ANOVA)
- मान-व्हिटनी यू (Mann-Whitney U)
- प्रतिगमन विश्लेषण (Regression analysis)
- घटक विश्लेषण (Factor Analysis)
- सहसंबंध (Correlation)
- Pearson उत्पाद-पल सहसंबंध गुणांक (Pearson product-moment correlation coefficient)
- स्पीअरमैन की रैंक सहसंबंध गुणांक (Spearman's rank correlation coefficient)
- समय श्रृंखला विश्लेषण (Time Series Analysis)
विशिष्ट विषय
जाँच के कुछ क्षेत्रों में व्यवहारिक सांख्यिकी का उपयोग इतना व्यापक है कि उनकी एक विशिष्ट शब्दावली है। इन विषयों में शामिल हैं:
- बीमांकिक विज्ञान (Actuarial science)
- व्यावहारिक सूचना अर्थशास्त्र (Applied information economics)
- बायोसांख्यिकी (Biostatistics)
- बूटस्ट्रैप (Bootstrap) & जैकनाईफ़ रीसाम्पेल्लिंग (Jackknife Resampling)
- व्यवसायिक सांख्यिकी (Business statistics)
- डेटा विश्लेषण (Data analysis)
- डाटा खनन (Data mining) (डेटा से ज्ञान को खोजने के लिए, सांख्यिकी का प्रयोग और पैटर्न की पहचान (pattern recognition))
- जनसांख्यिकी (Demography)
- आर्थिक सांख्यिकी (Economic statistics) (अर्थमिति)
- ऊर्जा सांख्यिकी (Energy statistics)
- इंजीनियरिंग सम्बंधित सांख्यिकी (Engineering statistics)
- पर्यावरण सांख्यिकी
- महामारी विज्ञान (Epidemiology)
- भूगोल और भौगोलिक सूचना प्रणाली (Geographic Information Systems) और विशेष रूप से स्थानिक विश्लेषण (Spatial analysis) में
- छवि संसाधन (Image processing)
- बहुभिन्नरूपी विश्लेषण (Multivariate Analysis)
- मनोवैज्ञानिक सांख्यिकी (Psychological statistics)
- गुणवत्ता (Quality)
- सामाजिक सांख्यिकी (Social statistics)
- सांख्यिकीय साक्षरता (Statistical literacy)
- सांख्यिकीय मॉडलिंग (Statistical modeling)
- सांख्यिकीय सर्वेक्षण (Statistical survey)
- प्रक्रिया विश्लेषण और केमोमेट्रिक्स (chemometrics) (विश्लेषणात्मक रसायन शास्त्र (analytical chemistry) और रसायन इंजीनियरी से प्राप्त डेटा के विश्लेषण के लिए)।
- संरचित डेटा विश्लेषण (सांख्यिकी) (Structured data analysis (statistics))
- उत्तरजीविता विश्लेषण (Survival analysis)
- विश्वसनीयता अभियांत्रिकी (Reliability engineering)
- सांख्यिकी विभिन्न खेलों में, विशेष रूप से बेसबॉल (baseball) और क्रिकेट (cricket)
आँकड़ों के साथ व्यापार में एक महत्वपूर्ण आधार उपकरण और विनिर्माण फार्म का.इसका उपयोग माप सिस्टम परिवर्तनीयता को समझने, नियंत्रण प्रक्रियाओं में (जैसे सांख्यिकीय प्रक्रिया नियंत्रण (statistical process control) अथवा एस पी सी), डाटा का सारांश दिखने, तथा डाटा-संचालित निर्णय लेने के लिए किया जाता है। इन भूमिकाओं में यह एक प्रमुख यंत्र है और शायद अकेला विश्वसनीय उपकरण भी है।
दुरुपयोग
यह एक आम धारणा है कि प्रस्तुतकर्ता सांख्यिकीय ज्ञान के दुरूपयोग (misused) के लिए, ज्यादातर और जानबूझ कर, ऐसे रास्ते ढूंढते हैं, जिनसे केवल उन आंकडों की व्याख्या करें, जो उनके लाभ के अनुरूप है बेंजामिन दिसरईली द्वारा दी एक प्रसिद्ध कहावत है, " झूठ तीन प्रकार के होते हैं: झूठ, शापित, झूठ और आँकड़े (There are three kinds of lies: lies, damned lies, and statistics)"; और हार्वर्ड के प्रमुख लॉरेंस लोवेल (Lawrence Lowell) ने सन 1909 में लिखा था कि आँकड़े, वील पाइस की तरह तब तक ठीक हैं जब तक आप उस व्यक्ति को जानते हों जिसने उन्हें बनाया था, तथा उनके अवयवों के बारे में संतुष्ट हैं।.
यदि विभिन्न अध्ययन एक दूसरे का खंडन करते हों, तब आम जनता का ऐसे अध्ययनों पर से विश्वास उठ सकता है। उदाहरण के लिए, एक अध्ययन से यह पता चले कि कोई आहार या गतिविधि रक्तचाप को बढाते हैं, जबकि कोई दूसरा अध्ययन यह कहे कि वह रक्तचाप को कम करते हैं। ऐसी विसंगतियां प्रयोगात्मक डिजाइन में मामूली हेर-फेर द्वारा उठ सकती हैं, जैसे रोगी समूहों, या अनुसंधान प्रोटोकॉल के वह मतभेद, जो आसानी से गैर विशेषज्ञों द्वारा समझे ना जा सकें.(कभी कभी मीडिया रिपोर्ट्स ऐसी महत्वपूर्ण प्रासंगिक जानकारी को पूरी तरह से नजरअंदाज कर देती हैं।)
एक निश्चित नमूने को चुनकर, (या, खारिज या संशोधित कर), परिणाम में फेर-बदल किया जा सकता है। जरूरी नहीं कि इस तरह का जोड़तोड़ दुर्भावनापूर्ण अथवा कुटिलतापूर्ण हो; यह शोधकर्ता के अनभिप्रेत पक्षपात से उत्पन्न हो सकता है। डेटा का सारांश देने वाले ग्राफ भी गुमराह करने वाले हो सकते हैं।
इस तथ्य की गहन आलोचना हुई है कि परिकल्पना परीक्षण का वह दृष्टिकोण, जिसका व्यापक रूप से प्रयोग किया जाता है और जो कई मामलों में कानून या विनियम के द्वारा आवश्यक है, एक परिकल्पना (शून्य परिकल्पना (null hypothesis)) की "तरफदारी" करता है और यह एक बड़े अध्ययन में, किसी मामूली अन्तर के महत्त्व को भी बढ़ा-चढा कर दिखा सकता है। एक ऐसा फर्क जो उच्च सांख्यिकीय महत्त्व का हो, तब भी हो सकता है कि वह बिना किसी व्यावहारिक महत्व का हो। (देखें परिकल्पना परीक्षण की आलोचना (criticism of hypothesis testing) और शून्य परिकल्पना पर विवाद (controversy over the null hypothesis)। )
यह आम रिपोर्ट, कि एक परिकल्पना को, महत्व के दिए गए स्तर पर नकार दिया गया, इससे अच्छी प्रतिक्रिया वह होगी, जिसमें पी-मूल्य (p-value) पर ज्यादा महत्त्व दिया गया हो। यह पी-मूल्य, बहरहाल, इस प्रभाव के आकार को नहीं दर्शाता.एक दूसरा आम दृष्टिकोण है विश्वास के अंतराल (confidence interval) का वर्णन देना.हालांकि यह भी उन्ही गणनाओं से प्राप्त होते हैं जैसे परिकल्पना-टेस्टस अथवा पी-मूल्य, वे इस प्रभाव के आकार और उसके आस-पास की अनिश्चितता, दोनों का वर्णन भी करते हैं।
इन्हें भी देखें
- सांख्यिकी के बुनियादी विषयों की सूची (List of basic statistics topics)
- सांख्यिकीय विषयों की सूची (List of statistical topics)
- शैक्षिक सांख्यिकीय संघों की सूची (List of academic statistical associations)
- राष्ट्रीय और अंतरराष्ट्रीय सांख्यिकीय सेवाओं की सूची (List of national and international statistical services)
- सांख्यिकी के प्रकाशनों की सूची (List of publications in statistics)
- सांख्यिकीविदों की सूची (List of statisticians)
- संभाव्यता और सांख्यिकी शब्दकोष (Glossary of probability and statistics)
- संभावना और सांख्यिकी पर संकेतन (Notation in probability and statistics)
- सरकारी आँकड़े (Official statistics)
- भविष्यवाणी (Forecasting)
- सांख्यिकी की नींव (Foundations of statistics)
- बहुभिन्नरूपी आँकड़े (Multivariate statistics)
- प्रतिगमन विश्लेषण (Regression analysis)
- सांख्यिकीय घटना (Statistical phenomena)
- सांख्यिकीय सलाहकार (Statistical consultant) (बहुवचन)
- सांख्यिकीविद् (Statistician)
- संरचनात्मक समीकरण मॉडलिंग (Structural equation modeling)
- आर (प्रोग्रामन भाषा) -- सांख्यिकी के लिए विशेष रूप से उपयोगी
बाहरी कड़ियाँ
ऑनलाइन पाठ्यक्रम और पाठ्यपुस्तकें
- जानिए साांख्यिकी का महत्व और विशेषताएं
- सांख्यिकी के सिद्धान्त (गूगल पुस्तक; लेखक - दर्याब सिंह)
- सांख्यिकी (गूगल पुस्तक ; लेखक - डॉ एस के सिंह)
- 10 Great Indian Statisticians of all times
- सांख्यिकी विशेषज्ञों की भी अच्छी मांग है
- स्टेटस फॉर स्टूडेंट्स: सांख्यिकी को समझने और इसमें गणना करने के लिए परिचयात्मक गाइड
- "सांख्यिकी के नए रूप" द्वारा विल जी. होपकिंस
- इलेक्ट्रॉनिक सांख्यिकी की पाठ्यपुस्तक (स्टेटसॉफ्ट, इंक., सांख्यिकीय होमपृष्ठ)
- हाइपरस्टेट ऑनलाइन: सांख्यिकी की एक परिचयात्मक पाठ्यपुस्तक और ऑनलाइन ट्यूटोरियल - सांख्यिकी पाठ्यक्रम में मदद के लिए (डेविड लेन)
- एनआईएसटी/एसईएम्ऐटीईसीएच e-पुस्तिका सांख्यिकीय तरीकों के बारे में
- स्टेटनोट्स: बहुभिन्नरूपी विश्लेषण विषय पर, जी डेविड गारसन द्वारा
- डॉ॰ जेरार्ड ई. डेलाल द्वारा "सांख्यिकी कार्यविधि के बारे में एक छोटी हैण्डबुक",साँचा:category handlerसाँचा:main otherसाँचा:main other[dead link] टुफ़्त्स विश्वविद्यालय (Tufts University)।
सामान्य साइटें और संगठन
- अमेरिकन सांख्यिकीय एसोसिएशन
- मुफ्त सांख्यिकी (स्वतंत्र और खुला स्रोत सॉफ्टवेयर, डेटा और tutorials)
- अंतर्राष्ट्रीय सांख्यिकी संस्थान
- गणितीय सांख्यिकी संस्थान
- संभाव्यता वेब
- रॉयल सांख्यिकीय सोसाइटी
- सांख्यिकीय एजेंसियों (इंटरनेशनल)
- स्टेटलिब: डाटा, सॉफ्टवेयर और समाचार के सांख्यिकी समुदाय (कार्नेगी मेल्लोन) से
- स्टेटपेजेस.नेट (सांख्यिकीय गणना, मुफ्त सॉफ्टवेयर, आदि)
- स्टेटसी.ओआरजी: सांख्यिकीय विज्ञान वेब
अन्य संसाधन
- सांख्यिकीय विश्लेषण में विवाद (एक पन्ने की समीक्षा (पीडीऍफ़))
- खोजपूर्ण आँकड़े एप्प्लेट्स
- रीसाम्पेल्लिंग: कंप्यूटर और सांख्यिकी की शादी (ERIC Digests)
- संभावना और सांख्यिकी के अध्यापन और अध्ययन के लिए संसाधन (एरिक डाईजेस्ट)
- सॉफ्टवेयर रिपोर्टें (इंटरनेशनल एसोसिएशन फॉर स्टतीस्तिकल कम्प्यूटिंग द्वारा)
- Statistics Quotes