सांख्यिकी

अध्याय 13 · गणित · कक्षा 10 32 मिनट में पढ़ें

यह क्यों ज़रूरी है

सोचो तुम्हारा स्कूल 200 छात्रों के अंक इकट्ठा करता है, या कोई शहर साल भर का रोज़ का तापमान दर्ज करता है। यह तो आँकड़ों की बाढ़ है। 200 संख्याओं को घूरकर किसी को कुछ समझ नहीं आता — हमें चाहिए एक संख्या जो पूरे ढेर का प्रतिनिधित्व करे: एक सामान्य अंक, एक सामान्य तापमान, वह आकार जो सबसे ज़्यादा बार आता है।

कक्षा 9 में तुमने संख्याओं की एक छोटी सूची का माध्य, माध्यिका और बहुलक निकाला था, जिसे एक-एक करके पढ़ा जा सकता था। पर असली आँकड़े आम तौर पर इतने बड़े होते हैं कि अलग-अलग सूचीबद्ध नहीं किए जा सकते, इसलिए उन्हें वर्ग अंतरालों की सारणी में दबा दिया जाता है — “10–25 अंक: 2 छात्र, 25–40 अंक: 3 छात्र, …”। एक बार सही मान अंतरालों के अंदर छिप जाएँ, तो पुराने सूत्र वैसे-के-वैसे काम नहीं आते।

यह अध्याय तुम्हें सिखाता है कि वर्गीकृत आँकड़ों में से केंद्रीय प्रवृत्ति के तीनों माप — माध्य, बहुलक और माध्यिका — कैसे निकाले जाएँ। तुम माध्य निकालने के तीन तरीक़े सीखोगे (और यह कि जादुई तरीक़े से तीनों एक ही जवाब क्यों देते हैं), एक सूत्र जो सबसे व्यस्त अंतराल के अंदर बहुलक ढूँढता है, और एक सूत्र जो ठीक बीच का मान निकालता है। यही वे औज़ार हैं जो संख्याओं की दीवार को एक अकेले, अर्थपूर्ण सारांश में बदल देते हैं।

मूल विचार

वर्गीकृत आँकड़े सही मानों को वर्ग अंतरालों के अंदर छिपा देते हैं, इसलिए हम हर अंतराल के मध्य-बिंदु (वर्ग चिह्न) को उसके प्रतिनिधि के रूप में लेते हैं। माध्य उन मध्य-बिंदुओं का औसत है, जो इस हिसाब से तौला जाता है कि हर वर्ग में कितने मान आते हैं — यह प्रत्यक्ष, कल्पित-माध्य या पग-विचलन विधि से निकलता है, जो सिर्फ़ इसमें फ़र्क़ रखती हैं कि गणना कितनी साफ़-सुथरी है, जवाब में कभी नहीं। बहुलक सबसे ऊँची बारंबारता वाले वर्ग (बहुलक वर्ग) के अंदर रहता है, और माध्यिका उस वर्ग के अंदर रहती है जहाँ बारंबारताओं का चलता-जोड़ पहली बार आधे तक पहुँचता है (माध्यिका वर्ग)। हर एक के पास एक सूत्र है जो उस वर्ग के अंदर का मान ठीक-ठीक पकड़ता है।

आओ इसे समझें

वर्ग चिह्न के बारे में एक बात पहले, क्योंकि पूरी सांख्यिकी इन्हीं पर टिकी है। वर्गीकृत आँकड़ों में हम मानते हैं कि किसी वर्ग का हर मान उसके केंद्र पर बैठा है। मध्य-बिंदु (वर्ग चिह्न) बस दोनों सीमाओं का औसत है:

वर्ग चिह्न = (निचली सीमा + ऊपरी सीमा) / 2

तो वर्ग 10–25 के लिए चिह्न (10 + 25)/2 = 17.5 है। यह एक अकेली संख्या पूरे वर्ग का प्रतिनिधित्व करती है।

माध्य — प्रत्यक्ष विधि

वर्गीकृत आँकड़ों का माध्य (हर वर्ग चिह्न × उसकी बारंबारता) के जोड़ को कुल बारंबारता से भाग देने पर मिलता है:

x̄ = Σfᵢxᵢ / Σfᵢ

जहाँ xᵢ वर्ग चिह्न है और fᵢ i-वें वर्ग की बारंबारता। तुम गुणनफल fᵢxᵢ का एक अतिरिक्त स्तंभ बनाते हो, उसे जोड़ते हो, और प्रेक्षणों की कुल संख्या से भाग देते हो।

30 छात्रों के अंक लो:

वर्ग अंतरालबारंबारता (fᵢ)वर्ग चिह्न (xᵢ)fᵢxᵢ
10–25217.535.0
25–40332.597.5
40–55747.5332.5
55–70662.5375.0
70–85677.5465.0
85–100692.5555.0
कुलΣfᵢ = 30Σfᵢxᵢ = 1860
प्रत्यक्ष विधि से माध्य

ऊपर की सारणी (30 छात्रों के अंक) से प्रत्यक्ष विधि द्वारा माध्य अंक निकालो।

माध्य — कल्पित-माध्य विधि

जब वर्ग चिह्न बड़े हों (मसलन 200, 300, 400…), तो हर एक को उसकी बारंबारता से गुणा करना थका देता है। तरकीब: एक अनुमानित माध्य चुनो जिसे कल्पित माध्य a कहते हैं (बीच के पास का वर्ग चिह्न लो), और इस बात के साथ काम करो कि हर वर्ग चिह्न उससे कितनी दूर बैठा है। वह अंतर है विचलन dᵢ = xᵢ − a। चूँकि हमने हर मान में से a घटाया है, इसलिए अंत में हम उसे वापस जोड़ देते हैं:

x̄ = a + (Σfᵢdᵢ / Σfᵢ)

यह ठीक वही माध्य देता है क्योंकि हर मान में से एक अचर घटाने पर माध्य उतना ही घट जाता है — उसे वापस जोड़ने पर वह बहाल हो जाता है। अंकों के आँकड़ों के लिए a = 47.5 लो:

वर्ग अंतरालfᵢxᵢdᵢ = xᵢ − 47.5fᵢdᵢ
10–25217.5−30−60
25–40332.5−15−45
40–55747.500
55–70662.51590
70–85677.530180
85–100692.545270
कुल30Σfᵢdᵢ = 435
कल्पित-माध्य विधि से माध्य

उन्हीं अंकों के आँकड़ों के लिए, a = 47.5 लेकर कल्पित-माध्य विधि से माध्य निकालो।

माध्य — पग-विचलन विधि

विचलनों −30, −15, 0, 15, 30, 45 को देखो: ये सब 15 के गुणज हैं, यानी वर्ग माप के। तो हर एक को h (वर्ग माप) से भाग देकर और भी छोटी पूर्ण संख्याएँ uᵢ = (xᵢ − a) / h पाओ। चूँकि हमने हर विचलन को h के गुणक से छोटा किया है, इसलिए अंत में h से गुणा कर वापस बड़ा कर देते हैं:

x̄ = a + h × (Σfᵢuᵢ / Σfᵢ)

वर्ग अंतरालfᵢxᵢuᵢ = (xᵢ − 47.5)/15fᵢuᵢ
10–25217.5−2−4
25–40332.5−1−3
40–55747.500
55–70662.516
70–85677.5212
85–100692.5318
कुल30Σfᵢuᵢ = 29
पग-विचलन विधि से माध्य

उन्हीं अंकों के आँकड़ों के लिए, a = 47.5 और h = 15 लेकर पग-विचलन विधि से माध्य निकालो।

तीनों एक क्यों हैं। ये एक ही गणना हैं, बस अलग कपड़ों में। कल्पित-माध्य विधि हर मान को a से नीचे खिसका देती है, फिर a वापस जोड़ देती है। पग-विचलन विधि वह खिसकाव और h से भाग करती है, फिर h से वापस गुणा कर देती है। कोई जानकारी नहीं खोती — इसलिए माध्य एक ही होना ही चाहिए। वही चुनो जो गणना सबसे हल्की रखे:

माध्य के लिए विधि चुनना
विधिसूत्रकब सबसे अच्छीअतिरिक्त स्तंभ
प्रत्यक्षx̄ = Σfᵢxᵢ / Σfᵢxᵢ और fᵢ छोटे होंfᵢxᵢ
कल्पित माध्यx̄ = a + Σfᵢdᵢ / Σfᵢxᵢ बड़े होंdᵢ, fᵢdᵢ
पग-विचलनx̄ = a + h × (Σfᵢuᵢ / Σfᵢ)विचलनों में उभयनिष्ठ गुणनखंड h होdᵢ, uᵢ, fᵢuᵢ
Concept check

पग-विचलन विधि में तुमने Σfᵢuᵢ निकाला पर अंत में h से गुणा करना भूल गए। तुम्हारा माध्य ज़्यादा बड़ा होगा, ज़्यादा छोटा, या सही?

वर्गीकृत आँकड़ों का बहुलक

बहुलक वह मान है जो सबसे ज़्यादा बार आता है। वर्गीकृत आँकड़ों में तुम अलग-अलग मान नहीं देख सकते, पर सबसे ऊँची बारंबारता वाला वर्ग ज़रूर पहचान सकते हो — वह है बहुलक वर्ग। बहुलक उसी वर्ग के अंदर का कोई मान है, जो इस सूत्र से मिलता है:

बहुलक = l + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h

जहाँ l = बहुलक वर्ग की निचली सीमा, f₁ = बहुलक वर्ग की बारंबारता, f₀ = उससे ठीक पहले वाले वर्ग की बारंबारता, f₂ = उसके ठीक बाद वाले वर्ग की बारंबारता, और h = वर्ग माप। विचार यह: बहुलक उस पड़ोसी की ओर झुकता है जो ज़्यादा ऊँचा हो। अगर बहुलक वर्ग के बाद वाला वर्ग पहले वाले से ज़्यादा व्यस्त हो, तो बहुलक उसी ओर खिसक जाता है।

परिवार के आकार का आयतचित्र, अंतराल 1-3, 3-5, 5-7, 7-9, 9-11 और बारंबारताएँ 7, 8, 2, 2, 1। बारंबारता 8 वाला 3-5 का स्तंभ सबसे ऊँचा है और बहुलक वर्ग के रूप में उजागर है।
बहुलक वर्ग बस सबसे ऊँचा स्तंभ है — सबसे ऊँची बारंबारता वाला वर्ग। यहाँ यह 3 से 5 है, जिसकी बारंबारता 8 है।

20 घरों का परिवार-आकार सर्वेक्षण:

परिवार का आकारपरिवारों की संख्या
1–37
3–58
5–72
7–92
9–111
वर्गीकृत आँकड़ों का बहुलक

ऊपर के परिवार-आकार आँकड़ों का बहुलक निकालो (सबसे ऊँची बारंबारता 8 है, वर्ग 3-5 में)।

वर्गीकृत आँकड़ों की माध्यिका

माध्यिका बीच का मान है — आधे आँकड़े उससे नीचे, आधे ऊपर। वर्गीकृत आँकड़ों में इसे निकालने के लिए पहले संचयी बारंबारता (cf) बनाओ: सारणी में नीचे जाते बारंबारताओं का चलता-जोड़। किसी वर्ग की संचयी बारंबारता उसकी अपनी बारंबारता और उससे पहले की सारी बारंबारताओं का जोड़ है, तो यह बताती है कि “इतनी दूर तक नीचे ज़्यादा-से-ज़्यादा कितने प्रेक्षण हैं”।

फिर माध्यिका वर्ग ढूँढो — वह पहला वर्ग जिसकी संचयी बारंबारता n/2 तक पहुँचे या पार करे (जहाँ n = कुल बारंबारता)। माध्यिका उसी के अंदर बैठती है:

माध्यिका = l + [(n/2 − cf) / f] × h

जहाँ l = माध्यिका वर्ग की निचली सीमा, n = कुल बारंबारता, cf = माध्यिका वर्ग से पहले वाले वर्ग की संचयी बारंबारता, f = माध्यिका वर्ग की बारंबारता, h = वर्ग माप। कोष्ठक नापता है कि (n/2)-वें प्रेक्षण तक पहुँचने के लिए माध्यिका वर्ग की शुरुआत से कितना आगे चलना है।

53 छात्रों के अंक, संचयी-बारंबारता स्तंभ जोड़कर:

अंकबारंबारता (f)संचयी बारंबारता (cf)
0–1055
10–2038
20–30412
30–40315
40–50318
50–60422
60–70729
70–80938
80–90745
90–100853
वर्गीकृत आँकड़ों की माध्यिका

ऊपर की संचयी-बारंबारता सारणी से 53 छात्रों के अंकों की माध्यिका निकालो।

तीनों को जोड़ने वाला एक काम का अनुभवजन्य संबंध भी है: 3 माध्यिका = बहुलक + 2 माध्य। यह सन्निकट है, पर झटपट जाँच के लिए या दो माप पता होने पर तीसरा निकालने के लिए उपयोगी है।

आम ग़लतियाँ

⚠️ Common mistake
What students think

माध्य में वर्ग चिह्न की जगह वर्ग की सीमाएँ (जैसे 10 और 25) इस्तेमाल करना।

Why it seems right

सीमाएँ तो सारणी में सामने ही होती हैं और गुणा करने के लिए सीधी संख्याएँ लगती हैं, जबकि वर्ग चिह्न एक अतिरिक्त क़दम है जो निकालना पड़ता है।

What actually happens

xᵢ के रूप में तुम्हें वर्ग चिह्न — मध्य-बिंदु (निचली + ऊपरी)/2 — ही लेना है। पूरा वर्ग उस मध्य-बिंदु पर केंद्रित माना जाता है, तो वर्ग 10–25 का प्रतिनिधि 17.5 है (10 या 25 नहीं)।

⚠️ Common mistake
What students think

बहुलक वर्ग वह है जिसका वर्ग अंतराल सबसे बड़ा हो, या जिसका वर्ग चिह्न सबसे बड़ा हो।

Why it seems right

'बहुलक' शब्द ऐसा लगता है मानो आकार या स्थान से जुड़ा हो, और सबसे बड़ा अंतराल या आख़िरी वर्ग नज़र में उभरकर आता है।

What actually happens

बहुलक वर्ग सबसे ऊँची बारंबारता वाला वर्ग है — सबसे ऊँचा स्तंभ। इसका इस बात से कोई वास्ता नहीं कि अंतराल कितना चौड़ा है या कहाँ बैठा है; इसे सिर्फ़ f के मान तय करते हैं।

⚠️ Common mistake
What students think

माध्यिका के लिए n/2 ही माध्यिका वर्ग चुनता है, या सूत्र में cf माध्यिका वर्ग की संचयी बारंबारता है।

Why it seems right

n/2 माध्यिका वर्ग के अंदर ही पड़ता है, तो लगता है cf उसी पंक्ति से पढ़ना चाहिए, और 'संचयी बारंबारता' लगता है मानो माध्यिका वर्ग तक का चलता-जोड़ हो।

What actually happens

माध्यिका वर्ग वह पहला वर्ग है जिसकी cf, n/2 तक पहुँचे या पार करे। और सूत्र में cf माध्यिका वर्ग से ठीक पहले वाले वर्ग की संचयी बारंबारता है — उसमें घुसने से पहले जितना पार हो चुका, उसकी गिनती। माध्यिका वर्ग की अपनी cf इस्तेमाल करने पर जवाब ग़लत आता है।

⚠️ Common mistake
What students think

बहुलक और माध्यिका के लिए सूत्र सीधे 118-126, 127-135 जैसे समावेशी वर्गों पर लगा देना।

Why it seems right

सारणी पहले से ही साफ़-सुथरे वर्ग अंतरालों जैसी दिखती है, तो लगता है यह सीधे रखने को तैयार है।

What actually happens

बहुलक और माध्यिका सूत्र सतत वर्ग मानते हैं। समावेशी वर्ग (बीच में अंतराल वाले, जैसे 118-126 फिर 127-135) को पहले सतत रूप (117.5-126.5, 126.5-135.5, …) में बदलना होगा, हर सीमा को अंतराल के आधे से समंजित कर के। वरना l और h ग़लत आ जाते हैं।

झटपट जाँच

वर्गीकृत आँकड़ों का माध्य निकालते समय कौन-सा मान किसी वर्ग अंतराल का प्रतिनिधित्व करता है?

प्रत्यक्ष, कल्पित-माध्य और पग-विचलन विधियाँ एक ही वर्गीकृत आँकड़ों पर लगाई जाती हैं। इनके परिणामों की तुलना कैसी है?

किसी वर्गीकृत बंटन में बहुलक वर्ग कौन-सा है?

n = 40 वाले आँकड़ों में, सारणी में नीचे की संचयी बारंबारताएँ 5, 13, 19, 26, 34, 40 हैं। माध्यिका वर्ग कौन-सा है?

अभ्यास प्रश्न

आसान

easy

निम्न आँकड़ों का माध्य प्रत्यक्ष विधि से निकालो।

easy

इनका बहुलक वर्ग और बहुलक निकालो: 0-10 (f=3), 10-20 (f=9), 20-30 (f=15), 30-40 (f=5), 40-50 (f=2)।

मध्यम

medium

35 राज्यों में महिला शिक्षिकाओं का प्रतिशत नीचे है। पग-विचलन विधि से माध्य निकालो (a = 50, h = 10 लो)।

medium

30 छात्रों के वज़न (किग्रा) की माध्यिका निकालो: 40-45 (2), 45-50 (3), 50-55 (8), 55-60 (6), 60-65 (6), 65-70 (3), 70-75 (2)।

चुनौती

challenge

नीचे के आँकड़ों का माध्य ₹18 है। लुप्त बारंबारता f निकालो। वर्ग (भत्ता ₹ में): 11-13 (7), 13-15 (6), 15-17 (9), 17-19 (13), 19-21 (f), 21-23 (5), 23-25 (4)।

challenge

किसी बंटन की माध्यिका 28.5 है और कुल बारंबारता 60 है। x और y निकालो। वर्ग: 0-10 (5), 10-20 (x), 20-30 (20), 30-40 (15), 40-50 (y), 50-60 (5)।

सारांश

अब तुम यह समझा सकने योग्य होने चाहिए:

  • वर्गीकृत आँकड़ों में हर वर्ग का प्रतिनिधि उसका वर्ग चिह्न = (निचली + ऊपरी)/2 होता है।
  • माध्य — प्रत्यक्ष विधि: x̄ = Σfᵢxᵢ / Σfᵢ।
  • माध्य — कल्पित-माध्य विधि: x̄ = a + (Σfᵢdᵢ / Σfᵢ), जहाँ dᵢ = xᵢ − a; तब काम आती है जब वर्ग चिह्न बड़े हों।
  • माध्य — पग-विचलन विधि: x̄ = a + h × (Σfᵢuᵢ / Σfᵢ), जहाँ uᵢ = (xᵢ − a)/h; तब काम आती है जब विचलनों में उभयनिष्ठ गुणनखंड h हो।
  • तीनों माध्य विधियाँ एक ही जवाब देती हैं — वे सिर्फ़ इसमें फ़र्क़ रखती हैं कि गणना कितनी हल्की है।
  • बहुलक: बहुलक वर्ग सबसे ऊँची बारंबारता वाला वर्ग है, और बहुलक = l + [(f₁ − f₀)/(2f₁ − f₀ − f₂)] × h।
  • माध्यिका: n/2 निकालो, माध्यिका वर्ग ढूँढो (पहली संचयी बारंबारता ≥ n/2), फिर माध्यिका = l + [(n/2 − cf)/f] × h, जहाँ cf माध्यिका वर्ग से पहले वाले वर्ग की हो।
  • इन्हें जोड़ने वाला झटपट संबंध: 3 माध्यिका = बहुलक + 2 माध्य
  • बहुलक और माध्यिका सूत्रों के लिए सतत वर्ग अंतराल चाहिए — समावेशी वर्गों को पहले बदलो।

आगे क्या

तुमने उन आँकड़ों को सारांशित करना सीखा जो पहले ही घट चुके हैं — सामान्य अंक, सबसे आम परिवार-आकार, बीच का वज़न। आगे, प्रायिकता में, तुम भविष्य की ओर पलटते हो: यह बताने के बजाय कि क्या हुआ, तुम नापते हो कि कोई बात होने की कितनी संभावना है। एक उछाले गए सिक्के से लेकर ताश की गड्डी तक, तुम अनिश्चितता पर ही 0 और 1 के बीच एक संख्या रख दोगे।