Modus a medián
Modus a medián patří spolu s průměrem mezi tzv. charakteristiky střední hodnoty (určitého souboru dat). Modus či medián můžeme využít tam, kde selhává, resp. kde není vhodné či příliš vypovídající použít průměr. Není třeba se lekat jazyku statistiky, vše si opět vysvětlíme na jednoduchých příkladech.
Představíme-li si vodorovnou osu a ní „rozseta“ všechna data (či hodnoty statistického znaku), zajímá nás určitá střední poloha, která by nejlépe daný soubor dat charakterizovala jednou jedinou (střední) hodnotou.
Pouze pro úplnost dodejme, že vedle toho nás také zajímá, jak jsou tyto hodnoty okolo středu rozptýleny (jde o tzv. ukazatele variability či měnlivosti).
Řekli jsme si, že průměr má velkou výhodu v tom, že jistým způsobem bere v úvahu všechny hodnoty – sečte je a vydělí jejich počtem – tedy v případě asi nejběžnějšího aritmetického průměru, neboť mimo něj existují i jiné průměry.
Průměr však může narazit na určitá omezení, kdy jeho použití by nemělo dobrou vypovídací hodnotu. Pak mohou na scénu nastoupit modus či medián. Například máme-li malou obec se 100 obyvateli, kde 99 lidí vydělává 15 000 Kč hrubého a jeden člověk 1 000 000 Kč, pak průměrná měsíční mzda v této obci vychází na 24 850 Kč.
Co se týká matematického výpočtu, mohli bychom se s tímto údajem spokojit, avšak cítíme, že toto číslo nepodává zrovna nejvěrnější představu o hrubé mzdě v dané obci. To je důvod, proč je vhodné se poohlédnout po jiných charakteristikách střední hodnoty (polohy), které by lépe vypovídaly o dané situaci. To je úkolem (dobrého) statistika, aby pracoval s daty a ukazateli tak, aby co nejvěrněji vypovídaly o stavu věcí. Co jsou tedy modus a medián (alternativy k průměru) a jak je určíme?
Modus
Modus, značí se nebo Mod(x)
, je taková hodnota statistického znaku, která má největší třídní četnost, tzn. hodnota, která se nejčastěji vyskytuje. Takových hodnot může být i několik (= několik různých hodnot může mít stejnou četnost). Pokud je jen jeden modus, mluvíme o typické hodnotě statistického znaku.
Pokud bychom použili výše uvedený příklad se mzdou v malé obci, situace by byla jednoduchá a modus jednoznačný, neboť máme pouze dvě různé hodnoty mezd: 15 000 Kč a 1 000 000 Kč. Modus je nejčetnější hodnota čili 15 000 Kč (vyskytla se 99krát).
Medián
Medián, značený nebo Med(x)
, je hodnota, která se nachází přesně uprostřed všech hodnot seřazených do neklesající posloupnosti. Řečeno jinak, všechny hodnoty x seřadíme podle velikosti a vybereme hodnotu, která se nachází uprostřed.
Medián tedy rozděluje všechny hodnoty na dvě poloviny. Co to prakticky znamená? Pobíráte-li například mediánovou mzdu, pak 50 % lidí má stejnou nebo vyšší mzdu a 50 % lidí má stejnou nebo nižší mzdu než Vy.
Vzorec pro určení mediánu se liší podle toho, zdali je počet všech hodnot n lichý, nebo sudý.
, je-li n liché číslo,
, je-li n sudé číslo.
Výrazy se označují jako pořádkové statistiky – od slova pořadí. Například x(1)
je první hodnota v pořadí, tj. buď nejnižší hodnota, nebo hodnota, která je nižší než nebo rovna další hodnotě v pořadí.
Ve výše uvedeném jednoduchém příkladu by hodnota mediánu vyšla také jednoznačně 15 000 Kč. Podívejme se na jiný, trochu zajímavější příklad, který demonstruje postup výpočtu a podává srovnání třech ukazatelů polohy – průměru, modu i mediánu.
Příklad
Vezměme si jako příklad opět vděčné mzdy. Často je slyšet ve sdělovacích prostředcích hodnota průměrné mzdy s dodatkem, že mediánová mzda je nižší – jinými slovy, že průměrné mzdy dosahuje méně než polovina obyvatel. Je to právě způsobeno extrémně vysokými výdělky úzké části obyvatelstva, které nadhodnotí výsledný průměr.
Slovem extrémní rozumíme velmi vysokou hodnotu, nikoliv morální soud. Ve statistice se také hovoří o hodnotě odlehlé a existují statistické testy, které určí, zdali hodnota do výběru ještě patří, nebo zdali již jde o hodnotu příliš velkou či chybu, kterou je třeba vyloučit, aby ostatní (poměrně konzistentní) data nebyla negativně ovlivněna či zkreslena.
Příklad se mzdou bereme jako svým způsobem typický. Nijak netrpíme závistí, spíše se držíme hesla „Přej a bude Ti přáno!“ Závist se dá totiž využít i pozitivně: když vidím, kolik je někdo schopen si vydělat (nikoliv nakrást), přemýšlím, co mohu učinit pro to, abych si také více vydělal. Ale dost už socio-ekonomických úvah a vraťme se k příkladu.
Zadání:
Mějme malou firmu o deseti zaměstnancích (n = 10) s následujícími výdělky:
12 000, 16 000, 15 000, 13 000, 12 000, 24 000, 15 000, 16 000, 16 000, 50 000.
Úkol zní: najděte jeden údaj – tj. charakteristickou střední hodnotu – která by nejlépe vypovídala o hrubé měsíční mzdě v uvedené firmě.
Řešení:
Spočítáme aritmetický průměr , určíme modus a medián .
Průměr
Počet hodnot n = 10, součet všech hodnot je 189 000 Kč.
= 189 000 Kč ÷ 10 = 18 900 Kč
.
Průměrná mzda je 18 900 Kč.
Modus
Modus je hodnota s největší třídní četností, tj. výše mzdy, která se vyskytuje nejčastěji, a to je hodnota 16 000 Kč, která je zastoupena 3krát.
= 16 000 Kč
.
Výše mzdy, kterou pobírá nejvíce zaměstnanců, je 16 000 Kč.
Medián
Abychom mohli určit/spočítat medián, jednotlivé mzdy nejprve seřadíme podle velikosti:
12 000, 12 000, 13 000, 15 000, 15 000, 16 000, 16 000, 16 000, 24 000, 50 000.
Počet všech hodnot je sudý (n = 10), proto použijeme vzorec:
Jelikož x(10/2) = x(5)
a x(10/2 + 1) = x(6)
, pro výpočet mediánu použijeme pátou a šestou hodnotu v pořadí. Hodnoty jsou seřazeny do neklesající posloupnosti, tj. podle velikosti. Pátá hodnota x(5) je 15 000 Kč a šestá hodnota v pořadí x(6) je 16 000 Kč (hodnoty jsou ve výše uvedeném uspořádaném seznamu zvýrazněny). Hodnota mediánu je potom:
= (15 000 Kč + 16 000 Kč) ÷ 2 = 15 500 Kč
.
Hodnota, která se nachází uprostřed všech podle velikosti seřazených výdělků, je 15 500 Kč.
Závěr:
Pátrání po jedné jediné střední hodnotě, která by charakterizovala výši mzdy v dané firmě, ukázala, že běžně používaný aritmetický průměr není zrovna ideální, neboť hodnota průměrné mzdy je částečně zkreslena jedním výrazně vyšším výdělkem (řekněme, že 50 000 Kč je mzda ředitele či vlastníka firmy).
Mnohem vhodnější je proto sáhnout po jiných ukazatelích. Modus (nejčetnější hodnota) a/nebo medián (hodnota uprostřed uspořádaného souboru) v tomto konkrétním příkladu podávají mnohem věrnější a přibližně stejný výsledek. Můžeme říci, že v dané firmě se typická mzda pohybuje na úrovni 15 500 Kč až 16 000 Kč.