Četnost absolutní a relativní
Četnost ve statistice jednoduše ukazuje, kolikrát se určitá hodnota statistického znaku vyskytla. Četnosti mohou být buď absolutní, nebo relativní. Jaký mají vztah a význam?
Celkový počet všech hodnot tradičně označíme písmenem n. Konkrétní hodnoty statistického znaku označíme xi a jejich absolutní četnosti mi, přitom i = 1, 2, …, k, kde k je počet různých hodnot statistického znaku. Vše obvykle pro přehlednost zapisujeme do tabulky četností, která má následující obecný tvar.
znak xi | x1 | x2 | … | xk |
---|---|---|---|---|
četnost mi | m1 | m2 | … | mk |
Samozřejmě platí, že součet absolutních četností m1 + m2 + … + mk = n. Někdy nás však také zajímá, jaké podíly mají jednotlivé hodnoty na celkovém počtu hodnot. Těmto podílům ti = mi / n říkáme relativní četnosti, které mají charakter pravděpodobností. Platí, že součet relativních četností je roven 1. Někdy se relativní četnosti ještě násobí stem, abychom získali údaje v procentech, v tom případě musí být součet relativních četností roven 100 %.
Graficky lze četnosti vyjádřit pomocí histogramu nebo polygonu četností, které podávají rychlou vizuální informaci o možném rozdělení pravděpodobností.
Příklad
Příklad si můžeme vypůjčit ze stránky věnované průměru, kde 20 studentů psalo písemku ze statistiky s výsledky uvedenými v tabulce.
Jedničku (tj. jednu z pěti možných hodnot) dostali 3 studenti (absolutní četnost) z dvaceti. Podíl jedničkářů na celkových výsledcích testu (relativní četnost) je 3/20 = 0,15 neboli 15 % atd. Součet absolutních četností musí dát celkový počet 20 studentů a součet relativních četností (podílů) musí dát 1 či 100 %.
Známka (hodnota statistického znaku) xi | Počet známek (absolutní četnost) mi | Podíl počtu známek na celku (relativní četnost) ti = mi / n |
---|---|---|
1 | 3 | 3/20 = 0,15 (15 %) |
2 | 6 | 6/20 = 0,30 (30 %) |
3 | 7 | 7/20 = 0,35 (35 %) |
4 | 2 | 2/20 = 0,10 (10 %) |
5 | 2 | 2/20 = 0,10 (10 %) |
Celkem (n) | 20 | 1 (100 %) |
Relativní četnost jako odhad pravděpodobnosti
Relativní četnosti – jako podíly, resp. zastoupení určité hodnoty na celku – můžeme použít jako odhady pravděpodobnosti. Máme-li dostatečně velký počet měření, můžeme určit statistickou pravděpodobnost.
Některé pravděpodobnosti lze vypočítat snadno. Například pravděpodobnost vrhnutí panny či orla při hodu mincí je 1/2 = 0,5 (tj. podle klasické definice jako počet příznivých možností vůči celkovému počtu možností).
U jiných věcí v životě to tak snadné či jednoznačné není. Například létání letadlem vzbuzuje v mnoha lidech strach, přitom statisticky jde o nejbezpečnější formu dopravy. Jak se dá vůbec změřit pravděpodobnost, že havárii (či dopravu letadlem) nepřežijete? Asi ne jinak než pozorováním a vztažením počtu úmrtí na celkový počet letů.
Statistiky jsou v tomto oboru dostupné a vzorek dat je dostatečně velký. Například podle Pražského letiště připadá jedna smrtelná nehoda (absolutní četnost) na dva miliony letů. Pravděpodobnost (relativní četnost), že nepřežijete cestu letadlem, je 1 ÷ 2 000 000 = 0,0000005 = 0,00005 %
, tedy pouhých 5 statisícin procenta. Pro ty, kteří mají fobii z létání (strach z nedostatku vlastní kontroly a pocit, že když se tam nahoře něco stane…) to asi nebude dostatečné, což chápeme, ale jde pouze o příklad.
Relativní četnosti jsme rovněž využili třeba u výpočtu variance u pokerového turnaje pro 9 hráčů. Pokud jsme již odehráli dostatečně velký počet turnajů, můžeme se podívat do statistik a zjistit, kolikrát jsme obsadili 1. až 9. místo a podíly na celkovém počtu turnajů můžeme považovat za pravděpodobnosti těchto umístění i v budoucích turnajích.