Statistika
Statistika nuda je, má však cenné údaje… se zpívá v jedné písničce. Zase taková nuda to není a opravdu má užitečné nástroje. Například způsob, který hodnotíme, jak jsou jednotlivé sázky u různých her výhodné, či nevýhodné (očekávaná hodnota) není nic jiného než vážený průměr. Statistické nástroje využíváme i v pokeru. Moderní poker, to je rovněž mj. pravděpodobnost a statistika. S námi statistiku pochopíte.
Úvodem jeden hezký a vskutku pozitivní citát: „Existují tři druhy lži: lež, velká lež a statistika.“ Při vyslovení slov matematika, statistika či matematická statistika mnohým vstávají hrůzou vlasy na hlavě. Není třeba mít obavy. Věříme, že vhodné a jednoduché příklady vám dají víc než vyčerpávající teorie. Praktické využití je to, co je třeba.
Co je statistika, původ slova
Slovo statistika má původ v latinském status, což znamená stát. Původní funkcí statistiky byl sběr údajů o státu a jeho obyvatelích, tedy například evidence narození (natalita) a úmrtí (mortalita), majetková a daňová evidence.
Dnes se statistika zabývá sběrem, zpracováním a vyhodnocováním dat. Nachází široké uplatnění v celé řadě lidských činností – ve státní sféře, ve výrobě, lékařství, fyzice či chemii a v neposlední řadě, abychom se drželi tématu, i u hazardních her.
Statistiku můžeme rozdělit do dvou základních oblastí na statistiku popisnou (deskriptivní) a statistiku induktivní (nebo též matematickou statistiku). V prvním případě máme k dispozici všechna data, která pomocí statistiky zpracujeme/charakterizujeme/popíšeme. Například máme údaje o všech obyvatelích ČR. Z nich jsme schopni zjistit, jaký je průměrný věk apod.
Někdy je však nemožné v omezeném čase veškerá data získat nebo by jejich pořízení bylo velmi drahé. Například, pokud bychom chtěli provést rychlý průzkum volebních preferencí pražských občanů, těžko by se nám podařilo oslovit všechny obyvatele (označujeme je jako základní soubor). Bylo by rovněž velmi drahé zaměstnat takový počet lidí, který by to zvládl.
Proto se provede výběr podle nějakého klíče. Z výběru pak usuzujeme na celek (základní soubor). Tento postup se obecně nazývá jako (statistická) indukce. Důležité je, aby byl výběr reprezentativní. Například existují demografické vzorky, které nám řeknou, kolik mužů a žen v tom a tom věku musíme oslovit. Usuzováním z části na celek (indukcí) se zabývá tzv. matematická statistika, která je založena na teorii pravděpodobnosti.
Dalším důvodem, proč se provádí výběr, je prostý fakt, že není například možné otestovat všechny vyrobené automobily, co vydrží po ujetí 100 000 km. Jindy při testování a měření dochází k úplnému fyzickému zničení vzorků atd.
Základní pojmy
Na úvod se sluší ještě uvést základní pojmy, s kterými se můžete ve statistice setkat. Jeden z nich už jsme nakousli. Jde o pojmy základní soubor, statistická jednotka a statistický znak. Základní soubor je skupina všech zkoumaných prvků, která je věcně, prostorově a časově vymezena. Statické jednotky jsou prvky základního souboru, které nesou určitý statistický znak či znaky.
Nejlépe to objasní příklad. Základním souborem jsou například všichni obyvatelé Kroměříže v roce 2013. Statistickou jednotkou je každý jednotlivý občan Kroměříže a statistickým znakem je to, co nás zajímá, například jejich věk, pohlaví, příjem apod. Pro statistiku je tedy klíčovým údajem statistický znak, tj. data, s kterými budeme pracovat, nikoliv statistická jednotka, které je pouze nositelem statistického znaku.
Pokud se dají statistické znaky vyčíslit/kvantifikovat (věk, tělesná výška, měsíční mzda apod.), označujeme je jako kvantitativní. Nedají-li se vyčíslit (pohlaví, národnost apod.) označujeme je jako kvalitativní.
Sledujeme-li pouze jeden znak základního souboru (věk), máme jednorozměrný základní soubor, sledujeme-li více statistických znaků současně, hovoříme o vícerozměrném základním souboru (věk, mzda – dvojrozměrný základní soubor atd.).