Matematická statistika
Z Multimediaexpo.cz
m (1 revizi) |
m (Nahrazení textu „<math>“ textem „<big>\(“) |
||
Řádka 8: | Řádka 8: | ||
'''Nejstarší statistický test''' | '''Nejstarší statistický test''' | ||
- | Nejstarší doložený příklad statistického testu je článek ''An Argument for Divine Providence,''<ref>[http://canoe.ens.fr/~ebrian/s1h-dhsrb/1710-arbuthnot.pdf John Arbuthnot: An Argument for Divine Providence]</ref> který roku 1710 uveřejnil [[John Arbuthnot]]. Z dat londýnských matrik za roky 1629–1710 Arbuthnot zjistil, že v každém z těchto 82 let bylo pokřtěno více chlapců než dívek. Kdyby se rodilo zhruba stejně chlapců jako dívek, bylo by to, jako by v 82 hodech mincí pokaždé padl orel. Pravděpodobnost takového jevu je < | + | Nejstarší doložený příklad statistického testu je článek ''An Argument for Divine Providence,''<ref>[http://canoe.ens.fr/~ebrian/s1h-dhsrb/1710-arbuthnot.pdf John Arbuthnot: An Argument for Divine Providence]</ref> který roku 1710 uveřejnil [[John Arbuthnot]]. Z dat londýnských matrik za roky 1629–1710 Arbuthnot zjistil, že v každém z těchto 82 let bylo pokřtěno více chlapců než dívek. Kdyby se rodilo zhruba stejně chlapců jako dívek, bylo by to, jako by v 82 hodech mincí pokaždé padl orel. Pravděpodobnost takového jevu je <big>\(1 / 2^{82}</math>, což se přibližně rovná 1 / 4 836 000 000 000 000 000 000 000. Arbuthnot tak nepravděpodobnou možnost zavrhl (moderním jazykem řečeno zamítl nulovou hypotézu stejné pravděpodobnosti narození chlapce jako dívky) a prohlásil, že chlapců se prostě rodí více. |
Článek měl ambice více filosofické a morální a objev testu je tak spíše vedlejší produkt – Arbuthnot ze svého výpočtu odvodil, že vzhledem k vyšší úmrtnosti mužů je jím dokázaný jev projevem péče božské Prozřetelnosti o lidstvo. Bůh se tak stará, aby na jednoho muže v dospělosti připadala jedna žena, což zároveň svědčí o nepřirozenosti a škodlivosti polygamie.<ref>{{Citace monografie | Článek měl ambice více filosofické a morální a objev testu je tak spíše vedlejší produkt – Arbuthnot ze svého výpočtu odvodil, že vzhledem k vyšší úmrtnosti mužů je jím dokázaný jev projevem péče božské Prozřetelnosti o lidstvo. Bůh se tak stará, aby na jednoho muže v dospělosti připadala jedna žena, což zároveň svědčí o nepřirozenosti a škodlivosti polygamie.<ref>{{Citace monografie | ||
Řádka 65: | Řádka 65: | ||
| místo = Praha | | místo = Praha | ||
| rok = 2004 | | rok = 2004 | ||
- | | isbn = 80-7178-820-1}} (dále Hendl 2004), s. 37–38.</ref> Počet objektů v této podmnožině se označuje < | + | | isbn = 80-7178-820-1}} (dále Hendl 2004), s. 37–38.</ref> Počet objektů v této podmnožině se označuje <big>\(n</math> a nazývá [[rozsah výběru]]. Postupy získávání výběru zkoumá [[teorie výběru]], která se zabývá mimo jiné tím, zda je výběr [[reprezentativita výběru|reprezentativní]], tedy zda popisné charakteristiky výběru se až na [[náhodná výběrová chyba|náhodnou výběrovou chybu]] shodují s charakteristikami celé základní populace. Základním způsobem dosahování reprezentativnosti přitom jsou různé druhy [[pravděpodobnostní výběr|pravděpodobnostního výběru]], při nichž má každý prvek základní populace známou nenulovou pravděpodobnost, že bude obsažen ve vzorku. Není-li výběr reprezentativní, vzniká [[systematická chyba]], která znemožňuje korektní zobecnění výsledků analýzy na celou základní populaci.<ref>Hendl 2004, s. 39</ref> Často však není pravděpodobnostní výběr možný a jsou k dispozici např. pouze data vzniklá „na základě příležitosti“ (oportunitní), o jejichž reprezentativnosti není jasno – to se týká např. mnoha situací v astronomii nebo historických vědách. V takovém případě je k zobecnění potřeba přistupovat s velkou opatrností. |
Zkoumají-li se [[kausalita|kausální závislosti]], tedy vliv různých zásahů, používá se [[experimentální design]]. Například některé náhodně vybrané prvky populace mohou být podrobeny zásahu, jejíž efekt se zkoumá, zatímco zbylé slouží jako [[kontrolní skupina]]. Rozdíl mezi ošetřenou a kontrolní skupinou pak lze až na výběrovou chybu interpretovat jako vliv zásahu.<ref>Hendl 2004, s. 59–76</ref> Do designu vytváření a sběru dat se může promítnout i čas, takže hovoříme o [[časová řada|časových řadách]] a [[longitudinální studie|longitudinálních studiích]]. | Zkoumají-li se [[kausalita|kausální závislosti]], tedy vliv různých zásahů, používá se [[experimentální design]]. Například některé náhodně vybrané prvky populace mohou být podrobeny zásahu, jejíž efekt se zkoumá, zatímco zbylé slouží jako [[kontrolní skupina]]. Rozdíl mezi ošetřenou a kontrolní skupinou pak lze až na výběrovou chybu interpretovat jako vliv zásahu.<ref>Hendl 2004, s. 59–76</ref> Do designu vytváření a sběru dat se může promítnout i čas, takže hovoříme o [[časová řada|časových řadách]] a [[longitudinální studie|longitudinálních studiích]]. | ||
Řádka 86: | Řádka 86: | ||
Testování může zahrnovat i více proměnných. Příkladem může být test toho, zda se navzájem liší střední hodnota náhodné veličiny ''X'' ve skupinách definovaných diskrétní náhodnou veličinou ''Y'' – takovýto test může být užitečný například v situaci, kdy ''X'' je výnos jabloní a ''Y'' je značka hnojiva, kterým se stromy ošetřují, takže test zjišťuje, zda se účinky jednotlivých hnojiv od sebe statisticky významně liší. V tomto případě lze při testování využít [[Analýza rozptylu|analýzu rozptylu]], jsou-li splněny předpoklady této metody. | Testování může zahrnovat i více proměnných. Příkladem může být test toho, zda se navzájem liší střední hodnota náhodné veličiny ''X'' ve skupinách definovaných diskrétní náhodnou veličinou ''Y'' – takovýto test může být užitečný například v situaci, kdy ''X'' je výnos jabloní a ''Y'' je značka hnojiva, kterým se stromy ošetřují, takže test zjišťuje, zda se účinky jednotlivých hnojiv od sebe statisticky významně liší. V tomto případě lze při testování využít [[Analýza rozptylu|analýzu rozptylu]], jsou-li splněny předpoklady této metody. | ||
- | V klasické teorii testování se vychází z toho, že platí předpokládaná vlastnost zkoumaných náhodných veličin. Tento přepoklad se označuje nulová hypotéza a značí < | + | V klasické teorii testování se vychází z toho, že platí předpokládaná vlastnost zkoumaných náhodných veličin. Tento přepoklad se označuje nulová hypotéza a značí <big>\(H_0</math>. Jelikož data jsou náhodná a náhoda může „pracovat proti nám“, nelze obvykle závěry testování vyslovit s naprostou jistotou. Proto se zároveň se předem stanoví [[hladina spolehlivosti]] <big>\(\alpha</math>, což je míra rizika (pravděpodobnost) toho, že hypotézu <big>\(H_0</math> zamítneme, ačkoliv ve skutečnosti platí (omyl označovaný jako chyba 1. druhu). Hladina spolehlivosti se tradičně stanovuje 0,05 nebo 0,01. Menší hladina spolehlivosti znamená větší jistotu při zamítání nulové hypotézy, ale zároveň také větší riziko chyby 2. druhu, jež spočívá v akceptování nulové hypotézy, ačkoli tato hypotéza ve skutečnosti neplatí. |
- | Dále se z dat vypočítá takzvané testovací kritérium, jehož [[rozdělení pravděpodobnosti|rozdělení]] podmíněné předpokládanou platností nulové hypotézy je známo. Vyjde-li hodnota testovacího kritéria typická pro toto známé rozdělení, nulovou hypotézu akceptujeme či přesněji řečeno nezamítáme na základě známých dat. Naopak vyjde-li hodnota extrémní, tedy v oblasti hodnot, do níž realizace přepokládaného rozdělení padají s pravděpodobností menší než < | + | Dále se z dat vypočítá takzvané testovací kritérium, jehož [[rozdělení pravděpodobnosti|rozdělení]] podmíněné předpokládanou platností nulové hypotézy je známo. Vyjde-li hodnota testovacího kritéria typická pro toto známé rozdělení, nulovou hypotézu akceptujeme či přesněji řečeno nezamítáme na základě známých dat. Naopak vyjde-li hodnota extrémní, tedy v oblasti hodnot, do níž realizace přepokládaného rozdělení padají s pravděpodobností menší než <big>\(\alpha</math> (tj. hodnota testovacího kritéria překročí [[kritická mez|kritickou mez]]), usoudíme, že testovací kritérium nejspíše nepochází z předpokládaného rozdělení a nulovou hypotézu zamítneme ve prospěch opačné tzv. alternativní hypotézy, označované <big>\(H_1</math>. |
Zatímco dříve bylo třeba hledat kritické meze v tabulkách rozdělení příslušného testovacího kritéria, dnes statistické softwary vypisují takzvanou [[hodnota významnosti|hodnotu významnosti]] (též zvanou signifikance nebo p-hodnota). Tato hodnota udává pravděpodobnost, že při platnosti nulové hypotézy vyjde testová statistika rovna naměřené nebo ještě extrémnější. Test se vyhodnocuje takto: | Zatímco dříve bylo třeba hledat kritické meze v tabulkách rozdělení příslušného testovacího kritéria, dnes statistické softwary vypisují takzvanou [[hodnota významnosti|hodnotu významnosti]] (též zvanou signifikance nebo p-hodnota). Tato hodnota udává pravděpodobnost, že při platnosti nulové hypotézy vyjde testová statistika rovna naměřené nebo ještě extrémnější. Test se vyhodnocuje takto: | ||
- | * Je-li hodnota významnosti menší než hladina spolehlivosti (< | + | * Je-li hodnota významnosti menší než hladina spolehlivosti (<big>\(p \,< \alpha</math>), pak zamítneme nulovou hypotézu a přijmeme alternativní hypotézu. Riskujeme chybu prvního druhu s pravděpodobností nanejvýš <big>\(\alpha</math>. |
- | * Je-li hodnota významnosti větší nebo rovna než hladina spolehlivosti (< | + | * Je-li hodnota významnosti větší nebo rovna než hladina spolehlivosti (<big>\(p \ge \alpha</math>), pak nulovou hypotézu nezamítneme. Riskujeme chybu druhého druhu s pravděpodobností označovanou <big>\(\beta</math>.<ref>Hendl 2004, s. 175–179</ref> |
Bayesovský přístup ke statistice podobné úlohy pojímá jako problém stanovení distribuce zkoumané vlastnosti, podmíněné daty a naší výchozí informací o zkoumaném systému.<ref>Gelman 2004, s. 4–5</ref> V příkladech uvedených na počátku odstavce by to byla distribuce střední hodnoty rozdělení průměrů součástek resp. distribuce středních hodnot výnosů ve skupinách podle použitého hnojiva. | Bayesovský přístup ke statistice podobné úlohy pojímá jako problém stanovení distribuce zkoumané vlastnosti, podmíněné daty a naší výchozí informací o zkoumaném systému.<ref>Gelman 2004, s. 4–5</ref> V příkladech uvedených na počátku odstavce by to byla distribuce střední hodnoty rozdělení průměrů součástek resp. distribuce středních hodnot výnosů ve skupinách podle použitého hnojiva. |
Verze z 14. 8. 2022, 14:49
Matematická statistika je vědecká disciplína na pomezí popisné statistiky a aplikované matematiky. Zabývá se teoretickým rozborem a návrhem metod získávání a analýzy empirických dat obsahujících prvek nahodilosti, tedy teorií plánování experimentů, výběrů, statistických odhadů, testování hypotéz a statistických modelů. S využitím aparátu teorie pravděpodobnosti se snaží odhadnout vlastnosti rozdělení pozorovaných dat, chápaných jako realizace náhodných veličin, a metodologicky plánovat sběr dat tak, aby toto odhadování bylo efektivní. Jestliže tedy teorie pravděpodobnosti na základě znalosti chování určité náhodné veličiny určuje pravděpodobnost určitého výsledku (náhodného pokusu), matematická statistika naopak na základě dat hledá vlastnosti náhodné veličiny. Tento postup se označuje jako statistická inference, statistická indukce nebo statistické usuzování. Základními typy statistické inference jsou bodový odhad, intervalový odhad a testování hypotéz. Jako statistické modelování se označuje tvorba a testování komplexních hypotéz o datech, zahrnující obvykle určování více parametrů či složitou strukturu dat.
Matematická statistika se vyvíjela paralelně s teorií pravděpodobnosti. První netriviální postupy tohoto oboru byly známy již v 18. století. Na počátku 19. století Carl Friedrich Gauss a Adrien-Marie Legendre vynalezli metodu nejmenších čtverců a na konci tohoto století a na počátku 20. století se matematické metody statistiky začaly rychle rozvíjet v souvislosti s eugenickým a biologickým výzkumem. Vlastním tvůrcem matematické statistiky jako samostatné disciplíny v dnešním pojetí byl v první polovině 20. století britský biolog Ronald Fisher. Od té doby se matematická statistika bouřlivě rozvíjí a její metody se používají ve všech empirických vědách při získávání a interpretaci dat.
Obsah[skrýt] |