V sobotu 2. listopadu proběhla mohutná oslava naší plnoletosti !!
Multimediaexpo.cz je již 18 let na českém internetu !!

Kvantil

Z Multimediaexpo.cz

(Rozdíly mezi verzemi)
m (1 revizi)
m (Nahrazení textu „</math>“ textem „\)</big>“)
 
(Nejsou zobrazeny 2 mezilehlé verze.)
Řádka 1: Řádka 1:
-
{{Wikipedia-cs|Kvantil|700}}
+
[[Soubor:Quantile.png|thumb|230px|Distribuční funkce s vyznačenými kvantily ''Q''<sub>0,2</sub>, ''Q''<sub>0,4</sub>, ''Q''<sub>0,6</sub>, ''Q''<sub>0,8</sub>]]
-
 
+
'''Kvantily''' (z [[latina|lat.]] ''quantilis'', jak malý/velký?) jsou ve [[statistika|statistice]] čísla (hodnoty), která dělí soubor seřazených (například naměřených) hodnot na několik zhruba stejně velkých částí. Kvantil je tedy [[míra polohy]] [[rozdělení pravděpodobnosti]] [[náhodná veličina|náhodné veličiny]]. Popisují body, ve kterých [[distribuční funkce]] [[náhodná proměnná|náhodné proměnné]] prochází danou hodnotou.
 +
 
 +
== Definice ==
 +
Kvantily tvoří vlastně [[Inverzní zobrazení|inverzní funkci]] k funkci distribuční. V případě [[spojité rozdělení|spojitého rozdělení]] s distribuční funkcí ''F''(''x'') je kvantil ''Q<sub>p</sub>'' takové číslo, pro které platí
 +
:''P''(''X'' ≤ ''Q<sub>p</sub>'') = ''p'', tedy ''F''(''Q<sub>p</sub>'') = ''p''.
 +
Pokud je distribuční funkce [[rostoucí funkce|rostoucí]] (tedy i [[prostá funkce|prostá]]), lze kvantil psát přímo jako inverzní funkci:
 +
:''Q<sub>p</sub>'' = ''F''<sup>−1</sup>(''p'').
 +
 
 +
Distribuční funkce však nemusí být prostá (byť je vždy [[neklesající funkce|neklesající]]), takže tuto definici nelze použít vždy. U [[diskrétní rozdělení|diskrétních rozdělení]] pak ani vždy nemusí existovat bod, kde by distribuční funkce dosahovala přesně požadované hodnoty. Obecněji se proto kvantil ''Q<sub>p</sub>'' definuje jako takové číslo, pro které platí, že
 +
:''P''(''X'' ≤ ''Q<sub>p</sub>'') ≥ ''p'' a zároveň ''P''(''X'' < ''Q<sub>p</sub>'') ≤ ''p'',
 +
distribuční funkcí to lze vyjádřit jako
 +
:''F(''Q<sub>p</sub>''+) = ''F(''Q<sub>p</sub>'') ≥ ''p'' a zároveň ''F(''Q<sub>p</sub>''−) ≤ ''p''.
 +
 
 +
Ani tato obecná definice však přesně neurčuje kvantil v případě, že distribuční funkce není prostá. V takovém případě může jedné hodnotě ''p'' odpovídat několik čísel ''Q<sub>p</sub>'', která tuto definici splňují. To se zpravidla nepovažuje za problém, někdy se definice doplňuje o způsob výběru jednoznačné hodnoty, např. největší (příp. nejmenší) z těchto čísel, jejich průměr apod., jedná se však jen o konvence bez nějakého hlubšího matematického významu.
 +
 
 +
=== Speciální označení kvantilů ===
 +
Kvantily pro některé význačné hodnoty jsou označovány zvláštními jmény a pro nejdůležitější rozdělení jsou hodnoty základních kvantilů uváděny v tabulkách.
 +
 
 +
==== Medián ====
 +
{{viz též|Medián}}
 +
Kvantil rozdělující statistický soubor na dvě stejně početné množiny se nazývá [[medián]], tzn. jedná se o kvantil <big>\(Q_{0,5}\)</big>.
 +
 
 +
==== Kvartil ====
 +
Tři kvartily rozdělují statistický soubor na čtvrtiny. 25 % prvků má hodnoty menší než ''dolní kvartil'' <big>\(Q_{0,25}\)</big> a 75 % prvků hodnoty menší než ''horní kvartil'' <big>\(Q_{0,75}\)</big>; někdy se označují <big>\(Q_1\)</big> a <big>\(Q_3\)</big>.
 +
 
 +
==== Kvintil ====
 +
Čtyři kvintily dělí statistický soubor na pět stejných dílů. 20 % prvků souboru má hodnoty menší (nebo rovné) hodnotě prvního kvintilu, 80 % hodnoty větší (nebo rovné).
 +
 
 +
==== Decil ====
 +
Decil dělí statistický soubor na desetiny. Jako <big>\(k\)</big>tý decil označujeme <big>\(Q_{k/10}\)</big>.
 +
 
 +
==== Percentil ====
 +
Percentil dělí statistický soubor na setiny. Jako <big>\(k\)</big>-tý percentil označujeme <big>\(Q_{k/100}\)</big>.
 +
 
 +
=== Charakteristky variability ===
 +
Hodnoty kvantilů představují [[míra polohy|charakteristiky polohy]]. Znalosti kvantilů lze však použít i k určení [[Charakteristika náhodné veličiny|charakteristiky variability]].
 +
 
 +
==== Mezikvartilové rozpětí ====
 +
Pomocí horního a dolního kvartilu lze zavést mezikvartilové rozpětí, které definujeme jako hodnotu <big>\(Q_{0,75}-Q_{0,25}\)</big>.
 +
 
 +
==== Mezidecilové rozpětí ====
 +
Pomocí decilů lze zavést mezidecilové rozpětí, které je definováno jako <big>\(Q_{0,9}-Q_{0,1}\)</big>.
 +
 
 +
==== Mezipercentilové rozpětí ====
 +
Pomocí percentilů lze zavést mezipercentilové rozpětí, které je definováno jako <big>\(Q_{0,99}-Q_{0,01}\)</big>.
 +
 
 +
== Použití ==
 +
Kvantily lze používat např. pro vyhodnocování přijímacích testů: bodové výsledky všech zájemců tvoří statistický soubor, zatímco příslušné kvantily označují, jaká část zájemců dosáhla daného výsledku. Pokud například kvantil 90 % má hodnotu 150&nbsp;bodů a některý student v testu získal právě 150&nbsp;bodů, ví, že má lepší hodnocení než 90 % všech studentů (je tedy mezi 10 % nejlepších a pokud má být přijato např. 15 % zájemců, měl by se kvalifikovat).
 +
 
 +
== Příklad ==
 +
U [[normální rozdělení|normálního rozdělení]] s nulovou [[střední hodnota|střední hodnotou]] a jednotkovou [[směrodatná odchylka|směrodatnou odchylkou]] jsou některé kvantily:
 +
{| class="wikitable"
 +
|+ Kvantily standardního normálního rozdělení
 +
| '''''p''''' || 0,5 || 0,9 || 0,95 || 0,975 || 0,99 || 0,995
 +
|-
 +
| '''''Q<sub>p</sub>''''' || 0,0 || 1,2816 || 1,6449 || 1,9600 || 2,3263 || 2,5758
 +
|}
 +
Zde je například vidět, že necelý trojnásobek směrodatné odchylky u tohoto rozdělení pokrývá 99 % hodnot.
 +
 
 +
== Související články ==
 +
* [[Charakteristika náhodné veličiny]]
 +
 
 +
 
 +
{{Článek z Wikipedie}}  
[[Kategorie:Statistika]]
[[Kategorie:Statistika]]

Aktuální verze z 14. 8. 2022, 14:52

Distribuční funkce s vyznačenými kvantily Q0,2, Q0,4, Q0,6, Q0,8

Kvantily (z lat. quantilis, jak malý/velký?) jsou ve statistice čísla (hodnoty), která dělí soubor seřazených (například naměřených) hodnot na několik zhruba stejně velkých částí. Kvantil je tedy míra polohy rozdělení pravděpodobnosti náhodné veličiny. Popisují body, ve kterých distribuční funkce náhodné proměnné prochází danou hodnotou.

Obsah

Definice

Kvantily tvoří vlastně inverzní funkci k funkci distribuční. V případě spojitého rozdělení s distribuční funkcí F(x) je kvantil Qp takové číslo, pro které platí

P(XQp) = p, tedy F(Qp) = p.

Pokud je distribuční funkce rostoucí (tedy i prostá), lze kvantil psát přímo jako inverzní funkci:

Qp = F−1(p).

Distribuční funkce však nemusí být prostá (byť je vždy neklesající), takže tuto definici nelze použít vždy. U diskrétních rozdělení pak ani vždy nemusí existovat bod, kde by distribuční funkce dosahovala přesně požadované hodnoty. Obecněji se proto kvantil Qp definuje jako takové číslo, pro které platí, že

P(XQp) ≥ p a zároveň P(X < Qp) ≤ p,

distribuční funkcí to lze vyjádřit jako

F(Qp+) = F(Qp) ≥ p a zároveň F(Qp−) ≤ p.

Ani tato obecná definice však přesně neurčuje kvantil v případě, že distribuční funkce není prostá. V takovém případě může jedné hodnotě p odpovídat několik čísel Qp, která tuto definici splňují. To se zpravidla nepovažuje za problém, někdy se definice doplňuje o způsob výběru jednoznačné hodnoty, např. největší (příp. nejmenší) z těchto čísel, jejich průměr apod., jedná se však jen o konvence bez nějakého hlubšího matematického významu.

Speciální označení kvantilů

Kvantily pro některé význačné hodnoty jsou označovány zvláštními jmény a pro nejdůležitější rozdělení jsou hodnoty základních kvantilů uváděny v tabulkách.

Medián

Kvantil rozdělující statistický soubor na dvě stejně početné množiny se nazývá medián, tzn. jedná se o kvantil \(Q_{0,5}\).

Kvartil

Tři kvartily rozdělují statistický soubor na čtvrtiny. 25 % prvků má hodnoty menší než dolní kvartil \(Q_{0,25}\) a 75 % prvků hodnoty menší než horní kvartil \(Q_{0,75}\); někdy se označují \(Q_1\) a \(Q_3\).

Kvintil

Čtyři kvintily dělí statistický soubor na pět stejných dílů. 20 % prvků souboru má hodnoty menší (nebo rovné) hodnotě prvního kvintilu, 80 % hodnoty větší (nebo rovné).

Decil

Decil dělí statistický soubor na desetiny. Jako \(k\)tý decil označujeme \(Q_{k/10}\).

Percentil

Percentil dělí statistický soubor na setiny. Jako \(k\)-tý percentil označujeme \(Q_{k/100}\).

Charakteristky variability

Hodnoty kvantilů představují charakteristiky polohy. Znalosti kvantilů lze však použít i k určení charakteristiky variability.

Mezikvartilové rozpětí

Pomocí horního a dolního kvartilu lze zavést mezikvartilové rozpětí, které definujeme jako hodnotu \(Q_{0,75}-Q_{0,25}\).

Mezidecilové rozpětí

Pomocí decilů lze zavést mezidecilové rozpětí, které je definováno jako \(Q_{0,9}-Q_{0,1}\).

Mezipercentilové rozpětí

Pomocí percentilů lze zavést mezipercentilové rozpětí, které je definováno jako \(Q_{0,99}-Q_{0,01}\).

Použití

Kvantily lze používat např. pro vyhodnocování přijímacích testů: bodové výsledky všech zájemců tvoří statistický soubor, zatímco příslušné kvantily označují, jaká část zájemců dosáhla daného výsledku. Pokud například kvantil 90 % má hodnotu 150 bodů a některý student v testu získal právě 150 bodů, ví, že má lepší hodnocení než 90 % všech studentů (je tedy mezi 10 % nejlepších a pokud má být přijato např. 15 % zájemců, měl by se kvalifikovat).

Příklad

U normálního rozdělení s nulovou střední hodnotou a jednotkovou směrodatnou odchylkou jsou některé kvantily:

Kvantily standardního normálního rozdělení
p 0,5 0,9 0,95 0,975 0,99 0,995
Qp 0,0 1,2816 1,6449 1,9600 2,3263 2,5758

Zde je například vidět, že necelý trojnásobek směrodatné odchylky u tohoto rozdělení pokrývá 99 % hodnot.

Související články