Multimediaexpo.cz je již 18 let na českém internetu !!
V tiskové zprávě k 18. narozeninám brzy najdete nové a zásadní informace.
Giniho koeficient
Z Multimediaexpo.cz
Giniho koeficient je číselná charakteristika diverzifikace. Má veliké uplatnění v ekonomii, kde se jím poměřuje ekvivalence rozložení bohatství a důchodů v jednotlivých územních celcích, nejčastěji státech. Dále se často používá jako míra diverzifikační schopnosti skóringového modelu. Udává se od 0 do 1.
Obsah |
Definice
Giniho koeficient většinou definujeme jako poměr plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce (A) ku celkové ploše pod diagonálou (A+B), tedy
\(GC=\frac{A}{A+B}.\)
Protože obsah plochy pod diagonálou je polovina jednotkového čtverce, můžeme definici přepsat jako GC=2A nebo také GC=1-2B. Odtud použitím posledního jmenovaného výrazu dostáváme matematický vztah
\(GC= 1 - 2\int_S F^G(s) dF^B(s),\)
kde \(F^G(s)\) a \(F^B(s)\) jsou distribuční funkce dobrých a špatných klientů (viz skóringový model). Jiné vyjádření získáme, vyjdeme-li ze vztahu GC=2A. Potom
\(GC= 2\int_S \big(F^B(s)-F^G(s)\big) dF^B(s).\)
Interpretace
Giniho koeficient je tedy dvojnásobek plochy mezi Lorenzovou křivkou a diagonálou jednotkového čtverce, neboli ekvivalentně poměr této plochy a celkové plochy pod diagonálou. Hodnota Giniho koeficientu proto leží v intervalu [0,1], kde hodnota 0 značí perfektní (ideální) diverzifikační schopnost, hodnota 1 značí nulovou diverzifikační schopnost a záporné hodnoty značí opačnou klasifikaci skóringové funkce.
Somersovo d
Pro odhad Giniho koeficientu lze v praxi použít více postupů. Jedním z často používaných je odhad pomocí tzv. Somersovy d statistiky.
Označíme-li \(s_j\) skóre j-tého klienta, můžeme definovat charakteristiky a, b a c následovně:
- a je počet všech dvojic klientů (i,j), i>j takových, že rozdíly \(s_i-s_j\) a \(y_i-y_j\) jsou nenulové a mají stejné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen větším skóre než špatný klient);
- b je počet všech dvojic klientů (i,j), i>j takových, že rozdíly \(s_i-s_j\) a \(y_i-y_j\) jsou nenulové a mají opačné znaménko (tedy takových dvojic, kde dobrý klient byl ohodnocen menším skóre než špatný klient);
- c je počet všech dvojic klientů (i,j), i>j takových, že \(s_i=s_j\) a \(y_i\neq y_j\) (tedy takových dvojic, kde dobrý klient byl ohodnocen stejným skóre jako špatný klient).
Potom Somersovu d statistiku spočítáme jako
\(d = \frac{a-b}{a+b+c}.\)
Související články
Externí odkazy
Náklady na energie a provoz naší encyklopedie prudce vzrostly. Potřebujeme vaši podporu... Kolik ?? To je na Vás. Náš FIO účet — 2500575897 / 2010 |
---|
Informace o článku.
Článek je převzat z Wikipedie, otevřené encyklopedie, do které přispívají dobrovolníci z celého světa. |