Paretovo rozdělení

Počet obyvatel německých měst (žlutý histogram) lze dobře popsat Paretovým rozdělením (modrá čára).

Paretovo rozdělení, pojmenované podle italského ekonoma Vilfreda Pareta (1848–1923), je rodina spojitých rozdělení pravděpodobnosti na nekonečném intervalu [ x min , ) {\displaystyle [x_{\min },\infty )} , charakterizovaných dvěma kladnými parametry: exponentem k {\displaystyle k} a minimální hodnotou x min {\displaystyle x_{\min }} . Paretovo rozdělení se charakteristicky vyskytuje tam, kde náhodné kladné hodnoty probíhají několik řádů velikosti a jsou výsledkem vlivu mnoha nezávislých faktorů.

Distribuce byla Paretem původně použita k popisu rozdělení příjmů v Itálii. Ve druhém svazku Paretova Kursu politické ekonomie (Cours d'économie politique, 1897) se říká, že počet lidí ve státě, kteří mají příjem vyšší než jistou hodnotu x {\displaystyle x} , je přibližně úměrný 1 / x k {\displaystyle 1/x^{k}} , kde parametr k {\displaystyle k} je podle Pareta ve všech zemích někde kolem 1,5. Tato specifikace kumulativní distribuční funkce definuje rozdělení pravděpodobnosti pojmenované po Paretovi. Také mnoho dalších empirických distribucí lze dobře popsat jako Paretova rozdělení, například velikosti měst nebo výše škod v pojistné matematice.

Definice

Paretova hustota pravděpodobnosti f(x) s (x min = 1).
Kumulativní distribuční funkce F(x)

Spojitá náhodná proměnná X {\displaystyle X} má Paretovo rozdělení Par ( k , x min ) {\displaystyle \operatorname {Par} (k,x_{\min })} s parametry k > 0 {\displaystyle k>0} a x min > 0 {\displaystyle x_{\min }>0} pokud má hustotu pravděpodobnosti

f ( x ) = { k x min k x k + 1 x x min 0 x < x min {\displaystyle f(x)={\begin{cases}\displaystyle {\frac {kx_{\min }^{k}}{x^{k+1}}}&x\geq x_{\min }\\0&x<x_{\min }\end{cases}}}

Číslo x min {\displaystyle x_{\min }} je minimální hodnota a zároveň modus (nejčastější hodnota) distribuce, tj. místo maximální hustoty pravděpodobnosti. S rostoucí vzdáleností mezi x {\displaystyle x} a x min {\displaystyle x_{\min }} klesá pravděpodobnost, že X {\displaystyle X} nabývá hodnotu x {\displaystyle x} . Vzdálenost mezi x {\displaystyle x} a x min {\displaystyle x_{\min }} se zde přitom chápe jako poměr mezi těmito dvěma veličinami.

Parametr k {\displaystyle k} je exponent určující, jak rychle zmíněná pravděpodobnost klesá v závislosti na velikosti hodnoty x {\displaystyle x} . S větším k {\displaystyle k} křivka je výrazně strmější, tj. náhodná proměnná X {\displaystyle X} nabývá velké hodnoty s menší pravděpodobností, a naopak malé hodnoty k {\displaystyle k} vedou k plochým (platykurtickým) rozdělením s těžkým pravým ohonem.

Pravděpodobnost, že náhodná proměnná X {\displaystyle X} nabude hodnotu menší nebo rovnou x {\displaystyle x} , se stanoví z distribuční funkce F {\displaystyle F} . Pro všechna x x min {\displaystyle x\geq x_{\min }} tak platí:

P { X x } = F ( x ) = x min x f ( t ) d t = 1 ( x min x ) k {\displaystyle P\left\{X\leq x\right\}=F(x)=\int _{x_{\min }}^{x}f(t)\,dt=1-\left({\frac {x_{\min }}{x}}\right)^{k}} .

Z toho plyne pravděpodobnost, že náhodná proměnná X {\displaystyle X} nabude hodnoty větší než x x min {\displaystyle x\geq x_{\min }} :

P { X > x } = 1 P { X x } = ( x min x ) k {\displaystyle {\rm {P}}\left\{X>x\right\}=1-P\left\{X\leq x\right\}=\left({\frac {x_{\min }}{x}}\right)^{k}} .

Vlastnosti

Střední hodnota

Střední hodnota je:

E ( X ) = { x min k k 1 k > 1 , k 1. {\displaystyle \operatorname {E} (X)={\begin{cases}\displaystyle x_{\min }{\frac {k}{k-1}}&k>1,\\\infty &k\leq 1.\end{cases}}}

Kvantily

Medián

Medián je

m ( X ) = x min 2 k   . {\displaystyle \operatorname {m} (X)=x_{\min }{\sqrt[{k}]{2}}\ .}

Přezkoumání Paretova principu

Stejným způsobem se získá pro 4. kvintil, který uvádí Paretův princip:

Q 0 , 8 = x min 5 k {\displaystyle Q_{0{,}8}=x_{\min }{\sqrt[{k}]{5}}} .

Střední hodnota E ( X | X > Q 0 , 8 ) {\displaystyle \operatorname {E} (X|X>Q_{0{,}8})} , omezená na hodnoty větší než 4. kvintil, je pro k > 1 {\displaystyle k>1} :

E ( X | X > Q 0 , 8 ) = x min k k 1 / 5 ( k 1 ) / k {\displaystyle \operatorname {E} (X|X>Q_{0{,}8})=x_{\min }{\frac {k}{k-1}}/5^{(k-1)/k}} .

Pro k = 1 , 5 {\displaystyle k=1{,}5} , což Pareto považuje za typické, to vede k výsledku 1 / 5 3 {\displaystyle 1/{\sqrt[{3}]{5}}} , tj. cca 58 % z celkové očekávané hodnoty. Pokud by příjem populace odpovídal Paretově rozdělení s parametrem 1,5, 20 % lidí s nejvyššími příjmy získává pouze 58 % z celkového příjmu - ne 80 %, jak naznačuje Paretův princip. Paretovo pravidlo 80% : 20% přesně platí jen pro k = log 4 5 1 , 16 {\displaystyle k=\log _{4}5\approx 1{,}16} , tedy pro distribuci mnohem plošší, než by naznačovala Paretova typická hodnota k = 1 , 5 {\displaystyle k=1{,}5} .

Rozptyl

Rozptyl je

Var ( X ) = { x min 2 ( k k 2 k 2 ( k 1 ) 2 ) = x min 2 k ( k 2 ) ( k 1 ) 2 k > 2 , 1 < k 2. {\displaystyle \operatorname {Var} (X)={\begin{cases}\displaystyle x_{\min }^{2}\left({\frac {k}{k-2}}-{\frac {k^{2}}{(k-1)^{2}}}\right)=x_{\min }^{2}{\frac {k}{(k-2)(k-1)^{2}}}&k>2,\\\infty &1<k\leq 2.\end{cases}}}

Směrodatná odchylka

Pro k > 2 {\displaystyle k>2} je směrodatná odchylka

σ ( X ) = x min k 1 k k 2   . {\displaystyle \sigma (X)={\frac {x_{\min }}{k-1}}{\sqrt {\frac {k}{k-2}}}\ .}

Variační koeficient

Z očekávané hodnoty a směrodatné odchylky vychází pro k > 2 {\displaystyle k>2} variační koeficient

VarK ( X ) = 1 k ( k 2 )   . {\displaystyle \operatorname {VarK} (X)={\frac {1}{\sqrt {k(k-2)}}}\ .}

Šikmost

Šikmost je pro k > 3 {\displaystyle k>3}

v ( X ) = k k 3 3 k 2 ( k 2 ) ( k 1 ) + 2 k 3 ( k 1 ) 3 ( k k 2 k 2 ( k 1 ) 2 ) 3 2 = 2 ( 1 + k ) k 3 k 2 k   > 0. {\displaystyle \operatorname {v} (X)={\frac {\displaystyle {\frac {k}{k-3}}-3{\frac {k^{2}}{(k-2)(k-1)}}+2{\frac {k^{3}}{(k-1)^{3}}}}{\displaystyle \left({\frac {k}{k-2}}-{\frac {k^{2}}{(k-1)^{2}}}\right)^{\frac {3}{2}}}}={\frac {2(1+k)}{k-3}}\,{\sqrt {\frac {k-2}{k}}}\ >0.}

Pro k > 3 {\displaystyle k>3} je Paretovo rozdělení zešikmené doprava podle definice 3. centrálního momentu. Pro 3 k > 0 {\displaystyle 3\geq k>0} třetí moment diverguje, i když distribuce je stále zešikmená.

Momenty

Dále n {\displaystyle n} -tý obecný moment je

E ( X n ) = { x min n k k n k > n , k n . {\displaystyle \operatorname {E} (X^{n})={\begin{cases}\displaystyle x_{\min }^{n}{\frac {k}{k-n}}&k>n,\\\infty &k\leq n.\end{cases}}}

Charakteristická funkce

Charakteristická funkce je:

k ( i x m i n t ) k Γ ( k , i x m i n t )   . {\displaystyle k(-ix_{\mathrm {min} }t)^{k}\Gamma (-k,-ix_{\mathrm {min} }t)\ .}

kde Γ {\displaystyle \Gamma } je neúplná funkce gama .

Momentová vytvořující funkce

Momentová vytvořující funkce v uzavřené formě pro Paretovo rozdělení neexistuje.

Entropie

Entropie je: log ( k x min ) 1 k 1 {\displaystyle \log \left({\frac {k}{x_{\text{min}}}}\right)-{\frac {1}{k}}-1\!} .

Zipfův zákon

Zipfův zákon je matematicky totožný s Paretovým rozdělením (jen osy x {\displaystyle x} a y {\displaystyle y} se prohodí). Zatímco Paretovo rozdělení se dívá na pravděpodobnost určitých náhodných hodnot, Zipfův zákon se zaměřuje na pravděpodobnost, s jakou náhodné hodnoty zaujímají určitou pozici v pořadí podle frekvence.

Y ( x ) = log ( y ) = log ( a ) + b log ( x ) . {\displaystyle Y(x)=\log(y)=\log(a)+b\log(x).}

Identifikace Paretova rozdělení

Velikosti německých obcí a měst na dvojitém logaritmickém papíře

To, zda je empirická distribuce přibližně paretovsky rozdělená, lze odhadnout graficky pomocí vynesení empirické distribuční funkce v grafu s logaritmickými stupnicemi na obou osách. Pokud jde o paretovská data, budou body ležet zhruba na přímce. Je to proto, že pravděpodobnost P { X > x } {\displaystyle {\rm {P}}\left\{X>x\right\}} lze vyjádřit v mocninném tvaru a upravit na

P { X > x } = ( x min x ) k = a x b , kde a = x min k b = k {\displaystyle {\rm {P}}\left\{X>x\right\}=\left({\frac {x_{\min }}{x}}\right)^{k}=ax^{b},\quad {\text{kde}}\quad a=x_{\min }^{k}{\text{, }}\quad b=-k}

a po zavedení logaritmického měřítka na ose x {\displaystyle x} , tj. X = log ( x ) {\displaystyle X=\log(x)} , máme

Y ( X ) = log ( a ) + b X , {\displaystyle Y(X)=\log(a)+bX,}

což je přímka se směrnicí b {\displaystyle b} , což je hodnota opačná k parametru k {\displaystyle k} , který se tak dá graficky snadno odhadnout.

Reference

V tomto článku byl použit překlad textu z článku Pareto-Verteilung na německé Wikipedii.

Literatura

  • Rainer Schlittgen : Einführung in die Statistik. Analyse und Modellierung von Daten. 10. přepracované vydání. Oldenbourg Wissenschaftsverlag, Mnichov 2003, ISBN 3-486-27446-5, s. 231,
  • Karl Mosler, Friedrich Schmid: Wahrscheinlichkeitsrechnung und schließende Statistik. 2. vylepšené vydání. Springer, Berlín a. A. 2006, ISBN 3-540-27787-0, s. 99.
  • Vilfredo Pareto: Cours d'Économie Politique. 2 svazky. Rouge, Lausanne 1896-1897.

Externí odkazy


Zdroj datcs.wikipedia.org
Originálcs.wikipedia.org/wiki/Paretova_distribuce
Zobrazit sloupec 

Kalkulačka - Výpočet

Výpočet čisté mzdy

Důchodová kalkulačka

Přídavky na dítě

Příspěvek na bydlení

Rodičovský příspěvek

Životní minimum

Hypoteční kalkulačka

Povinné ručení

Banky a Bankomaty

Úrokové sazby, Hypotéky

Směnárny - Euro, Dolar

Práce - Volná místa

Úřad práce, Mzda, Platy

Dávky a příspěvky

Nemocenská, Porodné

Podpora v nezaměstnanosti

Důchody

Investice

Burza - ČEZ

Dluhopisy, Podílové fondy

Ekonomika - HDP, Mzdy

Kryptoměny - Bitcoin, Ethereum

Drahé kovy

Zlato, Investiční zlato, Stříbro

Ropa - PHM, Benzín, Nafta, Nafta v Evropě

Podnikání

Města a obce, PSČ

Katastr nemovitostí

Katastrální úřady

Ochranné známky

Občanský zákoník

Zákoník práce

Stavební zákon

Daně, formuláře

Další odkazy

Auto - Cena, Spolehlivost

Registr vozidel - Technický průkaz, eTechničák

Finanční katalog

Volby, Mapa webu

English version

Czech currency

Prague stock exchange


Ochrana dat, Cookies

 

Copyright © 2000 - 2024

Kurzy.cz, spol. s r.o., AliaWeb, spol. s r.o.