Khí-négyzet-eloszlás

Innen: Hungaropédia
(Khi-négyzet eloszlás szócikkből átirányítva)
Ugrás a navigációhozUgrás a kereséshez

A valószínűségszámítás elméletében és a statisztika területén a k szabadságfokú khí-négyzet-eloszlás (más neveken: khi-négyzet, Khi2) k darab független normális eloszlású valószínűségi változónak a négyzetösszege. Ez az eloszlás széles körben használatos a valószínűség-eloszlások között, a statisztikai területén, például a hipotézisek ellenőrzésekor, vagy egy konfidenciaintervallum létrehozásakor.[1][2][3][4] Ha szükséges a khí-négyzet-eloszlást megkülönböztetni a nem-centrális khí-négyzet-eloszlástól, akkor szokták néha centrális khí-négyzet-eloszlásnak is nevezni. A khí-négyzet-eloszlást statisztikák ellenőrzésére használják az elméleti és a megfigyelt értékek kiértékelésénél, összehasonlításánál. A khí-négyzet-eloszlás a gamma-eloszlás egy speciális esete.

Definíció

Ha Z1, ..., Zk független, standard normális eloszlású valószínűségi változók, akkor a négyzeteik összege,

Q=i=1kZi2,

a khí-négyzet-eloszlás szerint oszlik el, k szabadságfokkal. Ezt a következőképpen is jelölik:

Qχ2(k)vagyQχk2.

A khi-négyzet-eloszlásnak egy paramétere van, a k, egy pozitív egész, mely a szabadságfok mértéke.

Valószínűség-sűrűségfüggvény

Valószínűség-sűrűségfüggvény

A khí-négyzet-eloszlás valószínűség-sűrűségfüggvénye:

f(x;k)={x(k/2)1ex/22k/2Γ(k2),x0;0,más esetben.

ahol Γ(k/2) a gamma-eloszlást jelöli.

Kumulatíveloszlás-függvény

A kumulatíveloszlás-függvény:

F(x;k)=γ(k2,x2)Γ(k2)=P(k2,x2),

Ahol γ(k,z) az inkomplett gamma-függvény és a P(k,z) a rendezett gamma-függvény . Abban a speciális esetben, amikor k = 2, létezik egy egyszerű képlet:

F(x;2)=1ex2.

Ennek az eloszlásnak a táblázatai – rendszerint kumulatív formában – számos helyen megtalálhatók, általában statisztikai csomagokban. Egy zárt formájú közelítés található a nem-centrális khí-négyzet-eloszlásnál.

Additivitás

A khí-négyzet-eloszlás definíciója szerint a független khí-négyzet-változók összege is khí-négyzet-eloszlású. Speciálisan, ha {Xi}i=1n független khí-négyzet-eloszlású változók {ki}i=1n szabadságfokkal, akkor Y = X1 + ⋯ + Xn is khí-négyzet-eloszlásúak k1 + ⋯ + kn szabadságfokkal.

Az információ entrópiája

Az információ entrópiája:

H=f(x;k)lnf(x;k)dx=k2+ln(2Γ(k2))+(1k2)ψ(k2),

ahol ψ(x) a digamma-függvény. A khí-négyzet-eloszlás az X valószínűségi változó maximális entrópiájú valószínűség-eloszlása, ahol E(X)=ν rögzített és E(ln(X))=ψ(12)+ln(2) is rögzített.[5]

Nem centrális momentumok

A k szabadságfokú khí-négyzet-eloszlás zéró körüli momentumai:[6][7] E(Xm)=k(k+2)(k+4)(k+2m2)=2mΓ(m+k2)Γ(k2).

Kumulánsok

A kumulánsok a karakterisztikus függvény logaritmusának egy hatványsor-kiterjesztésével kaphatók meg:

κn=2n1(n1)!k

Aszimptotikus tulajdonságok

A centrális határeloszlás tételéből következően mivel a khi-négyzet-eloszlás független k szabadságfokú valószínűségi változók szummája, véges átlaggal és szórásnégyzettel, konvergál a normális eloszláshoz nagy k értékeknél. Praktikus okok miatt k > 50 esetben az eloszlás elég közel áll a normális eloszláshoz, hogy a különbség elhanyagolható lehessen.[8] Ha X ~ χ²(k), akkor k tart a végtelenhez, a (Xk)/2k eloszlás pedig a normális eloszlás felé tart. Azonban ez a konvergencia lassú, mivel a ferdeség 8/k, és az eloszlásgörbe meredeksége 12/k. A khí-négyzet-eloszlás más függvényei jóval gyorsabban konvergálnak a normális eloszláshoz. Néhány példa:

  • Ha X ~ χ²(k), akkor 2X közel normálisan eloszlású, 2k1 középértékkel.
  • Ha X ~ χ²(k), akkor X/k3 közel normálisan eloszlású 12/(9k) középértékkel és 2/(9k). szórásnégyzettel[9] Ezt Wilson–Hilferty-transzformációnak hívják.

Kapcsolódó eloszlások

  • limkχk2(x)μkσkdN(0,1) (normális eloszlás)
  • χk2χk2(0) (nem-centrális khí-négyzet-eloszlás nem-centralitás paraméterrel λ=0)
  • Khí-négyzet-eloszlás, a Pareto-eloszlás egy transzformációja
  • T-eloszlás, a khí-négyzet-eloszlás egy transzformációja
  • A T-eloszlás származtatható a khí-négyzet-eloszlásból és a normális eloszlásból
  • A nem-centrális T-eloszlás származtatható a khí-négyzet-eloszlásból és a normális eloszlásból

Statisztikailag független egységnyi szórásnégyzetes Gauss-eloszlású változók négyzeteinek szummája, melynek nincs zéró középértéke, a khí-négyzet-eloszlás általánosításához vezet, és nem-centrális khi-négyzet-eloszlásnak hívják. A khí-négyzet-eloszlás természetesen kapcsolódik más eloszlásokhoz, melyeknek a Gauss-eloszláshoz van közük. Például:

  • Y F-eloszlású, Y ~ F(k1,k2) ha Y=X1/k1X2/k2 ahol X1 ~ χ²(k1), és X2  ~ χ²(k2) statisztikailag független.
  • Ha X khí-négyzet-eloszlású, akkor X khí-eloszlású.
  • Ha X1  ~  χ2k1 és X2  ~  χ2k2 statisztikailag független, akkor X1 + X2  ~ χ2k1+k2. Ha X1 and X2 nem függetlenek, akkor X1 + X2 nem khí–eloszlású.

Általánosítás

A khí-négyzet-eloszlást a gaussi k, független, zéró középértékű, egységnyi szórásnégyzetű valószínűségi változók négyzeteinek szummájával kapjuk. Ennek az eloszlásnak az általánosítását úgy kaphatjuk, ha összegezzük más típusú gaussi valószínűségi változók négyzeteit. A következőkben bemutatunk néhány ilyen eloszlást.

Khí-négyzet-eloszlások

Nem-centrális khí-négyzet-eloszlás

A nem-centrális khí-négyzet-eloszlást a független gaussi valószínűségi változók négyzeteinek szummájával kapjuk, melyek egység-szórásnégyzettel és nem zéró középértékkel rendelkeznek.

Általánosított khí-négyzet-eloszlás

Az általánosított khí-négyzet-eloszlást a z′Az kvadratikus képletéből kapjuk, ahol z a zéró középértékű gaussi vektor tetszőleges kovariáns mátrixxal, A pedig egy tetszőleges mátrix.

Gamma-, exponenciális és kapcsolódó eloszlások

A X ~ χ²(k) khí-négyzet-eloszlás, a gamma-eloszlás egy speciális esete, X ~ Γ(k/2, 1/2), ahol k egy egész. Mivel az exponenciális eloszlás szintén a gamma-eloszlás egy speciális esete, ezért X ~ χ²(2), és X ~ Exp(1/2) egy exponenciális eloszlás. Az Erlang-eloszlás szintén a gamma-eloszlás egy speciális esete, ezért ha X ~ χ²(k) páros k-val, akkor X is Erlang-eloszlású k/2 alakparaméterrel és ½ skálaparaméterrel.

Alkalmazások

A khí-négyzet-eloszlásnak számos alkalmazása ismert a statisztikában, például a khí-négyzet-teszt vagy a szórásnégyzetek becslése. Felveti a normáliseloszlás-középérték becslésének a problémáját és a regressziós vonal meredekségének a becslését a T-eloszláson keresztül. A szórásnégyet-analízis problémájában is van szerepe az F-eloszlással kapcsolatban, mely két független khí-négyzet valószínűségi változó arányának az eloszlása, mindegyik osztva a megfelelő szabadságfokkal. A következő táblázat olyan eloszlásokat mutat be, melyek neve ‘khí’-vel kezdődik, valamilyen statisztikához kapcsolódik, a Xi ∼ Normal(μi, σ2i), i = 1, ⋯, k, független valószínűségi változókra alapozva:

Név Statisztika
Khí-négyzet-eloszlás i=1k(Xiμiσi)2
Nem-centrális khí-négyzet-eloszlás i=1k(Xiσi)2
Khí-eloszlás i=1k(Xiμiσi)2
Nem-centrális khí-eloszlás i=1k(Xiσi)2

Irodalom

  • Wilson, E.B – Hilferty, M.M: The distribution of chi-squared. Washington: Proceedings of the National Academy of Sciences. 1931. 684–688. o.  
  • Horváth Gézáné: Kvantitatív módszerek I. Fejezetek a valószínűségszámításból. (hely nélkül): PERFEKT ZRT. 2005. ISBN 9789633945902  
  • Jonhson, N.L.; S. Kotz, , N. Balakrishnan: Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). (hely nélkül): John Willey and Sons. 1994. ISBN 0-471-58495-9  
  • Maddala, G.S: Limited-Dependent and Qualitative Variables in Econometrics. (hely nélkül): Cambridge University Press. 1983.  

Kapcsolódó szócikkek

Jegyzetek

  1. Milton Abramowitz; Irene Stegun, (szerk.) (1983) [June 1964]. "[Irene Stegun Chapter 26]". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
  2. NIST (2006). Engineering Statistics Handbook - Chi-Squared Distribution
  3. Jonhson, N.L., S. Kotz, , N. Balakrishnan. Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). John Willey and Sons (1994). ISBN 0-471-58495-9 
  4. Mood, Alexander, Franklin A. Graybill, Duane C. Boes. Introduction to the Theory of Statistics (Third Edition, p. 241-246). McGraw-Hill (1974). ISBN 0-07-042864-6 
  5. (2009) „Maximum entropy autoregressive conditional heteroskedasticity model”. Journal of Econometrics, 219–230. o, Kiadó: Elsevier. [2016. március 7-i dátummal az eredetiből archiválva]. (Hozzáférés: 2011. június 2.) 
  6. Chi-squared distribution, from MathWorld, Hozzáférés ideje: Feb. 11, 2009
  7. M. K. Simon, Probability Distributions Involving Gaussian Random Variables, New York: Springer, 2002, eq. (2.35), ISBN 978-0-387-34657-1
  8. Box, Hunter and Hunter. Statistics for experimenters. Wiley, 46. o. (2005) 
  9. Wilson, E.B.; Hilferty, M.M. (1931) "The distribution of chi-squared". Proceedings of the National Academy of Sciences, Washington, 17, 684–688.

Külső hivatkozások