Kovariancia

Innen: Hungaropédia
Ugrás a navigációhozUgrás a kereséshez

A kovariancia a valószínűségszámítás és a statisztika tárgykörébe tartozó mennyiség, ami megadja két egymástól különböző változó együttmozgását. Kis értékei gyenge, nagy értékei erős lineáris összefüggésre utalnak. Nem normált; normálással a korrelációt kapjuk.

Definíció

Létezésének szükséges feltétele, hogy létezzen mindkét véletlen valószínűségi változó, továbbá szorzatuk várható értéke. Ez biztosan teljesül, ha X és Y négyzetesen integrálható, azaz E(|X|2)< és E(|Y|2)<. Értéke Cov(X,Y)=E((XE(X))(YE(Y))), ahol E az úgynevezett várhatóérték-operátor. Folytonos és diszkrét valószínűségi változók kovarianciája:

Cov(X,Y)={i=1nj=1nf(xi,yj)(xiE(X))(yjE(Y))ha X és Y diszkrét++f(x,y)(xE(X))(yE(Y))dxdyha X és Y folytonos.

Az n elemű x és y statisztikai minta tapasztalati (empirikus) kovarianciáját az alábbi képlettel adjuk meg: i=1n(xix¯)(yiy¯)n1 , ahol xi az x, yi az y minta i. eleme, x¯ és y¯ pedig az x és az y minták mintaátlagai. (Ugyanez a képlet átalakítható az 1n1i=1nxiyinn1x¯y¯ formára)

Példák

Legyen X=(X1,X2) kétdimenziós normális eloszlású, és P(X1,X2)=𝒩(μ,Σ) a Σ kovarianciamátrixszal:

Σ=(σ12ccσ22), ekkor a kovariancia:
Cov(X1,X2)=c.

Legyen X=(X1,X2) kétdimenziós multinomiális eloszlású (PX=M(n,(p1,p2))), így:

Cov(X1,X2)=E(X1X2)E(X1)E(X2)=n(n1)p1p2np1np2=np1p2.

Tulajdonságai

  • A kovariancia pozitív, ha X és Y között pozitív az összefüggés, ha X nagy, akkor Y is nagy, és ha X kicsi, akkor Y is kicsi.
  • A kovariancia negatív, ha X és Y között negatív az összefüggés, ha X nagy, akkor Y kicsi, és ha X kicsi, akkor Y nagy. Ez nem fordított arányosságot jelez, hiszen a kovariancia csak lineáris összefüggés kimutatására képes.
  • A kovariancia nulla, akkor X és Y között nincs lineáris összefüggés, de másfajta lehet.

Az eltolási tulajdonság:

Cov(X,Y)=E(XY)E(X)E(Y).

Bizonyítás:

Cov(X,Y)=E[(XE(X))(YE(Y))]=E[(XYXE(Y)YE(X)+E(X)E(Y))]=E(XY)E(X)E(Y)E(Y)E(X)+E(X)E(Y)=E(XY)E(X)E(Y)

Kapcsolat a szórásnégyzettel

Tétel: A kovariancia a szórásnégyzet általánosítása, mivel

Var(X)=Cov(X,X).

Bizonyítás:

Cov(X,X)=E[(XE(X))2]=Var(X)

Tehát a szórásnégyzet a valószínűségi változó önmagával vett kovarianciája. A kovarianciával kiszámítható négyzetesen integrálható valószínűségi változók összegének szórásnégyzete. Általában:

Var(i=1nXi)=i,j=1nCov(Xi,Xj)=i=1nVar(Xi)+i,j=1,ijnCov(Xi,Xj)=i=1nVar(Xi)+2i=1n1j=i+1nCov(Xi,Xj).

Speciálisan, két valószínűségi változó összegének szórásnégyzete:

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y).

Ahogy az közvetlenül következik a definícióból, ha az egyik valószínűségfi változó előjele megváltozik, akkor a kovariancia is:

Cov(X,Y)=Cov(X,Y)

Így két valószínűségi változó különbségére:

Var(XY)=Var(X+(Y))=Var(X)+Var(Y)2Cov(X,Y).

Linearitás, szimmetria és definitség

Tétel: A kovariancia szimmetrikus pozitív szemidefinit bilineáris forma a négyzetesen integrálható valószínűségi változók terében. Tétel: Bilineárisság: Az a,b,c,d,e,f,g,h valós számokra:

Cov(aX+b,cY+d)=acCov(X,Y)
Cov[X,(eY+f)+(gZ+h)]=eCov(X,Y)+gCov(X,Z).

Bizonyítás:

Cov(aX+b,cY+d)=E[(aX+bE(aX+b))(cY+dE(cY+d))]=E[(aXaE(X))(cYcE(Y))]=acE[(XE(X))(YE(Y))]=acCov(X,Y)
Cov[X,(eY+f)+(gZ+h)]=E[(XE(X))(eY+f+gZ+hE(eY+f+gZ+h))]=E[(XE(X))(eYeE(Y)+gZgE(Z))]=E[(XE(X))e(YE(Y))+(XE(X))g(ZE(Z))]=eE[(XE(X))(YE(Y))]+gE[(XE(X))(ZE(Z))]=eCov(X,Y)+gCov(X,Z)

Könnyen látható, hogy a kovariancia invariáns a konstans hozzáadására. A második egyenlőségben szimmetria miatt első változójában is lineáris. Tétel: Szimmetria.

Cov(X,Y)=Cov(Y,X)

Bizonyítás:

Cov(X,Y)=E[(YE(Y))(XE(X))]=Cov(Y,X)

Tétel (Pozitív szemidefinit):

Cov(X,X)0.

Bizonyítás:

Cov(X,X)=Var(X)0

A szimmetrikus szemidefinit bilineáris alakból következik, hogy teljesül a Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenség:

|Cov(X,Y)|Var(X)Var(Y)

A linearitásból következik, hogy a kovariancia függ a véletlen változók nagyságáétól. Így a kovariancia a tízszeresére változik, ha X helyett a 10X valószínűségi változót használjuk. Így a kovariancia nagysága a valószínűségi változók mértékegységeitől is függ. Mivel ez a tulajdonság nehezen értelmezhetővé teszi a kovariancia nagyságát, azért helyette inkább a korrelációs együtthatót használják, ami skálafüggetlen:

ρX,Y=Cov(X,Y)Var(X)Var(Y).

Korrelálatlanság és függetlenség

Definíció: Ha X és Y valószínűségi változók, és Cov(X,Y)=0, emiatt ϱ(X,Y)=0, akkor X és Y korrelálatlan. Tétel: Ha X és Y független valószínűségi változók, akkor Cov(X,Y)=0. Bizonyítás: Független valószínűségi változók esetén E(XY)=E(X)E(Y), d. h.

E(XY)E(X)E(Y)=0Cov(X,Y)=0.

A megfordítás nem mindig teljesül. Legyen az X valószínűségi változó egyenletes eloszlású a [1,1] intervallumon, és Y=X2. Nyilvánvaló, hogy X és Y nem függetlenek. Viszont

Cov(X,Y)=Cov(X,X2)=E(X3)E(X)E(X2)=00E(X2)=0.

További példák korrelálatlan, de nem független valószínűségi változókra: Legyenek X és Y valószínűségi változók úgy, hogy P(X=0,Y=1)=12 és P(X=2,Y=0)=P(X=2,Y=2)=14.

Ekkor P(X=0)=P(X=2)=12 és P(Y=0)=P(Y=2)=14, P(Y=1)=12.
Következik, hogy E(X)=E(Y)=1 és E(XY)=1, tehát Cov(X,Y)=0.
Másrészt X és Y nem függetlenek, mivel P(X=0,Y=1)=121212=P(X=0)P(Y=1).

Legyenek X és Y valószínűségi változók Bernoulli-eloszlásúak a p paraméterrel és függetlenek. Ekkor (X+Y) és (XY) korrelálatlan, de nem független.

A korrelálatléanság nyilvánvaló, mivel Cov(X+Y,XY)=Cov(X,X)Cov(X,Y)+Cov(Y,X)Cov(Y,Y)=0.
De (X+Y) és (XY) nem függetlenek, hiszen P(X+Y=0,XY=1)=0p(1p)3=P(X+Y=0)P(XY=1).

Források

Fordítás

Ez a szócikk részben vagy egészben a Kovarianz (Stochastik) című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.