Feltételes várható érték

Innen: Hungaropédia
Ugrás a navigációhozUgrás a kereséshez

A valószínűségszámításban egy valószínűségi változó feltételes várható értéke a várható érték, feltéve, hogy bekövetkezik egy adott A𝒜 esemény. Ha véges sok kimenetel lehetséges, akkor ez azt jelenti, hogy csak bizonyos értékeket vehet fel. Formálisabban, az esemény és komplementere particionálja a valószínűségi mezőt. Több valószínűségi változó esetén, egy valószínűségi változó várható értékben független egyenként vagy együttesen akkor és csak akkor, ha a feltételes várható értéke megegyezik a feltétel nélküli várható értékkel. A feltételes várható érték szintén valószínűségi változó, de elemi esemény mint feltétel esetén elfajult eloszlású, vagyis konstans. A fogalom általánosítható minden valószínűségi mezőre a mértékelmélet felhasználásával. A modern valószínűségszámításban a feltételes valószínűség definiálására használják.

Példák

1. példa: Tekintsünk egy szabályos dobókockát! Legyen az A esemény az, hogy páros számot dobunk, tehát a kimenetel 2, 4, vagy 6; a B esemény az, hogy az eredmény prímszám, azaz 2, 3 vagy 5. A táblázatban az esemény bekövetkeztét 1, be nem következését 0 jelöli.

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

Az A esemény feltétel nélküli várható értéke E(A)=(0+1+0+1+0+1)/6=1/2. Az A feltéve B (jelben A|B) esemény várható értéke E(A|B=1)=(1+0+0)/3=1/3, míg E(A|B=0)=(0+1+1)/3=2/3 a B komplementer eseményén. Hasonlóan, E(B|A) értéke E(B|A=1)=(1+0+0)/3=1/3, és E(B|A=0)=(0+1+1)/3=2/3. 2. példa: Tegyük fel, hogy van egy 10 éves adatsor az időjárásról! Ekkor meg lehet nézni az átlagos napi csapadékmennyiséget (tapasztalati feltétlen várható érték), az év egy szakaszában számított átlagos napi csapadékmennyiséget vagy az év egy bizonyos napjára jutó napi csapadékmennyiséget (tapasztalati feltételes várható értékek). A feltétlen esethez 3652 napi átlagot, március hónaphoz 310 napi átlagot, március 2-ához 10 napi átlagot kell figyelembe venni.

Klasszikus definíció

Eseményre vett feltételes várható érték

A klasszikus valószínűségszámításban egy X valószínűségi változó feltéve egy H esemény X átlaga H összes kimenetelére, azaz

E(XH)=ωHX(ω)|H|,

ahol |H| a H elemszáma. H lehet az, hogy egy másik Y valószínűségi változó egy adott értéket vesz fel, azaz Y=y. A fenti összeg csoportosítható X(ω) értékei szerint, vagyis 𝒳-en összegzünk, ami X lehetséges kimeneteleinek halmaza:

E(XH)=x𝒳x|{ωHX(ω)=x}||H|.

Általában, ha a H esemény valószínűsége pozitív, akkor hasonló formula teljesül. Külön figyelmet kap az a speciális lehetőség, ha a H azt jelzi, hogy egy másik Y valószínűségi változó egy adott értéket vesz fel, azaz Y=y. Legyen (Ω,,P) valószínűségi mező, X valószínűségi változó ezen, és legyen P(H)>0. Ekkor X feltételes várható értéke feltéve, hogy H, nem más, mint

E(XH)=E(1HX)P(H)=𝒳xdP(xH),

ahol 𝒳 az X(ω) lehetséges kimenetelei, és P(H) a valószínűségi mérték, és minden A mérhető halmazra P(AH)=P(AH)/P(H) A feltételes valószínűsége feltéve H. Ha P(H)=0 és H egy Y=y esemény, akkor a fenti definíció nem terjeszthető ki, habár más számítási módszerekkel egy érték kiszámítható. A Borel–Kolmogorov-paradoxon mutatja, hogy a feltételes valószínűség, így a feltételes várható érték nem határozható meg a definíció alapján. A megoldás a σ-algebrára és a valószínűségi változóra való kiterjesztés, amiből egy olyan definíció adódik, amivel ekkor is meghatározható a feltételes várható érték.

Valószínűségi változóra vett feltételes várható érték

Ha Y diszkrét valószínűségi változó ugyanazon az (Ω,,P) valószínűségi mezőn, mint X, és lehetséges kimenetelei 𝒴, akkor X feltételes várható értéke feltéve Y egy E(XY) valószínűségi változó 𝒴-on, melynek definíciója

E(XY)(y)=E(XY=y).

Egy kapcsolódó Ω-ből 𝒴-ba menő függvény definíciója

E(Xσ(Y))(ω)=E(XY=Y(ω)).

Ez a függvény az X valószínűségi változó feltételes várható értéke az Y által generált σ-algebrára. A két függvény kapcsolata

E(Xσ(Y))=E(XY)Y.

Ahogy fentebb említettük, ha Y folytonos valószínűségi változó, akkor nem lehet definiálni E(XY)-et ezen a módon. A Borel–Kolmogorov-paradoxon szerint meg kell határozni, hogy mely korlátozó procedúra hozza létre az Y = y egyenlőséget. Ha az Ω eseménytérnek van távolságfüggvénye, akkor eljárhatunk a következőképpen. Feltéve, hogy minden Hyε P-mérhető és P(Hyε)>0 minden ε>0 esetén. Ekkor az Hyε szerinti feltételes várható érték jóldefiniált. Az ε korláttal a nullához tartva definiálhatjuk, hogy

g(y)=limε0E(XHyε).

A korlátozó folyamatot a Radon–Nikodym-deriválttal helyettesítve egy általánosabb analóg definícióhoz jutunk.

Formális definíció

Feltételes várható érték rész-σ-algebrára

σ-algebrára vett feltételes várható érték: ebben a példában az (Ω,,P) valószínűségi mező az [0,1] intervallum a Lebesgue-mértékkel. Definiáljuk a következő σ-algebrákat: 𝒜=; az a σ-algebra, amit a 0, ¼, ½, ¾, 1 végpontú intervallumok generálnak; és 𝒞 a 0, ½, 1 végpontú intervallumok által generált σ-algebra. Itt a feltételes várható érték éppen a σ-algebra minimális halmazaira számított átlag

Tekintsük a következőket:

Mivel részalgebrája -nek, azért az X:Ωn függvény nem feltétlenül -mérhető. Ezért nem biztosított az HXdP| integrál létezése, ahol H és P| P leszűkítése -ra. Azonban a lokális HXdP átlagok meghatározhatók (Ω,,P|)-ban, a feltételes várható érték használatával. X feltételes várható értéke adott -ra, amit E(X) jelöl, egy -mérhető Ωn függvény, ami minden H esetén teljesíti azt, hogy

HE(X)dP=HXdP[1]

E(X) létezése könnyen megmutatható, ha észrevesszük, hogy μX:FFXdP véges mérték (Ω,)-n, ha F, ami abszolút folytonos P-re. Ha h a természetes beágyazása -nak -be, akkor μXh=μX| μX leszűkítése -ra, és Ph=P| P leszűkítése -ra. Továbbá, μXh abszolút folytonos Ph-re, hiszen abból, hogy

Ph(H)=0P(h(H))=0

következik, hogy

μX(h(H))=0μXh(H)=0.

Tehát

E(X)=dμX|dP|=d(μXh)d(Ph),

ahol a deriváltak Radon–Nikodym-deriváltak.

Feltételes várható érték valószínűségi változóra

A fentiek mellett legyen még:

Legyen g:Un Σ-mérhető függvény úgy, hogy minden f:Un Σ-mérhető függvényre

g(Y)f(Y)dP=Xf(Y)dP.

Ekkor a g(Y) valószínűségi változó X feltételes várható értéke egy adott Y valószínűségi változóra. Jelölése: E(XY). Ez a definíció ekvivalens al-σ-terére, amit Σ Yszerinti ősképe definiál. Hogyha definiáljuk, hogy

=Y1(Σ)={Y1(B):BΣ},

akkor

E(XY)=E(X)=d(μXY1)d(PY1)Y.

Diszkusszió

  • A definíció nem konstruktív, csak megadtuk a szükséges tulajdonságot, aminek a feltételes várható értéknek meg kell felelnie.
  • Az E(X) definíciója hasonlít a E(XH) definícióra egy H eseménnyel, azonban ezek nem ugyanazok. Az előbbi egy -mérhető Ωn-függvény, az utóbbi n egy eleme. Az előbb kiértékelése H-n az utóbbit adja.
  • A követelmények nem garantálják a feltételes várható értéket. Létezésére a Radon–Nikodym-tétel ad kritériumokat. Egy elégséges feltétel, hogy X várható értéke létezik.
  • Az egyértelműség majdnem biztos: A különböző feltételes várható értékek csak nulla valószínűségű halmazban különböznek.
  • A σ-algebra jellemzi a feltételezés szemcsézettségét. Egy nagyobb (finomabb) σ-algebra fölött több esemény valószínűségét őrzi meg. Egy szűkebb (durvább) σ-algebra több eseményt átlagol.

Kiszámítása

Ha X és Y diszkrét valószínűségi változó, akkor X feltételes várható értéke az Y = y eseményre tekinthető y függvényének Y lehetséges kimeneteleinek halmazán:

E(XY=y)=x𝒳xP(X=xY=y)=x𝒳xP(X=x,Y=y)P(Y=y),

ahol 𝒳 az X lehetséges kimeneteleinek halmaza. Ha X folytonos, viszont Y diszkrét valószínűségi változó, akkor a feltételes várható érték az Y = y eseményre

E(XY=y)=𝒳xfX(xY=y)dx,

ahol fX(xY=y)=fX,Y(x,y)P(Y=y), és fX,Y(x,y) az X és Y közös tömegfüggvénye. Ha X és Y folytonos valószínűségi változó, akkor X feltételes várható értéke az Y = y eseményre

E(XY=y)=𝒳xfXY(xy)dx,

ahol fXY(xy)=fX,Y(x,y)fY(y) és fY(y) az Y sűrűségfüggvénye.

Tulajdonságok

Az alábbi tulajdonságok majdnem biztosak, és a σ-algebra helyett mindenütt vehető Z valószínűségi változó.

Alapvető tulajdonságok

Linearitás:

E(X1+X2)=E(X1)+E(X2) és
E(aX)=aE(X), ha a.

Pozitivitás: ha X0, akkor E(X)0. Monotonitás: Ha X1X2, akkor E(X1)E(X2). Ha X -mérhető, akkor E(XY)=XE(Y). Ha Z valószínűségi változó, akkor E(f(Z)YZ)=f(Z)E(YZ). Teljes várható érték tétele: E(E(X))=E(X).

Függetlenség

Ha X független -tól, akkor E(X)=E(X). Ugyanis, ha B, akkor X független 1B-től, így

BXdP=E(X1B)=E(X)E(1B)=E(X)P(B)=BE(X)dP.

Tehát a definíciónak megfelel egy E(X) konstans valószínűségi változó, ahogy azt akartuk. Ha X független σ(Y,)-tól, akkor E(XY)=E(X)E(Y). Ez nem feltétlenül teljesül, ha X csak -tól vagy Y-tól független. Ha X,Y független, és 𝒢, független, továbbá X és független és Y és 𝒢 független, akkor E(E(XY𝒢))=E(X)E(Y)=E(E(XY)𝒢). Doob-féle feltételes függetlenségi tulajdonság:[2] Ha X,Y feltételesen független egy adott Z-re, akkor P(XBY,Z)=P(XBZ) (vagy ekvivalensen, E(1{XB}Y,Z)=E(1{XB}Z)).

Stabilitás

Ha X -mérhető, akkor E(X)=X. Ha Z valószínűségi változó, E(f(Z)Z)=f(Z). Más alakban, E(ZZ)=Z.

Torony tulajdonság

A 12 rész-σ-algebrákra E(E(X2)1)=E(X1). Speciális esetben, ha Z -mérhető valószínűségi változó, akkor σ(Z), így E(E(X)Z)=E(XZ). Doob-féle martingál tulajdonság: Legyenek, mint előbb, és legyen Z=E(X), ami -mérhető, ekkor E(ZZ)=Z felhasználásával E(XE(X))=E(X). Ha X,Y valószínűségi változó, akkor E(E(XY)f(Y))=E(Xf(Y)). Ha X,Y,Z valószínűségi változó, akkor E(E(XY,Z)Y)=E(XY).

Konvergencia

Monoton konvergencia tétele: Ha 0XnX, akkor E(Xn)E(X). Dominált konvergencia: Ha XnX és |Xn|Y, ahol YL1, akkor E(Xn)E(X). Fatou-lemma: Ha E(infnXn)>, akkor E(lim infnXn)lim infnE(Xn). Martingál konvergencia tétele: Ha X valószínűségi változó véges várható értékkel, akkor E(Xn)E(X), ha 12 rész-σ-algebrák növekvő sorozata és =σ(n=1n) vagy ha 12 rész-σ-algebrák csökkenő sorozata és =n=1n.

Jensen-egyenlőtlenség

A Jensen-egyenlőtlenség szerint, ha f: konvex függvény, akkor f(E(X))E(f(X)).

Projekció

A feltételes operátor kontrakciós vetülete az Lp(Ω,,P)Lp(Ω,,P). Lp-tereknek. Vagyis, E(|E(X)|p)E(|X|p) minden p ≥ 1-re. A feltételes várható érték mint L2-projekció: Ha X,Y a négyzetesen integrálható valós valószínűségi változók terének Hilbert-terének eleme, azaz második momentuma véges, akkor: az XE(X) leképezés önadjungált, E(XE(Y))=E(E(X)E(Y))=E(E(X)Y) ha Y -mérhető, akkor E(Y(XE(X)))=0, vagyis az E(X) feltételes várható érték az L2(P) szerinti értelemben az X ortogonális projekciója mint skaláris szorzat a -mérhető függvények alterében. Emiatt használható a Hilbert-féle projekciótétel alapján definiálható és bizonyítható a feltételes várható érték.

Számítások

Az X valószínűségi változó várható értékét akarjuk kiszámolni, amennyiben tudjuk, hogy egy A𝒜 esemény bekövetkezik. Legyen (Ω,𝒜,P) valószínűségi mező, X valószínűségi változó és A𝒜 esemény, ha P(A)0, akkor E(X|A)=1P(A)AXdP. A definíció értelmezése a feltételes valószínűség alapján: E(X|A)=ΩX(ω)dP(ω|A), ahol a feltételes valószínűség definíciója szerint P(B|A)=P(BA)P(A), a várható értékben lévő valószínűségre alkalmazva P(ω|A)=P(ωA)P(A), tehát ez a valószínűség csak akkor nem 0, ha ωA. Ezért csak az A eseményen integrálunk, viszont ωA esetén P(ω|A)=P(ω) és a mérték szerinti integrál definíciója szerint dP(ω)P(A)=1P(A)dP(ω). Ezt alkalmazva E(X|A)=ΩX(ω)dP(ω|A)=ΩX(ω)dP(ωA)P(A)=AX(ω)dP(ωA)P(A)=AX(ω)dP(ω)P(A)=1P(A)AXdP. A feltételes várható érték tulajdonságai: lineáris: E(X+Y|A)=E(X|A)+E(Y|A) ha c, akkor E(cX|A)=cE(X|A). Az X valószínűségi változó várható értékét akarjuk kiszámolni, amennyiben tudjuk, hogy egy 𝒜 σ-algebrában lévő események bekövetkeznek. Legyen (Ω,𝒜,P) valószínűségi mező, X valószínűségi változó és 𝒜 σ-algebra, ha E(|X|)< ekkor létezik olyan E(X|) valószínűségi változó, amely mérhető és minden A esemény esetén AXdP=AE(X|)dP.

Feltételes szórás

A feltételes várható érték segítségével definiálható feltételes szórás is. A képletekben szórás helyett szórásnégyzet szerepel: Definíció: Var(X)=E((XE(X))2) Algebrai képlet: Var(X)=E(X2)(E(X))2 Teljes szórás tétele: Var(X)=E(Var(X))+Var(E(X)).

Története

A feltételes valószínűség fogalmát Laplace vezette be, aki feltételes eloszlásokat számított. Andrej Kolmogorov 1933-ban formalizálta a Radon–Nikodym-tétellel.[3]Halmos Pál[4] és Joseph L. Doob[1] [5] 1953-ban általánosította a ma is használt fogalmat al-σ-algebrákkal.[6]

Jegyzetek

  1. 1,0 1,1 Billingsley, Patrick. Probability and Measure, 3rd, John Wiley & Sons, 445. o. (1995). ISBN 0-471-00710-2 
  2. Kallenberg, Olav. Foundations of Modern Probability, 2nd, York, PA, USA: Springer, 110. o. (2001). ISBN 0-387-95313-2 
  3. Kolmogorov, Andrey. Grundbegriffe der Wahrscheinlichkeitsrechnung (german nyelven). Berlin: Julius Springer, 46. o. (1933) 
  4. Oxtoby, J. C. (1953). „Review: Measure theory, by P. R. Halmos”. Bull. Amer. Math. Soc. 59 (1), 89–91. o. DOI:10.1090/s0002-9904-1953-09662-8. 
  5. J. L. Doob. Stochastic Processes. John Wiley & Sons (1953). ISBN 0-471-52369-0 
  6. Olav Kallenberg: Foundations of Modern Probability. 2. edition. Springer, New York 2002, ISBN 0-387-95313-2, S. 573.

Források

Fordítás

Ez a szócikk részben vagy egészben a Conditional expectation című angol Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.