Jensen-egyenlőtlenség

Innen: Hungaropédia
A lap korábbi változatát látod, amilyen imported>Vlk 2025. február 26., 05:44-kor történt szerkesztése után volt. (Jensen egyenlőtlensége: gondolatjel)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)
Ugrás a navigációhozUgrás a kereséshez

A Jensen-egyenlőtlenség elegáns közös kiterjesztését adja számos matematikai egyenlőtlenségnek. Ha egy véges vagy végtelen I intervallumon az f függvény konvex, a1,,anI, valamint p1,,pn nem negatív számok, amelyekre teljesül a p1++pn=1 összefüggés, akkor

f(p1a1++pnan)p1f(a1)++pnf(an).

Ha f szigorúan konvex, akkor egyenlőség csakis az a1=a2==an esetben teljesül.

Ha f konkáv, akkor az állítás fordított irányú egyenlőtlenséggel teljesül, azaz:

f(p1a1++pnan)p1f(a1)++pnf(an).

Például az

f(x)=x2

függvény szigorúan konvex a valós számok halmazán, így ha

a1,,an

tetszőleges,

p1==pn=1n

, akkor

(a1++ann)2a12++an2n,

ami éppen a számtani és négyzetes közép közötti egyenlőtlenség. Egyenlőség akkor és csak akkor áll fenn, ha a1==an. Hasonlóképpen a konkáv x log x függvényt használva azt kapjuk, hogy bármely pozitív a1,,an számokra

log(a1++ann)loga1++logann.

Mivel a jobb oldal a1ann logaritmusa, a számtani és mértani közép közötti egyenlőtlenséget kapjuk.

Jensen egyenlőtlensége

A matematikában Jensen egyenlőtlensége – amit a dán matematikusról, Johan Jensenről neveztek el – összefüggésbe hozza egy konvex függvény értékét a konvex függvény integráljával. Ezt 1906-ban bizonyította Jensen. Az általánosságára tekintettel az egyenlőtlenség megjelenik sok alakban, ami a kontextustól függ (és amiknek egy része az alábbiakban kerül bemutatásra). Az egyenlet véges képlete volt a logója a Matematikai Tudományok Intézetének a Koppenhágai Egyetemen 2006-ig.

Állítások

Jensen egyenlőtlenségének klasszikus képlete magába foglal különféle számokat és súlyokat. Az egyenlőtlenséget ki lehet fejezni eléggé általánosságban használva a mértékelméletet vagy egyenértékű valószínűségszerű jelölést. Ebben a valószínűség szerinti felállításban az egyenlőtlenséget tovább lehet általánosítani a teljes érvényességéig.

A véges képlet

Ha egy φ függvény konvex egy I valós intervallumon, ahol xi-k ezen intervallum elemei és ai-k a súlyok, Jensen egyenlőtlenségét ki lehet fejezni a következő formában:

φ(aixiai)aiφ(xi)ai.

Az egyenlőtlenség iránya nyilvánvalóan fordított, ha φ konkáv. Konkrét eset, ha a súlyok mind egyenlőek 1-gyel, akkor:

φ(xin)φ(xi)n.

Konkáv log(x) függvény (megjegyzés: használhatjuk Jensen egyenlőtlenséget a függvény konvexitásának vagy konkávitásának bizonyítására, valós intervallumon.) Behelyettesítve φ(x)=log(x)-et az előző képletbe, a számtani és mértani közép közötti egyenlőtlenséget kapjuk:

x1+x2++xnnx1x2xnn.

Ha a változó x egy másik t változó függvénye xi = g(ti). Általánosan a következőt kapjuk: ai–ket felváltja egy nem negatív integrálható f(x)függvény, mint például egy valószínűségi eloszlás, a szummákat pedig integrálok.

Az elméleti mértéktér és a valószínűség szerinti képlet

Legyen (Ω,A,μ) egy mértéktér μ(Ω) = 1. Ha g egy valós értékű függvény, ami μ szerint integrált φ pedig egy mérhető konvex függvény, akkor:

φ(Ωgdμ)Ωφgdμ.

Valószínűségelméletben legyen (Ω,𝔉,) egy valószínűségtér , X egy integrált valós értékű változó és φ egy mérhető konvex függvény. Akkor:

φ(𝔼{X})𝔼{φ(X)}.

Ekkor a valószínűségelméletben, a mértéknek (μ) megfeleltethető egy valószínűség , μ-nek egy várható érték 𝔼 , és g a függvénynek egy véletlen változó X.

Általánosan az egyenlőtlenség egy valószínűség szerint

Általánosan legyen T egy valós vektortér, X egy T értékű integrálható véletlen változó. Az integrálhatóság azt jelenti, hogy bármely T elem számára T: 𝔼|z,X|< , z eleme T létezik egy 𝔼{X} T elem, úgy hogy z,𝔼{X}=𝔼{z,X} . Ekkor minden mérhető konvex φ függvényre és minden σ-algebra-rára 𝔊𝔉:

φ(𝔼{X|𝔊})𝔼{φ(X)|𝔊}.

Ez a kijelentés általánosítja az előzőt, amikor a T vektortér a tengely és 𝔊 a triviális σ-algebra {,Ω}.

Bizonyítások

A Jensen-egyenlőtlenség grafikus bizonyítása egy lehetséges esetben. A szaggatott görbe az X tengely mentén X feltételezett eloszlása, míg a szaggatott görbe az Y tengely mentén a megfelelő eloszlású Y értékek. Vegyük észre, hogy X egyre növekedő értékei mellett Y(X) egyre jobban növeli az eloszlást. Jensen egyenlőtlenségének bizonyítása különféle módon történhet, és három különböző fent említett, különböző állításoknak megfelelő bizonyítás ajánlott. Ám mielőtt megkezdenénk ezeket a matematikai bizonyításokat, érdemes elemezni a grafikus bizonyítást a valószínűség szerinti eset alapján, ahol X egy valós szám, (lásd az ábrát). Elfogadva az X értékeknek egy feltételezett eloszlását, azonnal azonosíthatjuk az 𝔼{X} és a képe φ(𝔼{X}) értéket a grafikonon. Észrevehetjük Y=φ(X) a megfelelő értékek eloszlása egyre inkább nő az X növekedő értékeik mellett, és az Y eloszlása szélesebb, az X > X0 intervallumban, és keskenyebb X <X0 intervallumban bármilyen X0 számára; különösen igaz ez X0=𝔼{X} esetére. Következésképpen beláttuk, hogy Y mindig el fog mozdulni felfelé, tekintettel φ(𝔼{X}) pozíciójára. Ezzel bebizonyítottuk az egyenlőtlenséget, azaz:

𝔼{Y(X)}Y(𝔼{X}),

Egyenlőség akkor áll fenn, amikor φ(X) nem szigorúan konvex, például amikor ez egy egyenes. A bizonyításokat ez az intuitív elképzelés a következőkben fogalmazza meg:

1. bizonyítás (véges képlet)

Ha λ1 és λ2 két tetszőleges pozitív valós számok, melyekre λ1 + λ2 = 1, akkor φ konvexitása miatt:

φ(λ1x1+λ2x2)λ1φ(x1)+λ2φ(x2) minden x1,x2. -re.

Általánosan: ha λ1 , λ2 , …, λn pozitív valós számok, melyekre λ1 + … + λn = 1, akkor

φ(λ1x1+λ2x2++λnxn)λ1φ(x1)+λ2φ(x2)++λnφ(xn),

bármennyi x1 , …, xn számára. A Jensen-egyenlőtlenségnek ezt a véges képletét teljes indukcióval bizonyíthatjuk be. Ha n = 2 az állítás igaz. Tegyük fel, hogy n-re igaz az állítás, és bizonyítsuk n + 1-re. Ha legalább egy λi λ>0 például λ> 1 ; akkor konvexitás miatt:

φ(i=1n+1λixi)=φ(λ1x1+(1λ1)i=2n+1λi1λ1xi)λ1φ(x1)+(1λ1)φ(i=2n+1(λi1λ1xi)).

Mivel i=2n+1λi/(1λ1)=1 , felhasználva feltevésünket a képlet utolsó kifejezésében megkapjuk az eredményt, név szerint a Jensen-féle véges képletű egyenlőtlenséget. Azért, hogy megkapjuk az általános egyenlőtlenséget ebből a véges képletből, használjunk egy sűrűségérvet. A véges képletet újra fel lehet írni úgy, mint:

φ(xdμn(x))φ(x)dμn(x),

ahol μn egy mérték, amit a Dirac-delták egy tetszőleges kombinációja ad:

μn=i=1nλiδxi.

Mivel a konvex függvények folytonosak, és mivel a Dirac-delták kombinációi gyengén sűrűek az általános állítást egyszerűen megkapjuk.

2. bizonyítás (elméleti-határ képlet)

Legyen g egy valós értékű μ-integrálható függvény egy Ω mértéktérben, és legyen φ, egy konvex függvény a valós számok halmazán. Határozzuk meg φ jobb oldali deriváltját:

φ(x):=limt0+φ(x+t)φ(x)t.

Mivel φ konvex, a jobb oldali hányados ahogy a t közelíti a 0-t jobbról, egyre csökken és alulról korlátos.

φ(x+t)φ(x)t

Ha t < 0, a határértéke mindig létezik. Legyen:

x0:=Ωgdμ,
a:=φ(x0),
b:=φ(x0)x0φ(x0).

Akkor minden x -re ax + b ≤ φ(x). Ha x > x0 , és t = x − x0 > 0. Akkor,

φ(x0)φ(x0+t)φ(x0)t.

Tehát,

φ(x0)(xx0)+φ(x0)φ(x)

ahogyan azt bizonyítani akartuk. x < x0 esetében hasonlóan bizonyíthatjuk. Ha ax + b = φ(x0). φ(x 0 ) akkor átírhatjuk a képletet

ax0+b=a(Ωgdμ)+b. - alakúra.

De mivel μ(Ω) = 1, tehát minden valós k számra

Ωkdμ=k.

Így:

a(Ωgdμ)+b=Ω(ag+b)dμΩφgdμ.

3. Bizonyítás (általános egyenlőtlenség egy valószínűség szerint)

Legyen X egy integrálható valószínűségi változó, az értéket egy valós T vektortérből veszi. Mivel φ:T konvex, minden x,yT-re

φ(x+θy)φ(x)θ,

ahogy θ megközelíti a 0+ -t, ez az érték csökken. φ deriváltja X szerint az Y irányába:

(Dφ)(x)y:=limθ0φ(x+θy)φ(x)θ=infθ0φ(x+θy)φ(x)θ.

Látható, a differenciál lineáris y-ban van és mivel korábban beláttuk, hogy a jobb oldal infimuma kisebb mint az értéke a θ = 1 –nél.

φ(x)φ(x+y)(Dφ)(x)y.

Egy tetszőleges sub-σ-algebrára 𝔊 az utolsó egyenlőtlenség szerint, ha x=𝔼{X|𝔊},y=X𝔼{X|𝔊} fennáll, akkor

φ(𝔼{X|𝔊})φ(X)(Dφ)(𝔼{X|𝔊})(X𝔼{X|𝔊}).

Ebből következve megkapjuk az eredményt, mivel:

𝔼{[(Dφ)(𝔼{X|𝔊})(X𝔼{X|𝔊})]|𝔊}=(Dφ)(𝔼{X|𝔊})𝔼{(X𝔼{X|𝔊})|𝔊}=0,

Alkalmazások és speciális esetek

Képlet, amely magában foglal egy valószínűség szerinti sűrűség függvényt

Tételezzük fel, hogy Ω egy valós sorozat mérhető alhalmaza és f(x) egy nem negatív függvény, melyre:

f(x)dx=1.

Probabilisztikus nyelvben, f egy valószínűségi sűrűség-függvény. Jensen egyenlőtlensége a következő állítássá válik: Bármilyen g valós értékű függvény és φ konvex a g tartománya fölött, akkor

φ(g(x)f(x)dx)φ(g(x))f(x)dx.

Ha g(x) = x, akkor az egyenlőtlenségnek ez a formája redukálódik egy általában használt speciális esetre:

φ(xf(x)dx)φ(x)f(x)dx.

Alternatív véges képlet

Ha Ω véges halmaz {x1,x2,,xn} , és ha μ egy megszámlálható mérték az Ω-án, akkor az általános alak redukálódik egy összegekről szóló állításra:

φ(i=1ng(xi)λi)i=1nφ(g(xi))λi,

feltéve ha λ1+λ2++λn=1,λi0. Van egy képlet Ω –re is.

Statisztikus fizika

Jensen egyenlőtlensége a statisztikai fizikában különös fontosságú akkor, amikor a konvex függvény exponenciális. Adva van:

eXeX,

ahol a zárójel a várható értékekre utal tekintettel néhány valószínűségi eloszlásra a véletlenszerű X változóban. A bizonyítás ebben az esetben nagyon egyszerű (cf. Chandler, Sec. 5.5). A következő egyenlőtlenséget alkalmazva:

eX=eXeXX

Kapjuk a végső exponenciális egyenlőtlenséget:

eX1+X

Információelmélet

Ha p(x) x valószínűségi változó valódi eloszlás, és q(x) másik eloszlás, akkor Jensen egyenlőtlenségét alkalmazva Y(x) = q(x)/p(x)-re a véletlen változóra, a függvény legyen φ(y) = −log(y) így a Gibbs-egyenlőtlenséget kapjuk.

𝔼{φ(Y)}φ(𝔼{Y})
p(x)logp(x)q(x)dxlogp(x)q(x)p(x)dx
p(x)logp(x)q(x)dx0
p(x)logq(x)p(x)logp(x),

Ez megmutatja, hogy az átlagos üzenethossz minimalizált, amikor kódokat jelölnek ki valódi valószínűségek alapján. Az a nemnegatív mennyiség, (q-nak távolsága p-től) a Kullback–Leibler-távolság.

Rao–Blackwell-tétel

Ha L egy konvex függvény, akkor Jensen egyenlőtlenségéből, megkapjuk, hogy:

L(𝔼{δ(X)})𝔼{L(δ(X))}𝔼{L(𝔼{δ(X)})}𝔼{L(δ(X))}.

Tehát ha δ(X) torzítatlan becslés θ paraméterre T(X) egy elégséges statisztika θ-ra, egy kisebb várt veszteség birtokában L, számolás útján elérhető. Megadható olyan L becslés, mely hatásosabb mint δ(X).

δ1(X)=𝔼θ{δ(X)|T(X)=T(X)},

torzítatlan θ-ra, és X függvénye. Ezt az eredményt a Rao–Blackwell-tételként ismerik.

Kapcsolódó szócikkek

Források

  • Walter Rudin (1987): Valós és komplext elemzés. McGraw-Hill. ISBN 0-07-054234-1
  • David Chandler (1987): Bevezetés a modern statisztikus mechanikába. Oxford. ISBN 0-19-504277-8
  • Jensen, Johan Ludwig William Valdemar (1906): "Sur les fonctions* convexes* et les inégalités* entre* les valeurs* moyennes*". Acta Mathematica 30: 175-193

További információk

  • Eric W Weisstein: Jensen egyenlőtlenség - A matematika világa
  • Jensen egyenlőtlensége logóként szolgált a Koppenhágai Egyetem Matematikai Szakosztálya számára.