Regressziószámítás

Innen: Hungaropédia
A lap korábbi változatát látod, amilyen imported>Vépi 2023. május 28., 18:03-kor történt szerkesztése után volt. (kékít)
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)
Ugrás a navigációhozUgrás a kereséshez

A statisztikában a regressziószámítás vagy regresszióanalízis során két vagy több véletlen változó között fennálló kapcsolatot modellezzük. A regressziós modell tulajdonságai alapján megkülönböztethetünk lineáris és nemlineáris regressziót, az adataink alapján pedig idősor, keresztmetszeti, és panel regresszióanalízist.

A feladat

A regresszió feladata két vagy több valószínűségi változó közötti y=f(x1,x2,,xn) függvénykapcsolat meghatározása. A változókat reprezentáló (n+1) dimenziós P(y;x1,x2,,xn) vektor koordinátáira kapott m számú P1,P2,,Pm mérési adatból meg kell határozni egy, a vizsgált jelenséget leíró, jól kezelhető függvényt: y=f(x1,x2,,xn)=f(X), amelynek az Xk=(x1,x2,,xn)k helyeken felvett y^k=f(Xk) értékei

  • vagy megegyeznek a megfelelő mért értékekkel: y^k=yk - (interpoláció),
  • vagy az ek=(yky^k) eltérések valamilyen minimum-feltételnek eleget tesznek (regresszió).

Az eltérések mértékét többféleképpen lehet megadni. Leggyakrabban a hibaértékek ek eltérések : i=1mek2 négyzetösszegének minimumát követeljük meg. (l.: legkisebb négyzetek módszere). A vizsgált jelenség természete szabja meg a közelítésre alkalmas függvény típusát. Eszerint megkülönböztetünk lineáris és nemlineáris regressziót. A kapcsolt változók száma szerint ugyancsak eltérnek a modellek. Ilyen értelemben beszélünk két-, három- stb. változós regresszióról.

Lineáris regresszió

Az általános lineáris modell az

y^=A0+A1x1+A2x2++Anxn

függvény Ai együtthatóinak meghatározását követeli meg. (Többváltozós lineáris regresszió.) A leggyakoribb kétváltozós lineáris modell a síkon derékszögű koordináta-rendszerben pontokkal ábrázolható adathalmazra y^=A1x+A0 egyenletű egyenes illesztését írja elő. Ezt az egyenest szokás trend-vonalnak, az egyenlet A1 együtthatóját trendnek (meredekség, tendencia), A0 konstansát tengelymetszetnek nevezni. Az együtthatók becslésére alkalmazott eljárások:

Nemlineáris regresszió

Nemlineáris regressziószámítást akkor alkalmaznak, ha a modell nemlineáris. Az ilyenkor alkalmazható linearizáló módszer abból áll, hogy az eredeti (y;x1,) változók helyett, velük összefüggő, de egymással lineáris kapcsolatban lévő (Y;X1,) változókat vezetünk be.

Például az y=AeBx formulából az X=x;Y=lny helyettesítésekkel az Y=lnA+BX lineáris kapcsolat adódik. Ennek(a,b) együtthatóiból az eredeti formula konstansai adódnak: A=ea;B=b.

Regresszió. Gyakorlati alkalmazások