Tartalom
A többszörös regresszió segítségével megvizsgálhatjuk a független változók és egy függő változó közötti kapcsolatot. Míg a több regressziós modell lehetővé teszi ezen független, vagy prediktív változók relatív hatásainak elemzését a függő, illetve a kritériumváltozók függvényében, ezek a gyakran összetett adatkészletek hamis következtetésekhez vezethetnek, ha nem megfelelően elemzik őket.
Példák a többes regresszióra
Az ingatlanügynök több regressziót használhat a házak értékének elemzésére. Például, független változóként felhasználhatja a házak méretét, korát, hálószobák számát, az otthon átlagos árát a környéken és az iskolák közelségét. Ezeket egy többszörös regressziós modellbe ábrázolva felhasználhatja ezeket a tényezőket arra, hogy kritériumváltozóként láthassa a házak áraival való kapcsolatát.
A többszörös regressziós modell alkalmazásának másik példája lehet valaki az emberi erőforrásokban, amely meghatározza a vezetői pozíciók fizetését - a kritériumváltozót. Az előrejelző változói lehetnek az egyes vezetők szolgálati ideje, az átlagos ledolgozott órák száma, a kezelt személyek száma és a menedzser részlegek költségvetése.
A többes regresszió előnyei
Két fő előnye van az adatok többszörös regressziós modell alkalmazásával történő elemzésének. Az első az a képesség, hogy meghatározzuk egy vagy több prediktív változó relatív hatását a kritériumértékre. Az ingatlanügynök megállapíthatja, hogy a házak mérete és a hálószobák száma szorosan összefügg a ház árával, míg az iskolákhoz való közelségnek nincs korrelációja, vagy akár negatív korreláció, ha elsősorban nyugdíjazásról van szó. közösség.
A második előnye az, hogy azonosíthatjuk az eltéréseket vagy rendellenességeket. Például a menedzsment fizetésével kapcsolatos adatok áttekintésekor az emberi erőforrás menedzser megállapíthatta, hogy a ledolgozott órák száma, az osztály mérete és költségvetése szorosan összefügg a fizetésekkel, míg a szolgálati idő nem. Alternatív megoldásként előfordulhat, hogy az összes felsorolt prediktív érték korrelálódik a vizsgált bérek mindegyikével, kivéve egy kezelőt, akinek a többihez képest túl fizettek.
A többes regresszió hátrányai
A többszörös regressziós modell alkalmazásának minden hátránya általában a felhasznált adatoknak felel meg. Ennek két példája a hiányos adatok felhasználása és hamis következtetés, hogy a korreláció okozati összefüggés.
Tegyük fel például, hogy amikor az ingatlanügynök átvizsgálja a házak árát, az ingatlanügynök csak tíz házat vizsgált meg, amelyek közül hét fiatal szülők vásárolt. Ebben az esetben az iskolák közelsége közötti kapcsolat arra késztetheti őt, hogy ez befolyásolja az összes ház eladási árát a közösségben. Ez szemlélteti a hiányos adatok hibáit. Ha nagyobb mintát használt volna, akkor megállapíthatta, hogy az eladott 100 házból az otthonértékek csupán tíz százaléka az iskola közelségéhez kapcsolódik. Ha a vevők életkorát előrejelző értékként használta volna, megállapíthatta, hogy a fiatalabb vásárlók hajlandóak többet fizetni a lakásokért a közösségben, mint az idősebb vásárlók.
Tegyük fel, hogy a vezetői fizetések példáján kívül volt olyan, aki alacsonyabb költségvetéssel, kevesebb szolgálati idővel és kevesebb alkalmazotti személyzettel rendelkezik, de többet keresett, mint bárki más. A HR menedzser megnézheti az adatokat és arra a következtetésre juthat, hogy ennek az embernek túlfizetnek. Ez a következtetés azonban téves lenne, ha nem veszi figyelembe, hogy ez a menedzser a társaság weboldaláért felelõs volt, és rendkívül áhított készségekkel rendelkezik a hálózati biztonság területén.