Tartalom
A statisztikákban a varianciaanalízis (ANOVA) a különféle adatcsoportok együttes elemzésének módja annak megállapításához, hogy azok rokonak vagy hasonlóak. Az ANOVA-n belüli egyik fontos teszt a négyzet alapú térségi hiba (MSE). Ez a mennyiség a statisztikai modell által előre jelzett értékek és a tényleges rendszer mért értékei közötti különbség becslésének módja. A gyökér MSE kiszámítása néhány egyszerű lépésben elvégezhető.
Négyzetes hibák összege (SSE)
Számítsa ki az adatcsoportok általános átlagát. Tegyük fel például, hogy két adatcsoport van, az A halmaz és a B halmaz, ahol az A halmaz az 1, 2 és 3 számokat tartalmazza, a B halmaz pedig a 4, 5 és 6 számokat. Az A halmaz átlaga 2 (a összeadva 1, 2 és 3, és osztva 3-tal) és a B halmaz átlaga 5 (a 4, 5 és 6 összeadásával és 3-val való elosztással kapjuk meg).
Kivonjuk az adatok átlagát az egyes adatpontokból, és szögezzük be a következõ értéket. Például, az A adatkészletben az 1 kivonása 2-es középértékkel -1 értéket eredményez. Ennek a számnak a szorozása (vagyis a szorzás önmagával) az 1. eredményt adja. Ha ezt az eljárást megismételjük az A halmaz többi részével, akkor 0 és 1, és B halmaz esetén az 1, 0 és 1 számok is szerepelnek. .
Összegezzük az összes négyzetes értéket. Az előző példából az összes négyzet számának összegzése 4-es számot eredményez.
A gyökér-MSE kiszámítása ANOVA-ban
Keresse meg a hibaszabadság fokát úgy, hogy kivonja az összes adatpontot a kezelés szabadságának (az adatkészletek száma). Példánkban összesen hat adatpont és két különböző adatkészlet található, ami 4-et ad a hiba szabadságának.
Osszuk el a négyzetek összegét a hibaszabadság fokával. Folytatva a példát, a 4-et elosztva 4-rel kapjuk az 1. Ez az átlagos négyzet hiba (MSE).
Vegyük az MSE négyzetgyökét. A példát lezárva, az 1 négyzetgyöke 1. Ezért az ANOVA gyökér MSE-je ebben a példában 1.