Tartalom
- TL; DR (túl hosszú; nem olvastam)
- Szabványbeli eltérés vs. a minta szórása
- A minta szórásának megállapítása
- Átlagos eltérés vs. standard eltérés
Statisztikai tesztek, például a t-teszt alapvetően a szórás fogalmától függ. A statisztikai vagy természettudományos hallgatók rendszeresen használják a szórásokat, és meg kell értenie, hogy mit jelent, és hogyan kell megtalálni az adathalmazból. Szerencsére az egyetlen adat, amire szükséged van, az eredeti adatok, és noha a számítások unalmasak lehetnek, ha sok adat van, ezekben az esetekben függvényeket vagy táblázatkezelő adatokat kell használnia az automatikus elvégzéshez. A kulcsfogalom megértéséhez azonban csak annyit kell tennie, hogy lát egy alapvető példát, amelyet kézzel könnyedén kidolgozhat. Alapjában véve a minta szórása azt mutatja, hogy a mintája alapján mennyit változik a kiválasztott mennyiség az egész populációban.
TL; DR (túl hosszú; nem olvastam)
használata n a minta méretére, μ az adatok átlagára, xén minden egyes adatponthoz (-tól) én = 1 - ig én = n), és Σ, mint összegző jel, a minta szórása (s2):
s2 = (Σ xén – μ)2 / (n − 1)
És a minta szórása a következő:
s = √s2
Szabványbeli eltérés vs. a minta szórása
A statisztikák arra irányulnak, hogy a teljes populációra vonatkozóan becsléseket készítsenek a populációból származó kisebb minták alapján, és a folyamat becslése során felmerülő bizonytalanságok elszámolására irányul. A szórások számszerűsítik a vizsgált populáció variációjának mértékét. Ha megpróbálja megtalálni az átlagos magasságot, akkor egy eredménycsoportot kap az átlag (átlag) érték körül, és a szórás leírja a klaszter szélességét és a magasság eloszlását a népesség között.
A „minta” szórás becsüli a teljes populáció valódi szórását a populációból származó kis minta alapján. Leggyakrabban nem lesz képes a mintavételre a szóban forgó teljes populációból, tehát a minta szórása gyakran a megfelelő verzió.
A minta szórásának megállapítása
Szüksége van az eredményekre és a számra (n) a mintában szereplő emberek száma. Először számolja ki az eredmények átlagát (μ) az összes egyedi eredmény összegzésével, majd a mérések számával történő elosztásával.
Például öt férfi és öt nő pulzusszámát (percenként ütemben):
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
A következő átlaghoz vezet:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
A következő lépés az, hogy az egyes mérésekből kivonjuk az átlagot, majd négyzet alakúvá tesszük az eredményt. Például az első adatponthoz:
(71 – 70.2)2 = 0.82 = 0.64
És a második:
(83 – 70.2)2 = 12.82 = 163.84
Ezen a módon folytatja az adatokat, majd összeadja ezeket az eredményeket. Tehát a példaadatokhoz ezen értékek összege:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
A következő szakasz különbséget tesz a minta szórása és a populáció szórása között. A minta eltérése esetén ezt az eredményt el kell osztani a minta méretével mínusz egy (n -1). Példánkban n = 10, tehát n – 1 = 9.
Ez az eredmény a minta szórását adja meg, jelölve: s2, amely például:
s2 = 353.6 ÷ 9 = 39.289
A minta szórása (s) csak a szám pozitív négyzetgyöke:
s = √39.289 = 6.268
Ha a népesség szórását (σ) az egyetlen különbség az, hogy osztja el n inkább mint n −1.
A minta szórásának teljes képlete a Σ összegző szimbólum segítségével fejezhető ki, az összeg az egész mintára vonatkoztatva, és xén képviselő Az első eredmény a _n. A minta szórása:
s2 = (Σ xén – μ)2 / (n − 1)
És a minta szórása egyszerűen:
s = √s2
Átlagos eltérés vs. standard eltérés
Az átlagos eltérés kissé eltér a standard eltéréstől. A középérték és az egyes értékek közötti különbség elosztása helyett inkább az abszolút különbséget veszi figyelembe (figyelmen kívül hagyva a mínuszjeleket), majd megkapja az átlagot. Az előző szakaszban szereplő példához az első és a második adatpont (71 és 83) a következőt adja:
x1 – μ = 71 – 70.2 = 0.8
x2 – μ = 83 – 70.2 = 12.8
A harmadik adatpont negatív eredményt ad
x3 – μ = 63 – 70.2 = −7.2
De el kell távolítani a mínuszjelet, és ezt 7.2-nek kell venni.
Mindezek összegét osztjuk el osztva n az átlagos eltérést adja meg. A példában:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
Ez lényegesen különbözik a korábban kiszámított szórástól, mivel nem tartalmaz négyzeteket és gyökereket.