Tartalom
- TL; DR (túl hosszú; nem olvastam)
- A különbség a bizalom szintje és a bizalom intervalluma között
- A megbízhatósági intervallumok vagy szintek kiszámítása nagy minták esetén
- A megbízhatósági intervallumok kiszámítása kis minták esetén
A statisztikák arra vonatkoznak, hogy következtetéseket vonnak le a bizonytalansággal szemben. Bármikor mintát vesz, nem lehet teljesen biztos abban, hogy a mintája valóban tükrözi a populációt, amelyből származik. A statisztikusok ezt a bizonytalanságot úgy kezelik, hogy figyelembe veszik azokat a tényezőket, amelyek befolyásolhatják a becslést, számszerűsítik bizonytalanságukat, és statisztikai teszteket végeznek e bizonytalan adatok következtetéseinek levonására.
A statisztikusok konfidencia-intervallumokkal határoznak meg egy olyan értéktartományt, amelyben valószínűleg egy „minta” alapján az „igazi” populáció átlagát tartalmazzák, és ebben bizalmi szintekkel fejezik ki a bizonyossági szintüket. Noha a konfidenciaszintek kiszámítása nem gyakran hasznos, egy adott konfidenciaszinthez a konfidencia-intervallumok kiszámítása nagyon hasznos készség.
TL; DR (túl hosszú; nem olvastam)
Számítson ki egy konfidencia intervallumot egy adott konfidenciaszintre a standard hiba szorzatával szorozva Z pontszám a választott bizalmi szintre. Vonja le ezt az eredményt a minta középértékéből, hogy megkapja az alsó korlátot, és add hozzá a minta átlagához, hogy megtalálja a felső korlátot. (Lásd a forrásokat)
Ismételje meg ugyanazt a folyamatot, de a t pontszám a Z pontszám kisebb minták esetén (n < 30).
Keressen meg egy megbízhatósági szintet egy adatkészlethez úgy, hogy a konfidencia-intervallum méretének felét elválasztja, megszorozza azt a minta méretének négyzetgyökével, majd osztja a minta szórásával. Keresse meg a kapott eredményt Z vagy t pontozás egy táblázatban, hogy megtalálja a szintet.
A különbség a bizalom szintje és a bizalom intervalluma között
Amikor lát egy idézett statisztikát, néha egy intervallum adódik utána, a „CI” rövidítéssel („konfidencia intervallum”) vagy egyszerűen egy plusz-mínusz szimbólummal, amelyet egy ábra követ. Például: „egy felnőtt férfi átlagos tömege 180 font (CI: 178,14–181,86)” vagy „egy felnőtt férfi átlagos súlya 180 ± 1,86 font.” Mindkettő ugyanazt az információt mondja el Önnek: a minta alapján Használva az ember átlagos súlya valószínűleg egy bizonyos tartományba esik. Maga a tartományt konfidencia intervallumnak nevezzük.
Ha a lehető legbiztosabbnak szeretné tudni, hogy a tartomány a valós értéket tartalmazza, akkor kibővítheti a tartományt. Ez növeli a „bizalom szintjét” a becslésben, de a tartomány nagyobb potenciális súlyokat fed le. A legtöbb statisztika (beleértve a fent idézett statisztikát is) 95% -os konfidencia intervallumban van megadva, ami azt jelenti, hogy 95% esély van arra, hogy a valódi átlagérték a tartományon belül legyen. Használhat 99% -os vagy 90% -os megbízhatósági szintet is, igényeinek függvényében.
A megbízhatósági intervallumok vagy szintek kiszámítása nagy minták esetén
Amikor a konfidenciaszintet használja a statisztikákban, akkor általában szüksége van rá a konfidencia intervallum kiszámításához. Ez egy kicsit könnyebb megtenni, ha nagy mintája van, például több mint 30 ember, mert használhatja Z pontszám a becslés helyett bonyolultabb t pontszámok.
Vegye ki a nyers adatait, és kiszámolja a minta átlagát (egyszerűen csak összeadja az egyes eredményeket, és ossza meg az eredmények számával). Számítsa ki a szórást úgy, hogy kivonja az eredményt az átlagból az egyes eredményekből, majd négyzetbe adja ezt a különbséget. Összeadja ezeket a különbségeket, majd ossza meg az eredményt a mintaméret mínusz 1-gyel. Vegye ki az eredmény négyzetgyökét a minta szórásának meghatározásához (lásd a forrásokat).
A megbízhatósági intervallum meghatározásával először meg kell határoznia a standard hibát:
SE = s / √n
Ahol s a mintája szórása és n a minta mérete. Például, ha 1000 férfiből vett mintát, hogy kiszámítsa egy férfi átlagos tömegét, és 30 mintadarab szórást kapjon:
SE = 30 / √1000 = 30 / 31.62 = 0.95
Ebből a megbízhatósági intervallum megállapításához keresse meg azt a konfidenciaszintet, amelyben a intervallumot kiszámítani szeretné Z-score tábla, és szorozza ezt az értéket a Z pontszám. 95 százalékos megbízhatósági szint mellett a Z-értéke 1,96. A példát használva ez azt jelenti:
Átlag ± Z × SE= 180 font ± 1,96 × 0,95 = 180 ± 1,86 font
Itt ± 1,86 font a 95 százalékos megbízhatósági intervallum.
Ha inkább ilyen információval rendelkezik, a minta méretével és a szórással együtt, akkor a következő képlet segítségével kiszámíthatja a megbízhatósági szintet:
Z = 0,5 × a konfidencia intervallum mérete × √n / s
A konfidencia-intervallum mérete csak ± kétszerese a ± értéknek, tehát a fenti példában tudjuk, hogy ez 0,5-szeres, ez 1,86. Ez adja:
Z = 1.86 × √1000 / 30 = 1.96
Ez értéket ad nekünk Z, amelyet felnézhet a Z-pontú táblázat a megfelelő konfidenciaszint megtalálásához.
A megbízhatósági intervallumok kiszámítása kis minták esetén
Kis minták esetében a konfidencia-intervallum kiszámításához hasonló eljárás létezik. Először vonjon le 1-et a minta méretéből, hogy megtalálja a „szabadság fokát”. Szimbólumokban:
df = n −1
A mintához n = 10, ez adja df = 9.
Keresse meg az alfa-értéket úgy, hogy kivonja a konfidenciaszint decimális verzióját (azaz a százalékos megbízhatósági szintet osztva 100-val) az 1-ből, és elosztja az eredményt 2-rel, vagy szimbólumokkal:
α = (1 - tizedes megbízhatósági szint) / 2
Tehát egy 95 százalékos (0,95) konfidenciaszintnél:
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Keresse meg az alfa-értékét és a szabadság fokát (egy farokban) t elosztási táblázat és jegyezze fel az eredményt. Alternatív megoldásként hagyja ki a fenti 2-es elosztást, és használjon egy két farkot t érték. Ebben a példában az eredmény 2,226.
Mint az előző lépésben, számítsa ki a konfidencia-intervallumot úgy, hogy megszorozza ezt a számot a standard hibával, amelyet a minta szórása és a minta mérete azonos módon határoz meg. Az egyetlen különbség az, hogy a Z pontszám, akkor használja a t pontszám.