Tartalom
- Véletlenszerű mintavétel
- Pontosság
- Bizalmi intervallumok
- Szabványos hiba
- Nehézségek a nagyobb mintaszámok használatában
A minta mérete a statisztikai elemzés elvégzéséhez elvégzett megfigyelések számát jelenti. A minták mérete emberekből, állatokból, élelmiszer-tételekből, gépekből, elemekből vagy bármilyen más populációból áll.
Véletlenszerű mintavétel
A véletlenszerű mintavétel olyan módszer, amellyel véletlenszerű mintákat vesznek a populációból, hogy a népességre vonatkozó információkat torzítás nélkül becsüljék meg. Például, ha azt akarja tudni, hogy milyen típusú emberek élnek egy adott városban, véletlenszerűen kell interjút készítenie / mérnie a különböző embereket. Ha azonban mindenkit a könyvtárból használna, akkor nem lenne tisztességes / elfogulatlan becslése arról, hogy milyen a lakosság, amely a város elfoglalja, csak az emberek, akik a könyvtárba járnak.
Pontosság
A minták méretének növekedésével a becslések pontosabbak lesznek. Például, ha véletlenszerűen választunk ki 10 hím felnőtt embert, akkor az átlagos magasságuk 6 láb és 3 hüvelyk közötti lehet, talán azért, mert van egy kosárlabda játékos, amely felfújja becslésünket. Ha azonban kétmillió felnőtt férfi embert mérnénk, akkor jobban megjósolhatnánk a férfiak átlagos magasságát, mert a szélsőségek kiegyensúlyozódnának, és az igazi átlag elhomályosítaná az átlagtól való bármely eltérést.
Bizalmi intervallumok
Amikor a statisztikus előrejelzést készít az eredményről, gyakran egy intervallumot épít a becslés körül. Például, ha megmérjük 100 nő súlyát, akkor azt mondhatjuk, hogy 90 százalékkal biztosak vagyunk abban, hogy a nők valódi átlagos súlya 103–129 font közötti. (Ez természetesen más tényezőktől is függ, például a mérések változékonyságát is.) A minták méretének növekedésével magabiztosabbak leszünk becslésünkben, és intervallumunk kisebb lesz. Például egy millió nővel azt mondhatjuk, hogy 98 százalékkal bízunk abban, hogy a nők valódi átlagos súlya 115 és 117 font között van. Más szavakkal, ahogy a minta mérete növekszik, növekszik a bizalom méréseinkben és csökken a bizalmi intervallumok mérete.
Szabványos hiba
A variáció az adatok átlag körüli eloszlásának mértéke. A szórás a variáció négyzetgyöke, és segít megbecsülni, hogy a népesség hány százaléka esik az értéktartomány közé az átlaghoz viszonyítva. A minta méretének növekedésével a standard hiba, amely a szórástól és a minta méretétől függ, csökken. Következésképpen a becslések pontosságának növekedése és az ezen becsléseken alapuló kutatás megbízhatóbbnak tekinthető (kevesebb hibakockázattal).
Nehézségek a nagyobb mintaszámok használatában
A nagyobb mintaszám nyilvánvalóan jobb, pontosabb becslést eredményez a populációk vonatkozásában, de számos probléma merül fel a nagyobb mintát alkalmazó kutatókkal. Először is, nehéz lehet véletlenszerű mintát találni azokról az emberekről, akik hajlandóak kipróbálni egy új drogot. Ha ezt teszi, költségesebbé válik a drog több ember számára történő biztosítása, és az idő múlásával több ember figyelemmel kísérése. Ezenkívül több erőfeszítést igényel a nagyobb mintaszám megszerzése és fenntartása. Még akkor is, ha a nagyobb méretű minták pontosabb statisztikákat szolgáltatnak, a többletköltségekre és erőfeszítésekre nem mindig van szükség, mivel a kisebb minták jelentős eredményeket is eredményezhetnek.