Hogyan számolhatom az interkvartilis tartományt?

Posted on
Szerző: Monica Porter
A Teremtés Dátuma: 22 Március 2021
Frissítés Dátuma: 17 Lehet 2024
Anonim
Hogyan számolhatom az interkvartilis tartományt? - Tudomány
Hogyan számolhatom az interkvartilis tartományt? - Tudomány

Tartalom

Az interkvartilis tartomány, amelyet gyakran IQR-ként rövidítenek, az adott adatkészlet 25. százalékától a 75. percentilléig vagy a középső 50 százalékig terjedő tartományt képviseli. Az interkvartilis tartomány felhasználható annak meghatározására, hogy egy teszt átlagos teljesítménytartománya lenne: Használhatja azt, hogy megnézze, hol esik a legtöbb nép egy adott tesztre, vagy meghatározza, mennyi pénzt keres egy hónapban egy vállalat átlagos alkalmazottja. . Az interkvartilis tartomány az adat elemzésének hatékonyabb eszköze lehet, mint az adathalmaz átlaga vagy mediánja, mivel ez lehetővé teszi a szórási tartomány meghatározását, nem pedig egyetlen számot.


TL; DR (túl hosszú; nem olvastam)

Az interkvartilis tartomány (IQR) az adatkészlet középső 50 százalékát képviseli. Ennek kiszámításához először rendezze meg az adatpontját a legkisebbtől a legnagyobbig, majd az (N + 1) / 4 és a 3 * (N + 1) / 4 képletek segítségével határozza meg az első és a harmadik kvartilis helyzetét, ahol N a szám pont az adatkészletben. Végül vonjuk le az első kvartilust a harmadik kvartilisből, hogy meghatározzuk az adatkészlet interkvartilis tartományát.

Rendeljen adatpontokat

Az interkvartilis tartomány kiszámítása egyszerű feladat, de a kiszámítás előtt el kell rendeznie az adatkészlet különböző pontjait. Ehhez először olvassa el az adatpontokat a legkevesebbtől a legnagyobbig. Például, ha az adatpontja 10, 19, 8, 4, 9, 12, 15, 11 és 20, akkor ezeket átrendezheti: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Amint az adatpontjait ilyen módon rendezték, akkor léphet a következő lépésre.


Határozza meg az első kvartilis pozíciót

Ezután határozza meg az első kvartilis helyzetét a következő képlet segítségével: (N + 1) / 4, ahol N az adatkészletben szereplő pontok száma. Ha az első kvartilis két szám közé esik, akkor az első kvartilis pontszáma a két szám átlaga. A fenti példában, mivel kilenc adatpont van, 1-től 9-ig adhat hozzá 10-et, majd osztja meg 4-rel, hogy 2,5-et kapjon. Mivel az első kvartilis a második és a harmadik érték közé esik, akkor 8 és 9 átlagát kapná, amikor az első kvartilis pozíciója 8,5 lesz.

Határozza meg a harmadik kvartilis pozíciót

Az első kvartilis meghatározása után határozza meg a harmadik kvartilis helyzetét a következő képlet segítségével: 3 * (N + 1) / 4, ahol N ismét az adatkészletben szereplő pontok száma. Hasonlóképpen, ha a harmadik kvartilis két szám közé esik, akkor egyszerűen vegye figyelembe az átlagot, mint ahogyan az első kvartilis pontszámot kiszámítja. A fenti példában, mivel kilenc adatpont van, 1-től 9-ig adhat hozzá 10-et, 10-gyel megszorozzuk, hogy 30-at kapjon, majd 4-el osztja, hogy 7,5-et kapjon. Mivel az első kvartilis a hetedik és a nyolcadik érték közé esik, akkor a 15 és 19 átlagát veszi fel, hogy egy harmadik kvartilis pontszámot 17-re kapjon.


Számítsa ki az interkvartilis tartományt

Miután meghatározta az első és a harmadik kvartilét, számolja ki az intervartilis tartományt úgy, hogy kivonja az első kvartilis értékét a harmadik kvartilis értékéből. A cikk során felhasznált példa befejezéséhez kivonjuk a 8.5 értéket a 17-ből, és megállapíthatjuk, hogy az adatkészlet interkvartilis tartománya 8,5.

Az IQR előnyei és hátrányai

Az interkvartilis tartomány előnye, hogy képes azonosítani és kiküszöbölni az eltolódásokat az adatkészlet mindkét végén. Az IQR szintén jó mérési eredménye a ferde adat eloszlás esetén, és az IQR kiszámításának ez a módszere csoportosított adatkészletek esetében is használható, mindaddig, amíg kumulatív frekvenciaeloszlást használ az adatpontok rendezéséhez. A csoportosított adatok intervartilis tartományának képlete megegyezik a nem csoportosított adatokkal, az IQR egyenlő az első kvartilis értékével, kivonva a harmadik kvartilis értékéből. Ennek azonban számos hátránya van a szóráshoz képest: kevésbé érzékeny néhány szélsőséges pontszámra és a mintavételi stabilitás nem olyan erős, mint a szórás.