Tartalom
Egyszerűsítse a számkészletek, különösen a nagy számkészletek összehasonlítását, a középérték, az üzemmód és a medián segítségével kiszámítva a középértékeket. Az adatok változékonyságának vizsgálatához használja a halmazokat és a standard eltéréseket.
Átlag kiszámítása
Az átlag a számkészlet átlagos értékét jelöli. Például vegye figyelembe a 20, 24, 25, 36, 25, 22, 23 értékeket tartalmazó adatkészletet.
A középérték megállapításához használja a következő képletet: Átlag: egyenlő az adatkészletben szereplő számok összegével és az adatkészletben szereplő értékek számával. Matematikai szempontból: Mean = (az összes kifejezés összege) ÷ (hány kifejezés vagy érték a készletben).
Adja hozzá a számokat a példa adatkészlethez: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Ossza el az adatpontok számával a készletben. Ennek a készletnek hét értéke van, tehát ossza el 7-el.
Helyezze be az értékeket a képletbe az átlag kiszámításához. Az átlag megegyezik az értékek (175) összegével, elosztva az adatpontok számával (7). 175 ÷ 7 = 25 óta ezen adatkészlet átlaga egyenlő 25. Nem minden átlagérték egyenlő egy egész számmal.
A medián kiszámítása
A medián azonosítja a számkészlet középpontját vagy középső értékét.
Helyezze a számokat a legkisebbtől a legnagyobbig. Használja a példaérték-készletet: 20, 24, 25, 36, 25, 22, 23. Rendezés szerint a készlet értéke 20, 22, 23, 24, 25, 25, 36.
Mivel ennek a számkészletnek hét értéke van, a középső érték vagy a középső érték 24.
Ha a számkészletnek páros számú értéke van, akkor számítsa ki a két középső érték átlagát. Tegyük fel például, hogy a számkészlet a 22, 23, 25, 26 értékeket tartalmazza. A középső 23 és 25 között helyezkedik el. A 23 és 25 összeadásával kapjuk a 48 értéket. Ha a 48-at kettőre osztjuk, a medián értéke 24.
Számítási mód
Az üzemmód meghatározza az adatkészlet leggyakoribb értékét vagy értékeit. Az adatoktól függően lehet egy vagy több üzemmód, vagy egyáltalán nincs üzemmód.
A medián megkereséséhez hasonlóan rendezze az adatkészletet a legkisebbtől a legnagyobbig. A példában a rendezett értékek 20, 22, 23, 24, 25, 25, 36 lesznek.
Üzemmód akkor fordul elő, amikor az értékek ismétlődnek. A példában a 25 érték kétszer fordul elő. Más szám nem ismétlődik. Ezért az üzemmód értéke 25.
Egyes adatkészleteknél egynél több üzemmód fordul elő. A 22., 23., 23., 24., 27., 27., 29. adatkészlet két üzemmódot tartalmaz, egy-egy 23 és 27-nél. Más adatkészleteknek lehetnek kettőnél több módjai is, lehetnek kettőnél több számmal rendelkező módok is (mint 23., 23.) , 24, 24, 24, 28, 29: üzemmód megegyezik a 24-ös), vagy lehet, hogy egyáltalán nincs üzemmódja (21, 23, 24, 25, 26, 27, 29). Az üzemmód az adatkészletben bárhol megtörténhet, nem csak a közepén.
A tartomány kiszámítása
A tartomány mutatja az adatkészlet legalacsonyabb és legmagasabb értékei közötti matematikai távolságot. A tartomány az adatkészlet változékonyságát méri. Széles kör jelzi az adatok nagyobb variabilitását, vagy esetleg egyetlen, a többi adattól távol eső különbséget. A távoli értékek eltorzíthatják vagy eltolhatják az átlagértéket ahhoz, hogy befolyásolja az adatok elemzését.
A mintacsoportban a legalacsonyabb érték 20, a legmagasabb pedig 36.
A tartomány kiszámításához vonjuk le a legkisebb értéket a legmagasabb értékből. 36-20 = 16 óta a tartomány megegyezik a 16-nal.
A mintakészletben a 36 magas adatérték 11-rel meghaladja az előző 25-öt, ez az érték szélsőségesnek tűnik, figyelembe véve a készlet többi értékét. A 36 érték lehet egy külső adatpont.
A szórás kiszámítása
A szórás az adathalmaz változékonyságát méri. A tartományhoz hasonlóan egy kisebb szórás is jelzi a kisebb variabilitást.
A szórás megtalálásához az egyes adatpontok és az átlag közötti négyzetkülönbség összeadása szükséges, az összes négyzet összeadódik, az összeget el kell osztani az értéknél kevesebbel (N-1), és végül ki kell számolni az osztalék négyzetgyökét. Matematikailag kezdje az átlag kiszámításával.
Számítsa ki az átlagot az összes adatpontérték összeadásával, majd osztva az adatpontok számával. A minta adatkészletben 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Osszuk el a 175 összeget az adatpontok számával, 7 vagy 175 ÷ 7 = 25. Az átlag 25-gyel egyenlő.
Ezután vonja le az átlagot az egyes adatpontokból, majd négyzetbe foglalja az egyes különbségeket. A képlet így néz ki: ∑ (x-µ)2, ahol ∑ jelent összeg, x jelöli az egyes adatkészletek értékeit, és µ jelenti az átlagértéket. A példakészlettel folytatva az értékek: 20-25 = -5 és -52= 25; 24-25 = -1 és -12= 1; 25-25 = 0 és 02= 0; 36-25 = 11 és 112= 121; 25-25 = 0 és 02= 0; 22-25 = -3 és -32= 9; és 23-25 = -2 és -22=4.
A négyzetkülönbségek hozzáadásával hozamok: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Ossza el a négyzetkülönbségek összegét kevesebbel, mint az adatpontok száma. A példa adatkészletnek 7 értéke van, tehát N-1 egyenlő 7-1 = 6-tal. A négyzet különbségek, 160, osztva 6-tal, összege körülbelül 26,6667.
Számítsa ki a szórást úgy, hogy megtalálja az N-1 eloszlás négyzetgyökét. A példában a 26.6667 négyzetgyöke megközelítőleg 5.164-tel egyenlő. Ezért a szórás megközelítőleg 5,164.
A szórás segít az adatok értékelésében. Az adathalmaz azon számai, amelyek az átlag egy szórása alá esnek, az adatkészlet részét képezik. A két szóráson kívül eső számok extrém értékek vagy túllépések. A példakészletben a 36 érték több, mint kettőnél nagyobb standard eltérést mutat az átlagtól, tehát a 36 egy külső érték. A távoli adatok hibás adatokat képviselhetnek, vagy előre nem látható körülményekre utalhatnak, és ezeket az adatok értelmezésekor gondosan figyelembe kell venni.