Kaj je četverica?
Četverica je statistični izraz, ki opisuje delitev opazovanj v štiri definirane intervale na podlagi vrednosti podatkov in njihove primerjave s celotnim nizom opazovanj.
Razumevanje kvartilov
Za razumevanje kvartila je pomembno razumeti mediano kot merilo osrednje težnje. Mediana v statistiki je srednja vrednost niza števil. To je točka, na kateri točno polovica podatkov leži pod in nad osrednjo vrednostjo.
Torej, glede na niz 13 števil, bi bila mediana sedma številka. Šest številk pred to vrednostjo je najnižje število v podatkih, šest številk po mediani pa največja števila v danem nizu podatkov. Ker na mediano ne vplivajo skrajne vrednosti ali odbitki pri porazdelitvi, je včasih prednostna srednja vrednost.
Mediana je zanesljiv ocenjevalec lokacije, vendar ne pove ničesar o tem, kako se podatki na obeh straneh njene vrednosti širijo ali razpršijo. Tukaj se stopi kvartil. Četverica meri širjenje vrednosti nad in pod sredino, tako da razdeli porazdelitev na štiri skupine.
Ključni odvzemi
- Kvatil meri širjenje vrednosti nad in pod sredino tako, da razdeli porazdelitev v štiri skupine. Četverica razdeli podatke v tri točke - spodnji kvartil, srednji in zgornji kvartil - da tvorijo štiri skupine podatkovnega sklopa. Uporabljajo se kvartili za izračun interkvartilnega razpona, ki je merilo spremenljivosti okoli mediane.
Kako delujejo kvartili
Tako kot srednja razdeli podatke na polovico, tako da 50% meritve leži pod mediano in 50% leži nad njo, četverica podatke razdeli na četrtine, tako da je 25% meritve manj od spodnje četrtine, 50 % je manj od povprečja, 75% pa manj kot zgornji kvartil.
Četverica podatke razdeli na tri točke - spodnji kvartil, srednji in zgornji kvartil, da tvorijo štiri skupine podatkovnega niza. Spodnji kvartil ali prvi kvartil je označen kot Q1 in je srednja številka, ki pade med najmanjšo vrednost nabora podatkov in mediano. Drugi kvartil, Q2, je prav tako mediana. Zgornja ali tretja četrtina, označena kot Q3, je osrednja točka, ki leži med srednjim in najvišjim številom porazdelitve.
Zdaj lahko preslikamo štiri skupine, oblikovane iz kvartilov. Prva skupina vrednosti vsebuje najmanjše število do Q1; druga skupina vključuje Q1 do mediane; tretji niz je srednja do Q3; četrta kategorija obsega Q3 do najvišje podatkovne točke celotnega niza.
Vsak kvartil vsebuje 25% skupnih opazovanj. Na splošno so podatki razporejeni od najmanjših do največjih:
- Prvi kvartil: najnižje 25% številk Drugi kvartil: med 25, 1% in 50% (do mediane) Tretji kvartil: 51% do 75% (nad mediano) Četrti kvartil: največ 25% številk
Četrtinski primer
Delajmo s primerom. Recimo, da je razdelitev matematičnih točk v razredu 19 učencev po naraščajočem vrstnem redu:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Najprej označite srednjo vrednost Q2, ki je v tem primeru deseta vrednost: 75.
Q1 je osrednja točka med najmanjšo oceno in mediano. V tem primeru Q1 spada med prvo in peto oceno: 68.
Q3 je srednja vrednost med Q2 in najvišjo oceno: 84.
Zdaj, ko imamo svoje kvartile, razložimo njihovo število. Rezultat 68 (Q1) predstavlja prvo četrtino in je 25. pertiletil. 68 je mediana spodnje polovice ocene, ki je določena v razpoložljivih podatkih, tj. Mediana točk od 59 do 75.
Q1 nam pove, da je 25% ocen manj kot 68 in 75% ocen v razredu večje. Q2 (mediana) je 50. odstotki in kaže, da je 50% rezultatov manj kot 75, 50% rezultatov pa je nad 75. Končno, Q3, 75. kazalnik, razkrije, da je 25% ocen večji in 75% manj kot 84.
Posebna vprašanja
Če je podatkovna točka za Q1 dlje od mediane, kot je Q3 od mediane, potem lahko rečemo, da je med manjšimi vrednostmi nabora podatkov večja disperzija kot med večjimi vrednostmi. Enaka logika velja, če je Q3 dlje od Q2, kot je Q1 od mediane.
Če obstaja celo število podatkovnih točk, bo mediana povprečje srednjih dveh števil. V našem zgornjem primeru, če bi imeli 20 učencev namesto 19, bo srednja njihova ocena aritmetično povprečje desetega in enajstega števila.
Kvatile se uporabljajo za izračun interkvartilnega obsega, ki je merilo spremenljivosti okoli mediane. Interkvartilni razpon preprosto izračunamo kot razliko med prvim in tretjim kvartilom: Q3 - Q1. V resnici je razpon srednje polovice podatkov tisti, ki prikazuje, kako razširjeni so podatki.
Za velike nabore podatkov ima Microsoft Excel funkcijo QUARTILE za izračun kvartilov.
