Kaj je Homoskedastično?
Homoskedastično (napisano tudi "homoscedastic") se nanaša na stanje, v katerem je variacija preostalega ali napačnega izraza v regresijskem modelu konstantna. To pomeni, da se izraz napake ne razlikuje veliko, saj se spreminja vrednost spremenljivke napovedovalca. Vendar lahko pomanjkanje homoskedastičnosti kaže na to, da bo regresijski model morda moral vključevati dodatne spremenljivke napovedovalca, da bi razložil uspešnost odvisne spremenljivke.
Ključni odvzemi
- Homoskedastičnost se pojavi, kadar je variacija izraza napake v regresijskem modelu konstantna. Če je variacija izraza napake homoskedastična, je bil model dobro opredeljen. Če je odstopanja preveč, model morda ni dobro opredeljen. Dodajanje dodatnih spremenljivk napovedovalca lahko pomaga razložiti uspešnost odvisne spremenljivke. Heteroskedastičnost se pojavlja, kadar odstopanje izraza napake ni konstantno.
Kako deluje homoskedastično
Homoskedastičnost je ena predpostavka modeliranja linearne regresije. Če se odstopanje napak okoli regresijske črte močno razlikuje, je regresijski model lahko slabo definiran. Nasprotno od homoskedastičnosti je heteroskedastičnost, tako kot je nasprotje "homogeni" "heterogeno". Heteroskedastičnost (imenovana tudi „heteroscedastičnost“) se nanaša na stanje, pri katerem variacija izraza napake v regresijski enačbi ni konstantna.
Če upoštevamo, da je odstopanje izmerjena razlika med predvidenim izidom in dejanskim izidom dane situacije, lahko določitev homoskedastičnosti pomaga ugotoviti, katere dejavnike je treba prilagoditi za natančnost.
Posebna vprašanja
Preprost regresijski model ali enačba je sestavljena iz štirih pojmov. Na levi strani je odvisna spremenljivka. Predstavlja pojav, ki ga model želi "razložiti." Na desni strani sta stalnica, spremenljivka napovedovalca in izraz preostanek ali napaka. Izraz napake prikazuje količino spremenljivosti v odvisni spremenljivki, ki je ni pojasnjena s spremenljivko napovedovalca.
Primer homoskedastike
Recimo, da ste želeli razložiti ocene študentskih testov s časom, ki ga je vsak študent preživel v študiju. V tem primeru bi bili rezultati preskusov odvisna spremenljivka, čas, porabljen za študij, pa bi bil spremenljivka napovedovalca.
Izraz napake bi pokazal količino odstopanja v rezultatih testov, ki ga ni razložil čas študija. Če je ta odstopanje enotna ali homoskedastična, potem bi to lahko nakazovalo, da je model ustrezna razlaga za uspešnost preizkusa - razloži ga glede na čas, porabljen za študij.
Toda varianta je lahko heteroskedastična. Pregled podatkov o napačnem terminu lahko pokaže, da je veliko časa študija zelo ustrezalo visokim rezultatom testa, vendar so se rezultati nizkega preskusnega časa zelo razlikovali in vključevali tudi nekatere zelo visoke ocene. Torej variacije rezultatov ne bi dobro razložili zgolj ena spremenljivka napovedovalca - čas študija. V tem primeru je verjetno še kakšen dejavnik, zato bo morda treba izboljšati model, da ga prepoznamo. Nadaljnja preiskava lahko razkrije, da so nekateri študenti videli odgovore na preizkus pred časom ali da so že predhodno opravili podoben test, zato jim ni bilo treba izučiti tega posebnega testa.
Za izboljšanje regresijskega modela bi raziskovalec zato dodal še eno razlagalno spremenljivko, ki kaže, ali je študent odgovore videl pred preskusom. Regresijski model bi imel dve razlagalni spremenljivki - čas študija in ali je študent predhodno vedel za odgovore. S tema dvema spremenljivkama bi bilo treba razložiti več variance testnih rezultatov in varianta izraza napake bi bila potem homoskedastična, kar kaže na to, da je bil model dobro opredeljen.
