Kaj je večkratna linearna regresija - MLR?
Večkratna linearna regresija (MLR), znana tudi kot večkratna regresija, je statistična tehnika, ki uporablja več pojasnjevalnih spremenljivk za napovedovanje izida spremenljivke odziva. Cilj večkratne linearne regresije (MLR) je modelirati linearno razmerje med pojasnjevalnimi (neodvisnimi) spremenljivkami in odzivno (odvisno) spremenljivko.
V bistvu je večkratna regresija podaljšek navadne regresije najmanjših kvadratov (OLS), ki vključuje več kot eno razlagalno spremenljivko.
Formula za več linearno regresijo je
Сігналы абмеркавання Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ kjerkoli, za i = n opažanja: yi = odvisna spremenljivka = ekspanzijske spremenljivkeβ0 = y-prestrezanje (konstanta izraz) βp = koeficienti naklona za vsako pojasnjevalno spremenljivkoϵ = izraz napake modela (znan tudi kot ostanki)
Pojasnilo več linearne regresije
Preprosta linearna regresija je funkcija, ki analitiku ali statistiki omogoča napovedovanje o eni spremenljivki na podlagi informacij, ki so znane o drugi spremenljivki. Linearno regresijo lahko uporabimo le, če imamo dve neprekinjeni spremenljivki - neodvisno in odvisno spremenljivko. Neodvisna spremenljivka je parameter, ki se uporablja za izračun odvisne spremenljivke ali izida. Model večkratne regresije se razteza na več pojasnjevalnih spremenljivk.
Model večkratne regresije temelji na naslednjih predpostavkah:
- Med odvisnimi spremenljivkami in neodvisnimi spremenljivkami je linearno razmerje. Neodvisne spremenljivke niso preveč medsebojno korelirane . Moja opažanja so izbrana neodvisno in naključno iz populacije. Preostali posamezniki bi morali biti običajno razporejeni s srednjo vrednostjo 0 in odstopanjem σ
Koeficient določitve (R-kvadrat) je statistična metrika, ki se uporablja za merjenje, koliko različic izida je mogoče razložiti z variacijo neodvisnih spremenljivk. R2 se vedno poveča, saj je v model MLR dodanih več napovedovalcev, čeprav napovedovalci morda niso povezani s spremenljivko izida.
R2 sam po sebi torej ni mogoče uporabiti za določitev, kateri napovedovalci bi morali biti vključeni v model in katere je treba izključiti. R2 je lahko le med 0 in 1, pri čemer 0 pomeni, da izida ni mogoče napovedati s katero od neodvisnih spremenljivk in 1 kaže, da je izid neodvisnih spremenljivk mogoče napovedati brez napak.
Pri razlagi rezultatov večkratne regresije so beta koeficienti veljavni, medtem ko imajo ostale spremenljivke konstantne ("vse ostalo enako"). Izhod iz večkratne regresije lahko prikažemo vodoravno kot enačbo ali navpično v obliki tabele.
Primer z uporabo več linearne regresije
Na primer, analitik bo morda želel vedeti, kako gibanje trga vpliva na ceno Exxon Mobil (XOM). V tem primeru bo njegova linearna enačba imela vrednost indeksa S&P 500 kot neodvisne spremenljivke ali napovedovalca in ceno XOM kot odvisne spremenljivke.
V resnici obstaja več dejavnikov, ki napovedujejo izid dogodka. Gibanje cen Exxon Mobil je na primer odvisno od uspešnosti celotnega trga. Drugi napovedovalci, kot so cena nafte, obrestne mere in gibanje cen naftnih rokov, lahko vplivajo na ceno XOM in delniške cene drugih naftnih podjetij. Za razumevanje razmerja, v katerem sta prisotni več kot dve spremenljivki, uporabimo več linearno regresijo.
Za določitev matematičnega razmerja med več naključnimi spremenljivkami se uporablja več linearna regresija (MLR). Z drugimi besedami, MLR preuči, kako je več neodvisnih spremenljivk povezanih z eno odvisno spremenljivko. Ko je vsak neodvisni dejavnik določen za napovedovanje odvisne spremenljivke, je mogoče informacije o več spremenljivkah uporabiti za ustvarjanje natančne napovedi glede na učinek, ki ga imajo na izhodno spremenljivko. Model ustvari odnos v obliki premice (linearne), ki najbolje približa vse posamezne podatkovne točke.
Glede na zgornjo enačbo MLR v našem primeru:
- y i = odvisna spremenljivka: cena XOMx i1 = obrestne merex i2 = cena naftex i3 = vrednost S&P 500 indeksa x i4 = cena naftnih pogodbB 0 = y-prestrezanje v času ničB 1 = regresijski koeficient, ki meri spremembo enote v odvisni spremenljivka, ko se x i1 spremeni - sprememba cene XOM ob spremembi obrestnih merB 2 = vrednost koeficienta, ki meri spremembo enote v odvisni spremenljivki, ko se x x2 spremeni, - sprememba cene XOM, ko se cene nafte spremenijo
Ocene najmanjših kvadratov, B 0, B 1, B 2 … B p, običajno izračuna statistična programska oprema. V regresijski model lahko vključimo toliko spremenljivk, v katerih je vsaka neodvisna spremenljivka diferencirana s številom - 1, 2, 3, 4… p. Model večkratne regresije analitiku omogoča napovedovanje izida na podlagi informacij, podanih o več pojasnjevalnih spremenljivkah.
Kljub temu model ni vedno popolnoma natančen, saj se lahko vsaka podatkovna točka nekoliko razlikuje od rezultata, ki ga napoveduje model. Preostala vrednost, E, ki je razlika med dejanskim in predvidenim rezultatom, je vključena v model za upoštevanje tako majhnih sprememb.
Ob predpostavki, da vodimo svoj model regresije cen XOM s pomočjo programske opreme za statistiko, ki vrne ta izhod:
Analitik bi to razlago razlagal tako, da če ostanejo druge spremenljivke stalne, se bo cena XOM zvišala za 7, 8%, če se cena nafte na trgih poveča za 1%. Model tudi kaže, da se bo cena XOM znižala za 1, 5% po zvišanju obrestnih mer za 1%. R 2 kaže, da je 86, 5% nihanj cene delnic Exxon Mobil mogoče razložiti s spremembami obrestne mere, cene nafte, terminov nafte in indeksa S&P 500.
Ključni odvzemi
- Večkratna linearna regresija (MLR), znana tudi kot večkratna regresija, je statistična tehnika, ki uporablja več razlagalnih spremenljivk za napovedovanje izida spremenljivke odziva. Večkratna regresija je podaljšek linearne (OLS) regresije, ki uporablja samo eno pojasnjevalno spremenljivko. MLR se veliko uporablja pri ekonometriji in finančnih sklepih.
Razlika med linearno in večkratno regresijo
Linearna (OLS) regresija primerja odziv odvisne spremenljivke glede na spremembo neke pojasnjevalne spremenljivke. Vendar je redko, da je odvisna spremenljivka razložena le z eno spremenljivko. V tem primeru analitik uporabi več regresij, ki poskuša razložiti odvisno spremenljivko z več kot eno neodvisno spremenljivko. Več regresij je lahko linearnih in nelinearnih.
Več regresij temelji na predpostavki, da obstaja linearna povezava med odvisnimi in neodvisnimi spremenljivkami. Prav tako ne predvideva večje korelacije med neodvisnimi spremenljivkami.
