Kaj je postopna regresija?
Regresijska analiza je široko uporabljen statistični pristop, ki poskuša ugotoviti povezavo med spremenljivkami. Ideja je združiti ustrezne podatke za sprejemanje bolj informiranih odločitev in je običajna praksa v svetu vlaganj. Postopna regresija je korak za korakom iterativna konstrukcija regresijskega modela, ki vključuje samodejno izbiro neodvisnih spremenljivk. Razpoložljivost statističnih programskih paketov omogoča postopno regresijo, tudi pri modelih z več sto spremenljivkami.
Vrste postopne regresije
Osnovni cilj postopne regresije je z vrsto testov (F-testi, t-testi) najti nabor neodvisnih spremenljivk, ki pomembno vplivajo na odvisno spremenljivko. To se zgodi z računalniki z iteracijo, ki je postopek za dosego rezultatov ali odločitev s ponavljanjem krogov ali ciklov analize. Avtomatsko izvajanje testov s pomočjo statističnih programskih paketov ima prednost, da lahko posameznik prihrani čas.
Ključni odvzemi
- Regresijska analiza je statistični pristop, ki želi razumeti in izmeriti razmerja med neodvisnimi in odvisnimi spremenljivkami. Stopnična regresija je metoda, ki preuči statistični pomen vsake neodvisne spremenljivke znotraj modela. Pristop za izbiro naprej doda spremenljivko in nato preskusi statistični pomen.Način za odpravo nazaj se začne z modelom, napolnjenim s številnimi spremenljivkami, nato pa odstrani eno spremenljivko, da preveri njeno pomembnost glede na splošne rezultate. Regresija v koraku ima veliko kritik, saj se s pristopom vdelajo podatki v model, da se doseže želeni rezultat.
Postopno regresijo lahko dosežemo tako, da hkrati preizkusimo eno neodvisno spremenljivko in jo vključimo v regresijski model, če je statistično pomembna, ali z vključitvijo vseh potencialnih neodvisnih spremenljivk v model in odpravo tistih, ki niso statistično pomembne. Nekateri uporabljajo kombinacijo obeh metod in zato obstajajo trije pristopi k postopni regresiji:
- Izbira naprej se začne brez spremenljivk v modelu, preizkusi vsako spremenljivko, ko je dodana v model, nato obdrži tiste, ki se jim zdijo statistično najpomembnejše - postopek ponavlja, dokler rezultati niso optimalni. Odprava naprej se začne z naborom neodvisnih spremenljivk, brisanje posamezne, nato preizkusite, ali je odstranjena spremenljivka statistično pomembna. Dvosmerna eliminacija je kombinacija prvih dveh metod, ki preizkuša, katere spremenljivke je treba vključiti ali izključiti.
Primer postopne regresije z uporabo metode odstranjevanja nazaj je poskus razumevanja porabe energije v tovarni z uporabo spremenljivk, kot so čas delovanja opreme, starost opreme, velikost osebja, temperature zunaj in čas leta. Model vključuje vse spremenljivke - nato se vsaka odstrani, posamezno, da se ugotovi, kaj je najmanj statistično pomembno. Na koncu bi model lahko pokazal, da sta čas v letu in temperature najpomembnejši, kar morda kaže na to, da je največja poraba energije v tovarni največja poraba klimatske naprave.
Omejitve postopne regresije
Regresijska analiza, linearna in multivariatna, se danes v svetu naložb pogosto uporablja. Ideja je pogosto najti vzorce, ki so obstajali v preteklosti, ki bi se lahko ponovili tudi v prihodnosti. Preprosta linearna regresija bi lahko na primer v razmerju med ceno in donosom ter donosom zalog več let preučila, ali zaloge z nizkim razmerjem P / E (neodvisna spremenljivka) ponujajo višje donose (odvisna spremenljivka). Težava tega pristopa je, da se tržne razmere pogosto spreminjajo in odnosi, ki so bili v preteklosti, ne držijo nujno v sedanjosti ali prihodnosti.
Medtem pa ima postopek postopne regresije veliko kritikov in celo obstajajo pozivi, da bi metodo popolnoma prenehali uporabljati. Statistiki ugotavljajo številne pomanjkljivosti pristopa, vključno z napačnimi rezultati, prirojeno pristranskostjo samega postopka in potrebo po pomembni računalniški moči za razvoj kompleksnih regresijskih modelov s pomočjo iteracije.
