Kaj je lažna korelacija
V statistiki se lažna korelacija ali lažno povezovanje nanaša na povezavo med dvema spremenljivkama, ki se zdi vzročna, vendar ni. Lažni odnosi imajo pogosto videz ene spremenljivke, ki vpliva na drugo. To lažno korelacijo pogosto povzroči tretji dejavnik, ki se med pregledom ne kaže, včasih ga imenujemo zmeden dejavnik.
Ključni odvzemi
- Lažna korelacija ali napačnost je, kadar sta dva dejavnika naključno povezana, vendar nista. Pojav vzročne zveze je pogosto posledica podobnega gibanja na grafikonu, ki se izkaže za naključnega ali ga povzroči tretji "zmeden" dejavnik. Lažna korelacija lahko pogosto povzročijo majhne velikosti vzorcev ali poljubne končne točke.
Kako deluje lažna korelacija
Ko dve naključni spremenljivki tesno sledita drug drugemu na grafu, je mogoče zlahka sumiti na korelacijo ali razmerje med obema dejavnikoma, kadar sprememba vpliva na drugega. Če odložimo drugo temo, lahko to opazovanje bralca grafikona prepriča, da je gibanje spremenljivke A povezano z gibanjem v spremenljivki B ali obratno. včasih pa so po natančnejšem statističnem pregledu poravnana gibanja naključna ali jih povzroči tretji dejavnik, ki vpliva na prva dva. To je lažna korelacija. Raziskave z majhnimi velikostmi vzorcev ali poljubnimi končnimi točkami so posebnosti, dovzetne za lažljivost.
Primer lažnih korelacij
Odkrivati zanimive korelacije ni preveč zahtevno. Vendar se bo marsikdo izkazal za lažnega. Za moško vrsto na Wall Streetu dva priljubljena lažna razmerja vključujejo ženske in šport. V dvajsetih letih 20. stoletja je teorija dolžine krila, ki drži, da so dolžine krila in smer borze korelirane. Če so dolžine krila dolge, to pomeni, da borza propada; če so kratki, trg gre navzgor. Konec januarja se govori o tako imenovanem kazalcu Super Bowl, kar kaže na to, da zmaga ekipe AFC verjetno pomeni, da bo borza v prihodnjem letu padla, medtem ko zmaga ekipe NFC pomeni povečanje vrednosti trg. Od leta 1966 ima kazalnik natančnost 80%. To je zabaven kos pogovorov, vendar verjetno ne nekaj, kar bi resni finančni svetovalec priporočil kot naložbeno strategijo za stranke.
Tu je še nekaj primerov pogostih lažnih korelacij:
- Utopitve se povečajo, ko se poveča prodaja sladoleda. Morda se zdi, da povečana prodaja sladoleda povzroči več utopitve, v resnici pa lahko naraščajoča vročina več ljudi plava in kupuje več sladoleda. Stopnja umorov v ZDA v obdobju 2006–2011 se je znižala z enako hitrostjo kot Microsoft Internet Explorer Uporaba. Izvršitelji, ki rečejo prosim in hvala pogosteje uživajo v boljši skupni uspešnosti. Ljudje, ki nosijo orodje Oakland Raiders, imajo večjo verjetnost za kazniva dejanja.
Kako opaziti lažne korelacije
Statistiki in drugi znanstveniki, ki analizirajo podatke, morajo biti ves čas pozorni na lažne odnose. Obstajajo številne metode, ki jih uporabljajo, vključno z:
- Zagotavljanje ustreznega reprezentativnega vzorca. Pridobitev ustrezne velikosti vzorca. Pazite na poljubne končne točke. Nadzor za čim več zunanjih spremenljivk. Uporaba ničelne hipoteze in preverjanje močne p-vrednosti.
