Kaj je zanemarjanje velikosti vzorca?
Zanemarjanje velikosti vzorca je kognitivna pristranskost, ki sta jo znano raziskala Amos Tversky in Daniel Kahneman. Do tega pride, ko uporabniki statističnih informacij naredijo napačne sklepe, če ne upoštevajo velikosti vzorca zadevnih podatkov.
Glavni vzrok zanemarjanja velikosti vzorca je, da ljudje pogosto ne razumejo, da se pri majhnih vzorcih pogosteje pojavljajo visoke razlike. Zato je ključno ugotoviti, ali je velikost vzorca, uporabljenega za izdelavo določene statistike, dovolj velika, da lahko omogoči smiselne zaključke.
Vedeti, kdaj je velikost vzorca dovolj velika, je lahko izziv za tiste, ki ne poznajo dobro statističnih metod.
Ključni odvzemi
- Zanemarjanje velikosti vzorca je kognitivna pristranskost, ki sta jo proučevala Amos Tversky in Daniel Kahneman. Sestavljena je iz risanja napačnih zaključkov iz statističnih informacij, ker niso upoštevali učinkov velikosti vzorca. velikosti vzorcev so povezane z bolj nestanovitnimi statističnimi rezultati in obratno.
Razumevanje zanemarjanja velikosti vzorca
Kadar je velikost vzorca premajhna, ni mogoče narediti natančnih in zanesljivih zaključkov. V finančnem okviru lahko to vlagatelje na različne načine zavede.
Na primer, investitor bi lahko videl nov investicijski sklad, ki bi se lahko pohvalil, da je od ustanovitve ustvaril 15% letnih donosov. Vlagatelj morda hitro vključi, da je ta sklad njihova vozovnica za hitro ustvarjanje bogastva. Vendar bi ta sklep lahko bil nevarno napačen, če sklad ne bi vlagal zelo dolgo. V tem primeru bi lahko bili rezultati kratkoročne anomalije in imajo malo povezave z dejansko metodologijo naložbe sklada.
Zanemarjanje velikosti vzorca pogosto zamenjujemo z zanemaritvijo osnovne stopnje, kar je ločena kognitivna pristranskost. Medtem ko se zanemarjanje velikosti vzorcev nanaša na neupoštevanje vloge velikosti vzorcev pri določanju zanesljivosti statističnih trditev, zanemarjanje osnovne stopnje se nanaša na nagnjenost ljudi k zanemarjanju obstoječega znanja o pojavu pri ocenjevanju novih informacij.
Primer resničnega sveta zanemarjanje velikosti vzorca
Če želite bolje razumeti zanemarjanje velikosti vzorca, razmislite o naslednjem primeru, ki je bil izpeljan iz raziskav Amosa Tverskega in Daniela Kahnemana:
Od osebe zahteva, da vzame iz vzorca pet kroglic in ugotovi, da so štiri rdeče in ena zelena.
Oseba črpa iz vzorca 20 kroglic in ugotovi, da je 12 rdečih, osem pa zelenih.
Kateri vzorec daje boljši dokaz, da so kroglice pretežno rdeče?
Večina ljudi pravi, da prvi, manjši vzorec zagotavlja veliko močnejše dokaze, ker je razmerje med rdečo in zeleno veliko večje od večjega vzorca. Vendar v resnici višje razmerje odtehta manjša velikost vzorca. Vzorec 20 dejansko zagotavlja veliko močnejše dokaze.
Naslednji primer Amosa Tverskega in Daniela Kahnemana je naslednji:
Mesto imajo dve bolnišnici. V večji bolnišnici se vsak dan rodi povprečno 45 dojenčkov, v manjši bolnišnici pa se vsak dan rodi približno 15 dojenčkov. Čeprav je 50% vseh dojenčkov fantov, natančen odstotek niha iz dneva v dan.
V enem letu je vsaka bolnišnica zabeležila dneve, ko je več kot 60% dojenčkov dečkov. Katera bolnišnica je zabeležila več takih dni?
Na vprašanje je 22% anketirancev odgovorilo, da bo večja bolnišnica poročala več takšnih dni, 56% pa, da bodo rezultati enaki za obe bolnišnici. Pravzaprav je pravilen odgovor, da bi manjša bolnišnica zabeležila več takih dni, ker bi njena manjša velikost povzročila večjo spremenljivost.
Kot smo že omenili, je vzrok zanemarjanja velikosti vzorcev v tem, da ljudje pogosto ne razumejo, da se pri majhnih vzorcih pogosteje pojavljajo visoke stopnje variance. Pri vlaganju je to res lahko zelo drago.
