2.6. Karakteristike i važnost normalne distribucije
U dosadašnjim primerima pokazali smo da rezultati merenja mogu da se distribuiraju na različite načine. Pomenuli smo nekoliko specifičnih oblika distribucija, kao što su uniformna ili bimodalna. Takođe smo pokazali da se oblik distribucija može opisati matematičkim funkcijama. Na primer, ukoliko je distribucija ocena na nekom predmetu uniformna, to znači da je jednak broj studenata dobio svaku od ocena. Ako je u uzorku bilo 60 studenata, onda se odnos između ocena prikazanih na x-osi i njihove učestalosti prikazane na y-osi stubičastog dijagrama, može izraziti formulom:
`f(x)=0*x+10`
Gornja formula označava da se za bilo koju ocenu, tj. vrednost x iz raspona od 5 do 10, očekuje da učestalost, tj. vrednost y, bude 10. Poseban značaj u statistici ima distribucija podataka koja se može opisati ranije pomenutom zvonastom krivom. U pitanju je simetrična distribucija u kojoj je najveći broj rezultata grupisan oko sredine raspona, što govori da u uzorku ili populaciji postoji najveći broj prosečnih osoba ili merenja. Izjednačavanje prosečnosti i normalnosti može se smatrati diskutabilnim, ali činjenica je da se upravo ovaj oblik distribucije u statistici naziva normalnim. U nastavku teksta ćemo objasniti zbog čega normalna distribucija ima poseban status u statistici i koje su njene karakteristike važne za postupak statističkog zaključivanja.
2.6.1. Centralna granična teorema
Svet oko nas je multivarijatan. Većina događaja i fenomena koji nas okružuju može da se posmatra kao ishod delovanja velikog broja nasumičnih varijabli. Na prvi pogled, ta činjenica deluje obeshrabrujuće za istraživača koji želi da uoči pravilnosti u pojavama koje opisuje ili da predvidi verovatnoću ishoda nekog događaja. Srećom, pravilnost u delovanju velikog broja varijabli ipak postoji, a poznata je kao centralna granična teorema. Centralna granična teorema predstavlja jednu od najvažnijih postavki u oblastima statistike i teorije verovatnoće, a njenoj matematičkoj formulaciji i definiciji doprineli su brojni autori, najpre francuski matematičar Pjer-Simon Laplas početkom 19. veka, njegovi sunarodnici Abram de Moavr i Ogisten Luj Koši, a potom i ruski matematičar Aleksandar Ljapunov početkom 20. veka (Fischer, 2011).
Za potrebe ilustracije centralne granične teoreme, iskoristićemo primer jednostavnog instrumenta koji je konstruisao engleski statističar i psiholog Frensis Golton. Instrument se sastojao od drvene table u koju su ukucani ravnomerno raspoređeni klinovi. U njenom gornjem delu nalazio se levak za ubacivanje kuglica koje su se u toku pada odbijale o klinove i završavale u jednoj od pregrada u dnu table. Pojednostavljena forma
Goltonove table prikazana je na početku ove vežbe i sadrži samo jedan klin, odnosno jednu nasumičnu dihotomnu varijablu koja deluje na kuglicu. Kada kuglica udari u klin, može da se odbije ulevo i dobije vrednost 0, ili udesno, kada dobija vrednost 1. Na osnovu teorije verovatnoće, očekujemo da će nakon većeg broja ubacivanja, polovina kuglica završiti u levoj, a druga polovina u desnoj pregradi, odnosno da će polovina „merenja“ dati rezultat 0, a druga polovina rezultat 1. Očekivane ili teorijske verovatnoće prikazane su crvenim brojkama ispod svakog od mogućih ishoda na x-osi. Kada kliknete taster
Pusti kuglice, primetićete da visine stubića u početku nisu jednake, ali da sa povećavanjem broja merenja, odnosno veličine uzorka (kuglica), njihove visine postaju sve sličnije. To znači da na osnovu verovatnoća koje smo opazili na dovoljno velikom uzorku, možemo dosta precizno da procenimo teorijske verovatnoće ishoda nekog eksperimenta. Opažene ili empirijske verovatnoće prikazane su zelenim brojkama, a izračunate su kao proporcija, tj. odnos frekvencije svakog ishoda i ukupnog broja „merenja“ (N). Sa povećavanjem veličine uzorka, empirijske verovatnoće postaju sve sličnije teorijskim. Iako su one ponekad jednake čak i na manjim uzorcima, postale bi potpuno iste, stabilne i nepromenljive, tek kada bi uzorak postao beskonačno velik, odnosno kada bismo varijablu izmerili na svim članovima populacije.
U sledećem koraku dodaćemo još jednu varijablu u sistem, biranjem opcije 2 za broj varijabli, odnosno dodavanjem još jednog reda klinova. Kliknite taster Pusti kuglice. Da biste brže dostigli veću vrednost N, možete da povećate broj kuglica, npr. na 15. Distribucija teorijskih verovatnoća se promenila, jer se delovanjem dve varijable povećava broj mogućih ishoda. U našem primeru ti ishodi su izraženi kao suma pojedinačnih rezultata na svakoj varijabli. Pri tome broj varijabli u sistemu nije predstavljen brojem klinova već brojem redova. Klinovi su samo vizuelni prikaz nastajanja svih mogućih permutacija koje čine određeni ishod. Ako su odabrane dve varijable, broj ishoda je 3, ali je broj permutacija 4. Ishod 0 dešava se kada se loptica oba puta odbije ulevo (0+0), 2 kada se oba puta odbije udesno (1+1), a 1 je najverovatniji ishod jer se dobija dvema permutacijama: 0+1 i 1+0. Kada broj varijabli povećamo na 10, povećava se i raspon mogućih ishoda, odnosno varijabilnost dobijenih suma. Sada postaje još očiglednije da najveći broj permutacija vrednosti pojedinačnih varijabli daje sumu koja se nalazi u centru distribucije ili sume koje su u blizini te centralne vrednosti. Upravo na ovaj fenomen odnosi se termin centralno u nazivu pomenute teoreme. Dobijena distribucija verovatnoća je simetrična, što znači da su ishodi koji se nalaze sa leve i desne strane medijane i proseka približno jednako verovatni, s tim da njihova verovatnoća postaje sve manja kako se sume nasumičnih varijabli približavaju krajnjim vrednostima raspona. Specifičan oblik ovakve distribucije postaje još očigledniji kada broj varijabli povećamo na 16, a postupak uzorkovanja ubrzamo povećavanjem broja kuglica na 50. Već na uzorcima većim od 100, postaje uočljivo da vrednosti 7, 8 i 9 obuhvataju više od polovine dobijenih rezultata. To možete da proverite ako saberete empirijske (zelene) verovatnoće ova tri središnja ishoda. Činjenica da se najveći broj rezultata grupiše oko proseka, vidljiva je i po tome što je linija poligona frekvencija veoma strma sa obe strane, otprilike do vrednosti 5 i 11, a potom se znatno blaže opada do 0 i 16, kao krajnjih vrednosti teorijskog raspona distribucije. Otuda i pomenuti naziv ovakve krive koja podseća na oblik zvona. U statistici je ova zvonasta kriva poznatija kao Gausova ili normalna distribucija. Termin granična u nazivu teoreme odnosi se na činjenicu da sa približavanjem broja varijabli i veličine uzorka beskonačnosti, distribucija suma tih varijabli postaje sve sličnija teorijskoj normalnoj raspodeli koja se predstavlja idealno glatkom i kontinuiranom zvonastom krivom kakvu smo prikazali u odeljku o matematičkim funkcijama. Stoga se normalna distribucija smatra graničnom raspodelom ili, matematičkim rečnikom rečeno, limesom distribucije suma nasumičnih varijabli. Da biste jasnije videli oblik koji formira poligon frekvencija kliknite taster Zaustavi kuglice kada uzorak dostigne veličinu od nekoliko hiljada „merenja“.
Prethodno opisani primer predstavlja samo jednu od manifestacija centralne granične teoreme. Njena važnost u statistici je mnogo veća, a oblast njene primene mnogo šira. U datom primeru sumirali smo nasumične rezultate uzete iz tzv. Bernulijevih distribucija kojima se opisuju dihotomne varijable, odnosno pojave koje mogu da imaju samo dva moguća ishoda (npr. tačno-netačno, uspešno-neuspešno, pismo-glava, muško-žensko). Kao rezultat, dobili smo binomnu distribucija koja nastaje izvođenjem većeg broja eksperimenata sa dihotomnim ishodom. Ali centralna granična teorema primenjiva je i na sve druge nasumične varijable, bez obzira na oblik njihove distribucije. Štaviše, da kada bismo umesto sume računali prosek vrednosti dobijenih na pojedinačnim varijablama, takođe bismo kao rezultat dobili približno normalnu distribuciju. Ako ponovo pustite 50 kuglica u primeru sa 16 varijabli, ali kao podeoke na x-osi odaberete proseke umesto suma nula i jedinica, primetićete da se oblik distribucije ne menja, kao ni raspodela teorijskih i empirijskih verovatnoća. Svaki rezultat na x-osi promenili (transformisali) smo na isti način, deljenjem sa brojem varijabli, koji je u ovom slučaju 16. Obratite pažnju na to da su vrednosti M i s takođe postale 16 puta manje. Podeoke na skali x-ose možete da menjate čak i u toku formiranja grafikona da biste jasnije uočili opisanu pravilnost. Uočite da varijabilnost konačnih rezultata ostaje ista čak i kada je vrednost s drugačija. Standardna devijacija menja se u apsolutnom smislu, ali to ne znači da je raspršenje rezultata drugačije u zavisnosti od toga da li računamo sumu ili prosek vrednosti 0 i 1. Drugim rečima, variranje od s = 2 u odnosu na M = 8, potpuno je isto kao variranje od s = 0,12 u odnosu na M = 0,5. To potvrđuje i pokazatelj koji se zove koeficijent varijabilnosti, a računa se po formuli:
`V=s/M*100`
Koeficijent varijabilnosti (V) je zapravo vrednost standardne devijacije pretvorena u procente, kao univerzalne, standardne jedinice pomoću kojih se može porediti varijabilnost različitih pojava. Ako u toku formiranja distribucije menjate način računanja konačnih rezultata između sume i proseka, primetićete da se M i s menjaju, ali da V ostaje isti, odnosno da standardna devijacija u oba slučaja iznosi približno četvrtinu ili 25% vrednosti aritmetičke sredine.
Rezultati merenja mogu da se transformišu na različite načine. Na primer, umesto vrednosti 0 i 1, ishodima nasumičnih varijabli mogli smo da dodelimo vrednosti 1 i 2. Tada bismo kao rezultat dobili sume koje se kreću u intervalu od 16 do 32, umesto od 0 do 16. Ova distribucija biće prikazana kada kao vrednosti x-ose odaberete opciju suma 1 i 2. Ni u ovom slučaju ne menja se oblik distribucije, već se ona samo pravolinijski „pomera“ u desnu stranu koordinatnog sistema, tako da joj aritmetička sredina postaje 24, umesto prethodnih 8. Ovoga puta se standardna devijacija varijable nije promenila jer je raspon rezultata ostao potpuno isti. Međutim, koeficijent varijacije opada, jer je varijabilnost od 2, u odnosu na prosek od 24, zaista manja nego u odnosu na prosek koji iznosi 8. Opisane transformacije sirovih rezultata operacijama sabiranja, oduzimanja, množenja ili deljenja nazivamo linearnim, jer se relativne pozicije i relativna rastojanja među pojedinačnim rezultatima ne menjaju, tako da se ne menja ni oblik distribucije verovatnoća. Način na koji linearne transformacije utiču na vrednosti M i s možemo da prikažemo jednostavnim matematičkim formulama. Ako se vrednosti varijable X povećaju ili umanje za konstantu k, aritmetička sredina varijable povećava se ili umanjuje za istu vrednost k:
`M_(X+k)=M_X+k`
Ako se svaka vrednost varijable X pomnoži ili podeli konstantom k, prosek vrednosti varijable povećava se ili umanjuje k puta:
`M_(X*k)=M_X*k`
Ako se vrednosti varijable X povećaju ili umanje za konstantu k, standardna devijacija varijable ostaje ista:
`s_(X+k)=s_X`
Ako se vrednosti varijable X pomnože ili podele konstantom k, standardna devijacija varijable povećava se ili umanjuje k puta:
`s_(X*k)=s_X*k`
Iako se u navedenim formulama koriste operacije sabiranja i množenja, one su primenjive i na preostale dve osnovne operacije, jer je oduzimanje zapravo sabiranje sa negativnim brojem (npr. 4 - 2 = 4 + -2), a deljenje je množenje recipročnom vrednoću od 1 (npr. 4 : 2 = 4 · (1 : 2) = 4 · 0,5).
Koristeći gore navedena pravila, moguće je menjati M i s bilo koje varijable i pretvarati ih u vrednosti koje su lakše za interpretaciju, ne menjajući pri tome njihov smisao. Na primer, moguće je standardizovati sume nasumičnih varijabli iz našeg primera tako što se od dobijene sume oduzme maksimalna teorijska vrednost varijable i podeli polovinom teorijskog raspona. Distribuciju ovako dobijenih rezultata možete da vidite ako odaberete opciju raspon -1 do 1 za vrednosti x-ose. Bez obzira na to koliko nasumičnih varijabli odaberete, konačni rezultati uvek će imati isti teorijski raspon i istu očekivanu aritmetičku sredinu. Ovako dobijene vrednosti veoma su intuitivne za interpretaciju, jer je očekivani prosek rezultata 0, a vrednosti sa leve i desne strane distribucije imaju različit predznak. Zamislite, na primer, da ste na ovaj način izrazili uspeh đaka na testu znanja. Podatak da neki đak ima vrednost 0 odmah bi vam ukazao na to da je on postigao prosečan rezultat, dok bi predznak rezultata ukazivao na to da li je neki đak bolji ili lošiji od proseka grupe kojoj pripada. Ovaj opšti princip transformacije rezultata, u cilju lakšeg poređenja ispitanika na različitim varijablama, veoma često se koristi u psihologiji i biće detaljnije objašnjen kasnije. Na ovom mestu ćemo skrenuti pažnju još samo na to da koeficijent varijabilnosti nije moguće izračunati kada je aritmetička sredina jednaka nuli. Njegove vrednosti su neprikladne i veoma nestabilne čak i kada su vrednosti M bliske nuli, što možete da zaključite na osnovu znatno većeg variranja vrednosti V kada se kao raspon podeoka na x-osi odabere raspon između -1 i 1 u odnosu na distribucije varijabli koje nastaju kao sume ili proseci vrednosti binarnih varijabli. Međutim, ako je očekivana aritmetička sredina distribucija jednaka nuli, standardizacija nije ni neophodna, jer tada vrednosti standardnih devijacija omogućavaju poređenje varijabilnosti različitih varijabli.
Na kraju ovog odeljka ukazaćemo na još jednu važnu pravilnost vezanu za sumu nezavisnih nasumičnih varijabli. Ona može da se izrazi formulom:
`s_(SigmaX)^2=Sigmas_X^2`
Naime, varijansa sume nezavisnih nasumičnih varijabli jednaka je sumi varijansi tih varijabli. Ovo pravilo možemo da demonstriramo na primeru Goltonove table. Odaberite 50 kuglica, jednu varijablu, sumu 0 i 1 kao podeoke x-ose i pustite kuglice. Nakon dovoljno velikog broja merenja, varijansa dihotomne varijable stabilizuje se oko vrednosti 0,25. Povećavanjem broja varijabli na 2, varijansa se takođe povećava dva puta. Distribucija suma 10 nasumičnih varijabli u našem primeru ima varijansu 10 · 0,25 = 2,5, dok u slučaju 16 varijabli ona iznosi 16 · 0,25 = 4. Pošto su varijanse svih varijabli u našem primeru iste, gornju formulu možemo da napišemo i ovako:
`s_(SigmaX)^2=n*s_X^2`
gde je n broj nasumičnih varijabli. Ukoliko varijabilnost izrazimo standardnom devijacijom, prethodna formula dobija sledeći oblik:
`s_(SigmaX)=sqrt(n)*s_X`
Gornja formula važi za sume varijabli, ali se veoma lako može prilagoditi i primeru sa prosekom vrednosti nasumičnih varijabli:
`s_((SigmaX)/n)=(sqrt(n)*s_X)/n=s_X/sqrt(n)`
Ovde ćemo se zaustaviti kada je u pitanju izvođenje formula, ali kasnije ćemo se vratiti na veoma važnu pravilnost opisanu poslednjom jednačinom.
2.6.2. Funkcije mase i gustine verovatnoće
U prethodnom odeljku pokazali smo da distribucija suma vrednosti nasumičnih varijabli ima oblik normalne krive kada su veličina uzorka i broj varijabli dovoljno veliki. Zbog ove pravilnosti moguće je izračunati teorijske verovatnoće svakog ishoda sumativne varijable. U slučaju Goltonove table, ne možemo tačno da znamo gde će neka od kuglica da padne, ali možemo da odredimo gde će to najverovatnije biti. Štaviše, očekivane verovatnoće mogu da se izračunaju veoma precizno, korišćenjem odgovarajuće formule na osnovu koje su određene pozicije tačaka poligona frekvencija u dvodimenzionalnom koordinatnom sistemu. U odeljku o funkcijama prikazali smo nekoliko takvih formula. Pošto pomoću njih može da se izračuna verovatnoća svakog ishoda varijable X, ove formule nazivaju se funkcijama verovatnoće. U slučaju binomne raspodele jedne ili više varijabli, funkcija verovatnoće ima sledeći oblik:
`f(x)=(n!)/(x!(n-x)!)*p^x*(1-p)^(n-x)`
Statistička pismenost ne podrazumeva potrebu da se ova i slične formule znaju napamet, niti da se koriste svaki put kada je potrebno izračunati verovatnoću ishoda u nekoj distribuciji. Statistički pismen istraživač treba samo da razume opštu logiku funkcija verovatnoće. Ona je, u suštini, veoma jednostavna – na osnovu poznatih parametara, kao što su npr. x, n i p, može se izračunati vrednost nepoznatog parametra f(x). To je ujedno i osnovna logika statističkog zaključivanja i predviđanja. U gornjoj formuli x označava vrednost na x-osi, tj. ishod čija nas verovatnoća interesuje, n je broj dihotomnih varijabli, a p verovatnoća jednog od dva ishoda, npr. verovatnoća da kuglica odskoči ulevo ili da bacanjem novčića dobijemo pismo. Uzvičnikom se označava faktorijel broja, odnosno proizvod svih prirodnih brojeva koji su manji ili jednaki njemu. Izraz f(x) je verovatnoća određenog ishoda koja se prikazuje kao vrednost na y-osi koordinatnog sistema. Na primer, ako smo bacili 16 ispravnih novčića kod kojih verovatnoća da padne pismo iznosi 0,5, onda na osnovu formule možemo da izračunamo da verovatnoća da 5 novčića padne na pismo iznosi približno 0,067. To znači da bi oko 7% rezultata trebalo da završi u toj „pregradi“, a visina stubića iznad broja 5 trebalo bi da bude 0,067. U ovom primeru vrednost n (broj varijabli) iznosi 16 zato što jedno merenje, odnosno jedan eksperiment, nije bio bacanje jednog već šesnaest novčića. Sa druge strane, veličina uzorka određuje koliko puta smo izveli eksperiment, odnosno bacili 16 novčića. U slučaju da je eksperiment predstavljalo bacanje jednog novčića (ponavljano više puta), distribucija verovatnoća bila bi uniformna, sa dva stubića jednake visine. Osim toga, verovatnoća da padne 5 pisama u bacanju 16 novčića ista je kao i verovatnoća da padne 11 pisama, tj. 5 glava. S obzirom na to da je varijabla koja je prikazana na x-osi diskretna, vrednosti y pokazuju koliko bi (proporcionalno) rezultata trebalo da se „nagomila“ u svakoj tački x. Stoga ovu vrstu funkcija nazivamo funkcijama mase verovatnoće.
Diskusiju o teorijskim i empirijskim verovatnoćama nastavićemo na primeru varijabli sa većim brojem mogućih ishoda. Ovoga puta naglasak stavljamo na uticaj veličine uzorka i varijabilnosti pojave na tačnost procene teorijskih verovatnoća. Kao ilustraciju ćemo upotrebiti
simulaciju bacanja kockica za igru. Na početku je
štapićastim dijagramom prikazana distribucija opaženih verovatnoća koja bi mogla da se dobije ako 1 kockicu bacimo 6 puta. Verovatnoća dobijanja bilo kog od 6 brojeva iznosi 1 : 6 ili približno 17%. U početnom primeru desilo se upravo to – svaki od brojeva dobijen je po jednom. Menjajte podeoke, odnosno jedinice u kojima su izražene vrednosti na y-osi da biste lakše uočili vezu između učestalosti ishoda i njihove verovatnoće koja može da se izrazi kao relativna frekvencija ili kao procenat. U početnom primeru distribucija empirijskih verovatnoća jednaka je distribuciji teorijskih, jer je dobijen rezultat koji u potpunosti odgovara očekivanjima.
Ako ste u prvom bacanju dobili broj 3, kolika je verovatnoća da u drugom bacanju dobijete isti broj?
Ako kockicu bacite 6 puta, da li je verovatnije da ćete dobiti brojeve ovim redom: 1, 1, 1, 1, 1, 1 ili ovim redom: 2, 4, 6, 1, 3, 5?
Ako istovremeno bacite 6 kockica, da li je verovatnije da ćete dobiti brojeve 1, 1, 1, 1, 1, 1 ili 2, 4, 6, 1, 3, 5?
Da li biste rekli da je verovatnoća da dobijete distribuciju prikazanu na početku ove vežbe, nakon šest bacanja jedne kockice, mala ili velika?
Prethodna pitanja vezana su za neke od čestih grešaka u zaključivanju o verovatnoćama. Prvo se odnosi na pogrešnu pretpostavku o međusobnoj povezanosti ishoda događaja. Ishod bacanja kockice ni na koji način ne utiče na ishode njenih narednih bacanja jer su u pitanju potpuno nezavisni događaji. Verovatnoća da dobijete broj 3 ista je u prvom bacanju, kao i u svakom narednom. Druga greška odnosi se na izjednačavanje kombinacija i permutacija elemenata iz određenog skupa ishoda. Kod ovih drugih, svaki mogući niz elemenata skupa ishoda tretira se kao drugačiji događaj, tako da 1-2-3 nije isto što i 2-3-1. Na primer, dve dihotomne varijable daju tri kombinacije ishoda (dve 0, dve 1 i jedna 0 i jedna 1), ali četiri permutacije (0-0, 1-1, 0-1 i 1-0). Ako se vratimo na primer sa kockicama, permutacije 1-1-1-1-1-1 i 2-4-6-1-3-5 imaju potpuno iste verovatnoće. Jednako je (malo) verovatno da će se u 6 bacanja kockica dobiti baš taj redosled brojeva. Međutim, ako nas interesuje samo prisustvo tih brojeva u skupu od 6 brojeva, onda je reč o kombinacijama. Tada je verovatnoća da se dobiju svi mogući brojevi zaista veća od one da se dobiju samo jedinice, jer je veći broj kombinacija koji nam daje željeni ishod. Tako dolazimo i do odgovora na poslednje pitanje. Ukoliko istovremeno bacite 6 kockica, broj permutacija može da se izračuna kao 66, što daje 46.656 mogućih ishoda. Sa druge strane, ako nas interesuje koliko kombinacija svih 6 brojeva postoji, rezultat ćemo dobiti izračunavanjem vrednosti 6!, što iznosi 720. Dakle, verovatnoća da nakon bacanja 6 kockica dobijemo sliku koju vidimo na grafikonu je izuzetno mala i iznosi 720 : 46.656 ≈ 1,5%. U tih 720 ishoda, na primer, spadaju permutacije 2-4-6-1-3-5, 1-2-4-5-6-3, 3-4-2-1-5-6, 5-4-6-3-1-2 i sve ostale koje sadrže svaki od 6 brojeva. Međutim, verovatnoća da dobijemo sve jedinice još je manja i iznosi 1 : 46.656, jer samo jedna permutacija daje željeni ishod: 1-1-1-1-1-1.
Kako se pravilnosti koje smo opisali odražavaju na istraživačku praksu? Zamislite da na osnovu uzorka veličine 6 želite da opišete distribuciju neke pojave u populaciji. Kada kliknete taster Baci 1 kockicu 6 puta, biće prikazani simulirani rezultati koje biste mogli da dobijete na odabranom uzorku veličine 6. Obratite pažnju na dve stvari. Prvo, svaki put kada kliknete taster i napravite novi uzorak, verovatno ćete dobiti drugačiju distribuciju opaženih verovatnoća. Drugo, malo je verovatno da ćete na uzorku veličine 6 dobiti distribuciju koja tačno odslikava teorijsku raspodelu verovatnoća u populaciji koja bi trebalo da je uniformna. Postavite vrednosti y-ose na verovatnoće i pređite pokazivačem miša preko tačkica da biste videli empirijske verovatnoće svakog ishoda. Kao što smo rekli, u pitanju je proporcija izražena kao odnos broja poželjnih ishoda i ukupnog broja mogućih ishoda. Empirijske verovatnoće najverovatnije se razlikuju od teorijskih koje iznose 0,167. Na osnovu prikazanog primera postaje jasno da je svaki uzorak koji koristimo u nekom istraživanju samo jedan od velikog broja uzoraka koji mogu da se uzmu iz iste populacije. Osim toga, ukoliko je uzorak mali, vrlo je verovatno da će slika populacije, a samim tim i zaključci o njoj, biti pogrešni. Kada veličinu uzorka povećate na 36 (bacanja), primetićete da se empirijske verovatnoće približavaju teorijskim. Za početak, gotovo je nemoguće da nakon 36 bacanja zaključite da je verovatnoća nekog od ishoda 0, kao što se dešavalo u uzorcima veličine 6. Dobijena slika stanja u populaciji i dalje nije potpuno precizna, ali će postajati sve tačnija sa daljim povećavanjem veličine uzorka. U statistici i teoriji verovatnoće ovaj fenomen se naziva zakonom velikih brojeva. Kada 1 kockicu bacite 46.656 puta, dobićete distribuciju koja je gotovo identična teorijskoj. Tada se opažene verovatnoće razlikuju od teorijskih tek na trećoj decimali. Međutim, već na uzorku veličine 100, razlike između opaženih i očekivanih učestalosti postaju relativno male i jasno upućuju na uniformnu distribuciju verovatnoća. U praktičnom smislu, to znači da je u istraživanjima poželjno imati što veći uzorak merenja, odnosno ispitanika, ali da to povećanje ima smisla samo do određene granice. Sada odaberite opcije bacanja 2 kockice 6 puta i kliknite taster Baci 2 kockice 6 puta. U ovom primeru, kao rezultati varijable prikazane dijagramom, koriste se zbirovi brojeva dobijenih na dve istovremeno bačene kockice.
Na osnovu uzorka veličine 6, praktično je nemoguće predvideti izgled teorijske distribucije varijable. Situacija se popravlja na uzorku veličine 36, ali tek nakon 100 bacanja kockica može se naslutiti da distribucija u populaciji nije uniformna i da su najverovatniji događaji oni koji se nalaze oko središnje vrednosti. Ovi događaji su najverovatniji jer najveći broj permutacija dobijenih brojeva daje sumu 7, a najmanji sume 2 i 12. Kada prikažete teorijsku distribuciju verovatnoća, biće vam jasnije kakav je odnos teorijskih učestalosti svake od 11 mogućih suma u rasponu od 2 (samo 1+1), preko 7 (npr. 5+2, 2+5, 4+3, 6+1), do 12 (samo 6+6). Ako nastavite dalje i odaberete bacanje 6 kockica 100 puta, primetićete da je tada teško predvideti teorijske verovatnoće čak i na uzorku koji je ranije bio dovoljno velik da pruži barem približno tačnu sliku distribucije varijable u populaciji. Ali čak ni u ovom slučaju nije neophodno praviti uzorak veličine 46.656, jer se sasvim prihvatljiva procena dobija i na uzorku veličine 1.000. Ipak, zbog povećanja broja mogućih ishoda, odnosno povećanja raspona rezultata, potrebno je formirati veći uzorak kako bi se dobila adekvatna slika stanja u populaciji. To znači da granica na osnovu koje bi se definisao dovoljno veliki uzorak, prvenstveno zavisi od broja i raspona mogućih ishoda, odnosno od varijabilnosti pojave koju želimo da opišemo. Što je varijabilnost pojave veća, biće potreban veći uzorak da bi se ona pouzdano opisala. Na primer, ukoliko odaberete 6 za broj kockica i kliknete taster Prikaži teorijsku distribuciju verovatnoća, videćete da je aritmetička sredina te varijable u populaciji µ = 21, a njena standardna devijacija σ = 4,183. To su vrednosti koje očekujemo ali koje najverovatnije nećemo dobiti na malim uzorcima. Ako odaberete 6 bacanja i nekoliko puta napravite uzorke veličine 6, primetićete da se aritmetičke sredine (M) i standardne devijacije (s) uzoraka često značajno razlikuju od populacijskih parametara. Međutim, sa povećanjem veličine uzorka, raste tačnost procene parametara populacije (µ i σ) na osnovu statistika uzorka (M i s). Malo je verovatno da će u velikom nasumičnom uzorku procene parametara biti izuzetno netačne.
Primetili ste da se sa povećavanjem broja kockica čiji zbir računamo, povećava i raspon dobijenih rezultata, odnosno broj podeoka na x-osi. Samim tim, verovatnoća pojedinačnih ishoda postaje sve manja, jer suma verovatnoća, koja uvek iznosi 1, mora da se podeli na više delova. Na primer, verovatnoća broja 7 kao najverovatnijeg ishoda zbira brojeva dobijenih bacanjem 2 kockice, iznosi oko 0,167, dok verovatnoća vrednosti 21, kao najčešće sume brojeva dobijenih bacanjem 6 kockica, iznosi oko 0,093. To znači da bi sa daljim povećavanjem broja podeoka na x-osi, verovatnoća svake od tih vrednosti postajala sve bliža 0. Štaviše, verovatnoća pojedinačnih ishoda zaista bi postala 0 kada bi broj podeoka postao beskonačan, tj. kada bismo hteli da opišemo distribuciju varijable koja nije diskretna već kontinuirana. Na prvi pogled, ova pravilnost deluje nelogično, ali treba posmatrati njene praktične implikacije. Kada opisujemo neku varijablu, najčešće nas ne interesuje samo jedan rezultat, već raspon rezultata u okviru koga se nalazi najveća koncentracija verovatnoća. Stoga se matematičke funkcije kojima se opisuju raspodele verovatnoća kontinuiranih varijabli, nazivaju funkcijama gustine verovatnoća. Ovaj princip često se primenjuje i na diskretne varijable čije skale imaju puno podeoka. Tako ćete, na primer, češće nailaziti na tvrdnje da se najverovatnija ili prosečna inteligencija nalazi u rasponu između 90 i 110, nego da iznosi tačno 100. U tim slučajevima se zapravo pretpostavlja da je varijabla u populaciji kontinuirana. Zbog toga grafički prikaz funkcije gustine verovatnoće više ne izgleda kao niz tačaka koje formiraju poligon frekvencija, već kao neprekidna, glatka kriva koja blago i postepeno menja svoj oblik od početne do krajnje tačke raspona. U slučaju normalne raspodele, koju dobijamo kao sumu velikog broja nasumičnih varijabli, ta funkcija se predstavlja zvonastom krivom koju možete da prikažete kada kliknete taster Prikaži funkciju gustine verovatnoće. Na osnovu površine osenčene crvenom bojom, može se zaključiti da je većina rezultata obuhvaćena intervalom između 17 i 25, što približno odgovara rasponu koji biste dobili ako od aritmetičke sredine oduzmete vrednost jedne standardne devijacije i na nju dodate istu tu vrednost. Ako prikažete teorijsku distribuciju verovatnoća za bacanje 6 kockica i saberete pojedinačne verovatnoće vrednosti 17 do 25, dobićete sumu koja je veća od 70%. Dakle, verovatnoća da se neki ishod u normalnog distribuciji nalazi između vrednosti M - s i M + s iznosi približno 0,7. Osim toga, može se videti i da je verovatnoća dobijanja rezultata koji odstupaju od proseka za više od 2 standardne devijacije ulevo ili udesno, veoma mala ako su rezultati distribuirani normalno. Ovakav način interpretacije verovatnoća događaja čini osnovu statističkog zaključivanja, o čemu će biti više reči u trećem poglavlju.
2.6.3. Standardizacija sirovih rezultata
Standardizacija je višeznačan pojam, čak i u okviru pojedinačnih oblasti kao što su psihologija ili statistika. Načelno, standard podrazumeva postojanje opšteprihvaćenog principa, konsenzusa i uređenosti načina upotrebe nekog proizvoda ili sprovođenja nekih aktivnosti. Primeri standarda su saobraćajni znaci, internet protokoli za razmenu podataka, dozvoljena emisija ugljen-dioksida iz motora ili sistem međunarodno priznatih mernih jedinica, kao što su metar, kilogram ili amper. Ranije pomenuti koeficijent varijacije je takođe oblik standardizacije koja omogućava poređenje varijabilnosti varijabli koje imaju različite standardne devijacije i aritmetičke sredine. Jasno je da nepostojanje standarda otežava komunikaciju i razumevanje pojava koje se opisuju. Za većinu građana kontinentalne Evrope deluje zbunjujuće informacija da je neka osoba visoka 5,5 stopa ili da se automobil kreće brzinom od 65 milja na sat. Zamislite tek kakvi bi problemi u komunikaciji nastali da se i dalje koriste sve arhaične mere za širinu i dužinu koje su različite kulture upotrebljavale kroz vekove, kao što su npr. lakat, koji uz to može da bude biblijski i grčki, hvat, furlong, liga, perč, trska ili šaka. U oblasti psihologije, pod standardizacijom se najčešće podrazumeva prilagođavanje instrumenata za korišćenje u određenoj populaciji, npr. adaptacija nekog upitnika za primenu u populaciji adolescenata ili adaptacija testa sposobnosti, nastalog u SAD za korišćenje u drugoj državi. Pitanjima standardizacije testova bavi se granična oblast statistike i psihologije koja se zove psihometrija. U ovom odeljku biće više reči o drugačijoj vrsti standardizacije koja podrazumeva linearno transformisanje sirovih rezultata merenja u cilju njihove lakše interpretacije i poređenja među različitim ispitanicima i/ili varijablama. U tom smislu, standardizacija podrazumeva promenu jedinica mere u kojima su izražene vrednosti varijable, npr. bodova, sekundi ili centimetara, u univerzalne i samorazumljive jedinice, a u skladu sa unapred definisanim i opšteprihvaćenim pravilima.
Zamislićemo da je
80 studenata radilo dva testa znanja, zeleni i plavi. Bodovi svih studenata prikazani su u dva reda i sortirani su od najnižeg ka najvišem. Rezultati na oba testa distribuirani su normalno, što znači da je najviše vrednosti grupisano oko medijane i proseka. Student A. M. postigao je 37 bodova na prvom testu a 42 na drugom. Kućice sa rezultatima ovog studenta možete da locirate u grupi svih rezultata pomeranjem klizača ispod oba reda rezultata ili klikom na opciju
Pozicioniraj redove na … studenta A. M. Pokušajte da odgovorite na sledeća pitanja samo na osnovu sirovih rezultata koje je A. M. postigao na oba testa:
Očigledno je da na osnovu dva sirova rezultata nećete moći da date odgovore na postavljena pitanja, jer vam nedostaje kontekst koji bi tim podacima dao smisao, npr. podatak o tome koliki je bio teorijski raspon bodova na testovima ili koliki je prosečan učinak svih studenata. Međutim, pozicija klizača ispod svakog reda ipak nam govori nešto o učinku A. M., jer je njegov rezultat na zelenom testu pomeren više udesno, ka većim rezultatima, a na plavom je upravo suprotno. Čak i na taj način smo izvršili standardizaciju, jer smo učinak A. M. izrazili kao poziciju u nizu rezultata koji su sortirani, odnosno rangirani. Ako kliknete taster Prikaži rezultate kao … rangove, biće prikazane i konkretne vrednosti tih pozicija za svakog ispitanika. Kada uspeh A. M. izrazimo njegovim rangovima na listi svih studenata (15 i 55) umesto sirovim brojem bodova (37 i 42), možemo da zaključimo da je A. M. relativno dobro uradio prvi test i da ga je verovatno uradio bolje od drugog testa, naravno pod uslovom da smo rang 1 dodelili najboljem studentu u grupi. Obratite pažnju na to da neki studenti imaju vrednosti rangova koje nisu celobrojne. U pitanju je način računanja tzv. spojenih rangova za više istih rezultata. Ako su npr. 7, 8, 9. i 10. student ostvarili isti broj poena na testu, onda i njihov rang treba da bude jednak. Zajednički rang obično se računa kao prosek rangova koji bi inače bili dodeljeni vrednostima po redosledu na listi, u ovom slučaju 8,5.
Korišćenje rangova kao načina standardizacije vrednosti varijable ima dva nedostatka. Prvi je činjenica da rangovi nisu ekvidistantne jedinice, jer zavise od gustine rezultata u različitim delovima distribucije. Na primer, kada pogledate rezultat studenta A. M., primetićete da je njegov rang na plavom testu bolji za 3 pozicije od studenata koji su osvojili samo bod manje. Ako pomerite plavi red ka najmanjim vrednostima, uočićete da se poslednji i pretposlednji student međusobno razlikuju za čak 5 bodova, iako je razlika njihovih rangova samo 1. To znači da rangovi pružaju informaciju o tome koji rezultat je bolji ili lošiji od nekog drugog, ali ne i za koliko. Drugi i bitniji nedostatak upotrebe rangova kao standardnih mera je činjenica da njihove vrednosti zavise od broja merenja. U ovom primeru, rangovi na različitim testovima uporedivi su samo zato što je oba testa radio isti broj studenata. Da je, na primer, drugi test uradilo deset studenata manje, rangovi više ne bi bili uporedivi, jer bi na prvom testu rang 40 označavao da se student nalazi otprilike na polovini rang liste, dok bi na drugom ukazivao da je on po učinku u donjoj polovini grupe. Uostalom, mi tvrdimo da je A. M. „relativno dobro“ uradio test samo zato što znamo da je u grupi bilo 80 studenata. Rang 15 bi imao potpuno drugačije značenje da je ostvaren u grupi od 20 studenata. Ovaj nedostatak ispravlja se veoma lako, tako što se rang svakog rezultata podeli najvećim rangom u grupi i pomnoži sa sto. Na taj način se dobijaju percentilni rangovi čije vrednosti se uvek kreću u rasponu od 0 do 100 i pokazuju na kom procentualnom delu distribucije podataka se nalazi neki rezultat. Ovde treba napomenuti da smer rangiranja obično nije isti za ova dva oblika transformacije rezultata. Uobičajeno je da se rangiranje po uspehu obavlja tako što se prvi rang dodeli najboljem rezultatu. Međutim, kod percentilnih rangova logika je upravo suprotna. Najniži percentilni rang dodeljuje se najmanjem rezultatu, odnosno krajnjem levom rezultatu neke distribucije podataka. To znači da pre formiranja percentilnih rangova, bodove studenata treba sortirati obratno, tako da najbolji student dobije najniži rang. Upravo to su rezultati koje dobijate ako kliknete taster Prikaži rezultate kao … percentilne rangove. Najbolji student sada dobija transformisani rezultat 100, što znači da je 100% studenata u grupi po učinku jednako ili lošije od njega. Analogno tome, student koji ima percentilni rang 50, nalazi se na polovini rang liste. Student A. M. ima percentilni rang 82,5 na zelenom testu, što znači da ga je uradio bolje od približno 82% studenata. Njegov percentilni rang na plavom testu ukazuje na to da ga je uradio znatno lošije od zelenog, jer je na tom testu bolji od približno trećine studenata. Sirovi rezultati koji su povezani sa odgovarajućim percentilnim rangovima nazivaju se percentili ili centili. Kao što smo rekli u odeljku o interkvartilnom rasponu, to su podeoci koji dele distribuciju na 100 jednakih delova. Na primer, vrednost 31 na zelenom testu je 60. percentil distribucije, odnosno vrednost ispod koje se nalazi oko 60% rezultata svih ispitanika. Treba imati na umu da percentilni rangovi, kao ni rangovi, nisu ekvidistantne jedinice, tako da pomenutih 100 delova distribucije nije jednako po rasponu sirovih rezultata, već po njihovom broju. Na primer, na plavom testu, isti broj (procenat) rezultata (studenata) nalazi se između vrednosti 40 i 44, kao i između vrednosti 23 i 34. Veći raspon koji je potreban da bi se obuhvatilo 10% rezultata u zoni nižih vrednosti ukazuje na to da je više studenata grupisano oko vrednosti 40, dok su levi i desni kraj (normalne) distribucije razvučeni, pa se u tim zonama nalazi manji broj rezultata. Da je distribucija bodova bila uniformna, rangovi bi postali ekvidistantni, jer bi isti raspon bodova, u bilo kom delu distribucije, obuhvatao isti procenat rezultata, odnosno studenata.
Položaj rezultata u grupi najbolje ćemo razumeti ako su nam poznate aritmetička sredina i standardna devijacija te grupe. Kada prikažete vrednosti M i s za oba testa, postaje jasno da je A. M. bolji od proseka grupe na zelenom, a lošiji od proseka na plavom testu. Pored toga, vidimo da je njegovo odstupanje od proseka izraženo apsolutnim brojem bodova veće na plavom testu (37 - 30 = 7), nego na zelenom (42 - 50 = -8). Međutim, kao što nam sirovi broj bodova A. M. ne govori puno o njegovom učinku van odgovarajućeg konteksta, tako nam ni njegovo odstupanje u broju bodova od proseka ne znači mnogo ako ne uzmemo u obzir varijabilnost rezultata. Kao što se vidi na osnovu raspona i standardnih devijacija, varijabilnost je veća na plavom testu. Razlika između najboljeg i najlošijeg studenta na plavom testu iznosi 83 boda, dok je raspon bodova na zelenom nekoliko puta manji. U skladu sa tim, može se reći da je odstupanje od 8 bodova na plavom testu, u relativnom smislu, manje nego odstupanje od 7 bodova na zelenom. Preciznije, prva razlika je blizu polovine vrednosti s2, a druga je jednaka vrednosti s1. Ovom logikom dolazimo do postupka standardizacije koji se veoma često koristi u psihologiji, a poznat je kao transformacija u z (zet) skorove ili z vrednosti. Standardizacija pretvaranjem u z vrednosti uzima u obzir kako prosek, tako i varijabilnost rezultata, a vrši se prema sledećoj formuli:
`z=(x-M)/s`
Svako x u grupi merenja pretvara se u njegovo odstupanje od proseka grupe kojoj pripada, pri čemu se to odstupanje izražava u broju standardnih devijacija. Kada kliknete opciju Prikaži rezultate kao … z skorove, u donjim redovima će biti prikazane standardizovani z skorovi svakog studenta. Student A. M. dobija z skor 1 na zelenom testu, jer je od proseka rezultata bolji za vrednost jedne s, dok je njegov standardizovani skor na plavom testu oko -0,5, zato što je na njemu postigao rezultat koji je za približno pola standardne devijacije lošiji od proseka svih studenata. To znači da studenti koji su ostvarili prosečan rezultat, nakon standardizacije dobijaju z vrednost 0, pa tako i aritmetička sredina novonastale varijable postaje 0. Standardna devijacija standardizovane (z) varijable, kao i njena varijansa, uvek iznosi 1, što može da se dokaže pomoću formula za računanje z vrednosti i pravilnosti koje smo pomenuli u poglavlju o centralnoj graničnoj teoremi:
`s_z=s_((X-M)/s)=s_(X-M)/s=s_X/s=s/s=1`
S obzirom na to da su rezultati koje koristimo u ovom primeru distribuirani normalno, standardizovane vrednosti bodova nam omogućavaju da donesemo određene zaključke o gustini verovatnoća ispod normalne krive. Odaberite opciju Pozicioniraj redove na … z1 = 2 i z2 = 1 da biste označili kućice u kojima se nalaze rezultati studenta koji je na plavom testu bolji za 2 standardne devijacije od proseka i studenta koji je na zelenom testu bolji za jednu standardnu devijaciju od proseka. Ako standardizovane vrednosti izrazite kao percentilne rangove, možete zaključiti da je vrednosti z = 1 analogna vrednost 85. centila, a da vrednosti z = 2 odgovara vrednost 97,5. centila. Ova pravilnost je karakteristika svake (približno) normalne distribucije. Ukoliko je neka varijabla normalno distribuirana, već na osnovu z vrednosti može da se zaključi kolika je verovatnoća ishoda koji se nalaze iznad i/ili ispod te tačke. U našem primeru, student koji ima z vrednost 2 na testu čiji su rezultati normalno distribuirani, bolji je od približno 97,5%, a lošiji od približno 2,5% svojih kolega. Pošto je normalna distribucija simetrična, isti princip je primenjiv i na suprotni kraj distribucije. Ako pronađete poziciju studenta koji je osvojio 16 bodova na plavom testu, primetićete da tom broju odgovara z vrednost -2, odnosno percentilni rang 2,5. Student koji na plavom testu ima 16 bodova, bolji je od samo 2,5% svojih kolega. To znači da se približno 95% vrednosti varijable koja je normalno distribuirana nalazi između vrednosti M - 2 · s i vrednosti M + 2 · s. Ako isti princip primenimo za analizu vrednosti koje se nalaze na pozicijama z = 1 i z = -1 na oba testa, dolazimo do zaključka da interval M ± 1 · s obuhvata oko 68% rezultata. Ove pravilnosti vezane za gustinu verovatnoća, odnosno površinu ispod normalne krive, biće detaljnije opisane u narednom poglavlju.
Standardizacija sirovih rezultata merenja olakšava intraindividualno i interindividualno poređenje. Prvi termin označava mogućnost poređenja rezultata iste osobe na različitim varijablama, npr. na dva testa znanja. Drugi termin označava mogućnost poređenja različitih osoba na istim, pa čak i na različitim varijablama. Zvuči pomalo čudno, ali može se reći da je osoba koja ima z = 1,64 na težini, a z = -0,98 na visini, više teška nego što je visoka. Pri tome uvek treba imati na umu da je u pitanju relativna vrednost varijable, izračunata na osnovu proseka grupe rezultata. U našem primeru sa testovima, student koji je osvojio 47 bodova na zelenom testu dobiće z skor 2,43, što upućuje na njegov izuzetno dobar učinak. Međutim, ukoliko pretpostavimo da je teorijski raspon na testu bio 100 bodova, njegov apsolutni učinak više nije tako dobar. Međutim, on je ipak najbolji u svojoj grupi, tj. u kontekstu uspeha ostalih studenata na istom testu. To je suština standardizacije u psihologiji, jer se pojam „normalnog“ ili „prosečnog“ najčešće definiše na osnovu rezultata referentne grupe u kojoj se merenja obavljaju. Kada bi svi stanovnici planete Zemlje naprasno postali inteligentniji i imali u proseku koeficijent inteligencije 120, onda bi se upravo ta vrednost proglasila „normalnom“.
Još jedna pogodnost koju nude z skorovi jeste mogućnost da se njihov raspon prilagodi vrednostima koje su istraživaču najpogodnije za potrebe analize i interpretacije podataka. Aritmetička sredina i standardna devijacija z distribucije mogu da se izmene jednostavnim računskim operacijama, a da se pri tome očuva njihov smisao i relativna pozicija ispitanika u grupi. Na primer, odluka da se prosečna vrednost IQ skale označi sa 100, nije ništa drugo nego međunarodni konsenzus psihologa. Prosečan IQ skor mogao je isto tako da bude označen nulom ili vrednošću 50. To je jedan od razloga zbog kojih IQ skalu smatramo intervalnom a ne razmernom. Ako zamislimo da su zeleni i plavi test bili testovi sposobnosti, sve bodove možemo da transformišemo u vrednosti standardne IQ skale tako što najpre sirove rezultate pretvorimo u z skorove, a potom svaki z skor pomnožimo vrednošću željene standardne devijacije i saberemo sa vrednošću željene aritmetičke sredine. U slučaju IQ skale, te vrednosti su σ = 15 i μ = 100. Ovako dobijeni IQ skorovi prikazuju se kada kliknete opciju Prikaži rezultate kao … IQ skorove. Biti prosečan sada ne znači imati 30 bodova, već imati IQ 100. Analogno tome, biti bolji od 97,5% studenata sada znači imati IQ skor 130. Na sličan način može se obaviti bilo koja druga vrsta linearne transformacije sirovih rezultata. Na primer, u oblasti psihometrije često se koristi skala T skorova, čija je aritmetička sredina 50, a standardna devijacija 10.
2.6.4. Površina ispod normalne krive
Normalna distribucija je jedna od najznačajnijih distribucija u statistici. Već smo pokazali da centralna granična teorema pruža osnov za procenu verovatnoća ishoda koji nastaju kao suma nasumičnih varijabli. Opisane pravilnosti su posebne korisne u oblasti inferencijalne statistike. Normalna distribucija predstavlja važan fenomen i u oblasti psihologije, jer se veliki broj varijabli, npr. osobine ličnosti ili različite sposobnosti, distribuira na ovaj način. Stoga bi trebalo poznavati osnovne karakteristike normalne distribucije kao teorijskog modela i matematičke funkcije. Uzmimo kao primer
rezultate na testu sposobnosti izražene IQ skorovima za koje se smatra da su u populaciji normalno distribuirani. Na početku je prikazan histogram IQ vrednosti uzorka veličine 500 uzetog iz opšte populacije. Svaki put kada kliknete opciju
Prikaži histogram, biće prikazivani rezultati novog i drugačijeg uzorka od 500 osoba uzetih iz iste opšte populacije. Dobijene distribucije se međusobno razlikuju, ali upućuju na isti zaključak – najverovatnije je da će se iz populacije nasumično odabrati osobe koje su prosečne inteligencije. Pri tome se, kao što smo rekli, ne misli na IQ skor 100 kao očekivanu vrednost aritmetičke sredine, već na raspon IQ skorova u blizini te vrednosti koji obuhvata najveći broj članova populacije i najveći broj osoba u uzorku. Svaka od dobijenih empirijskih distribucija rezultata u uzorcima, može približno da se predstavi ili
aproksimira teorijskom krivom koja je prikazana kao crvena linija. Ova linija predstavlja funkciju gustine verovatnoće koja se primenjuje na sve normalno distribuirane varijable. Već smo pomenuli da svaka funkcija verovatnoće može da se izrazi odgovarajućom formulom, a u slučaju normalne distribucije, ta formula izgleda ovako:
`f(x) = 1/(sigmasqrt(2pi))*e^(-((x-mu)^2)/(2sigma^2))`
Pošto su e (Ojlerov broj) i π (Arhimedov broj) konstante, funkcija pokazuje da verovatnoća bilo koje vrednosti x normalno distribuirane varijable može da se predvidi na osnovu dva njena parametra – aritmetičke sredine µ i standardne devijacije σ. Ako u formulu uvrstimo vrednosti x = 130, µ = 100 i σ = 15, možemo da zaključimo da je verovatnoća da neka osoba u opštoj populaciji ima IQ veći od 130 veoma mala. Štaviše, možemo da budemo još precizniji ukoliko koristimo pravilnosti vezane za površinu ispod normalne krive. Ranije smo objasnili da se, za razliku od funkcije mase verovatnoće, funkcija gustine ne koristi za opisivanje verovatnoće pojedinačnog ishoda, već za opisivanje gustine verovatnoća u određenom rasponu ishoda. Na primer, kada odaberete opciju Prikaži površinu, biće prikazana površina ispod normalne krive koju formira interval vrednosti između jedne standardne devijacije levo i jedne standardne devijacije desno od aritmetičke sredine. U slučaju standardizovane varijable čija je aritmetička sredina 0, to je interval između -1 i 1, dok bi u slučaju IQ, to bio interval između 85 (100 - 15) i 115 (100 + 15). Kao što vidite, taj interval obuhvata približno 68% svih rezultata. To znači da, ukoliko je inteligencija zaista distribuirana normalno sa µ = 100 i σ = 15, približno 68% populacije ima IQ između 85 i 115. Ili, drugačije rečeno, ukoliko nasumično birate osobe iz opšte populacije, verovatnoća da odaberete nekoga ko ima IQ između 85 i 115 iznosi 68%. Ako počnemo da proširujemo osenčeni interval, njime će biti obuhvatan sve veći i veći broj ishoda, odnosno rezultata. Međutim, taj priraštaj će biti sve manji kako se približavamo krajevima distribucije. Postavite i levu i desnu granicu osenčene površine na vrednost 0, potom jednu od njih polako pomerajte ka desnom kraju distribucije. Obratite pažnju na to da do vrednosti 1, odnosno µ + 1σ, procenat raste veoma brzo, a nakon te tačke dosta sporije, da bi između 3. i 4. standardne devijacije porast postao gotovo beznačajan. Istu pravilnost uočićete dok levu granicu pomerate ka levom kraju distribucije. Ova promena iz brzog u spori priraštaj dešava se na precizno definisanim mestima koja se nazivaju tačke prevoja ili infleksije. Kada kliknete opciju Prikaži tačke prevoja, na crvenoj liniji biće označene tačke prevoja u kojima distribucija menja svoj tok i prelazi iz konkavnog (ispupčenog) u konveksan (udubljen) oblik. Uočite da se tačke prevoja nalaze iznad vrednosti jedne standardne devijacije levo i desno od proseka.
Na osnovu do sada opisanih pravilnosti, možemo da sažmemo nekoliko osnovnih svojstava teorijske normalne distribucije. Najpre, ona je simetrična, što znači da su njena leva i desna strana potpuno jednake u odnosu na središnju osu i aritmetičku sredinu. Drugim rečima, 50% ishoda nalazi se u rasponu od 0 do levog kraja distribucije, kao i od 0 do njenog desnog kraja. U vezi sa tim, teorijska normalna distribucija ima samo jedan očigledan vrh iznad aritmetičke sredine, pa se stoga kaže da je unimodalna. Međutim, ukoliko pokušate da prikažete verovatnoću moda ili najčešće vrednosti postavljanjem obe granice površine na istu tačku, primetićete da je to nemoguće i da je vrednost uvek 0%. Ovo je posledica ranije pomenute kontinuiranosti funkcije gustina verovatnoća. Zbog specifične pozicije tačaka prevoja, obično se kaže da simetrični krajevi normalne distribucije imaju sigmoidalan oblik koji podseća na latinična slova S. Ovaj oblik ukazuje na to da je najveća gustina verovatnoća skoncentrisana u rasponu µ ± 1σ. Ukoliko taj raspon povećavamo, njime ćemo obuhvatati sve veći procenat mogućih vrednosti. Ako raspon povećamo za po jednu standardnu devijaciju, obuhvatićemo približno 95% rezultata. Preciznije, 95% rezultata koji potiču iz normalne distribucije naći će se u rasponu µ ± 1,96 · σ. Dodavanjem još jedne standardne devijacije, dolazimo do raspona koji obuhvata gotovo sve rezultate. Konkretno, verovatnoća da se neka vrednost uzeta iz normalne distribucije nađe u intervalu µ ± 2,58 · σ iznosi 99%. Kao što smo rekli, dalje povećavanje raspona praktično nema smisla, jer će se njime ostvarivati sve manji i manji priraštaj, a raspon vrednosti nikada neće dostići 100%. Ova karakteristika teorijske normalne distribucije zove se asimptotičnost. Asimptotičnost se na grafikonu ispoljava tako što crvena linija dodiruje x-osu tek u beskonačnosti. U praktičnom smislu, to znači da u statistici nikada ne možemo da budemo 100% sigurni u svoje zaključke. Na primer, ne bi trebalo da tvrdite da ste 100% sigurni da u populaciji ne postoji osoba koja bi ostvarila bolji rezultat na testu sposobnosti od najvišeg rezultata koji ste opazili u svom uzorku. Možete samo da kažete da je ta verovatnoća izuzetno mala, npr. manja od 5% ili 1%. Srećom, to je sasvim dovoljno za potrebe statističkog zaključivanja. Naravno, često postoji i ograničenje instrumenata koje koristimo, jer čak i da u populaciji postoji osoba koja ima IQ 250, to ne bismo mogli da izmerimo. U tom smislu, empirijske distribucije dobijene na uzorku samo su bolja ili lošija procena stanja u populaciji, ali na njih se mogu primeniti pravila koja se odnose na odgovarajuće teorijske distribucije. Ako ponovo prikažete histogram sirovih rezultata, primetićete da on nije ni simetričan, ni kontinuiran, ni asimptotičan, možda čak ni unimodalan, ali njegova sličnost sa normalnom distribucijom nam ipak daje za pravo da primenjujemo sva pomenuta pravila. Intervali M ± 1,96 · s i M ± 2,58 · s, obuhvataju približno iste procente ishoda koje u teorijskoj distribuciji obuhvataju intervali µ ± 1,96 · σ i µ ± 2,58 · σ.
2.6.5. Standardna greška aritmetičke sredine
Do sada smo, u kontekstu verovatnoće ishoda, često ukazivali na razlike između onoga što se očekuje i onoga što se opazi u istraživanju. Teorijske verovatnoće vezivali smo za svojstva populacije, a empirijske za svojstva uzorka. Primeri sa novčićima i kockicama za igru bili su pogodni za ilustraciju osnovnih principa statističkog zaključivanja zato što su nam kod njih poznate teorijske verovatnoće ishoda. Međutim, u istraživanjima najčešće nisu poznati parametri distribucija varijabli u populaciji, što znači da su M i s koje se dobiju na uzorku, samo bolje ili lošije procene nama nepoznatih vrednosti µ i σ. Pokazali smo da tačnost te procene zavisi od dva faktora. Prvo, greška M kao procene µ obrnuto je proporcionalna veličini uzorka – što je uzorak manji, verovatnije je da M bitno odstupa od µ. Drugo, greška M kao procene µ direktno je proporcionalna varijabilnosti (varijansi) pojave – što je varijabilnost veća, veća je verovatnoća da se u uzorku dobije M koja značajno odstupa od prave vrednosti µ. To znači da greška M kao procene µ neke varijable X, može da se izrazi sledećim odnosom:
`sigma_X^2/N`
U poglavlju o centralnoj graničnoj teoremi pokazali smo da je prosek varijansi jednak varijansi proseka, te bi gornji odnos mogao da se napiše i ovako:
`sigma_X^2/N=sigma_(X/N)^2=sigma_((Sigmax)/N)^2=sigma_M^2`
To znači da je:
`sigma_M=sigma_X/sqrt(N)`
Poslednja formula predstavlja izraz pomoću koga se izračunava vrednost standardne greške aritmetičke sredine. U nastavku teksta, detaljnije ćemo opisati logiku ovog važnog deskriptivnog pokazatelja i njegovu ulogu u donošenju zaključaka o izmerenim pojavama.
U vežbi ćemo koristiti
primere simuliranih IQ skorova. Za početak, odaberite prvu distribuciju sa leve padajuće liste. U pitanju su normalno distribuirani rezultati merenja, čija je aritmetička sredina oko 100, a standardna devijacija oko 15. Ove vrednosti prikazane su u kućicama sive tabele sa desne strane, a simboli µ i σ upotrebljeni su zato što prikazanu distribuciju tretiramo kao sliku ciljne populacije, npr. rezultate koje bismo dobili da smo sve studente neke države testirali testom sposobnosti. Jasno je da se iz iste, dovoljno velike populacije, može uzeti praktično neograničen broj uzoraka. Na primer, iz ciljne populacije koja ima oko 10.000 članova, može se uzeti više od 2 kvintilijarde (broj sa 33 nule) različitih kombinacija od po 10 članova. Svaki od tih uzoraka veličine 10, imao bi svoju M koja bi bila bolja ili lošija procena µ. Istraživač, naravno, neće uzimati hiljade uzoraka iz iste populacije, ali mora da bude svestan da je uzorak koji koristi, samo jedan od velikog broja mogućih uzoraka. Samim tim, aritmetička sredina koju je dobio, samo je jedna od velikog broja (drugačijih) aritmetičkih sredina koje su mogle da budu dobijene na uzorcima iste veličine, uzetim iz iste populacije. Aritmetičke sredine izračunate na tako formiranim uzorcima možemo da prikažemo i grafički. Odaberite opciju N = 10 na desnoj padajućoj listi da biste simulirali uzimanje uzoraka veličine 10 iz prikazane populacije i iscrtali dobijene aritmetičke sredine na grafikonu. Iz populacije će biti uzeto 2.000 uzoraka. Kao što vidite, u uzorcima veličine 10 dobijaju se i vrednosti M koje se dosta razlikuju od µ. U crvenoj tabeli prikazana je aritmetička sredina nasumično formiranog uzorka koja je najudaljenija od prave aritmetičke sredine u levu stranu, a u plavoj aritmetička sredina uzorka koja je od nje najviše udaljena udesno, ka većim vrednostima. Na osnovu grafikona vidi se da je dobijanje takvih ekstremno pogrešnih vrednosti malo verovatno, ali moguće. U zelenoj tabeli prikazuju se aritmetičke sredine dobijene na svakom pedesetom nasumično formiranom uzorku. Simbol N
M u sivoj tabeli označava broj M-ova prikazanih na desnom grafikonu, odnosno broj uzoraka koji su uzeti iz populacije, a simbol M
M aritmetičku sredinu tih M-ova. Obratite pažnju na to da sa porastom broja uzoraka uzetih iz iste populacije, distribucija njihovih aritmetičkih sredina sve više podseća na normalnu krivu, a aritmetička sredina aritmetičkih sredina M
M postaje sve bliža aritmetičkoj sredini populacije µ. Ovo je još jedna od važnih i korisnih manifestacija centralne granične teoreme. Ako isti postupak ponovite na uzorcima veličine 50 (N = 50), primetićete da je distribucija velikog broja tako dobijenih M-ova takođe približno normalna, ali je njena varijabilnost manja. Ta varijabilnost nije ništa drugo do ranije pomenuta standardna greška aritmetičke sredine, koja je u sivoj tabeli prikazana simbolom σ
M. To znači da je standardna greška aritmetičke sredine zapravo standardna devijacija aritmetičkih sredina uzoraka iste veličine, uzetih iz iste populacije. U primeru sa veličinom uzoraka od 50 studenata, ona je izračunata po formuli:
`sigma_M=sigma/sqrt(50)`
Sada je jasnije i zbog čega se za označavanje standardne devijacije i standardne greške aritmetičke sredine koristi isti osnovni simbol – σ. Oba pokazatelja su mere varijabilnosti, odnosno standardne devijacije, ali se u slučaju distribucija statistika, kao procena parametara populacije, obično koristi termin standardna greška (parametra). Vrednost σM uvek se izražava u istim jedinicama u kojima se izražavaju μ i σ. U našem primeru to su IQ jedinice. Ako umesto N = 50 odaberete opciju N = 250, primetićete da se vrednost σM dodatno smanjuje, jer su aritmetičke sredine tako velikih uzoraka još tačnije procene aritmetičke sredine populacije. Ako bismo, na kraju, pojavu izmerili na celoj populaciji, greške aritmetičke sredine ne bi ni bilo. Kada na levoj listi odaberete drugu normalnu distribuciju, koja ima manju varijansu od prve, primetićete da na uzorcima veličine 250, σM postaje još manja. Vrednosti M su sada gotovo uvek odlične procene prave µ, zbog relativno male varijanse pojave u populaciji i relativno velikih uzoraka na kojima se računaju aritmetičke sredine. Ekstremno pogrešne aritmetičke sredine, koje su prikazane u crvenoj i plavoj tabeli, sada su znatno bliže vrednosti μ nego u prethodnom primeru.
Odaberite treću distribuciju sa leve liste i opciju N = 10 sa desne, kako biste simulirali uzimanje uzoraka veličine 10 iz populacije u kojoj IQ skorovi nisu distribuirani normalno, već uniformno. Varijansa distribucije u populaciji znatno je veća nego u prethodna dva primera i iznosi približno 29 jedinica. Očigledno je da ne postoji jasno grupisanje rezultata oko proseka, jer je podjednak broj osoba postigao rezultate koji su prosečni, kao i one koji su znatno iznad ili znatno ispod proseka. Međutim, bez obzira na to što varijabla nije distribuirana normalno u populaciji, aritmetičke sredine uzoraka uzetih iz te populacije ipak formiraju tipičnu zvonastu krivu prikazanu na desnom grafikonu. Što je veličina uzoraka veća, oblik distribucije njihovih aritmetičkih sredina sve više podseća na standardnu normalnu raspodelu. To znači da na distribuciju M-ova velikih uzoraka uzetih iz iste populacije, bez obzira na oblik distribucije varijable u populaciji, mogu da se primene pravilnosti vezane za površinu ispod normalne krive. Analogno rasponu µ ± z · σ, koji obuhvata određeni procenat normalno distribuiranih podataka, zaključujemo da se isti procenat distribucije M-ova može obuhvatiti intervalom µ ± z · σM. Vrednost z u ovim izrazima predstavlja bilo koju vrednost uzetu iz standardne normalne distribucije na osnovu koje se formira željeni interval. Pomenuli smo da su dve najčešće korišćene vrednosti 1,96 i 2,58. To znači, na primer, da bismo u 99% uzoraka uzetih iz populacije čija je aritmetička sredina µ, dobili M koja se nalazi u intervalu između µ - 2,58 · σM i µ + 2,58 · σM. Ovaj interval prikazan je u trećem redu sive tabele. Odaberite veličinu uzorka N = 250 i primer uniformne distribucije. Interval µ ± 2,58 · σM pokazuje da se 99% aritmetičkih sredina uzoraka veličine 250 nalazi između vrednosti 95,5 i 105, iako je aritmetička sredina populacije približno 100. To znači da su u približno 1% uzoraka dobijene aritmetičke sredine koje odstupaju od µ za više od 2,58 vrednosti σM. Vrednosti M u crvenoj i plavoj tabeli najverovatnije su upravo takve ekstremno pogrešne procene µ, koje se nalaze van raspona µ ± 2,58 · σM. Na osnovu boje kojom su ispisane vrednosti M, možete da zaključite da li je zaista tako. Zelena boja označava da se M nalazi u intervalu µ ± 2,58 · σM a crvena da je van njega.
Sa leve padajuće liste odaberite 4. distribuciju a sa desne opciju N = 10. Distribucija M-ova uzoraka uzetih iz bimodalne distribucije takođe podseća na normalnu, a ukoliko su uzorci dovoljno veliki, na nju će moći da se primeni i pravilnost vezana za raspone µ ± z · σM. Više puta smo ukazali na teorijsku važnost ovog raspona, ali kakva je njegova praktična korist u istraživanjima? Odgovor je – nikakva, jer istraživaču nisu poznate vrednosti µ i σ. Međutim, to ne znači da opisane pravilnosti ne mogu da se primene i na nivou uzorka. Naime, činjenica da svako M potiče iz teorijske distribucije M-ova, koja je normalna kada su uzorci veliki, omogućava da se uz pomoć formule:
`s_M=s/sqrt(N)`
izračuna standardna greška aritmetičke sredine uzorka. U ovoj situaciji istraživač menja smer zaključivanja, pretpostavljajući da je M koje je dobio u uzorku potpuno tačno, tj. da je jednako µ. Pri tome je svestan činjenice da su u drugim uzorcima iste veličine, uzetim iz iste populacije, mogle da se dobiju drugačije vrednosti M. Ovoga puta raspon koji obuhvata određeni procenat tih vrednosti određen je intervalom M ± z · sM a ne µ ± z · σM. U tako definisanom intervalu trebalo bi da se nađe i prava aritmetička sredina populacije. Verovatnoća da se to zaista desilo, određena je odabranom vrednošću z, koja se naziva marginom greške. Na primer, verovatnoća da se µ nalazi u intervalu M ± 1,96 · sM iznosi oko 95%, a da se nalazi u intervalu M ± 2,58 · sM oko 99%. Pošto indirektno govore o stepenu poverenja u M kao procenu μ, ovi intervali nazivaju se intervalima poverenja ili intervalima pouzdanosti aritmetičke sredine.
Većina statističara bi upravo iznetu interpretaciju intervala poverenja aritmetičke sredine smatrala netačnom. Naime, raspon vrednosti koji se dobija pomoću izraza M ± z · sM predstavlja ishod uzorkovanja, a ne nasumičnu varijablu za koju može da se veže distribucija verovatnoća. Varijablu bi činili svi mogući intervali izračunati na isti način. To znači da jedan konkretan interval može da sadrži ili da ne sadrži vrednost μ, odnosno da verovatnoća da on uključuje aritmetičku sredinu populacije iznosi 0 ili 1. Pomenutih 95% ili 99% ne odnosi se, dakle, na verovatnoću da se μ nalazi u određenom intervalu, već na verovatnoću da se u skupu svih intervala koji su formirani na isti način, dobije onaj koji u sebi sadrži pravu aritmetičku sredinu populacije. Za potrebe ovog udžbenika ipak ćemo se složiti sa pojedinim uglednim statističarima koji smatraju da je ovakvo tradicionalističko shvatanje samo „cepanje dlake na dva dela“, i da u većoj meri zbunjuje čitaoca nego što mu pomaže da shvati smisao i način primene intervala poverenja (Howell, 2012). Uz napomenu da se takav pristup može smatrati pogrešnim, intervale poverenja tretiraćemo kao raspone vrednosti u okviru kojih se, sa određenim stepenom verovatnoće, nalazi neki parametar. Pri tome treba imati na umu dve činjenice. Prvo, u statistici se uglavnom koriste dva pomenuta intervala od 95% i 99%, ali se može upotrebiti bilo koji drugi. Međutim, dodatno proširivanje intervala pouzdanosti najčešće nema smisla, jer zbog asimptotičnosti normalne distribucije, poverenje u M nikada ne može da dostigne 100%, niti verovatnoća da µ nije u definisanom intervalu može da postane 0. Tako je, na primer, verovatnoća da je µ van raspona M ± 1,96 · sM manja od 5%, da je van raspona M ± 2,58 · sM manja je od 1%, da je van raspona M ± 3 · sM manja je od 0,3%, dok je verovatnoća da µ nije u rasponu M ± 4 · sM manja od 0,007%. Vrednosti M koje se prikazuju u crvenoj, plavoj i zelenoj tabeli, ispisuju se zelenom bojom ako je µ u okvirima raspona µ ± 2,58 · σM, a crvenom ako nije.
Druga bitna činjenica vezana za intervale poverenja aritmetičke sredine, odnosi se na vrednosti margine greške koje se koriste za njihovo izračunavanje. Ako sa desne liste odaberete manje uzorke, veličine 10 ili 50, primetićete da se za izračunavanje intervala poverenja u crvenoj, plavoj i zelenoj tabeli ne koriste vrednosti 2,58 i 1,96. Razlog je vezan za primenu zakona velikih brojeva. Naime, centralna granična teorema može da se primeni na distribucije uzoračkih aritmetičkih sredina samo ako su uzorci dovoljno veliki, nezavisno od toga kakav je oblik distribucije u populaciji. Ukoliko su uzorci mali, distribucije njihovih aritmetičkih sredina više ili manje odstupaju od normalne distribucije. Tako je, ne primer, kao margina greške za N = 10 upotrebljena vrednost 3,25 umesto 2,58, odnosno 2,26 umesto 1,96. O načinu na koji se određuju margine greške u slučaju malih uzoraka, biće više reči u narednom odeljku. Za sada je bitno da uočite da su vrednosti M i intervala poverenja M koji se prikazuju u zelenoj tabeli, najverovatnije obojeni zelenom bojom. To znači da se većina vrednosti M nalazi u rasponu µ ± 2,58 · σM, odnosno da se na osnovu većine tih vrednosti i odgovarajuće standardne greške aritmetičke sredine, dobija raspon koji obuhvata pravu aritmetičku sredinu populacije, iako je u pitanju interval poverenja od 95%. Obratite pažnju i na to da ekstremno pogrešne vrednosti M, prikazane u crvenoj i plavoj tabeli, najčešće daju intervale poverenja koji ne obuhvataju vrednost μ. Ipak, ove ekstremne vrednosti M dobijaju se veoma retko kada su uzorci nasumični i reprezentativni.
Za razliku od prva četiri primera distribucija u populaciji, dve poslednje raspodele sa leve padajuće liste su asimetrične, odnosno iskošene. Oblik pete distribucije nazivamo iskošenim ulevo, jer je njena leva strana ili rep (engl. tail) razvučenija nego desna. Takva distribucija mogla bi da se dobije ako je test sposobnosti bio relativno lak, pa je većina ispitanika ostvarila visoke rezultate. Ukoliko odaberete opciju N = 10 sa desne liste, primetićete da distribucija M-ova u ovom slučaju nema oblik normalne krive i da je takođe blago iskošena ulevo. Kao što smo rekli, razlog je u tome što se centralna granična teorema manifestuje samo u slučaju velikog broja aritmetičkih sredina velikih uzoraka iste veličine, uzetih iz iste populacije. Kada bismo iz populacije uzimali uzorke veličine 1, dobili bismo distribuciju koja je identična distribuciji pojave u populaciji, dok bi se sa povećavanjem veličine uzoraka njen oblik sve više približavao normalnoj. Isti slučaj je i sa šestom distribucijom koja je iskošena udesno. Iskoristićemo navedene primere teorijskih distribucija da bismo dodatno pojasnili logiku µ i σ kao pokazatelja kojima se opisuju raspodele rezultata merenja. Kao što vidite, prve četiri distribucije prikazane sa leve strane imaju slične aritmetičke sredine, ali različite standardne devijacije. Sa druge strane, dve poslednje (iskošene) distribucije imaju različite proseke, ali sličnu varijabilnost. Pri tome, one imaju nešto veću standardnu devijaciju od prve normalne distribucije, ali bitno manju od uniformne i bimodalne. To znači da već sama standardna devijacija pruža informacije o nekoj vrsti greške aritmetičke sredine. Dok sM pokazuje koliko je M dobra procena µ, s pokazuje koliko je M dobra kao predstavnik svih vrednosti x. U našem primeru M ipak bolje predstavlja rezultate svih studenata kada su distribucije „samo“ iskošene, nego kada bitno odstupaju od normalne, kao u primeru uniformne ili bimodalne distribucije. U prvom slučaju, očiglednije je grupisanje rezultata oko jedne vrednosti koja se nalazi relativno blizu aritmetičkoj sredini. Na kraju, uočite i to da je kod pozitivno iskošene distribucije aritmetička sredina veća od moda, dok je kod negativno iskošene upravo suprotno.
U ovom poglavlju pokušali smo da pojasnimo matematičku i logičku osnovu formule za izračunavanje sM, ali je za čitaoca mnogo važnije da razume njenu praktičnu vrednost. Pored činjenice da nam omogućava da procenimo u kom rasponu rezultata bi mogla da se nađe µ, standardna greška aritmetičke sredine, odnosno njena formula, šalje nam nekoliko bitnih poruka. Prva je da će aritmetička sredina u uzorku biti potpuno tačna procena aritmetičke sredine u populaciji samo ako je varijabilnost merene pojave nulta ili ako je N beskonačno, tj. ako smo varijablu izmerili na celoj populaciji. Prva situacija je moguća, ali u tom slučaju reč je o varijabli koja nema nikakvu informativnu ili istraživačku vrednost. Podatak da su svi studenti na nekom testu dobili isti broj bodova potpuno je beskoristan u kontekstu statističke obrade, izuzev što nam pokazuje da test možda nije pouzdan. Druga situacija je najčešće nemoguća, obično neekonomična, a tek ponekad zaista poželjna. Dakle, istraživač mora da se pomiri sa činjenicom da M koje je izračunao na uzorku, uvek sa sobom nosi rizik greške. Srećom, centralna granična teorema omogućava nam da tu grešku kvantifikujemo.
Druga bitna poruka formule za izračunavanje sM vezana je za koren u njenom imeniocu. Poruka glasi da nema potrebe niti smisla da se uzorak povećava u beskonačnost, jer to povećanje nije u linearnom odnosu sa smanjenjem greške. Operacije korenovanja i stepenovanja su nelinearne transformacije vrednosti, što ste mogli da vidite na primeru kvadratne jednačine u odeljku o funkcijama. U kontekstu poverenja u aritmetičku sredinu, to znači da se veći efekat postiže povećavanjem malih uzoraka, nego dodatnim povećavanjem velikih. Na primer, ako se uzorak poveća sa 5 na 105, vrednost imenioca povećaće se oko 5 puta, te će se za toliko smanjiti i greška aritmetičke sredine. Ali ako se nakon toga uzorak poveća za dodatnih 100 ispitanika, tako da njegova veličina bude 205, vrednost imenioca biće manja tek oko 1,5 puta. Drugim rečima, povećanje uzorka ima opravdanja do određenog nivoa, nakon čega vrednost sM dostiže plato. Koji je to plato, zavisi na prvom mestu od varijabilnosti pojave koja se meri, ali o tome će biti više reči u narednom poglavlju. Ponovite prethodne vežbe na uzorcima različite veličine, za različite teorijske distribucije i posmatrajte za koliko se smanjuje standardna greška aritmetičke sredine kada se veličina uzorka poveća za 40, sa N = 10 na N = 50, a koliko kada se veličina poveća za 200 ispitanika, sa N = 50 na N = 250.
2.6.6. Skjunis i kurtozis
Varijable i njihove distribucije do sada smo opisivali koristeći dve vrste numeričkih pokazatelja. Prvu čine mere centralne tendencije, kojima se iskazuje najverovatniji ishod u nekoj distribuciji, npr. srednja, prosečna ili tipična vrednost. Ta vrednost treba što bolje da predstavlja sve podatke, odnosno da odredi tačku na x-osi oko koje se grupiše većina rezultata. Stoga se mere grupisanja često nazivaju i
lokacijom distribucije. Drugu grupu pokazatelja čine mere varijabilnosti, koje pokazuju koliko snažno se rezultati grupišu oko odabrane mere centralne tendencije. Međutim, pored lokacije i varijabilnosti, često je potrebno opisati i oblik distribucije. To se, naravno, najlakše postiže upotrebom grafikona, ali istraživač treba da bude upoznat i sa kvantitativnim pokazateljima koji se koriste za ove potrebe. Dva najčešća su
skjunis i
kurtozis. Postoji nekoliko različitih formula za njihovo izračunavanje (Panik, 2005), ali u većini statističkih programa koriste se algoritmi koji vrednosti skjunisa i kurtozisa vezuju za oblik i svojstva normalne raspodele. Naime, vrednosti ovih deskriptivnih pokazatelja uvek će iznositi 0 kada je distribucija normalna, tako da se njihova udaljenost od nulte vrednosti može upotrebiti za kvantifikaciju stepena odstupanja neke raspodele podataka od tipične zvonaste krive. Skjunis je pokazatelj iskošenosti (engl.
skewness) ili simetričnosti distribucije. Distribucija koja ima nultu vrednost skjunisa potpuno je simetrična, što ne mora da znači i da je normalna. Na primer,
prve četiri distribucije sa leve padajuće liste imaju skjunis blizak 0, jer su simetrične u odnosu na svoje centralne vrednosti. Sa druge strane, iskošene distribucije imaju skjunis različit od nule. Ulevo ili negativno iskošene distribucije imaju negativan skjunis, dok pozitivno iskošene distribucije imaju vrednosti skjunisa veće od 0. Skjunis distribucija prikazanih na levom grafikonu označen je simbolom
Sk u sivoj tabeli.
Za razliku od skjunisa, logika kurtozisa je manje intuitivna, ali je njegova vrednost veoma laka za interpretaciju. Kurtozis se često definiše kao pokazatelj ispupčenosti ili spljoštenosti distribucije, ali samo prvi deo ovog objašnjenja je zapravo tačan. Ako prikažete prve dve distribucije sa leve liste, primetićete da su njihove vrednosti kurtozisa (Ku) bliske nuli. Normalna distribucija smatra se srednje ispupčenom odnosno mezokurtičnom, jer njeni repovi nisu ni previše dugački, ni previše kratki u odnosu na dominantan broj središnjih vrednosti distribucije. Uniformna distribucija, međutim, ima vrednost kurtozisa manju od nule jer je spljoštena ili platikurtična. Tačnije, ona ni na jednom mestu nije ispupčena. Međutim, kada odaberete bimodalnu distribuciju, uočićete da vrednost kurtozisa postaje još manja. Kurtozis, dakle, treba shvatiti kao meru konkavnosti (st. gr. κυρτός) distribucije na mestu njene aritmetičke sredine, a u odnosu na njene krajeve, tj. repove. U tom smislu, nasuprot konkavnosti nije spljoštenost, već konveksnost, odnosno udubljenost distribucije. Iako to nije očigledno na prvi pogled, najmanju teorijsku vrednost kurtozisa (oko -2) ima Bernulijeva distribucija čija su dva ishoda jednako verovatna. U suštini, svi rezultati u ovoj distribuciji čine njene repove, jer ne postoji nijedan ishod koji je jednak proseku ili medijani. Drugim rečima, kurtozis pokazuje u kojoj meri rezultati koji su (znatno) udaljeni od aritmetičke sredine doprinose varijabilnosti pojave (Kaltenbach, 2012). Ukoliko je broj rezultata koji bitno povećavaju varijabilnost prevelik, kao kod bimodalne distribucije, kurtozis će biti negativan. Ukoliko je broj tih rezultata manji, kurtozis će biti pozitivan. To znači da kurtozis možemo da shvatimo i kao indikator postojanja aberantnih rezultata. Odaberite drugu distribuciju sa liste i obratite pažnju na to da su vrednosti 50, 100 i 150 na x-osi u stvari hiperlinkovi. Kliknite broj 100 da biste uklonili repove distribucije i zadržali samo rezultate bliske aritmetičkoj sredini. Distribucija postaje u većoj meri zaravnjena, tako da se vrednost kurtozisa smanjuje. Može se reći da sada nema dovoljno rezultata udaljenih od proseka da bi se distribucija smatrala normalnom. Ako, pak, kliknete brojeve 50 ili 150, kurtozis će se naglo povećati, jer se povećava varijabilnost zbog relativno malog broja aberantnih rezultata koji znatno odstupaju od aritmetičke sredine. Distribucija postaje ispupčena ili leptokurtična imajući u vidu ceo raspon x-ose. Kliknite ponovo iste brojeve da biste distribuciji vratili početni izgled.
Ranije smo pokazali da značajno odstupanje distribucije od normalnosti može da obesmisli izračunate vrednosti aritmetičke sredine i standardne devijacije kao najčešće korišćene mere grupisanja i raspršenja. Stepen i oblik odstupanja od normalnosti najlakše uočavamo na grafikonu, ali postavlja se pitanje koje vrednosti skjunisa i kurtozisa treba smatrati kritičnim u smislu bitno većih ili manjih od nule. Pošto se, kao i vrednosti drugih opisnih pokazatelja, skjunis i kurtozis računaju na uzorcima, većina statističkih paketa uz njihove vrednosti daje i vrednosti njihovih standardnih grešaka. Uz pomoć njih, a po istoj logici koju smo opisali u odeljku o standardnoj grešci aritmetičke sredine, mogu se izračunati intervali poverenja skjunisa i kurtozisa. U ovom slučaju nas takođe interesuje u kom intervalu se najverovatnije nalaze prave vrednosti pokazatelja za varijablu u populaciji, ali sada imamo i konkretnu vrednost koju tražimo, a to je nula. Ukoliko se nula nalazi unutar intervala poverenja skjunisa ili kurtozisa koji se izračunavaju kao Sk ± 1,96 · sSk, odnosno Ku ± 1,96 · sKu, zaključićemo da bi pokazatelji u populaciji vrlo verovatno mogli da budu nulti, iako smo na uzorku dobili nenulte vrednosti. Drugim rečima, iz populacije u kojoj je neka varijabla normalno distribuirana, moguće je izvući nasumični uzorak u kome ista varijabla nije normalno distribuirana. To smo, uostalom, više puta pokazali na raznim primerima uzimanja uzoraka. Naravno, sa povećanjem veličine uzorka, opada verovatnoća da će oblik distribucije znatno odstupati od slike u populaciji. Stoga pojedini autori smatraju da čak i umereno visoke apsolutne vrednosti skjunisa i kurtozisa ne utiču bitno na rezultate analize ukoliko su uzroci dovoljno veliki, npr. veći od 200 (Tabachnick & Fidell, 2014).
Ista kao i u prvom – oko 17%.
Verovatnoća oba ishoda je jednaka. Raznovrsnost brojeva u drugom ishodu sugeriše da bi on mogao češće da se dobije slučajno, ali verovatnoća da brojevi padnu tim redom potpuno je ista kao i da padne šest jedinica zaredom.
Ovoga puta je verovatniji drugi ishod, jer nas ne interesuje tačan redosled, već samo postojanje brojeva u skupu od šest kockica. Drugi ishod može da se dobije ako redom padnu brojevi 1, 2, 3, 4, 5, 6 ili 6, 5, 4, 3, 2, 1 ili 1, 3, 2, 4, 6, 5 i tako dalje. Prvi se dobija samo ako se na svim kockicama dobije broj 1.
Verovatnoća je veoma mala. U prvom bacanju je nebitno koji broj ćemo dobiti. Dakle, verovatnoća povoljnog ishoda je 6 : 6. U drugom treba da dobijemo neki od preostalih pet brojeva, pa je verovatnoća 5 : 6. I tako dalje. To znači da je verovatnoća da dobijemo prikazanu sliku (6 : 6) · (5 : 6) · (4 : 6) · (3 : 6) · (2 : 6) · (1 : 6) ili približno 1,5%.
Imajte na umu da različiti parovi brojeva mogu da daju iste sume. Samim tim, neke sume su verovatnije od drugih.
Ne, jer različite sume mogu da se dobiju različitim brojem permutacija brojeva. Najverovatniji ishod je 7 jer se dobija najvećim brojem permutacija. Najmanje verovatni ishodi (sume) su 2 i 12.
Na osnovu pozicije u nizu, može se reći da je A. M. dobro uradio test. Međutim, to i dalje ne znači da ga je uradio dovoljno dobro jer nemamo podatke o karakteristikama testa.
Na ovo pitanje nije moguće dati odgovor jer nemamo dovoljno podataka o testovima. Veći broj bodova u apsolutnom smislu ne znači da je student bolje uradio neki test. Moguće je da se razlikuju teorijski rasponi rezultata testova.
Odgovor može da se da samo u apsolutnom smislu ali ne i u relativnom. Razlika od 17 bodova može da bude velika ili mala, u zavisnosti od ukupnog raspona rezultata i karakteristika distribucije.
Obratite pažnju na to da isti rasponi z skorova ne obuhvataju isti procenat rezultata, tj. istu proporciju površine ispod normalne krive. Na primer, rasponom rezultata između proseka i prve standardne devijacije, obuhvaćeno je duplo više rezultata nego rasponom od z vrednosti 1 do desnog kraja distribucije.
Izvan raspona µ ± 1,96 · σ nalazi se 100 - 95 ili oko 5% rezultata. Izvan raspona µ ± 2,58 · σ nalazi se približno 1% svih rezultata.
Verovatnoća je približno 16%.
Verovatnoća je približno 5%.
Verovatnoća je približno 14%.
Središnji rezultati više „štrče“ ako se aberantni rezultati dodaju samo sa jedne strane. Kada se dodaju i autlajeri sa desne strane, aberantnost više nije toliko izražena, jer veliki broj atipičnih rezultata prestaje da bude atipično. Štaviše, ako biste nastavili da dodajete rezultate samo sa leve ili desne strane, kurtozis bi se najpre približavao nuli, a nakon toga bi postao negativan.
Dodavanje rezultata samo sa jedne strane, zakrivljuje distribuciju u tu stranu, tako da se vrednost skjunisa menja u zavisnosti od smera iskošenosti. Ako se aberantni rezultati dodaju sa obe strane, distribucija je simetrična, te je i njen skjunis blizak nuli.