Uvod Pojam, vrste i svrha vizualizacije 1.1. Vizuelno mišljenje 1.2. Vizuelna komunikacija 1.3. Vizuelna pismenost 1.3.1. Različiti aspekti vizuelne pismenosti 1.3.1.1. Piktogrami i piktografici 1.4. Karta, mapa, dijagram, grafik, infografik 1.5. Podatak, informacija, znanje, razumevanje 1.5.1. Tabelarni i grafički prikaz podataka 1.5.2. Deskriptivna i inferencijalna statistika 1.6. Naučna vizualizacija i vizualizacija informacija 1.7. Vizualizacija kao eksplorativna tehnika 1.8. Izbor prikladne tehnike vizualizacije 1.8.1. Nivoi merenja varijabli 1.8.2. Hijerarhija vizuelnih kodova 1.8.3. Čitljivost grafikona 1.9. Prvi test znanja Vizualizacija distribucija verovatnoća 2.1. Pojam verovatnoće 2.2. Populacija i uzorak 2.2.1. Tehnike uzorkovanja 2.3. Pojam nasumičnosti ili slučajnosti 2.4. Pojam varijabilnosti 2.5. Osnovne tehnike sažimanja podataka 2.5.1. Tabele frekvencija i tabele kontingencije 2.5.2. Mere grupisanja ili centralne tendencije 2.5.2.1. Aritmetička sredina, medijana i mod 2.5.2.2. Još neke vrste prosečnih vrednosti 2.5.3. Mere raspršenja ili varijabilnosti 2.5.3.1. Vizuelna procena i poređenje varijabilnosti 2.5.3.2. Varijansa i standardna devijacija 2.5.3.3. Pojam matematičke funkcije 2.5.3.4. Interkvartilni raspon 2.6. Karakteristike i važnost normalne distribucije 2.6.1. Centralna granična teorema 2.6.2. Funkcije mase i gustine verovatnoće 2.6.3. Standardizacija sirovih rezultata 2.6.4. Površina ispod normalne krive 2.6.5. Standardna greška aritmetičke sredine 2.6.6. Skjunis i kurtozis 2.7. Još neke važne statističke distribucije 2.7.1. Studentova t distribucija 2.7.2. Hi-kvadrat distribucija 2.7.3. Fišer-Snedekorova F distribucija 2.8. Stepeni slobode 2.9. Test-statistici, p vrednosti i nivoi značajnosti 2.9.1. Jednostrano testiranje razlika 2.10. Drugi test znanja Vizualizacija razlika i povezanosti između varijabli 3.1. Testiranje (ne)tačnosti nul-hipoteza 3.2. T-test za jedan uzorak 3.3. T-test za dva uzorka 3.3.1. Uslovi za primenu t-testa 3.4. Neparametrijske alternative t-testu za dva uzorka 3.4.1. Vold-Volfovicov test nizova 3.4.2. Kolmogorov-Smirnovljev test za dva uzorka 3.4.3. Men-Vitnijev test sume rangova 3.5. Hi-kvadrat test 3.5.1. Hi-kvadrat kao test nezavisnosti 3.5.2. Pojam veličine efekta 3.5.3. Hi-kvadrat kao test stepena poklapanja (distribucija) 3.5.4. Uslovi za primenu hi-kvadrat testa 3.6. Pirsonov produkt-moment koeficijent korelacije 3.6.1. Regresiona jednačina i regresiona prava 3.6.1.1. Smisao koeficijenta b i konstante a u regresionoj analizi 3.6.2. Standardna greška procene 3.6.3. Interpretacija koeficijenta korelacije 3.6.4. Uslovi za primenu Pirsonovog r 3.6.5. Korelacija i uzročnost 3.7. Koeficijenti korelacije za rangirane podatke 3.8. T-test za zavisne uzorke 3.9. Neparametrijske alternative t-testu za zavisne uzorke 3.10. Značajnost razlika uparenih podataka nominalnog nivoa 3.10.1. Maknimarov test 3.10.2. Koenova kapa 3.10.3. Testovi marginalne homogenosti za politomne varijable 3.11. Treći test znanja Završne napomene Literatura
2.9. Test-statistici, p vrednosti i nivoi značajnosti
U prethodnim odeljcima demonstrirali smo logiku nastanka t, χ2 i F distribucija na primerima rezultata uzorkovanih iz populacije standardnih z vrednosti. Iako smo ih vizualizovali uz pomoć histograma, napomenuli smo da se ove distribucije u statistici posmatraju kao teorijske, kontinuirane raspodele koje se opisuju odgovarajućim matematičkim funkcijama gustine verovatnoće. Na osnovu oblika krivih koje te funkcije formiraju, odnosno površina koje zahvataju, moguće je procenjivati verovatnoću različitih ishoda. Na primer, moguće je izraziti verovatnoću da se na uzorcima veličine 10 i 50 slučajno dobije F odnos koji iznosi 3. Na sličan način, ali koristeći t distribuciju, moguće je utvrditi verovatnoću da uzorak veličine 10, čija je aritmetička sredina 54, a standardna devijacija 5, potiče iz populacije čija aritmetička sredina iznosi 56. Drugim rečima, opisane teorijske distribucije omogućavaju da se na osnovu podataka prikupljenih na uzorku, testira tačnost pretpostavki o pojavama u populaciji. Primer takvih pretpostavki može da bude tvrdnja da se varijanse dva uzorka ne razlikuju ili da uzorak u kome je M = 16 potiče iz populacije čija je µ = 14. Stoga se vrednosti t, χ2 i F nazivaju test-statisticima (Howell, 2012), a analogne metode u kojima se koriste, poznate su kao t-test, χ2-test i F-test. Postupak primene ovih metoda biće detaljnije opisan u narednom poglavlju, ali pre toga je potrebno objasniti dva važna statistička koncepta - nivo verovatnoće i nivo značajnosti.
Zamislite da je visina u populaciji studenata distribuirana normalno sa µ = 160 cm i σ = 10 cm. To znači da približno 68% studenata ima visinu u intervalu µ ± 1 · σ (crvena površina), odnosno između 150 i 170 cm. Istu pravilnost možemo da posmatramo i drugačije, ukoliko interpretiramo deo površine izvan označenog intervala µ ± 1 · σ. Zamislite da ne znamo, već samo očekujemo ili pretpostavljamo da su parametri distribucije µ = 160 cm i σ = 10 cm. Kolika je verovatnoća da iz takve populacije nasumično odaberemo osobu čija visina odstupa od µ za jednu ili više σ, tj. studenta koji je viši od 170 cm ili niži od 150 cm? Nivo verovatnoće ili p nivo tog ishoda prikazan je plavom površinom i iznosi oko 32% ili 0,32. Naravno, oznaka p ne dolazi od reči plavo, već od latinske reči probabilitas i engleske probability. Ranije smo pomenuli da se verovatnoće u slučaju kontinuiranih distribucija gustine verovatnoće ne odnose na jedan ishod, već na raspon ishoda. Dakle, vrednost p od 0,32 označava verovatnoću da u populaciji koja ima gore navedene očekivane parametre, postoje studenti koji od µ odstupaju za jednu ili više σ. To takođe znači da bismo, čak i da je prosek visine u populaciji 160 cm, približno jednom u tri pokušaja, nasumičnim izborom, odabirali osobe koju su visoke 150 cm i niže ili 170 cm i više.
Kada bismo mogli da posumnjamo u tačnost početne pretpostavke o parametrima distribucije? Odaberite sa druge liste raspon -4,00 – 4,00 koji obuhvata gotovo 100% mogućih ishoda, odnosno visina studenata u populaciji. Verovatnoća da iz populacije u ovom primeru nasumično odaberemo studenta koji je visok 120 cm (µ - 4 · σ) ili manje, odnosno studenta koji je visok 200 cm (µ + 4 · σ) ili više, izuzetno je mala. Drugim rečima, ako je nasumično odabrani student visok 120 ili 200 cm, imamo razlog da posumnjamo u pretpostavljene parametre distribucije u populaciji, jer je u takvoj distribuciji ishod koji smo dobili izuzetno redak. Prilikom izvođenja ovakvog zaključka, polazimo od toga da je malo verovatno da takav rezultat dobijemo slučajno, tj. da je mnogo verovatnije da odabrani student u stvari potiče iz populacije čija µ nije 160 cm i/ili σ nije 10 cm. Tada imamo opravdanje da početnu pretpostavku smatramo netačnom, ali nikada nećemo biti potpuno sigurni da nismo pogrešili. Razlog je činjenica što, prostim slučajem, iz populacije u kojoj je varijabla distribuirana normalno, zaista možemo da dobijemo rezultat koji od µ odstupa za više od 4, 5, ili 6 σ. Mi se jednostavno vodimo logikom da su takvi slučajevi izuzetno retki i donosimo odluku na osnovu raspoloživih empirijskih podataka. To takođe znači da kao istraživači snosimo odgovornost za moguće odbacivanje tačne pretpostavke ili prihvatanje netačne. Prilikom donošenja te odluke, uobičajeno ja da se koriste unapred definisane granice u odnosu na koje se procenjuje da li je neki događaj dovoljno redak da bismo posumnjali u tačnost početne pretpostavke. Te granice se nazivaju nivoima značajnosti i označavaju se grčkim slovom α (alfa). U primeru sa intervalom -4,00 – 4,00, nivo značajnosti smo postavili na 0,00006, jer je tolika verovatnoća, odnosno p nivo, da iz skupa normalno distribuiranih podataka izvučemo rezultat koji od proseka odstupa za 4 ili više standardnih devijacija. U statistici, naravno, ne moramo da budemo toliko strogi. Opšte prihvaćena konvencija je da se koriste dva nivoa značajnosti, blaži od 5% ili 0,05 i stroži od 1% ili 0,01. Ako promenite raspone vrednosti površine označene crvenom bojom, uočićete da su to upravo oni rasponi koji se vezuju za ranije pomenute intervale poverenja µ ± 1,96 · σ i µ ± 2,58 · σ. Dakle, ishode koji se dešavaju samo pet puta u 100 merenja ili jednom u 100 merenja, u statistici smatramo dovoljno „čudnim“, „sumnjivim“, „retkim“ ili „atipičnim“, tako da imamo razlog da posumnjamo u pretpostavku od koje smo pošli. Istraživač može da se opredeli i za neki drugi nivo značajnosti, bilo da je on još blaži (npr. 10% ili 0,1) ili još stroži (npr. 0,1% ili 0,001), ali dva navedena nivoa se najčešće sreću u statističkim analizama. Poređenje p nivoa verovatnoće i α nivoa značajnosti predstavlja suštinu statističkog zaključivanja - ukoliko je p nivo dobijenog ishoda manji od postavljenog nivoa značajnosti, istraživač zaključuje da se polazna tvrdnja može smatrati netačnom. U suprotnom, smatraće je tačnom. U oba slučaja, verovatnoća greške nije nulta.
Logika statističkog zaključivanja koju smo opisali na primeru normalne distribucije, može da se primeni i na ostale teorijske distribucije. Sa prve liste odaberite Studentovu t distribuciju i obratite pažnju da njen oblik u slučaju veoma malog broja stepeni slobode, odnosno veoma malog uzorka na kome je izračunat t odnos, značajno odstupa od oblika Gausove krive. Interval µ ± 1 · σ, kojim je u slučaju normalne distribucije bilo obuhvaćeno oko 68% rezultata, zahvata tek 50% površine t distribucije za df = 1. Promenite broj stepeni slobode na 3 i uočite da se njen oblik približava obliku normalne distribucije sa povećanjem vrednosti df. Sada zamislite da ste na uzorku od samo četiri osobe želeli da procenite prosečnu vrednost sistolnog ili „gornjeg“ krvnog pritiska studenata. Dobili ste vrednosti M = 141 mmHg, s = 0,82 mmHg, tako da sM iznosi 0,41 mmHg. Vrednost df u ovom primeru iznosi 3 (N - 1), jer smo imali 4 ispitanika, odnosno merenja. Tvrdnja čiju tačnost želimo da proverimo je da prosečan krvni pristisak studenata ima normalnu vrednost od 140 mmHg. Odlučili smo se α = 0,05 kao blaži nivo značajnosti. Da bismo proverili tačnost postavljenje tvrdnje, upotrebićemo formulu iz poglavlja o t distribuciji:
`t=(M-mu)/s_M=(141-140)/0,41~~2,44`
Dakle, t vrednost aritmetičke sredine dobijene na uzorku od četiri studenta, uz pretpostavku da aritmetička sredina u populaciji iznosi 141, ima vrednost 2,44. Sa druge padajuće liste odaberite raspon -2,44 - 2,44, a sa treće 3 stepena slobode. Prikazani p nivo koji odgovara dobijenoj t vrednosti, odnosno dobijenoj M, iznosi 0,09. Pošto je veći od nivoa značajnosti 0,05, početnu tvrdnju ne možemo da smatramo tačnom. Iako se vrednosti 140 i 141 razlikuju u apsolutnom smislu, one se ne razlikuju statistički značajno. Pri tome treba obratiti pažnju na to da početna tvrdnja nije sadržala nikakvu pretpostavku o smeru razlike, tako da je t testom zapravo obavljeno dvostrano testiranje (eng. two-tailed). Vrednost 0,09 označava verovatnoću da se na uzorku veličine 4, slučajno dobije M koje je od µ udaljeno za 2,44 sM u bilo koju stranu. Jednostavnije rečeno, čak i da µ iznosi 140 mmHg, postoji 9% verovatnoće da potpuno slučajno dobijemo vrednost M koja je manja ili jednaka 139, odnosno veća ili jednaka 141. Upravo to se desilo u našem zamišljenom istraživanju, te zaključujemo da dobijeni ishod nije dovoljno redak da bismo 141 smatrali statistički značajno različitim ili udaljenim od 140. Obratite pažnju da bi za M = 139 apsolutna vrednost t bila ista, ali bi t odnos imao negativan predznak. Da li bi naš zaključak bio drugačiji da smo istu t vrednost dobili na nešto većem uzorku? Odaberite 9 kao broj stepeni slobode i proverite p nivo. Verovatnoća da u uzorku veličine 10 dobijemo M koje odstupa od µ za 2,44 ili više sM manja je nego u prethodnom primeru, tako da bismo vrednost 141 smatrali statistički značajno različitom od 140, ali samo na nivou 0,05. Dobijena razlika i dalje nije statistički značajna na nivou 0,01, jer je 0,04 veće od strožeg nivoa značajnosti koji se odnosi na 1% najređih ishoda. Ona ne bi bila značajna na tom strožem nivou čak ni na uzorku od približno 100 studenata, jer bi tada p nivo iznosio približno 0,02. Na kraju, možemo da zaključimo da statistički postupci bukvalno sprečavaju istraživače da na suviše malim uzorcima izvode zaključke koji bi doveli do proglašavanja netačnih tvrdnji tačnim.
Pomeranjem graničnih linija crvene površine utvrdite koja je minimalna t vrednost potrebna da bismo neku razliku smatrali značajnom na nivou 0,01 za 100 stepeni slobode.
Logika statističkog zaključivanja primenom χ2 i F distribucija donekle se razlikuje u odnosu na prethodno opisanu primenu t distribucije. Za početak, ove distribucije ograničene su sa leve strane, jer najmanja moguća vrednost χ2 i F iznosi nula. Osim toga, one su asimetrične i izrazito pozitivno zakrivljene kada je broj stepeni slobode mali. Specifičnost χ2 distribucije je i u tome što, za razliku od t distribucije, sa porastom broja stepeni slobode, raste i minimalna, odnosno granična vrednost od koje izračunata χ2 vrednost treba da bude veća da bismo fenomen koji smo uočili smatrali statistički značajnim. Odaberite hi-kvadrat distribuciju sa prve padajuće liste. Plava površina na prikazanom grafikonu prikazuje verovatnoću da vrednost χ2 bude jednaka ili veća od 3,84 za jedan stepen slobode. Teorijski, to znači da će 95% z vrednosti koje su nasumično odabrane iz normalne distribucije, kvadriranjem dati rezultat iz intervala od 0 do 3,84. Ako ovu pravilnost povežemo sa površinom ispod normalne krive, moglo bi se reći da je χ2 distribucija zapravo kvadrirana normalna distribucija koja je „presavijena“ po vertikalnoj osi. Verovatnoća da iz normalne distribucije nasumično odaberemo z vrednost veću od 1,96 ili manju od -1,96 iznosi 0,05, što je jednako verovatnoći da dobijemo kvadrat z vrednosti koji iznosi ±1,962 ili 3,84. Sa povećanjem broja uzorkovanih z vrednosti, odnosno broja stepeni slobode, očekivano se dobijaju veće sume izražene χ2 vrednostima. Na primer, sume devet nasumično odabiranih z vrednosti (df = 9) kretaće se u intervalu od 0 do 3,84 tek u nešto manje od 8% slučajeva. Praktična primena χ2 distribucije je višestruka i biće objašnjena u narednom poglavlju. Na ovom mestu ćemo kratko ilustrovati samo jednu od njih. Odaberite raspon 0,00 - 11,34 i broj stepeni slobode 3. Prikazani grafikon omogućava testiranje pretpostavke da 3 nasumično odabrane z vrednosti potiču iz normalne populacije. Naime, ukoliko kao zbir tih vrednosti dobijemo sumu koja je veća od 11,34, možemo da, sa verovatnoćom greške manjom od 1%, odnosno sigurnošću većom od 99%, tvrdimo da one ne potiču iz normalne distribucije, jer bi se tolike sume slučajno dobijale samo u 1% uzoraka. Dakle, pomoću samo tri merenja neke pojave, može se pretpostaviti da li je ona u populaciji normalno distribuirana. Podrazumeva se da istraživač neće na ovako banalan način testirati normalnost raspodele podataka, ali to je ipak pogodna ilustracija logike statističkog zaključivanja.
Od koje vrednosti treba da bude veći dobijeni χ2 za dva stepena slobode da bismo tvrdnju da odabrane z vrednosti ne potiču iz normalne distribucije smatrali tačnom uz verovatnoću greške manju od 5%, odnosno na nivou značajnosti 0,05?
2.9.1. Jednostrano testiranje razlika
Iz gore navedenih primera može se zaključiti da prilikom interpretacije statističke značajnosti χ2 vrednosti posmatramo samo desni kraj χ2 distribucije za odgovarajući broj stepeni slobode. Pri tome se ipak primenjuju pomenute statističke konvencije i α nivoi od 0,01 ili 0,05. Ali u ovom slučaju, tih 1% ili 5% retkih vrednosti definiše se kao odsečak desnog repa distribucije. Stoga se ova vrsta testiranja naziva jednostranim (eng. one-tailed). Za razliku od toga, u slučaju simetrične t distribucije, koristili smo dovstrano testiranje i pomenute nivoe delili na dva dela, tako da zbir plavih površina levog i desnog odsečka daje vrednost 0,01 ili 0,05. Konkretno, proveravali smo tačnost tvrdnje da se dobijena M statistički značajno razlikuje od µ, tj. verovatnoću da je statistički značajno manja ili statistički značajno veća od nje. Međutim, istraživač ima mogućnost i slobodu da upotrebi postupak jednostranog testiranja, čak i u slučaju t distribucije. Odaberite ponovo Studentovu t distribuciju sa prve liste, raspon -1,76 - 1,76 sa druge i 100 kao broj stepeni slobode. Pretpostavka čiju tačnost želimo da proverimo je da se prosečno vreme za koje studenti Fakulteta sporta i fizičkog vaspitanja pretrče stazu od 100 m, a koje iznosi 12 sekundi, ne razlikuje statistički značajno od zadatog kriterijuma od 13 sekundi. Ukoliko, na primer, dobijena t vrednost iznosi -1,76, zaključak bi bio da su studenti brži, ali ne i statistički značajno brži od kriterijuma, jer bismo razliku čija je apsolutna t vrednost 1,76 ili veća, potpuno slučajno mogli da dobijemo u 8% uzoraka veličine od oko 100. Drugim rečima, čak i da je prosečno vreme u populaciji svih studenata fakulteta sporta 13 sekundi, u 8 od 100 uzoraka uzetih iz te populacije dobijali bismo vrednosti aritmetičke sredine koje iznose 12 sekundi ili manje, odnosno 14 sekundi ili više. Sada pomerite desnu graničnu liniju do samog desnog kraja distribucije. Preostala plava površina postaje duplo manja, a odgovarajući p nivo pruža nam informaciju o tačnosti drugačije formulisane tvrdnje. Naime, ukoliko smo pre početka istraživanja opravdano očekivali da su studenti brži od datog kriterijuma, polazna tvrdnja nije morala da sadrži pitanje da li je M značajno različito od 13, već da li je značajno manje od 13. Tada nas ne bi ni interesovao desni kraj distribucije, tačnije onih 2,5% verovatnoće da je M - μ > 0, jer isključujemo mogućnost da su studenti sporiji od kriterijuma. Kritičnih 1% ili 5% aritmetičkih sredina tražimo samo u levom repu distribucije, tako da će naš zaključak biti da je M koje iznosi 12 sekundi, statistički značajno manje od 13 sekundi. Polaznu tvrdnju smo, dakle, testirali jednostrano. Naravno, istraživač ne treba da donosi odluku o tome koju vrstu testiranja će primeniti nakon što mu se rezultati koje je dobio ne dopadnu, već isključivo ako pre sprovedene analize pokaže da postoje jasne indicije da razlika može da se manifestuje samo u jednom smeru. Verovatnoća da neku razliku proglasimo statistički značajnom uvek je duplo veća ukoliko primenjujemo jednostrano testiranje umesto dvostranog.
Specifičnost F distribucije je u tome što njen oblik određuju dve vrednosti stepeni slobode, jer opisuje odnos varijansi parova uzoraka uzetih iz normalne distribucije. Testiranje tačnosti pretpostavki primenom F distribucije može da bude jednostrano i dvostrano, ali ćemo se u ovom udžbeniku kratko zadržati samo na prvom pristupu. Za početak, sa prve padajuće liste odaberite Fišer-Snedekorovu F distribuciju. Raspon prikazane distribucije pokazuje da su procene σ na malim uzorcima veoma neprecizne i da vrednosti s2 mnogo više variraju nego u slučaju velikih uzoraka. Grafikon pokazuje da bismo u približno 50% parova nasumično formiranih uzoraka dobili veću varijansu u imeniocu, tj. vrednosti F odnosa između 0 i 1, a u preostalih 50% veću varijansu u brojiocu i F odnos veći od 1. Kriva je takođe izrazito pozitivno zakrivljena, a razlog je vezan za karakteristike raspona racionalnih brojeva, tj. onih brojeva koji se izražavaju kao razlomci. Zamislite da smo u šest merenja dobijali sledeće odnose varijansi: 1/1, 2/1, 3/1, 4/1, 5/1 i 6/1. Vrednosti F odnosa bi se tada kretale u rasponu od 1 do 6. Međutim, u slučaju da smo dobili odnose 1/1, 1/2, 1/3, 1/4, 1/5 i 1/6, taj raspon bio bi mnogo uži i kretao bi se između 0,17 i 1. Dakle, ista proporcija ishoda koncentrisana je u mnogo manjem rasponu brojeva levo od jedinice, te je stoga desni kraj F distribucije u prikazanom primeru veoma razvučen. Ukoliko povećavate broj stepeni slobode varijanse u imeniocu (df2) na 3, 9, a potom i na 100, primetićete da se oblik krive ne menja bitno, ali da se verovatnoća dobijanja F vrednosti većih od 1 smanjuje. Ako se prisetimo opisa nastanka χ2 distribucije, razlog ove promene možemo pronaći u činjenici da na malim uzorcima uzetim iz standardizovane normalne distribucije postoji veća verovatnoća da se potceni vrednost σ2. U primeru sa df1 = 1 i df2 = 100, veća je verovatnoća da je s2 u brojiocu manja od s2 u imeniocu, a ova druga je sigurno tačnija procena prave σ2. Sa povećavanjem vrednosti df1, verovatnoća ishoda manjih i većih od 1 polako se izjednačava, raspon F distribucije se smanjuje i ona postaje sve više simetrična, jer je mala verovatnoća da se na velikim uzorcima dobijaju s2 koje bitno odstupaju od σ2. Na osnovu oblika krive može da se zaključi da je skoro nemoguće da varijansa jednog relativno velikog uzorka uzetog iz normalne distribucije, bude duplo veća od varijanse drugog uzorka iste veličine uzetog iz iste populacije.
Odredite graničnu vrednost od koje treba da bude veći F odnos da biste varijansu za koju je df = 3 smatrali statistički značajno većom od varijanse za koju je df = 100 na nivou 0,01.

Odaberite raspon 0,00 - 3,92, df1 = 3 i df2 = 9 i prokomentarišite površine koje formira taj raspon, odnosno zaključak koji biste na osnovu njega doneli o varijansama. Da li isti zaključak važi i u slučaju da je df1 = 9, a df2 = 3. Zbog čega važi, odnosno ne važi?
U odgovoru na pitanje upotrebite podatak o procentu koji obuhvata površina, pošto se vrednost p, odnosno proporcija površine izvan graničnih linija, zaokružuje na dve decimale, te nije dovoljno precizna na krajevima distribucije. Obratite pažnju da tražimo simetričnu površinu koja obuhvata obe strane distribucije. Da biste istovremeno pomerali obe granične linije, držite pritisnut taster Ctrl. Tražena vrednost iznosi približno 2,63, što je neznatno veće od odgovarajuće vrednosti koja za normalnu distribuciju iznosi 2,58.
Tražena vrednost iznosi približno 6.
Tražena vrednost iznosi približno 4.
U prvom slučaju, F odnos veći od 3,92 bio bi značajan na nivou 0,05. Isti zaključak ne važi u drugom slučaju, jer je tada veća verovatnoća dobijanja veće vrednosti F, zbog očekivane veće varijabilnosti u imeniocu.