1. | Studenti pet fakulteta polagali su isti test sposobnosti na kome su mogli da osvoje od 0 do 100 poena. Histogramima su prikazane distribucije dobijenih rezultata. Odredite tačnost tvrdnji.
|
||
T | N | ||
U slučaju fakulteta A raspon i interkvartilni raspon imaju istu vrednost. | |||
Ukoliko izuzmemo pojave koje uopšte ne variraju, distribucije kod kojih su raspon i interkvartilni raspon jednaki su veoma retke i atipične. To bi moglo da se desi ako sa obe strane distribucije postoji 25% potpuno jednakih rezultata. U ovom primeru to nije slučaj. Ukupan raspon distribucije je oko 100 poena. Kada se ukloni 1/4 najlošijih rezultata (u rasponu od 0–25 poena) i 1/4 najboljih (u rasponu 75–100 poena) dobija se raspon središnjih 50% rezultata koji iznosi približno 50 poena i znatno je manji od ukupnog raspona. Na slici je označen vitičastom zagradom.
| |||
Varijansa rezultata studenata fakulteta A je veća od varijanse rezultata studenata fakulteta B. | |||
Uniformna distribucija prikazana na slici A ne pokazuje da su studenti međusobno veoma slični, već naprotiv, da je u svakom razredu poena (od 0 do 100) podjednak broj njih. To znači da se rezultati mnogo više međusobno razlikuju, tj. više variraju nego rezultati prikazani na slici B. Na slici B je grupisanje ipak očiglednije i jače oko 20 poena što znači da je veći broj studenata međusobno sličnih po osvojenom broju poena.
| |||
Studenti fakulteta E ostvarili su u proseku lošije rezultate od studenata fakulteta D. | |||
Sve mere centralne tendencije distribucija D i E (označene strelicama) približno su jednake. Slike D i E se razlikuju po broju prikazanih rezultata. U grupi E je očigledno bilo manje studenata, pa su tako manje i frekvencije rezultata oko vrednosi moda, medijane i artitmetičke sredine.
| |||
Ukoliko bi se standardizovali rezultati studenata fakulteta A, najmanje 95% njih bi dobilo z skor 0. | |||
Standardizacijom se ne menja relativna pozicija rezultata u grupi. Da bi 95% studenata dobilo z skor jednak nuli trebalo bi da ih je pre standardizacije isto toliko imalo vrednost jednaku aritmetičkoj sredini. U slučaju distribucije A to nije tačno. Tek desetak studenata ili oko 5% njih ima rezultat blizak aritmetičkoj sredini koja iznosi oko 50 poena.
| |||
Skjunis distribucije B je veći od skjunisa distribucije E. | |||
Skjunis je mera iskošenosti distribucije. Distribucija E je gotovo potpuno simetrična, pa je tako i njen skjunes blizak nuli. Distribucija B je pozitivno iskošena, tako da je vrednost njenog skjunisa pozitivna, tj. veća od nule.
| |||
U grupi C medijana je bolja mera centralne tendencije od aritmetičke sredine. | |||
Distribucija C je simetrična, pa se tako i njena aritmetička sredina i medijana nalaze na približno istoj poziciji označenoj strelicom. U tom smislu, medijana je jednako loša mera centralne tendencije kao i aritmetička sredina. Slika pokazuje da postoje dva veoma različita moda i da bi ispitanike trebalo tretirati kao dve heterogene grupe formirane na osnovu neke kategorijalne varijable, npr. pola.
| |||
Standardne devijacije distribucija D i E su jednake. | |||
Što je grupisanje oko aritmetičke sredine neke distribucije slabije, to je njena varijansa veća. Aritmetičke sredine i rasponi distribucija D i E su približno jednaki, ali je u grupi E manje studenata koji imaju vrednost blisku ili jednaku proseku. Zbog proporcionalno većeg broja rezultata koji (značajnije) odstupaju od vrednosti aritmetičke sredine, varijansa rezultata u grupi E bila bi veća nego u grupi D.
| |||
Mod distribucije D je približno 30% veći od moda distribucije E. | |||
Modovi distribucija D i E su približno jednaki i označeni su strelicama. Razlikuju se samo frekvencije moda. U grupi D je veći broj studenata koji su osvojili rezultat blizak modu distribucije. U oba slučaja je vrednost moda oko 70 poena.
| |||
Standardna devijacija distribucije E je manja od 40 poena. | |||
Na osnovu histograma E može se zaključiti da je ukupan raspon poena oko 70. Najbolji i najgori student udaljeni su od proseka za oko 35 poena. Većina studenata ipak odstupa od proseka za samo nekoliko poena, tako da prosečno odstupanje, a samim tim i standardna decijacija, moraju da budu bitno manji od 40 poena. Koristeći orijentaciono pravilo da je odnos raspona i standardne devijacije normalne distribucije približno 1:6, možemo zaključiti da je standardna devijacija u ovom primeru oko 11 poena.
| |||
Najmanju vrednost kurtozisa ima distribucija C. | |||
Kurstozis je pokazatelj odstupanja distribucije od normalne po horizontali. Najprostije rečeno, što je više rezultata koji odstupaju od aritmetičke sredine, to je vrednost kurtozisa manja. U grupi A ima proporcionalno više studenata koji su ostvarili rezultat jednak ili blizak aritmetičkoj sredini nego u grupi C. Zbog toga će disribucija C imati najmanju, odnosno najnegativniju vrednost kurtozisa.
|
2. | Poznato vam je da je neka varijabla normalno distribuirana. Odaberite najverovatnije vrednosti statističkih pokazatelja. | ||
|
|||
Opcije u prvoj koloni nikako ne mogu da budu tačne jer normalna distribucija ne može da ima nultu varijabilnost. Takav skup rezultata bi na grafikonu bio predstavljen samo jednim stubićem. Dalje, normalna distribucija je karakteristična po tome što sve njene mere centralne tendencije imaju približno istu vrednost, pa tako opcije u trećoj koloni takođe treba eliminisati. Odgovori u srednjoj koloni tiču se pozicije kvartila. Kod normalne distribucije, ali i drugih simetričnih distribucija, rastojanje između vrednosti medijane (tj. drugog kvartila) i vrednosti prvog kvartila sa jedne strane, odnosno trećeg kvartila sa druge, trebalo bi da bude isto. Za razliku od toga, kod iskošenih distirbucija kao što je ona prikazana na slici B, biće potreban veći raspon vrednosti sa "razvučene" strane kako bi se "nakupilo" 25% ispitanika u odnosu na stranu distribucije na kojoj je "gomilanje" izraženije. Zbog toga bi raspon između Q1 i Q2 bio manji od raspona između Q2 i Q3 kao što je npr. u slučaju drugog odgovora u drugoj koloni. Uporedite približne pozicije kvartila prikazane tačkama na distribucijama B i D.
|
3. | Na uzorku od 2.000 ispitanika izmerena je verbalna agresivnost. Aritmetička sredina rezultata na primenjenom testu je 62, a njena standardna greška 1. Kolika je verovatnoća da prava aritmetička sredina u populaciji iznosi 57? | ||
|
|||
Aritmetičke sredine velikih uzoraka iste veličine uzetih iz iste populacije distriburaju se normalno oko prave aritemtičke sredine populacije (μ). Pri tome je standardna devijacija distribucije uzoračkih aritmetičkih sredina jednaka standardnoj greški aritmetičke sredine (sM). U skladu s tim, ukoliko pretpostavimo da μ iznosi 57, verovatnoća da se u (velikom) uzorku dobije M udaljena za 3 ili tačnije 2,58 sM od te vrednosti, manja je od 1%, jer bi interval μ ± 2,58 · sM trebalo da obuhvati 99% svih mogućih vrednosti M. Ukoliko posmatramo samo pozitivan kraj distribucije, ta verovatnoća je manja i od 0,5%. Dakle, veoma je mala verovatnoća da se iz populacije čija je μ = 57 uzme veliki uzorak čija je M = 62, a sM = 1. Smim tim, veoma je mala verovatnoća da uzorak u kome je M = 62 i sM = 1 potiče iz populacije u kojoj je μ = 57.
|
4. | O rezultatima sprovedenog istraživanja imate sledeće podatke: N=350, M=60, s=3. Takođe znate da su rezultati normalno distribuirani. Koja od navedenih tvrdnji je tačna? | ||
|
|||
Ukoliko je poznato da su rezultati distribuirani normalno, može se očekivati da se oni kreću u rasponu M ± 2,58 · s. U ovom primeru, to je otprilike interval od 52 do 68 poena. Samim tim, ne možemo da tvrdimo da niko od ispitanika nije ostvario manje od 54 poena. Isto tako, vrednost 69 ne može da bude vrednost trećeg kvartila jer bi to značilo da približno 25% ispitanika ima skor veći od te vrednosti, što je u ovom slučaju nemoguće. Ukoliko je distribucija normalna, nije moguće ni da je polovina ispitanika ostvarila rezultat jednak aritmetičkoj sredini, kao ni da je medijana udaljena od aritmetičke sredine za jednu celu standardnu devijaciju. Standardna greška aritmetičke sredine je uvek manja od standardne devijacije, jer se dobija deljenjem s sa korenom veličine uzorka, tako da u ovom slučaju ona ne može da bude 3,45. Ostaje treća opcija u prvoj koloni. Pošto je ukupan raspon rezultata otprilike 16 poena, interkvartilni raspon mora da bude manji od 20.
|
5. | Test znanja je radilo 180 studenata i dobijeni su normalno distribuirani rezultati. Student J. R. je postigao 24 poena i samo 2,5% studenata je uspešnije od njega. Aritmetička sredina rezultata svih studenata iznosila je 18. Kolika je približno varijansa? | ||
|
|||
Za rešavanje ovog zadatka koristimo pravilnosti vezane za površinu ispod normalne krive. Ukoliko je samo 2,5% studenata bolje od J. R., to znači da je on udaljen od vrednosti aritmetičke sredine za približno dve standardne devijacije. Do tog zaključka smo došli poznavajući pravilo da interval M ± 1,96 · s obuhvata oko 95% normalno distribuiranih podataka. Samim tim, njegov z skor bi iznosio približno 2 ili preciznije 1,96. Ako rastojanje od 2 standardne devijacije odgovara rasponu od 6 sirovih bodova (24 - 18), to znači da je vrednost jedne standardne devijacije 3 boda. Pošto se standardna devijacija računa kao koren varijanse, tačan odgovor je 9 poena.
|