3.2. T-test za jedan uzorak
Logiku metode koja je poznata kao t-test za jedan uzorak opisali smo u odeljku o Studentovoj t distribuciji. Reč je o postupku kojim se uz pomoć intervala poverenja aritmetičke sredine, izračunate na jednom uzorku merenja, testira značajnost njene razlike od neke unapred date vrednosti. Za početak, pođimo od sledeće nulte hipoteze:
H0: Efekat Miler-Lajerove iluzije nije statistički značajan
Kratkim eksperimentom proverićemo da li postoji efekat optičke iluzije koju je osmislio nemački sociolog Franc Karl Miler-Lajer. U pitanju je pojava da
horizontalnu duž opažamo kao kraću kada je ograničena strelicama koje su usmerene ka spolja, nego kada su strelice usmerene ka unutra. U našem primeru upotrebićemo
prilagođenu verziju ove iluzije. Kada kliknete taster
Enter, biće prikazana jedna horizontalna duž i tri izlomljene vertikalne duži (strelice) od kojih su leva i desna usmerene ulevo, a srednja udesno. Vaš zadatak je da uz pomoć tastera za kontrolu kursora na tastaturi postavite središnju duž u poziciju u kojoj će seći horizontalnu duž tačno na pola. Da biste brže pomerali središnju duž, držite pritisnut taster
Ctrl. Rastojanje od levog kraja horizontalne duži do mesta na kome se ona seče sa srednjom strelicom, treba da bude isto kao rastojanje od mesta tog preseka do tačke u kojoj desna strelica dodiruje horizontalnu duž. Nakon što ste postavili duž na željeno mesto, pritisnite taster
Enter da biste sačuvali rezultat i prikazali novi zadatak. Pošto tačnost procene polovine duži ne zavisi samo od uticaja Miler-Lajerove iluzije, već i od drugih faktora, u vežbu ćemo uključiti skup zadataka kod kojih se umesto strelica nalaze vertikalne duži koje seku horizontalnu duž pod uglom od 90 stepeni. U grupi ovih merenja, tačnost procene bi trebalo da bude veća. Nakon što ste uradili dva zadatka za vežbu, potrebno je da obavite još 14 merenja, 7 sa strelicama, tj. izlomljenim vertikalnim dužima i 7 sa pravim. Nakon završene vežbe, podaci će biti prikazani histogramima.
Ključna varijabla u našem primeru je tačnost procene polovine duži. Na osnovu njenih vrednosti možemo da utvrdimo u kojoj meri ste kao ispitanik bili podložni efektu Miler-Lajerove iluzije. Osim toga, interesuje nas i da li tačnost zavisi od tipa vertikalnih duži, tj. da li ste pravili tačnije procene kada su se duži sekle pod pravim ili pod oštrim uglom. U istraživanju nam nije bilo bitno da li su na tačnost uticale dužina horizontalne duži, pozicija na ekranu i početni položaj srednje duži, tako da vrednosti ovih varijabli nisu ni beležene. One su namerno varirane od strane eksperimentatora kako bi se kontrolisao efekat drugih potencijalno bitnih faktora, npr. da bi se isključio efekat uvežbavanja. Stoga ćemo ove varijable nazvati kontrolnim. Svojstvo koje govori o ishodu merenja i reakcijama ispitanika obično se naziva zavisnom varijablom. U našem primeru, to je tačnost procene. Svojstvo čiji se efekat na zavisnu varijablu proverava i čije vrednosti namerno varira osoba koja je dizajnirala istraživački nacrt, naziva se nezavisnom varijablom. U našem primeru, to je tip, odnosno ugao vertikalnih duži kao dihotomna varijabla. S obzirom na to da se dužina horizontalne duži nasumično menjala u 14 prikazanih zadataka, tačnost procene izračunata je kao odnos rastojanja do mesta na koje ste postavili središnju duž i ukupne dužine horizontalne duži. Klikom na ikonicu pored druge padajuće liste možete da preuzmete matricu sa sirovim podacima u kojoj je vrednosti u koloni procena potrebno podeliti vrednostima u koloni duzina da bi se dobio pokazatelj tačnosti procene. Tako dolazimo do kriterijuma od 0,5 koji ukazuje na savršeno tačnu procenu. Ukoliko uporedite vrednosti M za grupu plavih merenja (prav ugao) i M za grupu narandžastih merenja (oštar ugao), trebalo bi da uočite da je vaša procena bila tačnija, odnosno bliža vrednosti 0,5, kada su vertikalne duži bile prave. Izlomljene vertikalne duži usmerene ka unutra, odnosno strelice usmerene ka spolja, vizuelno su skraćivale levi segment horizontalne duži, tako da ste najverovatnije imali nesvesnu potrebu da ga produžite. Stoga je M za tu grupu merenja vrlo verovatno veća od 0,5. Kasnije ćemo se vratiti na podatke koje ste samostalno prikupili, a sada ćemo objasniti postupak primene t-testa za jedan uzorak na nekoliko pripremljenih skupova podataka.
Odaberite primer M-L iluzija sa liste ili kliknite link Prikaži primer ukoliko je otvoren okvir sa zadatkom. U zagradama je navedena referentna vrednost sa kojom se porede dobijene aritmetičke sredine. Radi boljeg razumevanja grafičkog prikaza, sirovi rezultati su sortirani od najmanjeg ka najvećem i navedeni na spisku koji se nalazi između grafikona i tabele sa deskriptivnim pokazateljima. Podaci su podeljeni u dve grupe od po 7 vrednosti i označeni su različitim bojama i simbolima – plavo || za grupu merenja kod kojih je ugao preseka bio prav, odnosno narandžasto >< za grupu merenja kod kojih je ugao preseka bio oštar. Aritmetička sredina plavih merenja iznosi 0,511 i razlikuje se od utvrđenog standarda. Međutim, potrebno je proveriti da li je ta razlika i statistički značajna. Ako na osnovu M i sM izračunamo interval poverenja od 99%, dobićemo raspon vrednosti između 0,491 i 0,530. Pošto ranije utvrđeni standard pripada tom rasponu, ne smemo da tvrdimo da se 0,511 statistički značajno razlikuje od 0,5. Numeričku potvrdu ovog zaključka daje nam vrednost t. Kada uvrstimo dostupne informacije u odgovarajuću formulu:
`t=(M-mu)/s_M=(0,51057-0,5)/0,00533~~1,985`
dobijamo vrednost t-testa koja iznosi približno 1,985. Obratite pažnju na to da su vrednosti deskriptivnih pokazatelja u tabeli zaokružene na tri decimale tako da nećete dobiti istu vrednost t ukoliko ih tako skraćene uvrstite u gornju formulu. Na osnovu odgovarajuće teorijske distribucije, može se utvrditi da vrednost t za 7 merenja, odnosno za 6 stepeni slobode (N - 1), treba da bude veća od 2,447 da bi se smatrala statistički značajno udaljenom od nule na nivou 0,05, a veća od 3,708 da bi se smatrala statistički značajnom na nivou 0,01. Naravno, od istraživača se ne očekuje da samostalno pronalazi ove granične vrednosti, već samo da razume logiku nivoa značajnosti i nivoa verovatnoće. U programima za statističku obradu, uz datu vrednost t-testa uvek se prikazuje i odgovarajuća p vrednost, koja u našem primeru iznosi 0,104. To znači da čak i ako prava µ svih mogućih procena polovina duži iznosi 0,5, postoji približno 10% verovatnoće da bismo u uzorku veličine 7 nasumično dobili M koje odstupa za 1,985 ili više svojih standardnih grešaka od te vrednosti. Ova verovatnoća je suviše velika da bismo 0,511 smatrali statistički značajno udaljenim, odnosno različitim od 0,5. Stoga nultu hipotezu ne treba da odbacimo. U izveštaju o istraživanju dobijeni rezultati obično se prikazuju na sledeći način:
t(6) = 1,985, p > 0,05
ili, češće, uz navođenje konkretne p vrednosti:
t(6) = 1,985, p = 0,104
Broj u zagradama označava broj stepeni slobode. Kada isti princip primenimo na uzorku od 7 merenja u kojima su horizontalne duži bile izlomljene, dobijamo interval potencijalnih vrednosti µ koji se kreće od 0,550 do 0,592 i koji ne obuhvata zadati kriterijum od 0,5. U ovom slučaju, hipotezu ćemo odbaciti kao netačnu, jer je izuzetno mala verovatnoća da slučajno dobijemo M koje toliko odstupa od 0,5. Drugim rečima, zaključujemo da je veća verovatnoća da M = 0,571 potiče iz populacije procena čija aritmetička sredina nije 0,5, odnosno da je na tačnost naše procene uticao ugao vertikalnih duži. Ovim smo statistički dokazali postojanje efekta Miler-Lajerove iluzije:
t(6) = 12,601, p < 0,001
Aritmetička sredina i standardna devijacija predstavljaju krajnji stepen sažimanja nekog skupa podataka. Ukoliko je varijabla približno normalno distribuirana, uz pomoć ovih vrednosti možemo da „rekonstruišemo“, odnosno da aproksimiramo izgled distribucije sirovih podataka. Odaberite opciju M ± 3 st. dev. sa druge liste da biste videli ovu teorijsku „rekonstrukciju“ sirovih podataka iz prvog primera u formi dve krive gustine verovatnoće. Krive prikazuju raspone od približno 99% sirovih rezultata dobijenih u istraživanju. One se delimično preklapaju, jer bi se uz dobijene vrednosti M i s za dve grupe merenja moglo očekivati da određeni broj procena iz narandžaste grupe bude tačniji od onih iz plave grupe. Međutim, procenat takvih rezultata je izuzetno mali, tako da već na osnovu grafikona možemo da zaključimo da dve grupe merenja, odnosno dva uzorka, ne potiču iz iste populacije. Pravu potvrdu ove tvrdnje nam, međutim, daju slike teorijskih distribucija potencijalnih vrednosti µ, odnosno potencijalnih vrednosti M drugih uzoraka iste veličine, uzetih iz iste populacije. Odaberite opciju M ± 3,708 st. gr. (standardne greške M) sa druge liste da biste prikazali intervale poverenja M, odnosno raspone u kojima se, uz 99% verovatnoće, nalaze vrednosti µ. Vrednost 0,5 pripada rasponu plave distribucije, ali ne i rasponu narandžaste, što pokazuje da se aritmetička sredina plave distribucije (0,511) ne razlikuje statistički značajno od vrednosti 0,5, dok je aritmetička sredina narandžaste distribucije (0,571) značajno udaljena od kriterijuma. Osim toga, dve distribucije se praktično ni ne dodiruju, što znači da µ za uzorak procena u slučaju pravih duži, najverovatnije nije isto kao i µ za uzorak procena u slučaju izlomljenih. Dakle, M ± 3 · s i M ± 3 · sM su dva suštinski različita intervala, od kojih nam prvi govori o tome kako izgleda očekivana distribucija sirovih podataka (x), pod pretpostavkom da su oni normalno distribuirani, a drugi kakva je očekivana distribucija velikog broja aritmetičkih sredina (M), koje se uvek distribuiraju u skladu sa normalnom raspodelom kada su uzroci veliki. Drugi interval, u zavisnosti od toga kako ga izračunamo, obuhvata određeni procenat vrednosti M koje bismo verovatno dobili na drugim uzorcima iste veličine, uzetim iz iste populacije. Istraživač jednostavno pretpostavlja da je jedno od tih M u stvari prava vrednost µ.
Dužina horizontalne duži, položaj duži na ekranu, inicijalni položaj srednje duži, vreme koje vam je bilo potrebno da rešite zadatak i vaš odgovor, tj. krajnji položaj srednje duži.
Ispitanik je mogao da utiče na krajnji odgovor, tj. poziciju srednje duži, kao i na vreme potrebno za rešavanje zadatka. Eksperimentator je dizajnirao aplikaciju, tako da se namerno i nasumično variraju vrednosti svih ostalih varijabli.
Ova svojstva stimulusa namerno su varirana da ne bi došlo do uvežbavanja ispitanika, rutinskog davanja odgovora ili korišćenja markera na ekranu ili monitoru (npr. logotipa) za pronalaženje srednje tačke duži. Svrha je bila da se kontrolišu sve varijable koje bi mogle da utiču na tačnost procene.
U eksperimentu je učestvovao samo jedan ispitanik, ali je broj merenja veći da bi se umanjio efekat potencijalnih grešaka. Ispitanik je slučajno mogao da pritisne taster ili napravi previd u jednom ili dva pokušaja, što ne bi trebalo da ima velik uticaj na konačni rezultat ako je broj merenja dovoljno velik. Uzet je veći uzorak procena da bi se došlo do pouzdanije procene tačnosti u populaciji svih odgovora.
Zbog veličine uzorka. Upotrebili smo graničnu vrednost t za 6 stepeni slobode.
Pošto granična vrednost t-testa za 6 stepeni slobode iznosi približno 2,447, vrednost sM treba da bude manja od 0,0045 da bi razlika bila značajna.
Apsolutna vrednost t bila bi ista ali bi njen predznak bio negativan. Vrednost 0,429 jednako je udaljena od 0,5 kao i 0,571, ali se nalazi na suprotnoj strani očekivane distribucije. Obe vrednosti su značajno različite od 0,5, ali je prva značajno manja a druga značajno veća.
Vrednost p bi bila duplo manja – 0,052.