Uvod Pojam, vrste i svrha vizualizacije 1.1. Vizuelno mišljenje 1.2. Vizuelna komunikacija 1.3. Vizuelna pismenost 1.3.1. Različiti aspekti vizuelne pismenosti 1.3.1.1. Piktogrami i piktografici 1.4. Karta, mapa, dijagram, grafik, infografik 1.5. Podatak, informacija, znanje, razumevanje 1.5.1. Tabelarni i grafički prikaz podataka 1.5.2. Deskriptivna i inferencijalna statistika 1.6. Naučna vizualizacija i vizualizacija informacija 1.7. Vizualizacija kao eksplorativna tehnika 1.8. Izbor prikladne tehnike vizualizacije 1.8.1. Nivoi merenja varijabli 1.8.2. Hijerarhija vizuelnih kodova 1.8.3. Čitljivost grafikona 1.9. Prvi test znanja Vizualizacija distribucija verovatnoća 2.1. Pojam verovatnoće 2.2. Populacija i uzorak 2.2.1. Tehnike uzorkovanja 2.3. Pojam nasumičnosti ili slučajnosti 2.4. Pojam varijabilnosti 2.5. Osnovne tehnike sažimanja podataka 2.5.1. Tabele frekvencija i tabele kontingencije 2.5.2. Mere grupisanja ili centralne tendencije 2.5.2.1. Aritmetička sredina, medijana i mod 2.5.2.2. Još neke vrste prosečnih vrednosti 2.5.3. Mere raspršenja ili varijabilnosti 2.5.3.1. Vizuelna procena i poređenje varijabilnosti 2.5.3.2. Varijansa i standardna devijacija 2.5.3.3. Pojam matematičke funkcije 2.5.3.4. Interkvartilni raspon 2.6. Karakteristike i važnost normalne distribucije 2.6.1. Centralna granična teorema 2.6.2. Funkcije mase i gustine verovatnoće 2.6.3. Standardizacija sirovih rezultata 2.6.4. Površina ispod normalne krive 2.6.5. Standardna greška aritmetičke sredine 2.6.6. Skjunis i kurtozis 2.7. Još neke važne statističke distribucije 2.7.1. Studentova t distribucija 2.7.2. Hi-kvadrat distribucija 2.7.3. Fišer-Snedekorova F distribucija 2.8. Stepeni slobode 2.9. Test-statistici, p vrednosti i nivoi značajnosti 2.9.1. Jednostrano testiranje razlika 2.10. Drugi test znanja Vizualizacija razlika i povezanosti između varijabli 3.1. Testiranje (ne)tačnosti nul-hipoteza 3.2. T-test za jedan uzorak 3.3. T-test za dva uzorka 3.3.1. Uslovi za primenu t-testa 3.4. Neparametrijske alternative t-testu za dva uzorka 3.4.1. Vold-Volfovicov test nizova 3.4.2. Kolmogorov-Smirnovljev test za dva uzorka 3.4.3. Men-Vitnijev test sume rangova 3.5. Hi-kvadrat test 3.5.1. Hi-kvadrat kao test nezavisnosti 3.5.2. Pojam veličine efekta 3.5.3. Hi-kvadrat kao test stepena poklapanja (distribucija) 3.5.4. Uslovi za primenu hi-kvadrat testa 3.6. Pirsonov produkt-moment koeficijent korelacije 3.6.1. Regresiona jednačina i regresiona prava 3.6.1.1. Smisao koeficijenta b i konstante a u regresionoj analizi 3.6.2. Standardna greška procene 3.6.3. Interpretacija koeficijenta korelacije 3.6.4. Uslovi za primenu Pirsonovog r 3.6.5. Korelacija i uzročnost 3.7. Koeficijenti korelacije za rangirane podatke 3.8. T-test za zavisne uzorke 3.9. Neparametrijske alternative t-testu za zavisne uzorke 3.10. Značajnost razlika uparenih podataka nominalnog nivoa 3.10.1. Maknimarov test 3.10.2. Koenova kapa 3.10.3. Testovi marginalne homogenosti za politomne varijable 3.11. Treći test znanja Završne napomene Literatura
1.7. Vizualizacija kao eksplorativna tehnika
Pojedini autori prave razliku između vizualizacije za potrebe prezentacije i vizualizacije u cilju eksploracije (Unwin, Chen, & Härdle, 2008). Kriterijum za podelu je veoma sličan onome koji smo opisali u prethodnom odeljku, ali se u ovom slučaju tehnike vizualizacije razlikuju sa stanovišta njihove svrhe i primene, a ne s obzirom na vrstu podataka koji se vizualizuju. Čen (Chen, 2006), na primer, naglašava značaj vrste zadatka koji se postavlja pred korisnika u toku interakcije sa grafičkim prikazima. Prvi tip zadatka naziva se vizuo-spacijalnim i podrazumeva interpretaciju topoloških karakteristika elemenata na vizuelnoj predstavi. Drugi tip je semantički i odnosi se na uviđanje latentnih fenomena koji ne moraju nužno da odgovaraju fizičkim svojstvima vizuelne predstave. U oblasti statistike, vizualizacija se obično vezuje upravo za ove druge zadatke, odnosno za eksplorativnu analizu podataka (Tukey, 1977). Primena tehnika vizualizacije u statistici je na neki način „detektivski“ posao, čiji cilj nije samo da se rezultati predstave u preglednoj formi, već i da se oni detaljnije opišu, međusobno povežu i da se u njima i na osnovu njih uoče (ne)pravilnosti. Nadmoćnost grafičkog predstavljanja je u tome što omogućava ne samo prikazivanje, već i otkrivanje podataka (Tufte, 1985). Dijagrami olakšavaju formiranje mentalnih predstava koje odražavaju ne samo spoljašnju stvarnost već i apstraktne relacije među podacima. Cilj svake vizualizacije je da kompleksno učini jednostavnim i da nevidljivo učini vidljivim i interpretabilnim. Vizualizacija nas podstiče da u podacima prepoznamo fenomene koje na prvi pogled nismo videli, pa čak ni očekivali. Zbog svega toga, vizualizacija kao sredstvo eksploracije unapređuje našu spoznaju, olakšavajući i ubrzavajući opažanje, učenje i zaključivanje. Prema psihologu Stjuartu Kardu, koji je takođe bio jedan od vodećih istraživača ranije pomenutog PARC centra, postoji barem pet načina na koje vizualizacija pospešuje naše razumevanje stvarnosti (Card et al., 1999):
1. Proširenjem kognitivnih kapaciteta. Primenom vizualizacije rasterećuju se i efikasnije koriste perceptivni i memorijski resursi korisnika. Naši kapaciteti za pamćenje vizuelnih sadržaja su praktično neograničeni i daleko nadmašuju sposobnost prisećanja verbalnog materijala (Standing, 1973). Osim toga, grafičke metafore često imaju ulogu „spoljašnje memorije“ zato što omogućavaju paralelno procesiranje većeg broja svojstava objekata za razliku od tekstualnih sadržaja koji se procesiraju serijski.
2. Ubrzavanjem pretrage. Velike količine podataka mogu da se prikažu grafički na malom prostoru, pri čemu različita vizuelna svojstva objekata kao što su boja, veličina ili oblik, olakšavaju njihovo pronalaženje i razumevanje u kontekstu drugih elemenata. Najjednostavniji primer je već pomenuta upotreba različitih boja i zadebljanja teksta u prikazivanju rezultata pretrage interneta ili lociranje učenika koji su najpopularniji ili najbolji u odeljenju.
3. Jasnijim uvidom u strukturu i promene. Vizualizacijom postaju uočljive relacije među podacima koje su apstraktne ili nisu direktno vidljive pre nego što se velike količine podataka sažmu. Dinamičkim vizualizacijama moguće je prikazati trendove i promene u vremenu. Sjajan primer predstavlja vizuelizacija kojom se traga za mogućim razlozima globalnog zagrevanja planete Zemlje.
4. Olakšavanjem zaključivanja. Grafički prikaz podataka omogućava lakše uočavanje problema, formiranje pretpostavki i donošenje zaključaka već na nivou ranog opažanja, odnosno percepcije osnovnih karakteristika objekata kao što su boja, veličina, oblik i položaj. Na primeru sociograma videli smo koliko variranje svojstava grafičkih objekata pomaže njihovom uočavanju, grupisanju i povezivanju.
5. Efikasnijim manipulisanjem podacima. Vizualizacija omogućava interakciju sa korisnikom koji u pravom smislu te reči istražuje informacioni prostor upravljajući vizuelnim metaforama. Veoma lako se mogu dodavati i oduzimati elementi prikazani na slici, i posmatrati kako te promene utiču na ostale podatke.
Kao prikladnu ilustraciju navedenih prednosti vizualizacije za potrebe eksploracije podataka, upotrebićemo neznatno modifikovani grafikon koji je izradio Majk Bostok, autor biblioteke D3 korišćene i za izradu ovog udžbenika. Grafikon prikazuje podatke o životnom veku i bogatstvu nacija koje je švedski fizičar i statističar Hans Rosling, osnivač fondacije Gepmajnder, predstavio u svojoj TED prezentaciji. U pitanju je grafikon kretanja (engl. motion chart) kojim se istovremeno može prikazati veći broj varijabli i njihove promene u toku vremena. Na grafikonu su prikazane vrednosti sledećih varijabli za 180 zemalja sveta: broj stanovnika, očekivani životni vek stanovnika, bruto nacionalni dohodak i region u kome se država nalazi. Vrednosti varijabli mogu da se predstave dinamički u vremenskom periodu od 1800–2010. godine pomeranjem klizača sa desne strane ili klikom na ikonicu u gornjem desnom uglu iznad klizača. Ime države prikazuje se kada se iznad kruga postavi pokazivač miša. Legenda koja objašnjava značenje boja dostupna je u gornjem desnom uglu grafikona.
Uporedite različite države i regione po broju stanovnika i nacionalnom dohotku.

Analizirajte promene u vremenu i povežite ih sa značajnim istorijskim događajima.

Uočite države koje se u različitim vremenskim periodima i po različitim svojstvima izdvajaju od ostalih država istog regiona ili celog sveta.

Da li su države Supsaharske Afrike u poslednjih 100 godina uspele da dostignu evropske države po kvalitetu života?

Koje države su imale najveći rast bruto nacionalnog dohotka po glavi stanovnika nakon Drugog svetskog rata?
Prilikom prvog prikazivanja grafikona najverovatnije ste prvo uočili razlike u veličini krugova, odnosno broju stanovnika, zbog dve najmnogoljudnije države na slici (Kina i Indija). Poređenje po regionima zahteva „prebacivanje“ u drugi režim filtriranja podataka, ignorisanje veličine krugova kao primarnog svojstva i grupisanje entiteta po boji.
Najočiglednije negativne promene kod većeg broja država su one u periodu Prvog i Drugog svetskog rata. Na grafikonu mogu da se vide i posledice velike gladi u Irskoj u drugoj polovini 19. veka, Ukrajini 30-tih godina i Kini 60-tih godina 20. veka. Jedna od prekretnica je poslednja dekada 19. veka, kada SAD preuzimaju poziciju najjače ekonomije sveta od Ujedinjenog Kraljevstva kao najveće imperijalne sile do tada.
Obratite pažnju na to da je moguće grupisati države po različitim atributima. Na kraju analiziranog perioda, u gornjem desnom uglu nalazi se veliki broj evropskih država, SAD, nekoliko azijskih i nekoliko bliskoistočnih država koje međusobno nisu slične po veličini, odnosno broju stanovnika.
Ne. To je jedan od osnovnih problema na koje je Hans Rosling želeo da skrene pažnju koristeći ovu zanimljivu vizualizaciju.
Pored SAD i nekolicine evropskih zemalja koje su i pre toga beležile stalan rast ekonomije, najjači posleratni razvoj uočljiv je kod država bogatih naftom: Irak, Kuvajt, Libija, Saudijska Arabija, Katar i Ujedinjeni Arapski Emirati.