Kadar želimo kvantitativne podatke statistično analizirati, je potrebno vse zbrane podatke (običajno s pomočjo vprašalnika) vnesti v eno bazo. Ta baza podatkov (ang. Database) mora biti primerno oblikovana z dveh vidikov, in sicer:
- praktični vidik – baza podatkov mora biti urejena razumljivo in logično, da iz nje zna razbrati podatke in informacije vsakdo in ne le oseba, ki je bazo pripravljala, in
- analitični vidik – baza podatkov mora biti urejena primerno zahtevam programov, s katerimi podatke v nadaljevanju statistično analiziramo.
Temelj baze podatkov je naš vprašalnik oz. naša vprašanja s pripadajočimi odgovori. Da je baza podatkov razumljiva in uporabna, je vanjo potrebno vnesti vsaj tri vrste podatkov, in sicer:
- spremenljivke (to so vprašanja),
- možne/dovoljene vrednosti spremenljivk (to so vprašanjem pripadajoči možni odgovori) in
- podatke (to so odgovori anketiranca).
Primer praznega vnosnega polja v statističnem programu PSPP (tudi SPSS), kjer je potrebno vnesti spremenljivke in možne vrednosti spremenljivk:
Primer našega anketnega vprašanja, za katerega bomo vnesli podatke:
zad_delo. Kako ste na splošno zadovoljni s svojim delovnim mestom?
1 – Zelo nezadovoljen
2 – Nezadovoljen
3 – Niti-niti
4 – Zadovoljen
5 – Zelo zadovoljen
Kako je videti baza po tem, ko smo v ustrezna polja vnesli naše vprašanje z možnimi vrednostmi?
- Št. 1: Vsaki spremenljivki pripada svoja vrstica v bazi, zato številka 1 pomeni, da smo vnesli našo prvo spremenljivko.
- Ime spremenljivke (ang. Name): Tu vnesemo ime spremenljivke, ki ga je smiselno oblikovati tako, da že samo ime pove, katero vprašanje se skriva za njim. V našem primeru torej »zad_delo« pomeni zadovoljstvo pri delu. Če bi spremenljivko poimenovali npr. samo »zad« bi vedeli le, da gre za neko zadovoljstvo, ne pa konkretno po katerem zadovoljstvu smo spraševali.
- Tip spremenljivke (ang. Type): Najpogosteje uporabljamo dva tipa spremenljivk, in sicer številske (ang. Numeric) ali opisne (ang. String) spremenljivke. To informacijo sicer program samodejno zapiše, imamo pa seveda možnost, da njegov avtomatski izpis tudi spremenimo.
- Širina podatka (ang. Width): Gre za dovoljeno število znakov, ki jih imamo na voljo za zapis našega podatka. To informacijo sicer program samodejno zapiše, imamo pa seveda možnost, da njegov avtomatski izpis tudi spremenimo. Širina se običajno poveča v primeru opisnih spremenljivk, kjer vpisujemo odprte odgovore, saj so le-ti običajno daljši od 8 znakov.
- Labela oz. opis spremenljivke (ang. Label): Tu običajno vnesemo besedilo našega vprašanja. Če je vprašanje kratko, vnesemo kar celo besedilo. V primeru daljših vprašanj je smiselno dolžino opisa spremenljivke razumljivo prilagoditi. Opisi spremenljivk so vnosi, ki sicer niso nujno potrebni, a kadar baze podatkov ne pripravljamo le za lastno uporabo, ampak mora biti baza razumljiva tudi drugim, je vnos opisov spreemnljivk ključnega pomena.
- Možne/dovoljene vrednosti spremenljivke (ang. Values): Tu vnesemo vsebino vseh možnih odgovorov posameznega vprašanja. Vsakemu odgovoru moramo pripisati tudi številčno oznako. Najbolj negativnemu odgovoru pripišemo najnižjo vrednost, najbolj pozitivnemu pa najvišjo vrednost.
- Manjkajoče vrednosti (ang. Missing): Tu je smiselno vnesti oznako, katero bomo vnesli v bazo v primeru, da anketiranec ni odgovoril na določeno vprašanje. Največkrat se v ta namen uporabljata vrednosti »99« ali »999«, sicer to vrednost lahko izberete poljubno.
- Merska lestvica (ang. Measure): To informacijo program zapiše samodejno glede na to, kakšne možne/dovoljene vrednosti spremenljivke vnesemo. Na osnovi merske lestvice program določi ali je spremenljivka nominalna, ordinalna ali razmernostna.
Ko smo vnesli zgoraj opisane informacije in podatke v bazo podatkov, smo naredili šele pol dela. O nadaljevanju pa v prihodnjem prispevku.
Se ukvarjate s pripravo baze podatkov za izvedbo statistične analize in potrebujete pomoč? V podjetju BenSTAT vam bomo svetovali in poskrbeli za kakovostno analizo vaših podatkov. Oglasite se: info@benstat.si!