t-test

34108 ogledov

Statistična metoda t-test je med najpogosteje uporabljenimi statističnimi metodami za preverjanje hipotez pri majhnih vzorcih. t-test je običajno sinonim za Studentovo t-test metodo.

Vsak statistični test, ki uporablja t porazdelitev, lahko imenujemo t-test (tudi t-preizkus). Običajno pa je t-test sinonim za Studentovo t-test metodo, ki je primerna za analizo majhnih vzorcev. Metodo t-test in t porazdelitev je leta 1908 razvil Anglež William Sealy Gosset pod psevdonimom Student, ko je delo opravljal za Guinnessovo pivovarno v Dublinu na Irskem.

t-test je izumil kot poceni način kontroliranja kakovosti temnega piva. Metodo t-test in t porazdelitev je predstavil v članku »The Probable Error of a Mean«, ki je bil leta 1908 objavljen v statistični znanstveni reviji Biometrika. Kasneje je to postal njegov najbolj znan članek.

Studentov t-test (ang. Student’s t-test) je metoda za testiranje hipotez, kjer testna statistika sledi Studentovi porazdelitvi oz. t porazdelitvi ob predpostavki, da ničelna hipoteza (H0) drži. S to metodo preverjamo razlike med aritmetičnima sredinama dveh neodvisnih vzorcev (ang. Independent samples t-test), primerna je tudi za preverjanje razlik majhnih vzorcev (n<30). t-test metoda predpostavlja normalno porazdelitev (ang. Normal distribution) obeh vzorcev, enako varianco obeh vzorcev in neodvisno slučajno zbrane podatke obeh vzorcev.

Postavitev hipotez:
H0: µ1 = µ2 (aritmetični sredini dveh vzorcev sta enaki)
H1: µ1 ≠ µ(aritmetični sredini dveh vzorcev nista enaki)

Testno statistiko pri t-test metodi imenujemo t statistika (ang. t statistic). Formula za izračun t statistike pri primerjavi aritmetične sredine enega vzorca in populacije:

t statistika: en vzorec in populacija

t statistiko pri primerjavi aritmetičnih sredin dveh neodvisnih vzorcev izračunamo po sledeči formuli:

t statistika: dva neodvisna vzorca

t porazdelitev (ang. t distribution) (tudi Studentova porazdelitev, t distribucija) je verjetnostna porazdelitev (ang. Probability distribution) slučajn zvezne  spremenljivke Y. Predstavlja jo skupina simetričnih krivulj, katerih zvonasto obliko določa število prostostnih stopenj (ang. Degrees of freedom (df)), tj. število neodvisnih opazovanj v vzorcu minus ena. Z večanjem vzorca se veča tudi število prostostnih stopenj, s čimer je oblika t porazdelitve vse bolj podobna obliki normalne porazdelitve. Normalna porazdelitev je zvonaste oblike z vrednostjo aritmetične sredine 1 in vrednostjo standardnega odklona 0. V praksi je pri večjem vzorcu (n>30) tudi t porazdelitev vse bolj podobna normalni porazdelitvi. V teoriji je t porazdelitev popolnoma enaka normalni porazdelitvi takrat, ko sta velikost vzorca in velikost populacije enaka oz. z vidika prostostnih stopenj takrat, ko je prostostnih stopenj neskončno.

Spodnja slika simbolično predstavlja razlike v zvonastih krivuljah pri različnem številu prostostnih stopenj v primerjavi z normalno porazdelitvijo.

Različne krivulje porazdelitev

Se ukvarjate s statistično analizo podatkov in potrebujete pomoč? Potrebujete izračun t statistike? V podjetju BenSTAT vam bomo svetovali in poskrbeli za kakovostno analizo vaših podatkov. Oglasite se: info@benstat.si!