Mis on statistilise analüüsi süsteem?

Terminit “statistilise analüüsi süsteem” kasutatakse tarkvara viitamiseks, mis võimaldab kasutajal teha andmekogumite statistilist analüüsi. Teine seda tüüpi tarkvara sageli kasutatav termin on statistiline programmeerimiskeel. Suurtähtedega kirjutatuna on Statistical Analysis System (SAS) ka ühe tuntuima seda tüüpi tarkvarapaketi õige nimi.

Statistilise analüüsi süsteem pakub andmekogumitega manipuleerimise ja analüüsi hõlbustamiseks vajalikku automatiseerimist ja töötlemisvõimsust. Need paketid hõlbustavad nii kirjeldava kui ka induktiivse statistika arvutamist. Tavaliselt kasutatavad kirjeldavad statistilised arvutused hõlmavad tsentraalse tendentsi, sagedusjaotuse ja seose arvutamist. Induktiivne statistiline analüüs, mida saab teha statistilise analüüsi süsteemiga, hõlmab statistiliste hüpoteeside testimist, nagu t-test, z-test ja hii-ruut test. Paljud statistilise analüüsi süsteemid toetavad ka teisi teste, nagu dispersioonanalüüs (ANOVA) ja selle sugulased ning erinevat tüüpi regressioonitestid.

Statistilise analüüsi süsteeme kasutatakse väga erinevates seadetes. Seda tüüpi tarkvarapakettide kõige sagedasemad kasutajad on loodus- ja sotsiaalteadlased akadeemilistes ja kommertsuuringutes. Ettevõtted võivad kasutada statistilise analüüsi süsteemi ka operatsioonide uurimise, projektijuhtimise ja muude äriteabe rakenduste jaoks.

Mõne tarkvarapaketi puhul kasutatakse sagedamini käsurea liidest (CLI), samas kui teistel on peamiselt graafiline kasutajaliides (GUI), sageli koos rippmenüüdega. Enamik tarkvarapakette pakuvad nii CLI kui ka GUI võimalusi, kuigi kasutajal ei pruugi mõlema liidese kaudu kõigile funktsioonidele juurde pääseda. Kui graafiline kasutajaliides on mittetehnilistele kasutajatele tuttavam, võimaldab CLI kasutamine programmide loomiseks analüüside hõlpsamat replikatsiooni.

Paljud statistikatarkvarapaketid kasutavad neljanda põlvkonna programmeerimiskeeli (4GL). Tänu nende kõrgemale abstraktsioonitasemele ja loomulikumale süntaksile on andmete töötlemine ja analüüs 4GL-is kiirem ja lihtsam kui madalama taseme programmeerimiskeeltes. Enne 4GL-i väljatöötamist oli arvutipõhine statistiline analüüs tülikas ja nõudis suuremat programmeerimisoskust.

Saadaval on suur hulk erinevate liideste, võimaluste ja laiendustega statistilise analüüsi tarkvararakendusi. Patenditud tarkvararakendused on endiselt populaarsed, kuid laialdaselt kasutatakse ka paljusid avatud lähtekoodiga tarkvararakendusi. Peaaegu kõik statistikatarkvarapaketid töötavad Windows® operatsioonisüsteemides ning enamikul on ka Macintosh® ja Linux® versioonid. Mõned rakendused ühilduvad ka Unix® operatsioonisüsteemidega.