Neparametriska statistika
Kas ir neparametriskā statistika?Neparametriskā statistika attiecas uz statistikas metodi, kurā dati nav nepieciešami normālam sadalījumam. Neparametriskā statistikā tiek izmantoti bieži vien kārtīgi dati, kas nozīmē, ka tā nepaļaujas uz skaitļiem, bet drīzāk uz rangu vai šķiru secību. Piemēram, apsekojums, kurā patērētāji izvēlas izvēli, sākot no patikas līdz nepatikam, tiek uzskatīti par kārtējiem datiem.
Neparametriskā statistika ietver neparametrisko aprakstošo statistiku, statistiskos modeļus, secinājumus un statistiskos testus. Neparametrisko modeļu struktūras struktūra netiek noteikta a priori, bet gan tiek noteikta pēc datiem. Ar terminu “ neparametrisks” nav domāts, ka šādiem modeļiem pilnīgi trūkst parametru, bet gan tas, ka parametru skaits un raksturs ir elastīgs un nav iepriekš noteikts. Histogramma ir varbūtības sadalījuma neparametriska novērtējuma piemērs.
Neparametriskās statistikas izpratne
Statistikā parametriskā statistika ietver tādus parametrus kā vidējais, vidējais, standartnovirze, dispersija utt. Šajā statistikas formā tiek izmantoti novērotie dati, lai novērtētu sadalījuma parametrus. Saskaņā ar parametrisko statistiku tiek pieņemts, ka dati atbilst normālam sadalījumam ar nezināmiem parametriem μ (populācijas vidējais lielums) un σ 2 (populācijas dispersija), kurus pēc tam aprēķina, izmantojot parauga vidējo lielumu un izlases dispersiju.
Neparametriskā statistika neizdara pieņēmumu par izlases lielumu vai to, vai novērotie dati ir kvantitatīvi.
Neparametriskā statistika neuzskata, ka dati tiek iegūti no normāla sadalījuma. Tā vietā, izmantojot šo statistisko mērījumu formu, tiek novērtēta sadalījuma forma. Lai gan daudzās situācijās var pieņemt normālu izplatīšanu, ir arī daži scenāriji, kuros nebūs iespējams noteikt, vai dati tiks izplatīti normāli.
Neparametriskas statistikas piemēri
Pirmajā piemērā apsveriet iespēju pētniekam, kurš vēlas aprēķināt mazuļu skaitu Ziemeļamerikā, kas dzimuši ar brūnām acīm, var nolemt ņemt 150 000 mazuļu paraugu un veikt datu kopas analīzi. To iegūtais mērījums tiks izmantots kā visu to mazuļu populācijas aprēķins, kuriem ir brūnas acis un kas dzimuši nākamajā gadā.
Otrajā piemērā apsveriet citu pētnieku, kurš vēlas uzzināt, vai gulēt agri vai vēlu ir saistīts ar to, cik bieži cilvēks saslimst. Pieņemot, ka paraugs tiek izvēlēts nejauši no populācijas, var uzskatīt, ka parauga lieluma sadalījums pēc slimības biežuma ir normāls. Tomēr nevar uzskatīt, ka eksperimentam, kas mēra cilvēka ķermeņa izturību pret baktēriju celmu, ir normāls sadalījums.
Tas notiek tāpēc, ka nejauši izvēlēti parauga dati var būt izturība pret celmu. No otras puses, ja pētnieks ņem vērā tādus faktorus kā ģenētiskais uzbūve un etniskā piederība, viņš var secināt, ka parauga lielums, kas izvēlēts, izmantojot šīs īpašības, var nebūt izturīgs pret celmu. Līdz ar to nevar pieņemt normālu sadalījumu.
Šī metode ir noderīga, ja datiem nav skaidras skaitliskas interpretācijas, un tos vislabāk izmantot ar datiem, kuriem ir šķirotība. Piemēram, personības novērtēšanas pārbaudē tās metriku var klasificēt kā izteikti nepiekrītu, nepiekrītu, vienaldzīgu, piekrist un pilnīgi piekrītu. Šajā gadījumā jāizmanto neparametriskas metodes.
Īpaši apsvērumi
Neparametriskā statistika ir guvusi atzinību, pateicoties to ērtai lietošanai. Atbrīvojoties no nepieciešamības pēc parametriem, dati kļūst piemērojamāki plašākam testu klāstam. Šāda veida statistiku var izmantot bez vidējā lieluma, izlases lieluma, standartnovirzes vai citu saistīto parametru novērtējuma, ja šāda informācija nav pieejama.
Tā kā neparametriskā statistika padara mazāk pieņēmumu par izlases datiem, tās piemērošana ir plašāka nekā parametru statistika. Gadījumos, kad parametriskā pārbaude ir piemērotāka, neparametriskās metodes būs mazāk efektīvas. Tas notiek tāpēc, ka rezultātiem, kas iegūti no neparametriskās statistikas, ir zemāka ticamības pakāpe nekā tad, ja rezultāti būtu iegūti, izmantojot parametrisko statistiku.
Taustiņu izņemšana
- Neparametrisko statistiku ir viegli izmantot, taču tā nepiedāvā citu statistisko modeļu precīzu precizitāti.
- Šāda veida analīze ir vispiemērotākā, apsverot kaut ko kārtību. Ja pat tad, ja mainās skaitliskie dati, rezultāti, visticamāk, paliks nemainīgi.