Či kvadrāta (χ2) statistikas definīcija
Kas ir Chi Square statistika?Chi kvadrāts ( χ 2 ) statistika ir pārbaude, kas mēra, kā cerības tiek salīdzinātas ar faktiskajiem novērotajiem datiem (vai modeļa rezultātiem). Chi kvadrāta statistikas aprēķināšanai izmantotajiem datiem jābūt nejaušiem, neapstrādātiem, savstarpēji izslēdzošiem, iegūtiem no neatkarīgiem mainīgajiem un no pietiekami liela parauga. Piemēram, rezultāti, izmetot monētu 100 reizes, atbilst šiem kritērijiem.
Chi kvadrāta testus bieži izmanto hipotēžu pārbaudē.
Chi laukuma formula ir
χc2 = ∑ (Oi − Ei) 2Ei kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as) \ sākas (izlīdzināta) & \ chi ^ 2_c = \ summa \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kur:} \\ & c = \ teksts {brīvības pakāpes} \\ & O = \ teksts {novērotā vērtība (-s)} \\ & E = \ teksts {paredzamā vērtība (s) )} \\ \ beigas {izlīdzinātas} χc2 = ∑Ei (Oi −Ei) 2, kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as)
Ko jums saka Chi Square statistika?
Pastāv divi galvenie či kvadrāta testi: neatkarības pārbaude, kurā tiek uzdots jautājums par attiecībām, piemēram, "Vai pastāv saistība starp dzimumu un SAT rādītājiem?"; un derīguma pārbaude, kurā tiek uzdots kaut kas līdzīgs: "Ja monētu iemet 100 reizes, vai tā nāks virs galvas 50 reizes un astes 50 reizes?"
Šajos testos tiek izmantotas brīvības pakāpes, lai noteiktu, vai noteiktu nulles hipotēzi var noraidīt, pamatojoties uz kopējo mainīgo un paraugu skaitu eksperimentā.
Piemēram, apsverot studentus un kursa izvēli, izlases lielums 30 vai 40 studenti, iespējams, nav pietiekami lieli, lai iegūtu nozīmīgus datus. Tādu pašu vai līdzīgu rezultātu iegūšana no pētījuma, kurā izmanto 400 vai 500 studentu izlasi, ir pamatotāka.
Citā piemērā apsveriet iespēju nomest monētu 100 reizes. Gaidāmais rezultāts, izmetot godīgu monētu 100 reizes, ir tāds, ka galvas nāks uz augšu 50 reizes, un astes - 50 reizes. Faktiskais rezultāts varētu būt tāds, ka galvas uznāk 45 reizes un astes - 55 reizes. Chi kvadrāta statistika parāda jebkādas neatbilstības starp sagaidāmajiem rezultātiem un faktiskajiem rezultātiem.
Taustiņu izņemšana
- Chi kvadrāts (χ 2 ) statistika ir pārbaude, kas nosaka, kā cerības tiek salīdzinātas ar faktiski novērotajiem datiem.
- Pastāv divi galvenie chi kvadrāta testi: datu neatkarības pārbaude un modeļa piemērotības pārbaude.
- Šīs pārbaudes var izmantot, lai noteiktu, vai hipotēžu pārbaudē var noraidīt noteiktu nulles hipotēzi.
Chi kvadrāta testa piemērs
Iedomājieties, ka izlases veida aptaujā piedalījās 2000 dažādu vēlētāju - gan vīriešu, gan sieviešu. Cilvēki, kuri atbildēja, tika klasificēti pēc dzimuma un pēc tā, vai viņi bija republikas, demokrāti vai neatkarīgi. Iedomājieties režģi ar kolonnām, kas apzīmētas ar republikāņu, demokrātu un neatkarību, un divām rindām ar marķējumu vīrietis un sieviete. Pieņemsim, ka 2000 respondentu dati ir šādi:
Republikānis | Demokrāts | Neatkarīgs | Kopā | |
Vīrietis | 400 | 300 | 100 | 800 |
Sieviete | 500 | 600 | 100 | 1200 |
Kopā | 900 | 900 | 200 | 2000. gads |
Pirmais solis, lai aprēķinātu chi kvadrāta statistiku, ir paredzamo frekvenču atrašana. Tos aprēķina katrai režģa "šūnai". Tā kā ir divas dzimumu kategorijas un trīs politiskā viedokļa kategorijas, ir paredzamas sešas frekvences. Paredzamā biežuma formula ir šāda:
E (r, c) = n (r) × c (r) n kur: r = rinda questionc = apšaubāmā kolonna = atbilstošā kopsumma \ sākas {saskaņots} un E (r, c) = \ frac {n (r) \ reizes c (r)} {n} \\ & \ textbf {kur:} \\ & r = \ teksts {attiecīgā rinda} \\ & c = \ teksts {attiecīgā kolonna} \\ & n = \ teksts {atbilstošā kopsumma } \\ \ beigas {izlīdzināts} E (r, c) = nn (r) × c (r) kur: r = rindā questionc = jautājuma kolonnā = atbilstošā kopsumma
Šajā piemērā paredzamās frekvences ir:
- E (1, 1) = (900 x 800) / 2 000 = 360
- E (1, 2) = (900 x 800) / 2 000 = 360
- E (1, 3) = (200 x 800) / 2 000 = 80
- E (2, 1) = (900 x 1 200) / 2 000 = 540
- E (2, 2) = (900 x 1 200) / 2 000 = 540
- E (2, 3) = (200 x 1 200) / 2 000 = 120
Tālāk šīs tiek izmantotas vērtības, lai aprēķinātu chi kvadrāta statistiku, izmantojot šādu formulu:
Chi-kvadrātā = ∑ [O (r, c) −E (r, c)] 2E (r, c) kur: O (r, c) = novērotie dati dotajā rindā un kolonnā \ sākas {izlīdzināts} & \ teksts {četri kvadrāti} = \ summa \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kur:} \\ & O (r, c) = \ teksts {novērotie dati par doto rindu un kolonnu} \\ \ beigas {izlīdzināts} Chi-square = ∑E (r, c) [O (r, c) −E (r, c)] 2, kur: O (r, c) = novērotie dati attiecīgajā rindā un kolonnā
Šajā piemērā katras novērotās vērtības izteiksme ir:
- O (1, 1) = (400 - 360) 2/360 = 4, 44
- O (1, 2) = (300 - 360) 2/360 = 10
- O (1, 3) = (100 - 80) 2/80 = 5
- O (2, 1) = (500 - 540) 2/540 = 2, 96
- O (2, 2) = (600 - 540) 2/540 = 6, 67
- O (2, 3) = (100 - 120) 2/120 = 3, 33
Chi kvadrāta statistika ir vienāda ar šo vērtību summu vai 32.41. Pēc tam mēs varam apskatīt chi kvadrāta statistikas tabulu, lai redzētu, ņemot vērā mūsu iestatījuma brīvības pakāpes, vai rezultāts ir statistiski nozīmīgs vai nē.
Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.