Galvenais » biznesa vadītāji » Či kvadrāta (χ2) statistikas definīcija

Či kvadrāta (χ2) statistikas definīcija

biznesa vadītāji : Či kvadrāta (χ2) statistikas definīcija
Kas ir Chi Square statistika?

Chi kvadrāts ( χ 2 ) statistika ir pārbaude, kas mēra, kā cerības tiek salīdzinātas ar faktiskajiem novērotajiem datiem (vai modeļa rezultātiem). Chi kvadrāta statistikas aprēķināšanai izmantotajiem datiem jābūt nejaušiem, neapstrādātiem, savstarpēji izslēdzošiem, iegūtiem no neatkarīgiem mainīgajiem un no pietiekami liela parauga. Piemēram, rezultāti, izmetot monētu 100 reizes, atbilst šiem kritērijiem.

Chi kvadrāta testus bieži izmanto hipotēžu pārbaudē.

Chi laukuma formula ir

χc2 = ∑ (Oi − Ei) 2Ei kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as) \ sākas (izlīdzināta) & \ chi ^ 2_c = \ summa \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {kur:} \\ & c = \ teksts {brīvības pakāpes} \\ & O = \ teksts {novērotā vērtība (-s)} \\ & E ​​= \ teksts {paredzamā vērtība (s) )} \\ \ beigas {izlīdzinātas} χc2 = ∑Ei (Oi −Ei) 2, kur: c = brīvības pakāpesO = novērotā vērtība (-s) E = paredzamā (-ās) vērtība (-as)

Ko jums saka Chi Square statistika?

Pastāv divi galvenie či kvadrāta testi: neatkarības pārbaude, kurā tiek uzdots jautājums par attiecībām, piemēram, "Vai pastāv saistība starp dzimumu un SAT rādītājiem?"; un derīguma pārbaude, kurā tiek uzdots kaut kas līdzīgs: "Ja monētu iemet 100 reizes, vai tā nāks virs galvas 50 reizes un astes 50 reizes?"

Šajos testos tiek izmantotas brīvības pakāpes, lai noteiktu, vai noteiktu nulles hipotēzi var noraidīt, pamatojoties uz kopējo mainīgo un paraugu skaitu eksperimentā.

Piemēram, apsverot studentus un kursa izvēli, izlases lielums 30 vai 40 studenti, iespējams, nav pietiekami lieli, lai iegūtu nozīmīgus datus. Tādu pašu vai līdzīgu rezultātu iegūšana no pētījuma, kurā izmanto 400 vai 500 studentu izlasi, ir pamatotāka.

Citā piemērā apsveriet iespēju nomest monētu 100 reizes. Gaidāmais rezultāts, izmetot godīgu monētu 100 reizes, ir tāds, ka galvas nāks uz augšu 50 reizes, un astes - 50 reizes. Faktiskais rezultāts varētu būt tāds, ka galvas uznāk 45 reizes un astes - 55 reizes. Chi kvadrāta statistika parāda jebkādas neatbilstības starp sagaidāmajiem rezultātiem un faktiskajiem rezultātiem.

Taustiņu izņemšana

  • Chi kvadrāts (χ 2 ) statistika ir pārbaude, kas nosaka, kā cerības tiek salīdzinātas ar faktiski novērotajiem datiem.
  • Pastāv divi galvenie chi kvadrāta testi: datu neatkarības pārbaude un modeļa piemērotības pārbaude.
  • Šīs pārbaudes var izmantot, lai noteiktu, vai hipotēžu pārbaudē var noraidīt noteiktu nulles hipotēzi.

Chi kvadrāta testa piemērs

Iedomājieties, ka izlases veida aptaujā piedalījās 2000 dažādu vēlētāju - gan vīriešu, gan sieviešu. Cilvēki, kuri atbildēja, tika klasificēti pēc dzimuma un pēc tā, vai viņi bija republikas, demokrāti vai neatkarīgi. Iedomājieties režģi ar kolonnām, kas apzīmētas ar republikāņu, demokrātu un neatkarību, un divām rindām ar marķējumu vīrietis un sieviete. Pieņemsim, ka 2000 respondentu dati ir šādi:

RepublikānisDemokrātsNeatkarīgsKopā
Vīrietis400300100800
Sieviete5006001001200
Kopā9009002002000. gads

Pirmais solis, lai aprēķinātu chi kvadrāta statistiku, ir paredzamo frekvenču atrašana. Tos aprēķina katrai režģa "šūnai". Tā kā ir divas dzimumu kategorijas un trīs politiskā viedokļa kategorijas, ir paredzamas sešas frekvences. Paredzamā biežuma formula ir šāda:

E (r, c) = n (r) × c (r) n kur: r = rinda questionc = apšaubāmā kolonna = atbilstošā kopsumma \ sākas {saskaņots} un E (r, c) = \ frac {n (r) \ reizes c (r)} {n} \\ & \ textbf {kur:} \\ & r = \ teksts {attiecīgā rinda} \\ & c = \ teksts {attiecīgā kolonna} \\ & n = \ teksts {atbilstošā kopsumma } \\ \ beigas {izlīdzināts} E (r, c) = nn (r) × c (r) kur: r = rindā questionc = jautājuma kolonnā = atbilstošā kopsumma

Šajā piemērā paredzamās frekvences ir:

  • E (1, 1) = (900 x 800) / 2 000 = 360
  • E (1, 2) = (900 x 800) / 2 000 = 360
  • E (1, 3) = (200 x 800) / 2 000 = 80
  • E (2, 1) = (900 x 1 200) / 2 000 = 540
  • E (2, 2) = (900 x 1 200) / 2 000 = 540
  • E (2, 3) = (200 x 1 200) / 2 000 = 120

Tālāk šīs tiek izmantotas vērtības, lai aprēķinātu chi kvadrāta statistiku, izmantojot šādu formulu:

Chi-kvadrātā = ∑ [O (r, c) −E (r, c)] 2E (r, c) kur: O (r, c) = novērotie dati dotajā rindā un kolonnā \ sākas {izlīdzināts} & \ teksts {četri kvadrāti} = \ summa \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {kur:} \\ & O (r, c) = \ teksts {novērotie dati par doto rindu un kolonnu} \\ \ beigas {izlīdzināts} Chi-square = ∑E (r, c) [O (r, c) −E (r, c)] 2, kur: O (r, c) = novērotie dati attiecīgajā rindā un kolonnā

Šajā piemērā katras novērotās vērtības izteiksme ir:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • O (2, 3) = (100 - 120) 2/120 = 3, 33

Chi kvadrāta statistika ir vienāda ar šo vērtību summu vai 32.41. Pēc tam mēs varam apskatīt chi kvadrāta statistikas tabulu, lai redzētu, ņemot vērā mūsu iestatījuma brīvības pakāpes, vai rezultāts ir statistiski nozīmīgs vai nē.

Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.

Saistītie noteikumi

Brīvības pakāpes definīcija Brīvības pakāpes norāda uz loģiski neatkarīgo vērtību maksimālo skaitu datu paraugā, kas ir vērtības, kurām ir tiesības mainīties. vairāk T-testa definīcija T-tests ir secinošās statistikas veids, ko izmanto, lai noteiktu, vai starp divām grupām ir būtiska atšķirība, kas dažās pazīmēs var būt saistīta. vairāk ko mums saka apgrieztā korelācija Apgrieztā korelācija, kas pazīstama arī kā negatīvā korelācija, ir pretēja saistība starp diviem mainīgajiem, tā, ka tie pārvietojas pretējos virzienos. vairāk Kā darbojas atlikušā standartnovirze Atlikušā standartnovirze ir statistikas termins, ko izmanto, lai aprakstītu novēroto vērtību standartnoviržu atšķirības pret prognozētajām vērtībām, kā parādīti punktos regresijas analīzē. vairāk Kā darbojas dispersijas analīze (ANOVA) dispersijas analīze (ANOVA) ir statistiskās analīzes rīks, kas datu kopā atrasto kopējo mainīgumu atdala divās sastāvdaļās: nejauši un sistemātiski. vairāk korelācija Korelācija ir statistisks rādītājs tam, kā divi vērtspapīri mainās viens pret otru. vairāk partneru saišu
Ieteicams
Atstājiet Savu Komentāru