T-tests

Kas ir T-tests?

T-tests ir secinošās statistikas veids, ko izmanto, lai noteiktu, vai starp divām grupām ir ievērojama atšķirība, kas dažās pazīmēs var būt saistīta. To lielākoties izmanto, ja datu kopām, piemēram, datu kopai, kas reģistrēta kā rezultāts 100 reizes pārspējot monētu, būtu normāls sadalījums, un tām varētu būt nezināmas novirzes. T-testu izmanto kā hipotēzes pārbaudes rīku, kas ļauj pārbaudīt pieņēmumu, kas piemērojams populācijai.

T-testā tiek apskatīta t-statistika, t-sadalījuma vērtības un brīvības pakāpes, lai noteiktu atšķirību varbūtību starp divām datu kopām. Lai veiktu testu ar trim vai vairākiem mainīgiem lielumiem, jāizmanto dispersijas analīze.

1:38

T-tests

T-testa izskaidrošana

Būtībā t-tests ļauj mums salīdzināt abu datu kopu vidējās vērtības un noteikt, vai tās nāk no vienas un tās pašas grupas. Iepriekš minētajos piemēros, ja mēs ņemtu studentu izlasi no A klases un citu studentu izlasi no B klases, mēs negaidītu, ka viņiem būs tieši tāds pats vidējais un standarta novirze. Tāpat paraugiem, kas ņemti no placebo barības saņēmušās kontroles grupas, un paraugiem, kas ņemti no izrakstīto zāļu grupas, vajadzētu būt nedaudz atšķirīgiem vidējiem rādītājiem un standarta novirzei.

Matemātiski t-testā tiek ņemts paraugs no abām kopām un tiek noteikts problēmas paziņojums, pieņemot nulles hipotēzi, ka abi līdzekļi ir vienādi. Balstoties uz piemērojamām formulām, noteiktas vērtības tiek aprēķinātas un salīdzinātas ar standarta vērtībām, un pieņemto nulles hipotēzi attiecīgi pieņem vai noraida.

Ja nulles hipotēzi var noraidīt, tas norāda, ka datu nolasījumi ir spēcīgi un nav nejauši. T-tests ir tikai viens no daudzajiem šajā nolūkā izmantotajiem testiem. Statistiķiem papildus jāizmanto testi, kas nav t-tests, lai pārbaudītu vairāk mainīgo lielumu un pārbaudes ar lielākiem paraugu lielumiem. Statistiķi liela parauga lielumam izmanto z-testu. Citas testēšanas iespējas ietver chi-kvadrāta testu un f-testu.

Pastāv trīs t-testu veidi, un tos klasificē kā atkarīgus un neatkarīgus t-testus.

Taustiņu izņemšana

T-tests ir secinošās statistikas veids, ko izmanto, lai noteiktu, vai starp divām grupām ir ievērojama atšķirība, kas dažās pazīmēs var būt saistīta.
T-tests ir viens no daudzajiem testiem, ko izmanto hipotēžu pārbaudei statistikā.
T-testa aprēķināšanai ir vajadzīgas trīs galvenās datu vērtības. Tajos ietilpst starpība starp katras datu kopas vidējām vērtībām (ko sauc par vidējo starpību), katras grupas standartnovirzi un katras grupas datu vērtību skaitu.
Pastāv vairāki dažādi t-testa veidi, kurus var veikt atkarībā no nepieciešamajiem datiem un analīzes veida.

Neskaidri testa rezultāti

Iedomājieties, ka zāļu ražotājs vēlas pārbaudīt nesen izgudrotas zāles. Tas notiek pēc standarta procedūras, kad tiek izmēģinātas zāles vienai pacientu grupai un piešķirts placebo citai grupai, ko sauc par kontroles grupu. Kontroles grupai piešķirtais placebo ir viela, kurai nav paredzētas terapeitiskās vērtības, un tā kalpo par etalonu, lai noteiktu, kā reaģē otra grupa, kurai tiek dotas faktiskās zāles.

Pēc narkotiku izmēģināšanas placebo barotās kontroles grupas locekļi ziņoja par vidējā dzīves ilguma palielināšanos par trim gadiem, savukārt grupas locekļi, kuriem izrakstītas jaunās zāles, ziņo par vidējā dzīves ilguma palielināšanos par četriem gadiem. Tūlītējs novērojums var norādīt, ka zāles patiešām darbojas, jo rezultāti, kas iegūti grupā, ir labāki. Tomēr ir arī iespējams, ka novērojums var būt saistīts ar iespējamību, īpaši pārsteidzošu veiksmes gabalu. T-tests ir noderīgs, lai secinātu, vai rezultāti ir patiesi pareizi un piemērojami visai populācijai.

Skolā 100 A klases audzēkņi novērtēja vidēji 85% ar standartnovirzi 3%. Vēl 100 B klases audzēkņu vērtēja vidēji 87% ar standarta novirzi 4%. Lai gan B klases vidējais rādītājs ir labāks nekā A klases, iespējams, nav pareizi secināt, ka B klases skolēnu vispārējie rezultāti ir labāki nekā A klases skolēnu. Tas ir tāpēc, ka kopā ar nozīmē, ka B klases standartnovirze ir arī lielāka nekā A klase. Tas norāda, ka to galējie procenti apakšējā un augšējā pusē bija daudz vairāk izkliedēti nekā A klases. T-tests var palīdzēt noteikt kura klase izturējās labāk.

T-testa pieņēmumi

Pirmais pieņēmums attiecībā uz t-testiem attiecas uz mērījumu skalu. T-testa pieņēmums ir tāds, ka savāktajiem datiem piemērotā mērījumu skala seko nepārtrauktai vai kārtējai skalai, piemēram, IQ testa rādītājiem.
Otrais izdarītais pieņēmums ir vienkāršs izlases paraugs, ka dati tiek vākti no reprezentatīvas, nejauši atlasītas daļas no kopējā populācijas.
Trešais pieņēmums ir tas, ka diagrammā parādot datus, rodas normāla sadalījuma, zvanveida formas sadalījuma līkne.
Ceturtais pieņēmums ir par samērā lielu izlases lielumu. Lielāks parauga lielums nozīmē, ka rezultātu sadalījumam vajadzētu tuvināties normālai zvanveida formai.
Pēdējais pieņēmums ir dispersijas viendabīgums. Viendabīga vai vienāda dispersija pastāv, ja paraugu standartnovirzes ir aptuveni vienādas.

T-testu aprēķināšana

T-testa aprēķināšanai ir vajadzīgas trīs galvenās datu vērtības. Tajos ietilpst starpība starp katras datu kopas vidējām vērtībām (ko sauc par vidējo starpību), katras grupas standartnovirzi un katras grupas datu vērtību skaitu.

T-testa rezultāts rada t-vērtību. Pēc tam šo aprēķināto t vērtību salīdzina ar vērtību, kas iegūta no kritisko vērtību tabulas (ko sauc par T-sadalījuma tabulu). Šis salīdzinājums palīdz noteikt, cik liela varbūtība, ka starpība starp līdzekļiem radās nejauši, vai datu kopām patiešām ir raksturīgas atšķirības. T-tests apšauba, vai atšķirība starp grupām atspoguļo patiesu atšķirību pētījumā vai arī tā, iespējams, ir bezjēdzīga statistiskā atšķirība.

T-sadales tabulas

T-sadalījuma tabula ir pieejama vienas un divu astes formātos. Pirmo izmanto, lai novērtētu gadījumus, kuriem ir noteikta vērtība vai diapazons ar skaidru virzienu (pozitīvu vai negatīvu). Piemēram, kāda ir varbūtība, ka izlaides vērtība paliek zemāka par -3 vai, kad ripo kauliņu pāri, iegūst vairāk nekā septiņus? Pēdējo izmanto diapazona robežu analīzei, piemēram, jautājot, vai koordinātas ir no -2 līdz +2.

Aprēķinus var veikt ar standarta programmatūras programmām, kas atbalsta nepieciešamās statistiskās funkcijas, piemēram, tās, kas atrodamas MS Excel.

T-vērtības un brīvības pakāpes

T-tests izvada divas vērtības: t-vērtību un brīvības pakāpi. T vērtība ir starpības starp divu paraugu kopu vidējo vērtību un starpību, kas pastāv paraugu kopās, attiecība. Kaut arī skaitītāja vērtību (starpību starp divu paraugu kopu vidējo vērtību) ir viegli aprēķināt, saucējs (atšķirība, kas pastāv paraugu kopās) var kļūt mazliet sarežģīts atkarībā no iesaistīto datu vērtību veida. Attiecības saucējs ir dispersijas vai mainības mērījums. Lielākas t-vērtības vērtības, ko sauc arī par t-rādītājiem, norāda, ka starp abām paraugu kopām pastāv liela atšķirība. Jo mazāka t vērtība, jo lielāka līdzība pastāv starp abām paraugu kopām.

Liels t vērtējums norāda, ka grupas ir atšķirīgas.
Neliels t vērtējums norāda, ka grupas ir līdzīgas.

Brīvības pakāpes attiecas uz vērtībām pētījumā, kurā var mainīties, un tās ir būtiskas nulles hipotēzes svarīguma un pamatotības novērtēšanai. Šo vērtību aprēķināšana parasti ir atkarīga no datu ierakstu skaita, kas pieejams paraugkopā.

Korelēts (vai pāra) T-tests

Korelēto t-testu veic, ja paraugi parasti sastāv no līdzīgu vienību pāriem vai ja ir atkārtotu mērījumu gadījumi. Piemēram, var būt gadījumi, kad tie paši pacienti tiek pārbaudīti atkārtoti - pirms un pēc noteiktas ārstēšanas saņemšanas. Šādos gadījumos katrs pacients tiek izmantots kā kontroles paraugs pret sevi.

Šī metode attiecas arī uz gadījumiem, kad paraugi ir kaut kādā veidā saistīti vai tiem ir atbilstošas īpašības, piemēram, salīdzinošā analīze, kurā iesaistīti bērni, vecāki vai brāļi un māsas. Korelēti vai sapāroti t-testi ir atkarīga tipa, jo tie attiecas uz gadījumiem, kad abas paraugu kopas ir saistītas.

Pārmērīga t-testa t vērtības un brīvības pakāpes aprēķināšanas formula ir šāda:

Mean1 un mean2 ir katras paraugu kopas vidējās vērtības, savukārt var1 un var2 apzīmē katras paraugu kopas dispersiju.

Atlikušie divi veidi pieder neatkarīgajiem t-testiem. Šo tipu paraugi tiek atlasīti neatkarīgi viens no otra, tas ir, datu grupas abās grupās nenorāda uz vienām un tām pašām vērtībām. Tajos ietilpst tādi gadījumi kā 100 pacientu grupa, kas tiek sadalīta divās grupās pa 50 pacientiem katrā. Viena no grupām kļūst par kontroles grupu, un tai piešķir placebo, bet otra grupa saņem noteikto ārstēšanu. Tas veido divas neatkarīgas izlases grupas, kas nav savstarpēji savienotas.

T-tests ar vienādu dispersiju (vai apvienotu)

Vienādas dispersijas t-testu izmanto, ja paraugu skaits katrā grupā ir vienāds vai abu datu kopu dispersija ir līdzīga. T-vērtības un brīvības pakāpes aprēķināšanai vienādās dispersijas t-testā izmanto šādu formulu:

T-vērtība = vidējais1 – vidējais2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2 kur: vidējais1 un vidējais2 = katra parauga kopasvarvar1 un var2 vidējās vērtības = var2 = katra izlases setn1 un n2 = ierakstu skaits katrā izlases kopā \ sākas {saskaņots} & \ teksts {T-vērtība} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ reizes var2 ^ 2} {n1 + n2 - 2}} \ reizes \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { kur:} \\ & mean1 \ text {un} mean2 = \ text {katra parauga kopu} \\ & \ text {vidējās vērtības} \\ & var1 \ text {un} var2 = \ text {dispersija katram no paraugu kopas} \\ & n1 \ teksts {un} n2 = \ teksts {Ierakstu skaits katrā paraugu kopā} \\ \ beigas {izlīdzināts} T-vērtība = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 vidējais1 − vidējais2 kur: vidējais1 un vidējais2 = katra parauga kopas vidējās vērtības1 un var2 = katras parauga kopas dispersijan1 un n2 = ierakstu skaits katrā paraugā komplekts

un,

Brīvības pakāpes = n1 + n2−2 kur: n1 un n2 = Ierakstu skaits katrā parauga kopā \ sākas {saskaņots} un \ teksts {Brīvības pakāpes} = n1 + n2 - 2 \\ & \ textbf {kur:} \\ & n1 \ teksts {un} n2 = \ teksts {Ierakstu skaits katrā izlases kopā} \\ \ beigas {izlīdzinātas} Brīvības pakāpes = n1 + n2−2 kur: n1 un n2 = Ierakstu skaits katrā izlases kopā Visiem, kas noklusina, tas ir tavs.

Nevienlīdzīgas variācijas T-tests

Nevienlīdzīgas dispersijas t-testu izmanto, ja paraugu skaits katrā grupā ir atšķirīgs, un atšķiras arī abu datu kopu dispersija. Šo testu sauc arī par Velča t-testu. Lai aprēķinātu t-vērtību un brīvības pakāpi nevienlīdzīgas dispersijas t-testam, izmanto šādu formulu:

T-vērtība = vidējais1 - vidējais2var12n1 + var22n2kur: vidējais1 un vidējais2 = katra parauga kopas1 un var2 vidējās vērtības = katra parauga komplekta dispersijan1 un n2 = ierakstu skaits katrā parauga kopā \ sākas {izlīdzināts} & \ teksts {T-vērtība} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {kur:} \ \ & mean1 \ text {un} mean2 = \ text {katra parauga kopu} \\ & \ text {vidējās vērtības} \\ & var1 \ text {un} var2 = \ text {katras izlases kopas dispersija} \ \ & n1 \ teksts {un} n2 = \ teksts {Ierakstu skaits katrā paraugkopā} \\ \ beigas {izlīdzināts} T-vērtība = n1var12 + n2var22 mean1 − mean2 kur: mean1 un mean2 = vidējās vērtības katra parauga kopasvar1 un var2 = katras parauga kopas dispersijan1 un n2 = ierakstu skaits katrā paraugu komplektā

un,

Brīvības pakāpes = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 kur: var1 un var2 = katras izlases kopas dispersija n1 un n2 = ierakstu skaits katrā izlases kopā \ sākas {saskaņots } & \ teksts {Brīvības pakāpes} = \ frac {\ pa kreisi (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {kur:} \\ & var1 \ text {un} var2 = \ text {Katra no izlases kopām dispersija} \\ & n1 \ text {un} n2 = \ text {Ierakstu skaits katrā izlases kopā } \\ \ beigas {izlīdzinātas} Brīvības pakāpes = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2, kur: var1 un var2 = katra dispersija no paraugu kopāmn1 un n2 = ierakstu skaits katrā paraugu komplektā

Pareiza izmantojamā T-testa noteikšana

Lai noteiktu, kuru t-testu vajadzētu izmantot, pamatojoties uz paraugu kopu parametriem, var izmantot šo diagrammu. Galvenie apsvērumi, kas jāņem vērā, ir, vai izlases ieraksti ir līdzīgi, datu ierakstu skaits katrā izlases kopā un katras izlases kopas dispersija.

Attēla Džūlija Banga © Investopedia 2019

Nevienmērīgas dispersijas T-testa piemērs

Pieņemsim, ka mēs veicam mākslas galerijā saņemto gleznu pa diagonāli. Vienā paraugu grupā ietilpst 10 gleznas, bet otrā - 20 gleznas. Datu kopas ar atbilstošajām vidējām un dispersijas vērtībām ir šādas:

	1. komplekts	2. komplekts
	19, 7	28.3
	20.4	26.7
	19, 6	20.1
	17.8	23.3
	18.5	25.2
	18.9	22.1
	18.3	17, 7
	18.9	27, 6
	19.5	20.6
	21.95	13, 7
		23.2
		17.5
		20.6
		18
		23.9
		21.6
		24.3
		20.4
		23.9
		13.3
Nozīmē	19.4	21.6
Dispersija	1.4	17.1

Lai arī 2. seta vidējais rādītājs ir augstāks nekā 1. komplekta, mēs nevaram secināt, ka visu gleznu vidējais garums ir aptuveni 21, 6 vienības, jo 2. komplekta dispersija ir ievērojami augstāka nekā 1. komplekta. Vai tas ir nejauši, vai tiešām pastāv atšķirības? visu mākslas galerijā saņemto gleznu kopskaits ">

Tā kā datu ierakstu skaits ir atšķirīgs (n1 = 10 un n2 = 20) un arī dispersija, iepriekšminētajai datu kopai t vērtību un brīvības pakāpi aprēķina, izmantojot formulu, kas minēta U -qual Variance T-Test sadaļa.

T vērtība ir -2, 24787. Tā kā mīnus zīmi var ignorēt, salīdzinot abas t vērtības, aprēķinātā vērtība ir 2.24787.

Brīvības pakāpes vērtība ir 24, 38 un tiek samazināta līdz 24, jo formulas definīcija prasa vērtības noapaļošanu uz leju līdz mazākajai iespējamajai veselajai vērtībai.

Kad tiek pieņemts normāls sadalījums, kā pieņemšanas kritēriju var norādīt varbūtības līmeni (alfa līmenis, nozīmīguma līmenis, p ). Vairumā gadījumu var pieņemt, ka vērtība ir 5%.

Izmantojot brīvības pakāpi kā 24 un 5% nozīmīguma pakāpi, apskatot t-vērtības sadalījuma tabulu, iegūst vērtību 2, 064. Šīs vērtības salīdzināšana ar aprēķināto vērtību 2.247 norāda, ka aprēķinātā t-vērtība ir lielāka par tabulas vērtību 5% nozīmīguma līmenī. Tāpēc droši var noraidīt nulles hipotēzi, ka starp līdzekļiem nav atšķirības. Iedzīvotāju grupai ir raksturīgas atšķirības, un tās nav nejaušas.

Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.

Saistītie noteikumi

Kā darbojas dispersijas analīze (ANOVA) dispersijas analīze (ANOVA) ir statistiskās analīzes rīks, kas datu kopā atrasto kopējo mainīgumu atdala divās sastāvdaļās: nejauši un sistemātiski. vairāk Izpratne par T izplatību AT sadalījums ir varbūtības funkcijas tips, kas ir piemērots, lai novērtētu populācijas parametrus maziem izlases lielumiem vai nezināmām dispersijām. vairāk brīvības pakāpes definīcijas Brīvības pakāpes norāda uz maksimāli loģiski neatkarīgu vērtību skaitu, kas ir vērtības, kuras var mainīties, datu paraugā. vairāk Kā darbojas atlikušā standartnovirze Atlikušā standartnovirze ir statistikas termins, ko izmanto, lai aprakstītu novēroto vērtību standartnoviržu atšķirības pret prognozētajām vērtībām, kā parādīti punktos regresijas analīzē. vairāk Kā darbojas Chi kvadrāta statistika Chi kvadrāta (χ2) statistika ir tests, kas mēra, kā cerības tiek salīdzinātas ar faktiskajiem novērotajiem datiem (vai modeļa rezultātiem). Chi kvadrāta statistikas aprēķināšanai izmantotajiem datiem jābūt nejaušiem, neapstrādātiem, savstarpēji izslēdzošiem, iegūtiem no neatkarīgiem mainīgajiem un no pietiekami liela parauga. vairāk Kā izmanto Wilcoxon testu Wilcoxon tests, kas attiecas vai nu uz Rank Sum pārbaudi, vai Signed Rank pārbaudi, ir neparametrisks tests, kurā salīdzina divas pārī savienotas grupas. vairāk partneru saišu

← Piegādes punkts

Krājumu vadība →

Ieteicams

Atstājiet Savu Komentāru