Galvenais » algoritmiskā tirdzniecība » Hipotēzes pārbaude finansēs: jēdziens un piemēri

Hipotēzes pārbaude finansēs: jēdziens un piemēri

algoritmiskā tirdzniecība : Hipotēzes pārbaude finansēs: jēdziens un piemēri

Ieguldījumu konsultants jums piedāvā ikmēneša ienākumu investīciju plānu, kas katru mēnesi sola mainīgu atdevi. Jūs tajā ieguldīsit tikai tad, ja būsit pārliecināti par vidējiem ienākumiem mēnesī 180 USD. Jūsu konsultants arī stāsta, ka pēdējos 300 mēnešus shēmai bija ieguldījumu atdeve ar vidējo vērtību 190 USD un standarta novirzi 75 USD. Vai jums vajadzētu ieguldīt šajā shēmā? Šādai lēmumu pieņemšanai noder hipotēžu pārbaude.

Šis raksts paredz, ka lasītāji pārzina normālas izplatīšanas tabulas, formulas, p vērtības un ar to saistītos statistikas pamatjēdzienus.

Kas ir hipotēzes pārbaude?

Hipotēzes vai nozīmīguma pārbaude ir matemātisks modelis apgalvojuma, idejas vai hipotēzes pārbaudei par interesējošo parametru noteiktā populācijas kopā, izmantojot datus, kas izmērīti paraugu komplektā. Aprēķini tiek veikti atlasītajiem paraugiem, lai iegūtu izlēmīgāku informāciju par visas populācijas īpašībām, kas ļauj sistemātiski pārbaudīt apgalvojumus vai idejas par visu datu kopu.

Šis ir vienkāršs piemērs: skolas direktors ziņo, ka viņas skolas audzēkņi eksāmenos vērtē vidēji 7 no 10. Lai pārbaudītu šo “hipotēzi”, mēs reģistrējam 30 skolēnu (izlases) atzīmes no visas skolas studentu grupas (teiksim 300) un aprēķinām šīs izlases vidējo vērtību. Pēc tam mēs varam salīdzināt (aprēķināto) izlases vidējo ar (uzrādīto) populācijas vidējo un mēģināt apstiprināt hipotēzi.

Kā piemēru var minēt konkrētā kopfonda gada ienesīgumu 8% apmērā. Pieņemsim, ka kopieguldījumu fonds pastāv 20 gadus. Mēs ņemam izlases veida kopfonda gada ienākumus, teiksim, piecus gadus (paraugs), un aprēķinām tā vidējo lielumu. Pēc tam mēs salīdzinām (aprēķināto) izlases vidējo rādītāju ar (apgalvoto) populācijas vidējo, lai pārbaudītu hipotēzi.

Lēmumu pieņemšanas kritērijiem jābalstās uz noteiktiem datu kopu parametriem.

Hipotēzes pārbaudei ir atšķirīgas metodoloģijas, taču ir iesaistīti tie paši četri pamata soļi:

1. solis: definējiet hipotēzi

Parasti paziņoto vērtību (vai prasību statistiku) norāda kā hipotēzi un uzskata, ka tā ir patiesa. Iepriekš minētajiem piemēriem hipotēze būs šāda:

  • A piemērs: skolas skolēni eksāmenos vērtē vidēji 7 no 10.
  • B piemērs: Kopfonda gada ienesīgums ir 8% gadā.

Šis izteiktais apraksts veido “ nulles hipotēzi (H 0 ) ”, un tiek uzskatīts, ka tas ir taisnība - veids, kā apsūdzētā tiesā žūrijas prāvā tiek uzskatīts par nevainīgu, kamēr viņu vaina nav pierādīta tiesā iesniegtajos pierādījumos. Tāpat hipotēzes pārbaude sākas ar “nulles hipotēzes” noteikšanu un pieņemšanu, un tad process nosaka, vai pieņēmums, iespējams, ir patiess vai nepatiess.

Svarīgi atzīmēt, ka mēs pārbaudām nulles hipotēzi, jo pastāv šaubas par tās pamatotību. Neatkarīgi no tā, kāda informācija ir pret norādīto nulles hipotēzi, ir ietverta alternatīvajā hipotēzē (H 1 ). Iepriekš minētajiem piemēriem alternatīvā hipotēze būs:

  • Studentu vērtējums ir vidējs, kas nav vienāds ar 7.
  • Kopfonda gada ienesīgums nav vienāds ar 8% gadā.

Citiem vārdiem sakot, alternatīvā hipotēze ir tieša nulles hipotēzes pretruna.

Tāpat kā tiesas procesā, žūrija uzņemas atbildētāja nevainīgumu (hipotēze nav spēkā). Prokuroram jāpierāda savādāk (alternatīva hipotēze). Tāpat pētniekam jāpierāda, ka nulles hipotēze ir patiesa vai nepatiesa. Ja prokuroram neizdodas pierādīt alternatīvo hipotēzi, žūrijai ir jāļauj atbildētājam aiziet (lēmumu jāpamato ar nulles hipotēzi). Tāpat, ja pētniekam neizdodas pierādīt alternatīvu hipotēzi (vai vienkārši neko nedara), tad tiek pieņemts, ka nulles hipotēze ir patiesa.

2. solis: iestatiet kritērijus

Lēmumu pieņemšanas kritērijiem jābalstās uz noteiktiem datu kopu parametriem, un šajā gadījumā tiek parādīts savienojums ar parasto izplatīšanu.

Saskaņā ar standarta statistikas postulāciju par izlases sadalījumu: “Jebkuram parauga lielumam n X4 izlases sadalījums ir normāls, ja parasti tiek sadalīts X kopums, no kura tiek ņemts paraugs.” Tādējādi visu citu iespējamo izlases varbūtības nozīmē, ka kādu varētu izvēlēties, parasti izplata.

Piemēram, nosakiet, vai XYZ akciju tirgū kotēto akciju vidējā dienas ienesīgums ap Jaungada dienu ir lielāks par 2%.

H 0 : nulles hipotēze: vidējais = 2%

H 1 : Alternatīva hipotēze: vidēji> 2% (to mēs vēlamies pierādīt)

Ņem paraugu (teiksim no 50 krājumiem no 500) un aprēķina parauga vidējo lielumu.

Normālam sadalījumam 95% vērtību atrodas divās vidējās populācijas standartnovirzēs. Tādējādi šis normālais sadalījuma un centrālās robežas pieņēmums parauga datu kopai ļauj mums noteikt 5% kā nozīmīguma līmeni. Ir jēga, jo saskaņā ar šo pieņēmumu pastāv mazāk nekā 5% varbūtība (100-95) iegūt novirzes, kas pārsniedz divas standarta novirzes no vidējā rādītāja. Atkarībā no datu kopu rakstura citus nozīmīguma līmeņus var uzskatīt par 1%, 5% vai 10%. Finanšu aprēķiniem (ieskaitot uzvedības finanses) vispārpieņemtais limits ir 5%. Ja mēs atrodam aprēķinus, kas pārsniedz parastās divas standarta novirzes, tad mums ir izteikts noviržu gadījums, lai noraidītu nulles hipotēzi.

Grafiski tas ir attēlots šādi:

Iepriekš minētajā piemērā, ja parauga vidējais rādītājs ir daudz lielāks par 2% (teiksim, 3, 5%), tad mēs noraidām nulles hipotēzi. Tiek pieņemta alternatīvā hipotēze (vidējais> 2%), kas apstiprina, ka krājumu vidējais ienesīgums dienā tiešām pārsniedz 2%.

Tomēr, ja parauga vidējais lielums, visticamāk, nav ievērojami lielāks par 2% (un saglabājas, teiksim, ap 2, 2%), tad NEVARAM noraidīt nulles hipotēzi. Izaicinājums ir jautājums par to, kā izlemt par šādiem tuviem gadījumiem. Lai izdarītu secinājumus no atlasītajiem paraugiem un rezultātiem, jānosaka nozīmīguma līmenis, kas ļauj izdarīt secinājumu par nulles hipotēzi. Alternatīvā hipotēze ļauj noteikt nozīmīguma līmeni vai "kritiskās vērtības" jēdzienu, lai izlemtu par šādiem tuviem gadījumiem.

Saskaņā ar mācību grāmatas standarta definīciju “Kritiskā vērtība ir robežvērtība, kas definē robežas, kuras pārsniedzot, var iegūt mazāk nekā 5% no parauga vidējiem rādītājiem, ja nulles hipotēze ir patiesa. Paraugu vidējie rādītāji, kas pārsniedz kritisko vērtību, novedīs pie lēmuma noraidīt nulles hipotēzi. "Iepriekš minētajā piemērā, ja mēs kritisko vērtību esam definējuši kā 2, 1% un aprēķinātais vidējais ir 2, 2%, tad nulles hipotēzi mēs noraidām. Kritiskā vērtība nosaka skaidru norobežošanu no pieņemšanas vai noraidīšanas.

3. solis: aprēķiniet statistiku

Šajā posmā tiek aprēķināts nepieciešamais (-ie) skaitlis (-i), kas pazīstams kā testa statistika (piemēram, vidējais, z-rādītājs, p-vērtība utt.), Atlasītajam paraugam. (Ar tiem mēs iepazīsimies vēlāk.)

4. solis: panāciet secinājumu

Izmantojot aprēķināto (-ās) vērtību (-as), izlemiet par nulles hipotēzi. Ja vidējā parauga iegūšanas varbūtība ir mazāka par 5%, secinājums ir noraidīt nulles hipotēzi. Pretējā gadījumā pieņemiet un saglabājiet nulles hipotēzi.

Kļūdu veidi

Ar paraugu balstītu lēmumu pieņemšanā var būt četri iespējamie rezultāti attiecībā uz pareizu piemērojamību visam iedzīvotāju lokam:

Lēmums saglabāt


Lēmums noraidīt


Attiecas uz visiem iedzīvotājiem


Pareizi


Nepareizi

(1. TIPA kļūda - a)


Neattiecas uz visiem iedzīvotājiem


Nepareizi

(2. TIPA kļūda - b)


Pareizi


Pareizie gadījumi ir tie gadījumi, kad lēmumi, kas pieņemti par paraugiem, ir patiesi piemērojami visai populācijai. Kļūdu gadījumi rodas, kad tiek nolemts saglabāt nulles hipotēzi (vai noraidīt to), pamatojoties uz izlases aprēķiniem, bet šis lēmums neattiecas uz visu kopumu. Šie gadījumi veido 1. tipa (alfa) un 2. tipa (beta) kļūdas, kā norādīts iepriekš tabulā.

Pareizas kritiskās vērtības izvēle ļauj novērst 1. tipa alfa kļūdas vai ierobežot tās līdz pieļaujamam diapazonam.

Alfa apzīmē kļūdu nozīmīguma līmenī, un to nosaka pētnieks. Lai saglabātu varbūtības aprēķinu standarta 5% nozīmīgumu vai ticamības līmeni, tas tiek saglabāts 5% līmenī.

Saskaņā ar piemērojamajiem lēmumu pieņemšanas kritērijiem un definīcijām:

  • “Šis (alfa) kritērijs parasti tiek iestatīts uz 0, 05 (a = 0, 05), un mēs salīdzinām alfa līmeni ar p vērtību. Ja I tipa kļūdas varbūtība ir mazāka par 5% (p <0, 05), mēs nolemjam noraidīt nulles hipotēzi; pretējā gadījumā mēs saglabājam nulles hipotēzi. ”
  • Tehniskais termins, ko izmanto šai varbūtībai, ir p-vērtība . To definē kā “izlases rezultāta iegūšanas varbūtību, ņemot vērā, ka nulles hipotēzē norādītā vērtība ir patiesa. P vērtību parauga iznākuma iegūšanai salīdzina ar nozīmīguma līmeni. "
  • II tipa kļūda vai beta kļūda tiek definēta kā “varbūtība nepareizi saglabāt nulles hipotēzi, ja faktiski tā nav piemērojama visai populācijai”.

Vēl daži piemēri parādīs šo un citus aprēķinus.

1. piemērs

Pastāv ikmēneša ienākumu ieguldījumu shēma, kas sola mainīgu ikmēneša ienesīgumu. Investors tajā ieguldīs tikai tad, ja būs pārliecināts par vidējiem ienākumiem mēnesī 180 USD. Viņam ir 300 mēnešu peļņas paraugs, kura vidējā vērtība ir 190 USD un standarta novirze 75 USD. Vai viņam vajadzētu ieguldīt šajā shēmā

Izveidosim problēmu. Investors iegulda shēmā, ja viņam / viņai tiek garantēta vēlamā vidējā atdeve 180 USD.

H 0 : nulles hipotēze: vidējais = 180

H 1 : Alternatīva hipotēze: vidējais> 180

1. metode. Kritiskās vērtības pieeja

Nosakiet parauga vidējo kritisko vērtību X L, kas ir pietiekami liela, lai noraidītu nulles hipotēzi - ti, noraidītu nulles hipotēzi, ja parauga vidējā vērtība = = kritiskā vērtība X L

P (identificēt I tipa alfa kļūdu) = P (noraidīt H 0, ņemot vērā, ka H 0 ir patiesa),

To varētu sasniegt, kad parauga vidējā vērtība pārsniedz kritiskās robežas.

= P (ņemot vērā, ka H 0 ir patiesa) = alfa

Grafiski tas parādās šādi:

Alfa = 0, 05 (ti, 5% nozīmīguma līmenis), Z 0, 05 = 1, 645 (no Z tabulas vai normāla sadalījuma tabulas)

=> X L = 180 + 1, 645 * (75 / sqrt (300)) = 187, 12

Tā kā izlases vidējais rādītājs (190) ir lielāks par kritisko vērtību (187, 12), nulles hipotēze tiek noraidīta, un secinājums ir tāds, ka vidējā mēneša peļņa patiešām ir lielāka par USD 180, tāpēc ieguldītājs var apsvērt iespēju ieguldīt šajā shēmā.

2. metode: standartizētas testa statistikas izmantošana

Var izmantot arī standartizētu vērtību z.

Testa statistika, Z = (vidējais parauga lielums - vidējais populācijas lielums) / (std-dev / sqrt (paraugu skaits).

Tad noraidīšanas reģions kļūst šāds:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Mūsu noraidīšanas reģions 5% nozīmīguma līmenī ir Z> Z 0, 05 = 1, 645.

Tā kā Z = 2, 309 ir lielāks par 1, 645, nulles hipotēzi var noraidīt ar līdzīgu secinājumu, kas minēts iepriekš.

3. metode: P-vērtības aprēķināšana

Mūsu mērķis ir identificēt P (parauga vidējais> = 190, kad vidējais = 180).

= P (Z> = (190–180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

Šajā tabulā p vērtības vērtības aprēķināšanai secināts, ka ir apstiprināti pierādījumi par vidējo mēneša ienesīgumu virs 180:

p-vērtība


Secinājumi


mazāk par 1%


Apstiprināti pierādījumi, kas apstiprina alternatīvu hipotēzi


no 1% līdz 5%


Spēcīgi pierādījumi, kas apstiprina alternatīvu hipotēzi


no 5% līdz 10%


Vāji pierādījumi, kas atbalsta alternatīvu hipotēzi


lielāks par 10%


Nav pierādījumu, kas apstiprinātu alternatīvu hipotēzi


2. piemērs

Jauns biržas mākleris (XYZ) apgalvo, ka viņa brokeru maksa ir zemāka nekā jūsu pašreizējā biržas māklera (ABC). Dati, kas pieejami no neatkarīgas pētījumu firmas, norāda, ka visu ABC brokeru klientu vidējais un standarta devums ir attiecīgi 18 USD un 6 USD.

Tiek ņemts 100 ABC klientu paraugs, un starpniecības maksas tiek aprēķinātas, izmantojot jaunās XYZ brokera likmes. Ja vidējais parauga lielums ir 18, 75 USD un std-dev ir vienāds (6 USD), vai var izdarīt secinājumus par atšķirību vidējā brokeru rēķinā starp ABC un XYZ brokeri ">

H 0 : nulles hipotēze: vidējais = 18

H 1 : Alternatīva hipotēze: vidējais 18 (to mēs vēlamies pierādīt.)

Noraidīšanas reģions: Z <= - Z 2, 5 un Z> = Z 2, 5 (pieņemot, ka nozīmīguma līmenis ir 5%, sadaliet pa 2, 5 katrā pusē).

Z = (vidējais parauga vidējais lielums) / (std-dev / sqrt (paraugu skaits))

= (18, 75-18) / (6 / (sqrt (100)) = 1, 25

Šī aprēķinātā Z vērtība ir starp divām robežām, kuras nosaka:

- Z 2, 5 = -1, 96 un Z 2, 5 = 1, 96.

Tādējādi tiek secināts, ka nav pietiekamu pierādījumu, lai secinātu, ka pastāv atšķirības starp jūsu esošā un jaunā brokera likmēm.

Alternatīvi, p-vērtība = P (Z1, 25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, kas ir lielāks par 0, 05 vai 5%, novedot pie tāda paša secinājuma.

Grafiski to attēlo šādi:

Kritikas punkti par hipotētisko testēšanas metodi:

  • Statistiskā metode, kas balstīta uz pieņēmumiem
  • Kļūdu novēršana, kas sīkāk aprakstīta alfa un beta kļūdu izteiksmē
  • P-vērtības interpretācija var būt neviennozīmīga, izraisot neskaidrus rezultātus

Grunts līnija

Hipotēzes pārbaude ļauj matemātiskam modelim apstiprināt apgalvojumu vai ideju ar noteiktu ticamības pakāpi. Tomēr, tāpat kā lielākajai daļai statistikas rīku un modeļu, to ierobežo daži ierobežojumi. Šī modeļa izmantošana finanšu lēmumu pieņemšanā jāapsver ar kritisku skatienu, paturot prātā visas atkarības. Līdzīgas analīzes veikšanai ir vērts izpētīt arī alternatīvas metodes, piemēram, Bajesija secinājumus.

Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.
Ieteicams
Atstājiet Savu Komentāru