Galvenais » algoritmiskā tirdzniecība » Noteikšanas koeficients

Noteikšanas koeficients

algoritmiskā tirdzniecība : Noteikšanas koeficients
Kāds ir noteikšanas koeficients?

Noteikšanas koeficients ir statistiskajā analīzē izmantots mērs, kas novērtē, cik labi modelis izskaidro un prognozē turpmākos rezultātus. Tas norāda uz izskaidrotā mainīguma līmeni datu kopā. Noteikšanas koeficients, ko mēdz dēvēt arī par “R-kvadrātu”, tiek izmantots kā vadlīnijas modeļa precizitātes mērīšanai.

Viens veids, kā interpretēt šo skaitli, ir teikt, ka mainīgajā modelī iekļautie mainīgie izskaidro aptuveni x% no novērotajām variācijām. Tātad, ja R2 = 0, 50, tad aptuveni puse no novērotajām variācijām ir izskaidrojama ar modeli.

1:58

R-kvadrātā

Taustiņu izņemšana

  • Noteikšanas koeficients ir sarežģīta ideja, kuras centrā ir datu nākotnes modeļa statistiskā analīze.
  • Noteikšanas koeficientu izmanto, lai izskaidrotu, cik lielu viena faktora mainīgumu var izraisīt tā saistība ar citu faktoru.

Izpratnes koeficienta izpratne

Noteikšanas koeficientu izmanto, lai izskaidrotu, cik lielu viena faktora mainīgumu var izraisīt tā saistība ar citu faktoru. To ļoti paļauj tendenču analīzē, un to attēlo kā vērtību no 0 līdz 1.

Jo tuvāk vērtībai ir 1, jo labāka ir abu faktoru atbilstība vai saistība. Noteikšanas koeficients ir korelācijas koeficienta kvadrāts, pazīstams arī kā "R", kas ļauj tam parādīt lineāro korelācijas pakāpi starp diviem mainīgajiem.

Šī korelācija ir pazīstama kā "piemērotības piemērotība". Vērtība 1, 0 norāda uz perfektu piemērotību, un tādējādi tas ir ļoti uzticams nākotnes prognožu modelis, norādot, ka modelis izskaidro visas novērotās izmaiņas. No otras puses, vērtība 0 norāda, ka modelim nav iespējams precīzi modelēt datus. Modelim ar vairākiem mainīgiem lielumiem, piemēram, daudzkārtējas regresijas modelim, labāks noteikšanas koeficients ir koriģētais R2. Ekonomikā R 2 vērtību virs 0, 60 uzskata par vērtīgu.

Noteikšanas koeficienta analīzes priekšrocības

Noteikšanas koeficients ir korelācijas kvadrāts starp prognozētajiem rādītājiem datu kopā ar faktisko punktu kopu. To var izteikt arī kā korelācijas kvadrātu starp X un Y vērtībām, X ir neatkarīgais mainīgais un Y ir atkarīgs mainīgais.

Neatkarīgi no attēlojuma R kvadrāts, kas vienāds ar 0, nozīmē, ka atkarīgo mainīgo nevar paredzēt, izmantojot neatkarīgo mainīgo. Un otrādi, ja tas ir vienāds ar 1, tas nozīmē, ka mainīgā atkarību vienmēr prognozē neatkarīgais mainīgais.

Šajā diapazonā esošais noteikšanas koeficients mēra to, cik lielā mērā neatkarīgais mainīgais prognozē atkarīgo mainīgo. Piemēram, R kvadrāts 0, 20 nozīmē, ka neatkarīgais mainīgais paredz 20% no atkarīgā mainīgā.

Piemērotības pakāpe vai lineārās korelācijas pakāpe mēra attālumu starp diagrammā uzstādīto līniju un visiem datu punktiem, kas ir izkaisīti pa grafiku. Stingrajam datu kopumam būs regresijas līnija, kas ir ļoti tuvu punktiem un ir ļoti piemērota, tas nozīmē, ka attālums starp līniju un datiem ir ļoti mazs. Labam piemērotumam ir R kvadrāts, kas ir tuvu 1.

Tomēr R kvadrāts nespēj noteikt, vai datu punkti vai prognozes ir neobjektīvas. Tas arī nenosaka analītiķim vai lietotājam, vai noteikšanas koeficients ir labs vai nē. Piemēram, zems R kvadrāts nav slikts, un personai ir jāpieņem lēmums, pamatojoties uz R kvadrāta numuru.

Noteikšanas koeficientu nevajadzētu interpretēt naivi. Piemēram, ja modeļa R kvadrāts ir 75%, tā kļūdu novirze ir par 75% mazāka nekā atkarīgā mainīgā dispersija, un tā kļūdu standartnovirze ir par 50% mazāka nekā atkarīgā standarta novirze mainīgs. Modeļa kļūdu standartnovirze ir aptuveni viena trešdaļa no kļūdu standartnovirzes, ko jūs iegūtu, izmantojot modeli tikai ar nemainīgu modeli.

Visbeidzot, pat ja R kvadrāta vērtība ir liela, modelī skaidrojošajiem mainīgajiem var nebūt statistiskas nozīmes, vai arī praktiski šo mainīgo faktiskais lielums var būt ļoti mazs.

Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.

Saistītie noteikumi

Kas ir kļūdas termins? Kļūdas termins tiek definēts kā mainīgais statistiskajā modelī, kas tiek izveidots, kad modelis pilnībā neatspoguļo faktiskās attiecības starp neatkarīgajiem un atkarīgajiem mainīgajiem. vairāk kā darbojas vairākkārtējā lineārā regresija Vairāku lineārā regresija (MLR) ir statistikas paņēmiens, kas izmanto vairākus skaidrojošos mainīgos, lai paredzētu atbildes mainīgā rezultātu. vairāk Labākās ietilpības līnija Labākās piemērotības līnija ir regresijas analīzes izvade, kas attēlo attiecības starp diviem vai vairākiem mainīgiem datu kopā. vairāk R-kvadrāts R-kvadrāts ir statistikas mērs, kas attēlo atkarīgā mainīgā dispersijas proporciju, ko izskaidro neatkarīgs mainīgais. vairāk Kā darbojas vismazāko kvadrātu metode Vismazāko kvadrātu metode ir statistikas metode, lai noteiktu modelim vispiemērotāko līniju, ko nosaka vienādojums ar noteiktiem parametriem novērotajiem datiem. vairāk Heteroskedasticitāte Statistikā heteroskedasticitāte notiek tad, kad mainīgā standarta novirzes, ko uzrauga noteiktā laika posmā, ir nepastāvīgas. vairāk partneru saišu
Ieteicams
Atstājiet Savu Komentāru