Galvenais » algoritmiskā tirdzniecība » Vairāku lineāru regresiju - MLR definīcija

Vairāku lineāru regresiju - MLR definīcija

algoritmiskā tirdzniecība : Vairāku lineāru regresiju - MLR definīcija
Kas ir multiplārā lineārā regresija - MLR?

Daudzkārtējā lineārā regresija (MLR), pazīstama arī kā daudzkārtējā regresija, ir statistikas paņēmiens, kas izmanto vairākus skaidrojošos mainīgos, lai paredzētu atbildes mainīgā rezultātu. Daudzkārtējās lineārās regresijas (MLR) mērķis ir modelēt lineāro sakarību starp skaidrojošajiem (neatkarīgajiem) mainīgajiem un atbildes (atkarīgajiem) mainīgajiem.

Būtībā daudzkāršā regresija ir parastās mazāko kvadrātu (OLS) regresijas pagarinājums, kas ietver vairāk nekā vienu skaidrojošo mainīgo.

Vairāku lineāru regresiju formula ir

yi = β0 + β1xi1 + β2xi2 + ... + βpxip + ϵ kur, i = n novērojumiem: yi = atkarīgs mainīgaisxi = izplešanās mainīgieβ0 = y-krustojums (nemainīgs termins) βp = katra skaidrojošā mainīgā slīpuma koeficientiϵ = modeļa kļūdas termins (pazīstams arī kā atlikumi) \ sākas {saskaņots} & y_i = \ beta_0 + \ beta _1 x_ {i1} + \ beta _2 x_ {i2} + ... + \ beta _p x_ {ip} + \ epsilon \\ & \ textbf {kur, priekš} i = n \ textbf {novērojumi:} \\ & y_i = \ teksts {atkarīgs mainīgais} \\ & x_i = \ teksts {paplašinošie mainīgie} \\ & \ beta_0 = \ teksts {y-pārtveršana (nemainīgs) termins)} \\ & \ beta_p = \ teksts {katra skaidrojošā mainīgā slīpuma koeficienti} \\ & \ epsilon = \ teksts {modeļa kļūdas termins (pazīstams arī kā atlikumi)} \\ \ beigas {saskaņots} yi = β0 + β1 xi1 + β2 xi2 + ... + βp xip + ϵ kur, i = n novērojumiem: yi = atkarīgs mainīgaisxi = izplešanās mainīgieβ0 = y-krustojums (nemainīgs termins) βp = Katra skaidrojošā mainīgā slīpuma koeficientiϵ = modeļa kļūdas termins (pazīstams arī kā atlikumi)

Vairāku lineāru regresiju izskaidrošana

Vienkārša lineārā regresija ir funkcija, kas ļauj analītiķim vai statistiķim veikt prognozes par vienu mainīgo, pamatojoties uz informāciju, kas ir zināma par citu mainīgo. Lineāro regresiju var izmantot tikai tad, ja vienam ir divi nepārtraukti mainīgie - neatkarīgs mainīgais un atkarīgs mainīgais. Neatkarīgais mainīgais ir parametrs, kuru izmanto, lai aprēķinātu atkarīgo mainīgo vai rezultātu. Vairāku regresiju modelis attiecas uz vairākiem skaidrojošiem mainīgajiem.

Daudzkārtējās regresijas modeļa pamatā ir šādi pieņēmumi:

  • Starp atkarīgajiem un neatkarīgajiem mainīgajiem pastāv lineāra sakarība.
  • Neatkarīgie mainīgie nav pārāk savstarpēji korelēti.
  • y i novērojumi tiek izvēlēti neatkarīgi un nejauši no populācijas.
  • Atlikumi parasti jāsadala ar vidējo vērtību 0 un dispersiju σ.

Noteikšanas koeficients (R-kvadrātā) ir statistikas rādītājs, ko izmanto, lai izmērītu, cik lielu iznākuma variāciju var izskaidrot ar neatkarīgo mainīgo variācijām. R 2 vienmēr palielinās, jo MLR modelim tiek pievienots vairāk pareģotāju, kaut arī prognozētāji var nebūt saistīti ar iznākuma mainīgo.

Tādējādi R2 pats par sevi nevar izmantot, lai noteiktu, kuri pareģi būtu jāiekļauj modelī un kuri jāizslēdz. R2 var būt tikai no 0 līdz 1, kur 0 norāda, ka iznākumu nevar paredzēt neviens no neatkarīgajiem mainīgajiem, un 1 norāda, ka iznākumu var prognozēt bez kļūdām no neatkarīgajiem mainīgajiem.

Interpretējot daudzkārtējās regresijas rezultātus, beta koeficienti ir derīgi, turot visus pārējos mainīgos nemainīgus ("visi pārējie vienādi"). Vairāku regresiju izvadi var parādīt horizontāli kā vienādojumu vai vertikāli tabulas formā.

Piemērs, izmantojot vairāku lineāru regresiju

Piemēram, analītiķis varētu vēlēties uzzināt, kā tirgus kustība ietekmē Exxon Mobil (XOM) cenu. Šajā gadījumā viņa lineārajam vienādojumam būs S&P 500 indeksa kā neatkarīga mainīgā vai prognozētāja vērtība un XOM kā atkarīgā mainīgā vērtība.

Patiesībā ir vairāki faktori, kas paredz notikuma iznākumu. Piemēram, Exxon Mobil cenu kustība ir atkarīga ne tikai no kopējā tirgus snieguma. Citi prognozētāji, piemēram, naftas cena, procentu likmes un naftas fjūčeru cenu kustība var ietekmēt XOM cenu un citu naftas kompāniju akciju cenas. Lai saprastu attiecības, kurās ir vairāk nekā divi mainīgie lielumi, tiek izmantota daudzkārtējā lineārā regresija.

Vairāku lineāro regresiju (MLR) izmanto, lai noteiktu matemātisko sakarību starp vairākiem nejaušiem mainīgajiem. Citiem vārdiem sakot, MLR pārbauda, ​​kā vairāki neatkarīgi mainīgie ir saistīti ar vienu atkarīgo mainīgo. Kad katrs neatkarīgais faktors ir noteikts, lai prognozētu atkarīgo mainīgo, informāciju par vairākiem mainīgajiem var izmantot, lai izveidotu precīzu prognozi par to, kāds ir to ietekmes līmenis uz iznākuma mainīgo. Modelis rada attiecības taisnas līnijas (lineāras) formā, kas vislabāk tuvina visus atsevišķos datu punktus.

Atsaucoties uz iepriekš minēto MLR vienādojumu, mūsu piemērā:

  • y i = atkarīgs mainīgais: XOM cena
  • x i1 = procentu likmes
  • x i2 = naftas cena
  • x i3 = S&P 500 indeksa vērtība
  • x i4 = naftas nākotnes līgumu cena
  • B 0 = y-pārtvere nulles laikā
  • B 1 = regresijas koeficients, kas mēra vienības izmaiņas atkarīgajā mainīgajā, mainoties x i1 - izmaiņas XOM cenā, mainoties procentu likmēm
  • B 2 = koeficienta vērtība, kas mēra vienības izmaiņas atkarīgajā mainīgajā, mainoties x i2 - izmaiņas XOM cenā, mainoties naftas cenām

Vismazāko kvadrātu aprēķini, B 0, B 1, B 2 … B p, parasti tiek aprēķināti ar statistikas programmatūru. Tā kā daudzus mainīgos var iekļaut regresijas modelī, kurā katrs neatkarīgais mainīgais tiek diferencēts ar skaitli - 1, 2, 3, 4 ... p. Vairāku regresiju modelis ļauj analītiķim paredzēt iznākumu, pamatojoties uz informāciju, kas sniegta par vairākiem skaidrojošiem mainīgajiem.

Tomēr modelis ne vienmēr ir pilnīgi precīzs, jo katrs datu punkts var nedaudz atšķirties no modeļa prognozētā rezultāta. Atlikušo vērtību E, kas ir starpība starp faktisko un prognozēto iznākumu, iekļauj modelī, lai ņemtu vērā šādas nelielās izmaiņas.

Pieņemot, ka mēs izmantojam mūsu XOM cenu regresijas modeli, izmantojot statistikas aprēķināšanas programmatūru, kas atdod šo izvadi:

Analītiķis šo izlaidumu interpretētu tādējādi, ka, ja citi mainīgie lielumi tiek turēti nemainīgi, XOM cena paaugstināsies par 7, 8%, ja naftas cena tirgos palielināsies par 1%. Modelis arī parāda, ka XOM cena samazināsies par 1, 5% pēc procentu likmju paaugstināšanās par 1%. R 2 norāda, ka 86, 5% no Exxon Mobil akciju cenu svārstībām var izskaidrot ar procentu likmju, naftas cenas, naftas fjūčeru un S&P 500 indeksa izmaiņām.

Taustiņu izņemšana

  • Daudzkārtējā lineārā regresija (MLR), pazīstama arī kā daudzkārtējā regresija, ir statistikas paņēmiens, kas izmanto vairākus skaidrojošos mainīgos, lai paredzētu atbildes mainīgā rezultātu.
  • Daudzkārtējā regresija ir lineārās (OLS) regresijas pagarinājums, kurā izmantots tikai viens skaidrojošais mainīgais.
  • MLR tiek plaši izmantots ekonometrijā un finanšu secinājumos.

Atšķirība starp lineāro un daudzkārto regresiju

Lineārā (OLS) regresija salīdzina atkarīgā mainīgā reakciju, ņemot vērā izmaiņas dažos skaidrojošos mainīgajos. Tomēr reti, ja atkarīgs mainīgais tiek izskaidrots tikai ar vienu mainīgo. Šajā gadījumā analītiķis izmanto vairāku regresiju, kas mēģina izskaidrot atkarīgo mainīgo, izmantojot vairāk nekā vienu neatkarīgu mainīgo. Vairākas regresijas var būt lineāras un nelineāras.

Vairāku regresiju pamatā ir pieņēmums, ka pastāv atkarība starp atkarīgajiem un neatkarīgajiem mainīgajiem. Tas arī neuzņemas būtisku korelāciju starp neatkarīgajiem mainīgajiem.

Investīciju kontu salīdzināšana Piegādātāja nosaukums Apraksts Reklāmdevēja atklāšana × Piedāvājumi, kas parādās šajā tabulā, ir no partnerībām, no kurām Investtopedia saņem kompensāciju.

Saistītie noteikumi

Ko regresija mēra Regresija ir statistisks mērījums, kas mēģina noteikt attiecības stiprumu starp vienu atkarīgo mainīgo (parasti apzīmēts ar Y) un citu mainīgo mainīgo virkni (pazīstamus kā neatkarīgus mainīgos). vairāk Kas ir kļūdas termins "> Kļūdas termins tiek definēts kā statistiskā modeļa mainīgais lielums, kas tiek izveidots, kad modelis pilnībā neatspoguļo faktiskās attiecības starp neatkarīgajiem un atkarīgajiem mainīgajiem. vairāk Kā vismazāk darbojas metode ar minimālo kvadrātu. kvadrātu metode ir statistikas paņēmiens, lai noteiktu modelim visatbilstošāko līniju, ko nosaka ar vienādojumu ar noteiktiem parametriem novērotajiem datiem .. vairāk Ekonometrija: ko tas nozīmē un kā tā tiek izmantota Ekonometrija ir statistisko un matemātisko modeļu piemērošana ekonomiskajiem. dati, lai pārbaudītu teorijas, hipotēzes un nākotnes tendences. vairāk R-kvadrāts R-kvadrāts ir statistikas rādītājs, kas attēlo atkarīgā mainīgā dispersijas proporciju, ko izskaidro neatkarīgs mainīgais. vairāk Kā darbojas noteikšanas koeficients. Noteikšanas koeficients ir rādītājs, ko izmanto statistiskajā analīzē, lai novērtētu, cik labi modelis izskaidro un prognozē turpmākos rezultātus. rtner saites
Ieteicams
Atstājiet Savu Komentāru