R Squared (R ^ 2) - Definisjon, Formel, Beregn R Squared

Hva er R Squared (R2) i regresjon?

R-kvadrat (R 2 ) er en viktig statistisk mål, som er en regresjonsmodell som representerer den andel av forskjellen eller avviket som statistikk for en avhengig variabel som kan forklares ved hjelp av en uavhengig variabel eller variabler. Kort sagt bestemmer den hvor godt data passer til regresjonsmodellen.

R kvadratformel

For beregningen av R kvadrat, må du bestemme korrelasjonskoeffisienten, og deretter må du kvadratere resultatet.

R kvadratformel = r 2

Hvor r kan korrelasjonskoeffisienten beregnes per nedenfor:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Hvor,

  • r = Korrelasjonskoeffisienten
  • n = nummer i det gitte datasettet
  • x = første variabel i sammenhengen
  • y = andre variabel

Forklaring

Hvis det er noen sammenheng eller korrelasjon som kan være lineær eller ikke-lineær mellom disse to variablene, skal den indikere om det er en endring i den uavhengige variabelen i verdi, så vil den andre avhengige variabelen sannsynligvis endre seg i verdi, si lineært eller ikke-lineært.

Tellerdelen av formelen utfører en test om de beveger seg sammen og fjerner deres individuelle bevegelser og relative styrke for begge som beveger seg sammen, og nevneren av formelen skalerer telleren ved å ta kvadratroten av produktet av forskjellene i variablene fra deres kvadratiske variabler. Og når du kvadrerte dette resultatet, får vi R i kvadrat, noe som ikke er annet enn bestemmelseskoeffisienten.

Eksempler

Eksempel 1

Vurder følgende to variabler x og y, du må beregne R Squared i Regression.

Løsning:

Ved å bruke den ovennevnte formelen må vi først beregne korrelasjonskoeffisienten.

Vi har alle verdiene i tabellen ovenfor med n = 4.

La oss nå legge inn verdiene i formelen for å komme frem til figuren.

r = (4 * 26,046,25) - (265,18 * 326,89) / √ ((4 * 21,274,94) - (326,89) 2 ) * ((4 * 31,901,89) - (326,89) 2 )

r = 17,501,06 / 17,512,88

Korrelasjonskoeffisienten vil være-

r = 0,99932480

Så beregningen blir som følger,

r 2 = (0,99932480) 2

R Squared Formula in Regression

r 2 = 0,998650052

Eksempel 2

India, et utviklingsland, ønsker å gjennomføre en uavhengig analyse av om endringer i råoljeprisene har påvirket rupien. Følgende er historien om Brent råoljepris og Rupee-verdsettelse, begge mot dollar som var gjeldende i gjennomsnitt for de årene per nedenfor.

RBI, Indias sentralbank, har henvendt seg til deg for å gi en presentasjon om det samme i neste møte. Bestem om bevegelsene i råolje påvirker bevegelsene i rupi per dollar?

Løsning:

Ved hjelp av formelen for korrelasjonen ovenfor kan vi beregne korrelasjonskoeffisienten først. Behandler gjennomsnittlig råoljepris som en variabel, si x, og behandler rupi per dollar som en annen variabel som y.

Vi har alle verdiene i tabellen ovenfor med n = 6.

La oss nå legge inn verdiene i formelen for å komme frem til figuren.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1,715,95

Korrelasjonskoeffisienten vil være-

r = -0,3614

Så beregningen blir som følger,

r 2 = (-0,3614) 2

R Squared Formula in Regression

r 2 = 0.1306

Analyse: Det ser ut til at det er et mindre forhold mellom endringer i råoljeprisene og endringer i prisen på den indiske rupien. Når råoljeprisen øker, påvirker også endringene i den indiske rupien. Men siden R kvadrat er bare 13%, forklarer endringene i råoljeprisen veldig mindre om endringer i den indiske rupien, og den indiske rupien er også gjenstand for endringer i andre variabler, som det må tas hensyn til.

Eksempel 3

XYZ laboratorium forsker på høyde og vekt og er interessert i å vite om det er noen form for sammenheng mellom disse variablene. Etter å ha samlet et utvalg på 5000 mennesker for hver kategori og kom opp med en gjennomsnittlig vekt og gjennomsnittshøyde i den aktuelle gruppen.

Nedenfor er detaljene de har samlet.

Du må beregne R Squared og konkludere om denne modellen forklarer avvik i høyden påvirker avvik i vekt.

Løsning:

Ved hjelp av formelen for korrelasjonen ovenfor kan vi beregne korrelasjonskoeffisienten først. Behandler høyden som en variabel, si x, og behandler vekten som en annen variabel som y.

Vi har alle verdiene i tabellen ovenfor med n = 6.

La oss nå legge inn verdiene i formelen for å komme frem til figuren.

r = (7 * 74.058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6,581.05 / 7,075,77

Korrelasjonskoeffisienten vil være-

Korrelasjonskoeffisient (r) = 0,9301

Så beregningen blir som følger,

r 2 = 0,8651

Analyse: Korrelasjonen er positiv, og det ser ut til at det er noe sammenheng mellom høyde og vekt. Når høyden øker, ser det ut til at vekten til personen øker. Mens R2 antyder at 86% av endringene i høyden tilskriver vektendringer, og 14% er uforklarlige.

Relevans og bruksområder

Relevansen av R kvadratert i regresjon er dens evne til å finne sannsynligheten for at fremtidige hendelser vil oppstå innenfor de gitte forutsagte resultatene eller resultatene. Hvis flere prøver legges til i modellen, vil koeffisienten vise sannsynligheten eller sannsynligheten for at et nytt punkt eller det nye datasettet faller på linjen. Selv om begge variablene har sterk sammenheng, viser ikke bestemmelsen kausalitet.

Noen av områdene der R-firkanten hovedsakelig brukes, er for å spore aksjefondets ytelse, for å spore risiko i hedgefond, for å bestemme hvor godt aksjen beveger seg med markedet, hvor R2 antyder hvor mye av bevegelsene i aksjen som kan forklares av bevegelsene i markedet.

Interessante artikler...