Korrelasjonsformel - Hvordan beregne? (Steg for steg)

Formel for å beregne korrelasjon

Korrelasjon er et statistisk mål mellom to variabler og er definert som endring av mengde i en variabel som tilsvarer endring i en annen, og den beregnes ved å summere produktet av summen av den første variabelen minus gjennomsnittet av den første variabelen til summen av den andre variabelen minus gjennomsnittet av den andre variabelen delt på hele under roten til produktet av kvadratet av den første variabelen minus gjennomsnittet av den første variabelen i summen av kvadratet av den andre variabelen minus gjennomsnittet av den andre variabelen.

Korrelasjonsverdien er begrenset mellom -1 og +1 og kan tolkes som følger:

  • -1: Hvis det er -1, er variabler kjent som perfekt negativt korrelert. Det betyr at hvis en variabel beveger seg i en retning, så beveger en annen seg i motsatt retning.
  • 0: Det betyr at variabelen ikke har noen korrelasjon.
  • +1: Hvis det er +1, så er variabler kjent som perfekt korrelert. Begge variablene beveger seg i positive retninger.

Hvis vi har to variable x og y, kan korrelasjonskoeffisienten mellom to variabler bli funnet som:

Korrelasjonskoeffisient = ∑ (x (i) - middel (x)) * (y (i) -mean (y)) / √ (∑ (x (i) -mean (x)) 2 * ∑ (y (i) -middel (y)) 2 )

Hvor,

  • x (i) = verdien av x i prøven
  • Gjennomsnitt (x) = gjennomsnitt av alle verdier av x
  • y (i) = verdien av y i prøven
  • Gjennomsnitt (y) = gjennomsnitt av alle verdier av y

Eksempler

Det er enkelt å beregne korrelasjonen i Excel. Syntaksen for funksjonen som er brukt er som følger:

Korrelasjonskoeffisient = CORREL (array1, array2)

Eksempel 1

La oss ta det samme eksemplet som vi har tatt ovenfor for å beregne korrelasjon ved hjelp av excel.

Løsning:

Nedenfor er verdiene på x og y:

Beregningen er som følger.

Basis excel formel = CORREL (array (x), array (y))

Koeffisient = +0,95

Siden denne koeffisienten er nær +1, er x og y derfor veldig positivt korrelert.

Eksempel 2

Korrelasjon er hovedsakelig nyttig for å analysere aksjekursen i selskaper og lage en aksjeportefølje basert på den.

La oss finne ut sammenhengen mellom Apple-aksjen og Nasdaq-indeksen basert på det siste års aksjeprestasjonen. Apple er et USA-basert multinasjonalt selskap som er spesialisert på IT-produkter som iPod, iPad, Mac, etc.

Løsning:

Nedenfor er den månedlige avkastningen av Apple og Nasdaq-aksjer for det siste året:

La oss nå legge inn verdiene -

Korrelasjonskoeffisient = ∑ (x (i) - gjennomsnitt (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - mener (y)) 2

Korrelasjon mellom Apple og Nasdaq = 0,039 / (√0,0039)

Koeffisient = 0,62

Siden korrelasjonen mellom Apple og Nasdaq er positiv, er Apple derfor positivt korrelert med Nasdaq.

Eksempel 3

La oss nå se på sammenhengen mellom Walmart og Nasdaq-indeksen basert på det siste års aksjeprestasjonen. Walmart er et amerikansk selskap som har en detaljhandel supermarkedskjede.

Løsning:

Nedenfor er den månedlige forestillingen mellom Walmart og Nasdaq for det siste året-

La oss nå legge inn verdiene i formelen -

Korrelasjonskoeffisient = ∑ (x (i) - gjennomsnitt (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - mener (y)) 2

Derfor er beregningen som følger,

Korrelasjon mellom Walmart og Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Koeffisient = 0,12

Vi kan se at Walmart og Nasdaq også er positivt korrelert, men ikke så mye sammenlignet med Apple-korrelasjon med Nasdaq.

Relevans og bruk

En korrelasjonskoeffisient er nyttig for å etablere det lineære forholdet mellom to variabler. Den måler hvordan en variabel vil bevege seg i forhold til bevegelsen til en annen variabel. Den praktiske bruken av denne koeffisienten er å finne ut forholdet mellom aksjekursbevegelse og den samlede markedsbevegelsen. Grunnlaget for denne analysen, en aksjeanalytiker, vil inkludere andelen aksjer for å skape en optimal portefølje med minimal risiko. Det er også nyttig i datavitenskap å finne ut forholdet mellom to variabler.

Også, korrelasjonskoeffisienten brukes veldig høyt for å studere konstruksjonsgyldigheten til data i faktoranalyse. Det brukes sterkt i regresjonsanalyse for å forutsi verdiene til avhengige variabler basert på forholdet mellom avhengige og uavhengige variabler. Denne ligningen er ganske nyttig i kvantitativ analyse for å få karakteren av forholdet mellom forskjellige variabler. Grunnlaget for dette forholdet, hvis en variabel ikke er relatert til andre variabler, kan den elimineres fra listen.

Interessante artikler...