Pearson korrelasjonskoeffisient (formel, eksempel) - Beregn Pearson R

Definisjon av Pearson korrelasjonskoeffisient

Pearson korrelasjonskoeffisient, også kjent som Pearson R statistisk test, måler styrke mellom de forskjellige variablene og deres forhold. Hver gang en statistisk test utføres mellom de to variablene, er det alltid en god ide for den som foretar analyse å beregne verdien av korrelasjonskoeffisienten for å vite at hvor sterk forholdet mellom de to variablene er.

Pearsons korrelasjonskoeffisient returnerer en verdi mellom -1 og 1. Tolkningen av korrelasjonskoeffisienten er som under:

  • Hvis korrelasjonskoeffisienten er -1, indikerer det et sterkt negativt forhold. Det innebærer et perfekt negativt forhold mellom variablene.
  • Hvis korrelasjonskoeffisienten er 0, indikerer det ingen sammenheng.
  • Hvis korrelasjonskoeffisienten er 1, indikerer det et sterkt positivt forhold. Det innebærer et perfekt positivt forhold mellom variablene.

En høyere absolutt verdi av korrelasjonskoeffisienten indikerer en sterkere sammenheng mellom variabler. Dermed indikerer en korrelasjonskoeffisient på 0,78 en sterkere positiv korrelasjon sammenlignet med en verdi på si 0,36. Tilsvarende indikerer en korrelasjonskoeffisient på -0,87 en sterkere negativ korrelasjon sammenlignet med en korrelasjonskoeffisient på si -0,40.

Med andre ord, hvis verdien er i det positive området, så viser det at forholdet mellom variabler er korrelert positivt, og begge verdiene reduseres eller øker sammen. På den annen side, hvis verdien er i det negative området, så viser det at forholdet mellom variabler er korrelert negativt, og begge verdiene vil gå i motsatt retning.

Pearson korrelasjonskoeffisientformel

Pearsons korrelasjonskoeffisientformel er som følger,

Hvor,

  • r = Pearson-koeffisient
  • n = antall par av aksjen
  • ∑xy = summen av produktene av de parrede aksjene
  • ∑x = summen av x-poengene
  • ∑y = summen av y-poengene
  • ∑x 2 = summen av kvadrat x poeng
  • ∑y 2 = summen av de kvadratiske y-poengene

Forklaring

Trinn 1: Finn ut antall par med variabler, som er betegnet med n. La oss anta at x består av 3 variabler - 6, 8, 10. La oss anta at y består av tilsvarende 3 variabler 12, 10, 20.

Trinn 2: Liste opp variablene i to kolonner.

Trinn 3: Finn ut produktet av x og y i tredje kolonne.

Trinn 4: Finn ut verdien av summen av alle x-variabler og alle y-variabler. Skriv resultatene på bunnen av en st og 2 nd kolonne. Skriv summen av x * y i tredje kolonne.

Trinn 5: Finn ut x 2 og y 2 i 4 th og 5 th kolonner og deres sum på bunnen av søylene.

Trinn 6: Sett inn verdiene som er funnet ovenfor i formelen og løs den.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Eksempel på Pearson korrelasjonskoeffisient R

Eksempel 1

I dette eksemplet ved hjelp av følgende detaljer i tabellen over de 6 personene som har en annen alder og forskjellige vekter gitt nedenfor for beregning av verdien av Pearson R

Sr Nei Alder (x) Vekt (y)
1 40 78
2 21 70
3 25 60
4 31 55
5 38 80
6 47 66

Løsning:

For beregningen av Pearson-korrelasjonskoeffisienten vil vi først beregne følgende verdier,

Her er det totale antallet personer 6, så n = 6

Nå er beregningen av Pearson R som følger,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622- 82618) / (√ (43680-40804) * (170190- 167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892.452938
  • r = 0,35

Dermed er verdien på Pearson-korrelasjonskoeffisienten 0,35

Eksempel 2

Det er to aksjer - A og B. Deres aksjekurser på bestemte dager er som følger:

Lager A (x) Stcok B (y)
45 9
50 8
53 8
58 7
60 5

Finn ut Pearson-korrelasjonskoeffisienten fra dataene ovenfor.

Løsning:

Først vil vi beregne følgende verdier.

Beregningen av Pearson-koeffisienten er som følger,

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0,9088

Derfor er Pearson-korrelasjonskoeffisienten mellom de to aksjene -0,9088.

Fordeler

  • Det hjelper å vite hvor sterkt forholdet mellom de to variablene er. Ikke bare tilstedeværelsen eller fraværet av korrelasjonen mellom de to variablene er indikert ved hjelp av Pearson korrelasjonskoeffisienten, men den bestemmer også nøyaktig i hvilken grad disse variablene er korrelert.
  • Ved hjelp av denne metoden kan man fastslå retningen av korrelasjonen, dvs. om korrelasjonen mellom to variabler er negativ eller positiv.

Ulemper

  • Pearson korrelasjonskoeffisient R er ikke tilstrekkelig til å fortelle forskjellen mellom de avhengige variablene og de uavhengige variablene ettersom korrelasjonskoeffisienten mellom variablene er symmetrisk. For eksempel, hvis en person prøver å vite sammenhengen mellom høyt stress og blodtrykk, så kan man finne den høye verdien av korrelasjonen, som viser at høyt stress forårsaker blodtrykket. Nå, hvis variabelen byttes rundt, vil resultatet i så fall også være det samme, noe som viser at stress er forårsaket av blodtrykket, noe som ikke gir mening. Dermed bør forskeren være klar over dataene han bruker til å gjennomføre analysen.
  • Ved hjelp av denne metoden kan man ikke få informasjonen om linjens skråning, da den bare sier om noe forhold mellom de to variablene eksisterer eller ikke.
  • Det er sannsynlig at Pearson korrelasjonskoeffisienten kan feiltolkes, spesielt når det gjelder homogene data.
  • Sammenlignet med de andre beregningsmetodene tar denne metoden lang tid å komme til resultatene.

Viktige poeng

  • Verdiene kan variere fra verdien +1 til verdien -1, der +1 indikerer det perfekte positive forholdet mellom de aktuelle variablene, -1 indikerer det perfekte negative forholdet mellom variablene som vurderes, og en 0-verdi indikerer at ingen sammenheng mellom variablene som er vurdert.
  • Den er uavhengig av variabelens måleenhet. For eksempel, hvis måleenheten til en variabel er i år mens måleenheten til den andre variabelen er i kilogram, selv da, endres ikke verdien av denne koeffisienten.
  • Korrelasjonskoeffisienten mellom variablene er symmetrisk, noe som betyr at verdien av korrelasjonskoeffisienten mellom Y og X eller X og Y vil være den samme.

Konklusjon

Pearson korrelasjonskoeffisient er den typen korrelasjonskoeffisient som representerer forholdet mellom de to variablene, som måles på samme intervall eller samme forholdsskala. Den måler styrken i forholdet mellom de to kontinuerlige variablene.

Den oppgir ikke bare tilstedeværelsen eller fraværet av korrelasjonen mellom de to variablene, men den bestemmer også nøyaktig i hvilken grad disse variablene er korrelert. Det er uavhengig av måleenheten til variablene der verdiene til korrelasjonskoeffisienten kan variere fra verdien +1 til verdien -1. Det er imidlertid ikke tilstrekkelig å fortelle forskjellen mellom de avhengige variablene og de uavhengige variablene.

Interessante artikler...