Skjevhet - Betydning, typer og eksempler

Innholdsfortegnelse

Skjevhet Betydning

Skjevhet beskriver hvor mye statistisk datadistribusjon som er asymmetrisk fra normalfordelingen, hvor fordelingen er likt delt på hver side. Hvis en fordeling ikke er symmetrisk eller normal, så er den skjev, dvs. den er enten frekvensfordelingen skjevt til venstre eller til høyre side.

Typer skjevhet

Hvis fordelingen er symmetrisk, har den en skjevhet på 0 og dens middel = median = modus.

Så i utgangspunktet er det to typer -

  • Positiv : Fordelingen er positivt skjev når det meste av distribusjonsfrekvensen ligger på høyre side av fordelingen og har en lengre og fetere høyre hale. Hvor fordelingen er gjennomsnitt> median> modus.
  • Negativ : Distribusjonen er negativt skjev når det meste av distribusjonsfrekvensen ligger på venstre side av distribusjonen og har en lengre og fetere venstre hale. Hvor fordelingen er gjennomsnittlig <Median <-modus.

Formel

Skjevhetsformel er representert som nedenfor -

Det er flere måter å beregne skjevheten i datadistribusjonen på. Den ene er Pearsons første og andre koeffisienter.

  • Pearsons første koeffisienter (Mode Skewness): Den er basert på distribusjonens gjennomsnitt, modus og standardavvik.

Formel: (middel - modus) / standardavvik.

  • Pearsons andre koeffisienter (Median Skewness): Den er basert på gjennomsnitt, median og standardavvik for fordelingen.

Formel: (middel - median) / standardavvik.

Som du kan se ovenfor, har Pearsons første skjevhetskoeffisient en modus som sin ene variabel for å beregne den, og den er bare nyttig når data har et mer repeterende tall i datasettet, som om det bare er noen få repeterende data i dataene sett som hører til modus, så er Pearsons andre skjevhetskoeffisient et mer pålitelig mål på sentral tendens da den anser medianen for datasettet i stedet for modus.

For eksempel:

Datasett (a): 7,8,9,4,5,6,1,2,2,3.

Datasett (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3.

For begge datasettene kan vi konkludere med at modusen er 2. Men det er ikke fornuftig å bruke Pearsons første skjevhetskoeffisient for datasett (a) da tallet 2 bare vises to ganger i datasettet, men det kan brukes å lage for datasett (b) ettersom det har en mer repeterende modus.

En annen måte å beregne skjevhet ved å bruke formelen nedenfor:

  • = Tilfeldig variabel.
  • X = fordeling gjennomsnitt.
  • N = Total variabel i fordelingen.
  • α = Standardavvik.

Eksempel på skjevhet

For å forstå dette konseptet mer detaljert, la oss se på eksemplet nedenfor:

I XYZ management college vurderer 30 sisteårsstudenter jobbplassering i QPR-forskningsfirmaet og kompensasjonen deres er basert på studentens akademiske prestasjoner og tidligere arbeidserfaring. Nedenfor er dataene om studentens kompensasjon i PQR-forskningsfirmaet.

Løsning

Bruk dataene nedenfor

Beregning av distribusjonsmiddel

  • = ($ 400 * 12 + $ 500 * 8 + $ 700 * 5 + $ 850 * 3 + $ 1000 * 2) / 30
  • Distribusjonsmiddel = 561,67

Beregning av standardavvik

  • Standardavvik = √ ((Summen av avviksfeltet * Antall studenter) / N).
  • Standardavvik = 189,16

Beregning av skjevhet kan gjøres som følger -

  • Skjevhet: (summen av avvikskuben) / (N-1) * Standardavvikets kube.
  • = (106374650.07) / (29 * 6768161.24)
  • = 0,54

Derfor forteller verdien 0,54 oss at distribusjonsdata er litt skjev fra normalfordelingen.

Fordeler

  • Skjevhet er bedre å måle ytelsen til investeringsavkastningen.
  • Investoren bruker dette når han analyserer datasettet, ettersom det vurderer distribusjonens ekstreme i stedet for å bare stole på
  • Det er et mye brukt verktøy i statistikken, da det hjelper å forstå hvor mye data som er asymmetri fra normalfordelingen.

Ulemper

  • Skjevhet spenner fra negativ uendelig til positiv uendelig, og det blir noen ganger vanskelig for en investor å forutsi trenden i datasettet.
  • En analytiker forutsier den fremtidige ytelsen til en eiendel ved hjelp av den økonomiske modellen, som vanligvis forutsetter at data blir normalt distribuert, men hvis distribusjonen av data er skjev, vil denne modellen ikke gjenspeile det faktiske resultatet i antakelsen.

Betydning

I statistikk spiller det en viktig rolle når distribusjonsdata ikke blir normalt distribuert. De ekstreme datapunktene i datasettet kan føre til at datadistribusjonen skjever mot venstre (dvs. ekstreme data i datasettet er mindre, det skjev datasettet er negativt, noe som betyr at modus). Det hjelper en investor som har en kortsiktig holdeperiode med å analysere dataene for å identifisere trenden, som faller ytterst på distribusjonen.

Konklusjon

Skjevhet er ganske enkelt hvor mye datasett som avviker fra normalfordelingen. En større negativ verdi i datasettet betyr at distribusjonen er negativt skjev og større positiv verdi i datasettet betyr at distribusjonen er positivt fordelt. Det er et godt statistisk mål som hjelper investoren med å forutsi avkastning fra fordelingen.

Interessante artikler...