P-verdiformel - Trinnvise eksempler for å beregne P-verdi

Innholdsfortegnelse

Hva er P-Value Formula?

P er et statistisk mål som hjelper forskere med å avgjøre om hypotesen deres er riktig. Det hjelper med å bestemme betydningen av resultatene. Nullhypotesen er en standardposisjon om at det ikke er noe forhold mellom to målte fenomener. Det er betegnet med H 0. En alternativ hypotese er den du vil tro hvis nullhypotesen konkluderes med å være usann. Dens symbol er H 1 eller H a.

P-verdi i excel er et tall mellom 0 og 1. Det er tabeller, regnearkprogrammer og statistisk programvare for å beregne p-verdien. Betydningsnivået (α) er en forhåndsdefinert terskel satt av forskeren. Det er generelt 0,05. En veldig liten p-verdi, som er mindre enn nivået av betydning, indikerer at du avviser nullhypotesen. P-verdi, som er større enn signifikansnivået, indikerer at vi ikke klarer å avvise nullhypotesen.

Forklaring av P-verdi-formelen

Formelen for beregning av p-verdien kan utledes ved hjelp av følgende trinn:

Beregning av P-verdi fra en Z-statistikk

Trinn 1: Vi må finne ut teststatistikken z

Z = (p̂ - p0) / √ (p0 (1-p0) / n)

Hvor

  • p̂ er prøveandel
  • p0 er antatt befolkningsandel i den nullhypotesen
  • n er prøvestørrelsen

Trinn 2: Vi må finne det tilsvarende nivået av p fra den oppnådde z-verdien. For dette formålet må vi se på z-tabellen.

Kilde: www.dummies.com

La oss for eksempel finne verdien av p som tilsvarer z ≥ 2,81. Siden normalfordelingen er symmetrisk, er negative verdier av z lik de positive verdiene. 2.81 er en sum på 2,80 og 0,01. Se på 2,8 i z-kolonnen og den tilsvarende verdien på 0,01. Vi får p = 0,0025.

Eksempler på P-Value Formula (med Excel-mal)

La oss se noen enkle til avanserte eksempler på P-verdi ligning for å forstå det bedre.

Eksempel 1

a) P-verdi er 0,3015. Hvis signifikansnivået er 5%, finn ut om vi kan avvise nullhypotesen.

b) P-verdi er 0,0129. Hvis signifikansnivået er 5%, finn ut om vi kan avvise nullhypotesen.

Løsning:

Bruk følgende data for beregning av P-verdi.

P-verdi vil være -

a) Siden p-verdien på 0,3015 er større enn signifikansnivået på 0,05 (5%), unnlater vi å avvise nullhypotesen.

b) Siden p-verdien på 0,0129 er mindre enn nivået av betydning på 0,05, avviser vi nullhypotesen.

Eksempel 2

27% av befolkningen i India snakker hindi i henhold til en forskningsstudie. En forsker er nysgjerrig på om tallet er høyere i landsbyen sin. Derfor rammer de null og alternative hypoteser. Han tester H 0: p = 0,27. Ha : p> 0,27. Her er p andelen mennesker i landsbyen som snakker hindi. Han bestiller en undersøkelse i landsbyen sin for å finne ut hvor mange som kan snakke hindi. Han finner ut at 80 av 240 personer som er samplet, kan snakke hindi. Finn ut den omtrentlige p-verdien for forskerens test hvis vi skulle anta at de nødvendige betingelser er oppfylt, og signifikansnivået er 5%.

Løsning:

Bruk følgende data for beregning av P-verdi.

Her er prøvestørrelsen n = 240,

p 0 er befolkningsandelen. Vi må finne utvalgets andel

= 80/240

= 0,33

Z Statistikk

Beregning av Z-statistikk

= 0,33 - 0,27 / √ 0,27 * (1 - 0,27) / 240

Z-statistikken vil være -

Z = 2,093696

P-verdi vil være -

P-verdi = P (z ≥ 2,09)

Vi må se på verdien av 2.09 er z-tabellen. Så vi må se på -2,0 i z-kolonnen og verdien i 0,09-kolonnen. Siden normalfordelingen er symmetrisk, er arealet til høyre for kurven lik det til venstre. Vi får p-verdien som 0,0183.

P-verdi = 0,0183

Siden p-verdien er mindre enn det signifikante nivået på 0,05 (5%), avviser vi nullhypotesen.

Merk: I Excel kommer p-verdien til 0,0181

Eksempel 3

Studier viser at et høyere antall flybilletter kjøpes av menn sammenlignet med kvinner. De kjøpes av menn og kvinner i forholdet 2: 1. Forskningen ble utført på en bestemt flyplass i India for å finne fordelingen av flybilletter blant menn og kvinner. Av 150 billetter ble 88 billetter kjøpt av menn og 62 av kvinner. Vi må finne ut om den eksperimentelle manipulasjonen forårsaker endring i resultatene, eller vi ser en sjansevariasjon. Beregn p-verdien forutsatt at graden av betydning er 0,05.

Løsning:

Bruk følgende data for beregning av P-verdi.

Trinn 1: Den observerte verdien er 88 for menn og 62 for kvinner.

  • Forventet verdi for menn = 2/3 * 150 = 100 menn
  • Forventet verdi for kvinner = 1/3 * 150 = 50 kvinner

Trinn 2: Finn ut chi-kvadrat

= ((88-100) 2 ) / 100 + (62-50) 2 /50

= 1,44 + 2,88

Chi-Square (X 2)

Chi-Square (X 2) vil være -

Chi-Square (X 2) = 4,32

Trinn 3: Finn grader av frihet

Siden det er to variabler - menn og kvinner, er n = 2

Frihetsgrader = n-1 = 2-1 = 1

Trinn 4: Fra p-verditabellen ser vi på den første raden i tabellen som frihetsgraden er 1. Vi kan se at p-verdien er mellom 0,025 og 0,05. Siden p-verdien er mindre enn graden av betydning på 0,05, avviser vi nullhypotesen.

P-verdi vil være -

P-verdi = 0,037666922

Merk: Excel gir direkte p-verdien ved hjelp av formelen:

CHITEST (faktisk område, forventet område)

Eksempel 4

Det er kjent at 60% av menneskene som går inn i klesbutikker i en by, kjøper noe. En klesbutikkeier ønsket å finne ut om tallet er høyere for klesbutikken som eies av ham. Han hadde allerede resultatene av en studie utført for butikken sin. 128 av 200 personer som kom inn i butikken hans, kjøpte noe. Butikkeieren betegnet pas andelen mennesker som kom inn i klesbutikken hans og kjøpte noe. Nullhypotesen innrammet av ham var p = 0,60, og den alternative hypotesen var p> 0,60. Finn p-verdien for forskningen på et signifikansnivå på 5%.

Løsning:

Bruk følgende data for beregning av P-verdi.

Her er prøvestørrelsen n = 200. Vi må finne utvalgets andel

= 128/200

= 0,64

Z Statistikk

Beregning av Z-statistikk

= 0,64 - 0,60 / √ 0,60 * (1 - 0,60) / 200

Z-statistikken vil være -

Z Statistikk = 1,1547

P-verdi = P (z ≥ 1,1547)

NORMSDIST Funksjon i Excel

NORMSDIST vil være -

NORMSDIST = 0,875893461

Det er en innebygd funksjon for å beregne en p-verdi fra az-statistikk i Excel. Det er kjent som NORMSDIST-funksjonen. Excel NORMSDIST-funksjonen beregner Standard Normal kumulativ distribusjonsfunksjon fra en gitt verdi. Dens format er NORMSDIST (z). Siden z-statistikkverdien er i celle B2, er funksjonen som brukes = NORMSDIST (B2).

P-verdien vil være -

P-verdi = 0,122410654

Siden vi må finne området til høyre for kurven,

p-verdi = 1 - 0,875893 = 0,1224107

Siden p-verdien på 0,1224107 er mer enn et signifikant nivå på 0,05, unnlater vi å avvise nullhypotesen.

Relevans og bruk

P-verdi har brede anvendelser i statistisk hypotesetesting, spesielt i nullhypotesetesting. For eksempel driver en fondsforvalter et aksjefond. Han hevder at avkastningen fra en bestemt ordning i aksjefondet tilsvarer Nifty, som er referanseindeksen for aksjemarkedet. Han ville innramme nullhypotesen om at avkastningen til aksjefondordningen tilsvarer Nifty. Den alternative hypotesen vil være at ordningens avkastning og Nifty-avkastning ikke er ekvivalente. Han ville da beregne p-verdien.

Interessante artikler...