Chi Square Test i Excel - Hvordan gjøre Chi Square Test med eksempel

Innholdsfortegnelse

Chi-Square Test med Excel

Chi-Square-testen i Excel er den mest brukte ikke-parametriske testen som brukes til å sammenligne to eller flere variabler for tilfeldig utvalgte data. Det er en type test som brukes til å finne ut forholdet mellom to eller flere variabler, dette brukes i statistikk som også er kjent som Chi-Square P-verdi, i excel har vi ikke en innebygd funksjon, men vi kan bruke formler for å utføre chi-kvadrat test i excel ved å bruke den matematiske formelen for Chi-Square Test.

Typer

  1. Chi-Square test for god passform
  2. Chi-Square test for uavhengighet av to variabler.

# 1 - Chi-Square test for god passform

Den brukes til å oppfatte nærheten til et utvalg som passer en populasjon. Symbolet for Chi-Square-testen er (2). Det er summen av alle ( Observert antall - Forventet antall) 2 / Forventet antall.

  • Hvor k-1 frihetsgrader eller DF.
  • Der Oi er den observerte frekvensen, er k kategori, og Ei er den forventede frekvensen.

Merk: - Tilpasningsevnen til en statistisk modell refererer til forståelsen av hvor godt eksempeldata passer til et sett med observasjoner.

Bruker

  • Kredittverdigheten til låntakere basert på aldersgrupper og personlige lån
  • Forholdet mellom prestasjonene til selgere og mottatt opplæring
  • Avkastning på en enkelt aksje og på aksjer i en sektor som farmasøytisk eller bank
  • Kategori av seere og virkningen av en TV-kampanje.

# 2 - Chi-Square test for uavhengighet av to variabler

Det brukes til å kontrollere om variablene er autonome av hverandre eller ikke. Med (r-1) (c-1) frihetsgrader

Der Oi er den observerte frekvensen, r er antall rader, c er antall kolonner, og Ei er den forventede frekvensen

Merk: - To tilfeldige variabler kalles uavhengige hvis sannsynlighetsfordelingen for den ene variabelen ikke påvirkes av den andre.

Bruker

Uavhengighetstest er egnet i følgende situasjoner:

  • Det er en kategorisk variabel.
  • Det er to kategoriske variabler, og du må bestemme forholdet mellom dem.
  • Det er krysstabeller, og forholdet mellom to kategoriske variabler må bli funnet.
  • Det er ikke-kvantifiserbare variabler (for eksempel svar på spørsmål som, velger ansatte i forskjellige aldersgrupper forskjellige typer helseplaner?)

Hvordan gjør jeg Chi-Square-testen i Excel? (med eksempel)

Lederen for en restaurant ønsker å finne forholdet mellom kundetilfredshet og lønnene til de som venter på bord. I dette vil vi sette opp hypotesen for å teste Chi-Square

  • Hun tar et tilfeldig utvalg på 100 kunder som spør om tjenesten var utmerket, god eller dårlig.
  • Hun kategoriserer deretter lønningene til folket som venter som lave, middels og høye.
  • Anta at nivået av betydning er 0,05. Her betegner H0 og H1 uavhengigheten og avhengigheten av tjenestekvaliteten på lønnene til folk som venter på bord.
  • H 0 - servicekvaliteten er ikke avhengig av lønnen til folk som venter på bordene.
  • H 1 - servicekvaliteten er avhengig av lønningene til folk som venter på bordene.
  • Hennes funn er vist i tabellen nedenfor:

I dette har vi 9 datapunkter vi har 3 grupper, som hver har en annen melding om lønn, og resultatet er gitt nedenfor.

Nå skal vi telle summen av alle radene og kolonnene. Vi vil gjøre dette ved hjelp av formel, dvs. SUM. For å totalere det utmerkede i den totale kolonnen, har vi skrevet = SUM (B4: D4) og trykk deretter på enter-tasten.

Dette vil gi oss 26 . Vi vil utføre det samme med alle radene og kolonnene.

For å beregne frihetsgraden (DF) bruker vi (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Det er 3 tjenestekategorier og 3 kategorier lønn.
  • Vi har 27 respondenter med middels lønn (nederste rad, midt)
  • Vi har 51 respondenter med god service (siste kolonne, midt)

Nå må vi beregne de forventede frekvensene: -

Forventede frekvenser kan beregnes ved hjelp av en formel: -

  • For å beregne for det utmerkede, vil vi bruke å multiplisere totalt lav med totalt utmerket delt på N.

Anta at vi må beregne for 1. rad og 1. kolonne (= B7 * E4 / B9 ) . Dette vil gi forventet antall kunder som har stemt utmerket service for lønningene til folk som venter så lave, dvs. 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

På samme måte må vi gjøre det samme for alle, og formelen brukes i diagrammet nedenfor.

Vi får forventet frekvenstabell som gitt nedenfor: -

Merk: - Anta at nivået av betydning er 0,05. Her betegner H0 og H1 uavhengighet og avhengighet av tjenestekvaliteten på lønnene til folk som venter på bord.

Etter å ha beregnet forventet frekvens, vil vi beregne chi-kvadrat datapunktene ved hjelp av en formel.

Chi-Square Points = (Observert-forventet) 2 / forventet

For å beregne det første punktet skriver vi = (B4-B14) 2 / B14.

Vi vil kopiere og lime inn formelen i andre celler for å fylle verdien automatisk.

Etter dette vil vi beregne chi-verdien (Beregnet verdi) ved å legge til alle verdiene gitt over tabellen.

Vi fikk Chi-verdien som 18.65823 .

For å beregne den kritiske verdien for dette, bruker vi en chi-kvadratisk kritisk verditabell for at vi kan bruke formelen gitt nedenfor.

Denne formelen inneholder to parametere CHISQ.INV.RT (sannsynlighet, grad av frihet).

Sannsynligheten er 0,05, og det er en betydelig verdi som vil hjelpe oss å avgjøre om vi skal godta Nullhypotesen (H 0 ) eller ikke.

Den kritiske verdien av chi-kvadrat er 9.487729037.

Nå finner vi verdien av chi-firkanten eller (P-verdi) = CHITEST (actual_range, expected_range)

Område fra = CHITEST (B4: D6, B14: D16) .

Som vi har sett er verdien av chi-testen eller P-verdien = 0,00091723.

Vi har beregnet alle verdiene. De chi-kvadrat (beregnet verdi) verdier er bare av betydning når dens verdi er det samme eller mer enn den kritiske verdi 9,48, dvs. kritiske verdi (tabulerte verdi) må være høyere enn 18,65 for å ta imot den nullhypotesen (H 0 ) .

Men her Beregnet verdi > Tabellverdi

X 2 (beregnet)> X 2 (tabulert)

18.65> 9.48

I dette tilfellet vil vi avvise Null Hypothesis (H 0 ), og Alternate (H 1 ) vil bli akseptert.

  • Vi kan også bruke P-verdi for å forutsi det samme, dvs. hvis P-verdi <= α (signifikant verdi 0,05), blir Null-hypotesen avvist.
  • Hvis P-verdien> α , ikke avvis nullhypotesen .

Her P-verdi (0,0009172) < α (0,05), avvis H 0 , godta H 1

Fra eksemplet ovenfor konkluderer vi med at tjenestekvaliteten er avhengig av lønnen til de som venter.

Ting å huske

  • Vurderer kvadratet til en standard normalvariat.
  • Evaluerer om frekvenser observert i forskjellige kategorier varierer betydelig fra frekvensene som forventes under et spesifisert sett med forutsetninger.
  • Bestemmer hvor godt en antatt fordeling passer til dataene.
  • Bruker beredskapstabeller (i markedsundersøkelser kalles disse tabellene kryssfaner).
  • Den støtter målinger på nominelt nivå.

Interessante artikler...