Central Limit Theorem (definisjon, formel) - Beregninger og eksempler

Definisjon av Central Limit Theorem

Den sentrale grensesetningen sier at tilfeldige prøver av en populasjons tilfeldig variabel med en hvilken som helst fordeling vil nærme seg å være en normal sannsynlighetsfordeling ettersom størrelsen på prøven øker, og den antar at når størrelsen på prøven i populasjonen overstiger 30, er gjennomsnittet av prøven som gjennomsnittet av alle observasjonene for utvalget vil være nær lik gjennomsnittet for populasjonen.

Central Limit Theorem Formula

Vi har allerede diskutert at når prøvestørrelsen overstiger 30, får fordelingen form av en normalfordeling. For å bestemme normalfordelingen til en variabel, er det viktig å vite gjennomsnittet og variansen. En normalfordeling kan oppgis som

X ~ N (µ, α)

Hvor

  • N = ingen observasjoner
  • µ = gjennomsnitt av observasjonene
  • α = standardavvik

I de fleste tilfeller avslører observasjonene ikke mye i sin råform. Så det er viktig å standardisere observasjonene for å kunne sammenligne det. Det gjøres ved hjelp av z-poengsummen. Det er nødvendig å beregne Z-poengsummen for en observasjon. Formelen for å beregne z-poengsummen er

Z = (X- µ) / α / √n

Hvor

  • Z = Z-poengsum for observasjonene
  • µ = gjennomsnitt av observasjonene
  • α = standardavvik
  • n = prøvestørrelse

Forklaring

Den sentrale grensesetningen sier at tilfeldige prøver av en tilfeldig populasjonsvariabel med en hvilken som helst fordeling vil nærme seg å være en normal sannsynlighetsfordeling når størrelsen på utvalget øker. Den sentrale grensesetningen antar at når størrelsen på prøven i populasjonen overstiger 30, vil gjennomsnittet av prøven, som gjennomsnittet av alle observasjonene for prøven, være nær lik gjennomsnittet for befolkningen. Også standardavviket til prøven når størrelsen på prøven overstiger 30 vil være lik standardavviket til populasjonen. Ettersom prøven er valgt tilfeldig fra hele populasjonen og størrelsen på prøven er mer enn 30, hjelper det med hypotesetesting og konstruerer konfidensintervallet for hypotesetesten.

Eksempler på Central Limit Theorem Formula (med Excel-mal)

Eksempel 1

La oss forstå konseptet med en normalfordeling ved hjelp av et eksempel. Gjennomsnittlig avkastning fra et aksjefond er 12%, og standardavviket fra gjennomsnittlig avkastning for investeringen i aksjefond er 18%. Hvis vi antar at fordelingen av avkastningen er normalt fordelt, så la oss tolke fordelingen for avkastningen i investeringen i aksjefondet.

Gitt,

  • Gjennomsnittlig avkastning for investeringen vil være 12%
  • Standardavviket vil være 18%

Så, for å finne ut avkastningen for et 95% konfidensintervall, kan vi finne det ut ved å løse ligningen som

  • Øvre rekkevidde = 12 + 1,96 (18) = 47%
  • Nedre område = 12 - 1,96 (18) = -23%

Resultatet betyr at 95% av tiden vil avkastningen fra aksjefondet være i området 47% til -23%. I dette eksemplet vil utvalgsstørrelsen, som er avkastningen til et tilfeldig utvalg på mer enn 30 observasjoner av avkastning, gi oss resultatet for populasjonsavkastningen til aksjefondet, da utvalgsfordelingen vil bli normalt distribuert.

Eksempel 2

Fortsett med det samme eksemplet, la oss bestemme hva som vil bli resultatet for et 90% konfidensintervall

Gitt,

  • Gjennomsnittlig avkastning for investeringen vil være 12%
  • Standardavviket vil være 18%

Så for å finne ut avkastningen for et 90% konfidensintervall, kan vi finne det ut ved å løse ligningen som

  • Øvre rekkevidde = 12 + 1,65 (18) = 42%
  • Nedre område = 12 - 1,65 (18) = -18%

Resultatet betyr at avkastningen fra fondet 90% av tiden vil være i området 42% til -18%.

Eksempel 3

Fortsett med det samme eksemplet, la oss bestemme hva som blir resultatet for et 99% konfidensintervall

Gitt,

  • Gjennomsnittlig avkastning for investeringen vil være 12%
  • Standardavviket vil være 18%

Så for å finne ut avkastningen for et 90% konfidensintervall, kan vi finne det ut ved å løse ligningen som

  • Øvre rekkevidde = 12 + 2,58 (18) = 58%
  • Nedre område = 12 - 2,58 (18) = -34%

Resultatet betyr at 99% av tiden vil avkastningen fra fondet være i området 58% til -34%.

Relevans og bruk

Den sentrale grensesetningen er ekstremt gunstig ettersom den lar forskeren forutsi gjennomsnittet og standardavviket for hele befolkningen ved hjelp av prøven. Ettersom prøven er valgt tilfeldig fra hele populasjonen og størrelsen på prøven er mer enn 30, vil enhver tilfeldig prøvestørrelse tatt fra befolkningen nærme seg å distribueres normalt, noe som vil hjelpe i hypotesetesting og konstruere konfidensintervallet for hypotesetesting. Basert på sentralgrenseteoremet, er forskeren i stand til å velge et vilkårlig utvalg fra hele befolkningen, og når størrelsen på prøven er mer enn 30,da kan den forutsi populasjonen ved hjelp av prøven da prøven vil følge en normalfordeling og også som gjennomsnittet og standardavviket til prøven vil være det samme som gjennomsnittet og standardavviket til populasjonen.

Interessante artikler...