Sampling Distribution - Definisjon, typer og eksempler

Hva er en prøvetaksfordeling?

En samplingsfordeling kan defineres som en sannsynlighetsfordeling ved bruk av statistikk ved først å velge en bestemt populasjon og deretter bruke stikkprøver som hentes fra populasjonen, dvs. den retter seg i utgangspunktet mot spredning av frekvenser relatert til spredning av forskjellige utfall eller resultater som muligens kan finne sted for den valgte befolkningen.

Forklaring

  • Mange forskere, akademikere, markedsstrateger osv. Går foran distribusjon av prøvetaking i stedet for å velge hele befolkningen. Dette gjør datasettet enkelt og også håndterbart. For å gjøre det lettere, anta at en markedsfører ønsker å gjøre en analyse av antall ungdommer som sykler mellom to regioner innenfor aldersgrensen 13-18.
  • For dette formålet vil han ikke ta hensyn til hele befolkningen som er tilstede i de to regionene mellom 13-18 år, noe som praktisk talt ikke er mulig, og selv om det er gjort, er det for tidkrevende, og datasettet kan ikke håndteres . I stedet vil markedsføreren ta et prøvesett på 200 hver fra hver region og få distribusjonen gjort.
  • Gjennomsnittlig telling av bruken av sykkelen her betegnes som gjennomsnittet av prøven. Hver utvalgte utvalg har sitt eget genererte gjennomsnitt, og fordelingen utført for gjennomsnittlig oppnådd gjennomsnitt er definert som prøvefordelingen. Avviket som oppnås betegnes som standardfeilen.

Eksempel på distribusjon av prøvetaking

  1. Forutsatt at en forsker gjennomfører en undersøkelse av vekten til innbyggerne i en bestemt by, og at han har fem observasjoner eller prøver, dvs. 70 kg, 75 kg, 85 kg, 80 kg og 65 kg. Byen anses generelt å ha en normalfordeling og opprettholder et standardavvik på 5 kg når det gjelder vektmål. Dermed kan gjennomsnittet beregnes som (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. Vi antar også at befolkningsstørrelsen er enorm; For å gå til det andre trinnet vil vi altså dele antall observasjoner eller prøver med 1, dvs. 1/5 = 0,20. Nå må vi ta kvadratroten på 0,20, som kommer til 0,45. Kvadratroten multipliseres deretter med standardavviket, dvs. 0,45 * 5 = 2,25 kg. Dermed oppnådd standard feil er 2,25 kg, og gjennomsnittet oppnådd var 75 kg. Disse to faktorene kan brukes til å beskrive fordelingen.

Typer distribusjon av prøvetaking

# 1 - Samplingfordeling av gjennomsnitt

  • Dette kan defineres som den sannsynlige spredningen av alle prøvemidlene valgt på en tilfeldig basis av en fast størrelse fra en bestemt populasjon. Når prøver har valgt en normal populasjon, vil spredningen av gjennomsnittet oppnådd også være normal til gjennomsnittet og standardavviket.
  • Hvis populasjonen ikke er normal til stille, vil fordelingen av midlene ha en tendens til å bli nærmere normalfordelingen forutsatt at utvalgsstørrelsen er ganske stor.

# 2 - Eksempelfordeling av andel

Dette er først og fremst knyttet til statistikken som er involvert i attributter. Her spiller rollen som binomial distribusjon inn. Generelt reagerer den på lovene i binomialfordelingen, men når prøvestørrelsen øker, blir den vanligvis normalfordeling igjen.

# 3 - Studentens T-distribusjon

Denne typen fordeling brukes når standardavviket til populasjonen er ukjent for forskeren, eller når størrelsen på prøven er veldig liten. Denne typen distribusjon er veldig symmetrisk og oppfyller betingelsen for standard normalvariasjon. Når prøvestørrelsen øker, har selv T-fordeling en tendens til å bli veldig nær normalfordelingen.

# 4 - F Distribusjon

  • Når den større avviket er obligatorisk tilstede i telleren, finner F-fordelingen sin bruk når frihetsgraden endrer også de kritiske verdiene av F, noe som gjelder for både store og små avvik. Dette kan beregnes fra tilgjengelige tabeller.
  • Sammenligningen er gjort fra den målte verdien av F som tilhører prøvesettet og verdien, som beregnes fra tabellen hvis den tidligere er lik eller større enn tabellverdien, blir nullhypotesen av studien avvist.

# 5 - Chi-Square Formeldistribusjon

Denne typen distribusjon brukes når datasettet innebærer å håndtere verdier som inkluderer å legge opp firkanter. Settet med kvadratiske mengder som hører til variansen til prøvene blir lagt til, og det blir dermed laget en fordelingsspredning, som vi kaller som chi-kvadratfordeling.

Betydning

  • Dette er viktig fordi det forenkler veien til statistisk slutning. Videre tillater det at analytiske betraktninger fokuseres på en statisk fordeling i stedet for den blandede probabilistiske spredningen av hver valgte prøveenhet.
  • Eliminering av variasjon som er tilstede i statistikken gjøres ved å bruke denne fordelingen.
  • Det gir oss et svar om de sannsynlige resultatene som mest sannsynlig vil skje.
  • De spiller en nøkkelrolle i inferensielle statistiske studier, noe som betyr at de spiller en viktig rolle i å komme med konklusjoner angående hele befolkningen.

Konklusjon

  • Dette er nøkkelen i statistikk fordi de fungerer som en hovedretningslinje for statistisk slutning. De veileder i utgangspunktet forskeren, akademikerne eller statistikerne om spredningen av frekvensene, og signaliserer en rekke varierte sannsynlige resultater som kan merkes ytterligere til hele befolkningen.
  • Den viktigste faktoren som er involvert her er gjennomsnittet av prøven og standardfeilen, som, hvis estimater, hjelper oss med å beregne prøvetaksfordelingen også. Det finnes forskjellige typer distribusjonsteknikker, og basert på scenariet og datasettet blir hver brukt.

Interessante artikler...