Hypergeometrisk distribusjon (definisjon, formel) - Hvordan beregne?

Definisjon av hypergeometrisk distribusjon

I statistikken og sannsynlighetsteorien er hypergeometrisk distribusjon i utgangspunktet en distinkt sannsynlighetsfordeling som definerer sannsynligheten for k suksesser (dvs. noen tilfeldige tegninger for objektet tegnet som har noen spesifisert funksjon) i n antall trekk, uten noen erstatning, fra en gitt populasjonsstørrelse N som inkluderer nøyaktig K-objekter som har den funksjonen, hvor trekningen kan lykkes eller kan mislykkes.

Formelen for sannsynligheten for en hypergeometrisk fordeling er avledet ved hjelp av et antall elementer i populasjonen, antall elementer i utvalget, antall suksesser i populasjonen, antall suksesser i utvalget og få kombinasjoner. Matematisk er sannsynligheten representert som,

P = K C k * (N - K) C (n - k) / N C n

hvor,

  • N = antall gjenstander i befolkningen
  • n = Antall elementer i prøven
  • K = Antall suksesser i befolkningen
  • k = Antall suksesser i utvalget

Gjennomsnittet og standardavviket til en hypergeometrisk fordeling uttrykkes som,

Gjennomsnitt = n * K / N Standardavvik = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Forklaring

Trinn 1: Bestem for det første det totale antallet elementer i befolkningen, som er betegnet med N. For eksempel er antall spillkort i en kortstokk 52.

Trinn 2: Deretter bestemmer du antall elementer i prøven, betegnet med n-for eksempel antall kort trukket fra kortstokken.

Trinn 3: Deretter bestemmer du tilfellene som vil bli ansett som suksesser i befolkningen, og det er betegnet med K. For eksempel antall hjerter i det totale dekket, som er 13.

Trinn 4: Deretter bestemmer du forekomster som vil bli ansett som suksesser i prøven som er tegnet, og det er betegnet med k. Antall hjerter i kortene trukket fra kortstokken.

Trinn 5: Til slutt avledes formelen for sannsynligheten for en hypergeometrisk fordeling ved hjelp av et antall elementer i populasjonen (trinn 1), antall elementer i utvalget (trinn 2), antall suksesser i befolkningen (trinn 3) og antall suksesser i utvalget (trinn 4) som vist nedenfor.

P = K C k * (N - K) C (n - k) / N C n

Eksempler på hypergeometrisk distribusjon (med Excel-mal)

Eksempel 1

La oss ta eksemplet med en vanlig kortstokk med spillkortform der 6 kort trekkes tilfeldig uten erstatning. Bestem sannsynligheten for å trekke nøyaktig 4 røde suiter-kort, dvs. diamanter eller hjerter.

  • Gitt, N = 52 (siden det er 52 kort i en vanlig spillstokk)
  • n = 6 (antall kort trukket tilfeldig fra kortstokken)
  • K = 26 (siden det er 13 røde kort hver i diamanter og hjerter)
  • k = 4 (Antall røde kort som skal betraktes som vellykket i prøven som er trukket)

Løsning:

Derfor kan sannsynligheten for å trekke nøyaktig 4 røde suiter kort i de trekkede 6 kortene beregnes ved hjelp av formelen ovenfor som,

Sannsynlighet = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6-4) / 52 C 6

= 26 C 4 * 26 C 2- / 52 C 6

= 14950 * 325/20358520

Sannsynligheten vil være -

Sannsynlighet = 0.2387 ~ 23.87%

Derfor er det 23,87% sannsynlighet for å trekke nøyaktig 4 røde kort mens du trekker 6 tilfeldige kort fra en vanlig kortstokk.

Eksempel 2

La oss ta et annet eksempel på en lommebok som inneholder 5 $ 100 regninger og 7 $ 1 regninger. Hvis fire regninger velges tilfeldig, så bestem sannsynligheten for å velge nøyaktig 3 $ 100 regninger.

  • Gitt, N = 12 (Antall $ 100 regninger + Antall $ 1 regninger)
  • n = 4 (antall regninger valgt tilfeldig)
  • K = 5 (siden det er 5 $ 100 regninger)
  • k = 3 (Antall $ 100 regninger som skal betraktes som en suksess i det utvalgte utvalget)

Løsning:

Derfor kan sannsynligheten for å velge nøyaktig 3 $ 100 regninger i de tilfeldig valgte 4 regningene beregnes ved hjelp av formelen ovenfor som,

Sannsynlighet = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4-3) / 12 C 4

= 5 C 3 * 7 C Anmeldelse for 1. / 12 C 4

= 10 * 7/495

Sannsynligheten vil være -

Sannsynlighet = 0,1414 ~ 14,14%

Derfor er det 14,14% sannsynlighet for å velge nøyaktig 3 $ 100 regninger mens du trekker 4 tilfeldige regninger.

Relevans og bruksområder

Konseptet med hypergeometrisk fordeling er viktig fordi det gir en nøyaktig måte å bestemme sannsynlighetene når antall forsøk ikke er et veldig stort antall, og at prøver tas fra en endelig populasjon uten erstatning. Faktisk er den hypergeometriske fordelingen analog med binomialfordelingen, som brukes når antall studier er vesentlig store. Imidlertid brukes hypergeometrisk fordeling hovedsakelig til prøvetaking uten erstatning.

Interessante artikler...