Empirisk regel - definisjon, formel, hvordan brukes i statistikk?

Hva er den empiriske regelen i statistikk?

Empirisk regel i statistikk sier at nesten alle (95%) av observasjonene i en normalfordeling ligger innenfor 3 standardavvik fra gjennomsnittet. Dette er en veldig viktig regel og hjelper i prognoser.

Formel

Formelen viser den forventede prosentandelen observasjoner som vil ligge innenfor hvert standardavvik fra gjennomsnittet.

Regelen sier at:

  • 68% av observasjonene vil ligge innenfor +/- 1 standardavvik fra gjennomsnittet
  • 95% av observasjonene vil ligge innenfor +/- 2 standardavvik fra gjennomsnittet
  • 7% av observasjonene vil ligge innenfor +/- 3 standardavvik fra gjennomsnittet

Hvordan å bruke?

Dette brukes i prognosetrenden til et datasett. Når datasettet er omfattende, og det blir utfordrende å studere hele befolkningen, kan Empirical Rule brukes på utvalget for å få en estimering av hvordan dataene i befolkningen vil reagere hvis du blir bedt om å finne gjennomsnittslønnen til alle regnskapsførerne i USA. Da er det en vanskelig oppgave å utføre da befolkningen er enorm. Så i så fall kan du velge, si 90 observasjoner tilfeldig fra hele befolkningen.

Så nå vil du ha 90 lønn. Du må finne gjennomsnittet og standardavviket til observasjonene. Hvis observasjonen følger en normalfordeling, kan dette brukes, og en estimering av lønnen til alle regnskapsførere i USA kan gjøres.

Si at gjennomsnittslønnen for prøven blir $ 90.000. Og standardavviket er $ 5000. Så ut av hele befolkningen trekker 68% av regnskapsførerne en lønn mellom +/- 1 standardavvik fra gjennomsnittet. Som gjennomsnittet er $ 90.000 og standardavviket er $ 5.000. Så 68% av alle regnskapsførere i USA blir betalt i området $ 90 000 +/- (1 * $ 5000). Det er innenfor $ 85.000 til $ 95.000

Hvis vi sprer oss litt mer, blir 95% av alle regnskapsførerne i USA betalt i området +/- 2 standardavvik. $ 90 000 +/- (2 * 5000). Så rekkevidden er $ 80.000 til $ 100.000.

I et bredere spekter trekker 99,7% av alle regnskapsførere lønn fra gjennomsnittlig +/- 3 standardavvik. Det vil si 90 000 +/- (3 * 5000). Området er $ 75.000 til $ 105.000

Du kan tydelig se at uten å studere hele befolkningen, kan estimering gjøres angående befolkningen. Hvis noen planlegger å jobbe som regnskapsfører i USA, kan han lett forvente at lønnen hans vil variere fra $ 75 000 til $ 105 000

Denne typen estimering bidrar til å lette arbeidet og lage prognoser for fremtiden.

Empiriske regeleksempler

Mr. X prøver å finne det gjennomsnittlige antall år en person overlever etter pensjonering, med tanke på pensjonsalderen til å være 60. Hvis gjennomsnittlig overlevelsesår på 50 tilfeldige observasjoner er 20 år og SD er 3, så finn ut sannsynligheten for at en personen vil trekke pensjon i mer enn 23 år

Løsning

Den empiriske regelen sier at 68% av observasjonene vil ligge innenfor 1 standardavvik fra gjennomsnittet. Her er gjennomsnittet av observasjonene 20.

68% av observasjonene vil ligge innenfor 20 +/- 1 (standardavvik), som er 20 +/- 3. Så området er 17 til 23.

Det er en sjanse på 68% at minimumsårene en person overlever etter pensjonering ligger mellom 17 og 23. Nå er prosentandelen som ligger utenfor dette området (100 - 68) = 32%. 32 er likt fordelt på begge sider, noe som betyr en 16% sjanse for at minimumsårene vil være under 17 og en 16% sjanse for at minimumsår vil være større enn 23.

Så sannsynligheten for at personen vil trekke mer enn 23 års pensjon er 16%.

Empirisk regel mot Chebyshevs teorem

Empirisk regel brukes på datasett som følger en normalfordeling som betyr klokkeformet. I en normalfordeling har begge sider av fordelingen 50% sannsynlighet hver.

Hvis datasettet ikke er normalt distribuert, er det en annen tilnærming eller regel som gjelder for alle typer datasett, som er Chebyshevs teorem. Det sier tre ting:

  • Minst 3/4 th samtlige observasjoner vil ligge innenfor 2Standard avvik fra gjennomsnittet. Det er en sterk tilnærming. Det betyr at hvis det er 100 observasjoner, vil 3/4 th av observasjonene som er 75 observasjoner ligge innenfor +/- 2 standardavvik fra gjennomsnittet.
  • Minst 8/9 th av alle observasjoner vil ligge innenfor 3Standardavvik fra gjennomsnittet.
  • Minst 1 - 1 / k 2 av alle observasjonene ligger innenfor K Standardavvik fra gjennomsnittet. Her blir K referert til som et hvilket som helst heltall.

Når skal jeg bruke?

Data er som gull i den moderne verden. Det strømmer enorme data fra forskjellige kilder og brukes til forskjellige tilnærminger eller prognoser. Hvis et datasett følger en normalfordeling, viser det en bjelleformet kurve; deretter kan Empirical Rule brukes. Den brukes på observasjoner for å skape en tilnærming for befolkningen.

Når det er sett at observasjonene viser en normalfordelingsstruktur, følges empirisk regel for å finne flere sannsynligheter for observasjonene. Regelen er ekstremt nyttig for mange statistiske prognoser.

Konklusjon

Empirisk regel er et statistisk konsept som hjelper til med å skildre sannsynligheten for observasjoner og er veldig nyttig når man finner en tilnærming til en enorm befolkning. Det skal alltid bemerkes at dette er tilnærminger. Det er alltid sjanser for avvikere som ikke faller i fordelingen. Så funnene er ikke nøyaktige, og det bør tas forholdsregler når de opptrer i henhold til prognosen.

Interessante artikler...