Excel Data Analysis ToolPak
Dataanalyse verktøypakke i excel er et tillegg i Excel som lar oss gjøre dataanalyse og forskjellige andre viktige beregninger, dette tillegget er som standard ikke aktivert i Excel, og vi må aktivere det manuelt fra filfanen i alternativdelen og deretter i tilleggsdelen, klikker vi på administrer tillegg og sjekk deretter analyseverktøypakken for å bruke den i Excel.
Fremgangsmåte for å laste tilleggsprogrammet for dataanalyse Toolpak
- Trinn 1 - Klikk på 'Fil'.

- Trinn 2 - Klikk på 'Alternativer' fra listen.

- Trinn 3 - Klikk på 'Tillegg' og velg deretter 'Excel-tillegg' for 'Administrer' . Klikk på "Gå".

- Trinn 4 - Dialogboksen 'Excel-tillegg' vises med listen over tillegg. Sjekk etter 'Analysis ToolPak' og klikk på 'OK'.

- Trinn 5 - Kommandoen 'Dataanalyse' vises under 'Data' -fanen i Excel helt til høyre på båndet, som vist nedenfor.

Liste over funksjoner tilgjengelig i Excel Data Analysis ToolPak
Nedenfor er listen over tilgjengelige funksjoner i Analysis Toolpak Excel-tillegget:
- ANOVA: Single Factor i Excel
- Korrelasjon i Excel
- Rangering og prosentandel i Excel
- Beskrivende statistikk i Excel
La oss nå diskutere hver av dem i detalj -
# 1 - ANOVA: Enkel faktor i Excel
ANOVA står for Analysis of Variance og er det første settet med alternativer tilgjengelig i Analysis Toolpak Excel Add-in. I enveis ANOVA analyserer vi om det er noen statistiske forskjeller mellom midlene til tre eller flere uavhengige grupper. Nullhypotesen foreslår at ingen statistisk signifikans eksisterer i et sett med gitte observasjoner. Vi tester denne hypotesen ved å sjekke p-verdien.
La oss forstå dette med et eksempel på ANOVA.
Eksempel
Anta at vi har følgende data fra eksperimentet utført for å sjekke 'Kan selvkontroll gjenopprettes under rus?' Vi kategoriserte 44 menn i 4 like grupper, bestående av 11 menn i hver gruppe.
- Gruppe A fikk 0,62 mg / kg alkohol.
- Group AC fikk alkohol pluss koffein.
- Group AR mottok alkohol og en økonomisk belønning for ytelse.
- Gruppe P fikk placebo.
Poeng på fullføringsoppgaven for tildelingen av stammen med “kontrollerte (innsatsfulle) minneprosesser” ble registrert, og resultatet ble som følger:

Vi må teste nullhypotesen, som foreslår at alle midler er like (det er ingen signifikant forskjell).
Hvordan kjøre ANOVA-testen?
For å kjøre ANOVA-enveistesten, må vi utføre følgende trinn:
- Trinn 1: Klikk på kommandoen 'Dataanalyse' som er tilgjengelig i 'Data' -fanen under 'Analyse'.

- Trinn 2: Velg 'Anova: Single Factor' fra listen og klikk på 'OK'.

- Trinn 3: Vi får dialogboksen 'Anova: Single Factor' . Vi må velge Inndataområde som data med kolonneoverskrift.

- Trinn 4: Da vi har tatt kolonneoverskrifter i vårt utvalg, trenger vi avkrysningsruten for "Etiketter i første rad."

- Trinn 5: For utgangsområde har vi valgt F1. Klikk på 'OK'.

Vi har nå ANOVA-analyse.

Jo større F-statistikkverdien i excel er, desto mer sannsynlig er det at gruppene har forskjellige midler, som avviser nullhypotesen om at alle midler er like. En F-statistikk større enn den kritiske verdien tilsvarer en p-verdi i excel mindre enn alfa, og begge betyr at vi avviser nullhypotesen. Derfor konkluderes det med at det er en betydelig forskjell mellom gruppene.
# 2 - Korrelasjon i Excel
Korrelasjon er et statistisk mål tilgjengelig i Analysis Toolpak Excel-tillegg, og det viser i hvilken grad to eller flere variabler svinger sammen. En positiv korrelasjon i excel indikerer i hvilken grad disse variablene øker eller reduseres parallelt. En negativ korrelasjon indikerer i hvilken grad den ene variabelen øker når den andre avtar.
Eksempel
Vi har følgende data relatert til annonseringskostnader og salg for et selskap. Vi ønsker å finne ut forholdet mellom begge slik at vi kan planlegge budsjettet vårt i samsvar med dette og forvente salg (sett mål også med tanke på andre faktorer).

Hvordan finne sammenheng mellom to sett med variabler?
For å finne ut sammenhengen mellom disse to settene med variabler, vil vi følge trinnene nedenfor:
- Trinn 1: Klikk på "Dataanalyse" under "Analyse" -gruppen som er tilgjengelig i "Data".

- Trinn 2: Velg 'Korrelasjon' fra listen og klikk på 'OK'.

- Trinn 3: Velg område '$ A $ 1: $ B $ 16' som inndataområde og $ F $ 1 som utgangsområde. Merk av i avmerkingsboksen for "Etiketter i første rad" da vi har kolonneoverskrifter i vårt inndataområde, og da vi har forskjellige hoder i en annen kolonne. Vi har valgt 'Kolonner' for 'Gruppert etter'.

- Trinn 4: Velg utdataområdet, og klikk deretter på 'OK'.

- Vi får resultatet.

Som vi kan se, er korrelasjonen mellom annonseringskostnad (kolonnehode) og Salg (radhode) +0,86274 ca., noe som indikerer at de har en positiv korrelasjon og til 86,27% grad. Nå kan vi derfor bestemme annonseringsbudsjettet og forventet salg.
# 3 - Rang og prosent i Excel
Percentil i excel refererer til et tall der en viss prosentandel av poengene faller under det tallet og er tilgjengelig i Excel-tillegget for analyseverktøypakken. For eksempel, hvis en bestemt poengsum er i den 90. persentilen, betyr det at studenten har scoret bedre enn 90% av de som tok testen. La oss forstå dette med et eksempel.
Eksempel
Vi har følgende data for poengene som er oppnådd av en elev i en klasse.

Vi ønsker å finne ut rangeringen og persentilen for hver student.
Hvordan finne rang og prosentandel?
Trinnene vil være:
- Trinn 1: Klikk på "Dataanalyse" under "Analyse" -gruppen som er tilgjengelig i "Data".

- Trinn 2: Klikk på 'Rang og prosent' fra listen, og klikk deretter på 'OK'.

- Trinn 3: Velg '$ B $ 1: B $ B $ 17' som inngangsområde og '$ D $ 1' som utgangsområde.

- Trinn 4: Siden vi har datafelthoder i kolonner, dvs. at dataene er gruppert i kolonner, må vi velge 'Kolonner' for 'Gruppert etter.'

- Trinn 5: Vi har valgt kolonneoverskrift i vårt inndataområde; Det er derfor vi må se etter "Etiketter i første rad" og deretter klikke på "OK".

- Vi fikk resultatet som følgende bilde.

# 4 - Beskrivende statistikk i Excel
Beskrivende statistikk som er inkludert i Excel-tillegget for analyseverktøypakken inneholder følgende informasjon om et eksempel:
- Sentral tendens
- Bety: Det kalles gjennomsnitt.
- Median: Dette er midtpunktet i fordelingen.
- Mode: Det er det nummeret som ofte forekommer.
- Målinger av variasjon
- Område: Dette er forskjellen mellom de største og minste variablene.
- Variasjon: Dette indikerte hvor langt tallene er spredt.
- Standardavvik: Hvor mye variasjon eksisterer fra gjennomsnittet / gjennomsnittet.
- Skjevhet: Dette indikerer hvor symmetrisk fordelingen av en variabel er.
- Kurtosis: Dette indikerer peakedness eller flathet i en fordeling.
Eksempel
Nedenfor har vi fått karakterer av studenter i økonomifag. Vi ønsker å finne beskrivende statistikk.

For å gjøre det samme er trinnene:
- Trinn 1: Klikk på kommandoen 'Dataanalyse' som er tilgjengelig i 'Analyse'- gruppen i ' Data '.

- Trinn 2: Velg 'Beskrivende statistikk' fra listen og klikk på 'OK'.

- Trinn 3: Velg '$ A $ 1: $ A $ 15' som inndataområde, velg 'Kolonner' for ' Gruppert etter', kryss av for 'Etiketter i første rad'

- Trinn 4: Velg '$ C $ 1' som utgangsområde og sørg for at vi har merket av for "Sammendragsstatistikk." Klikk på OK.

Nå har vi vår beskrivende statistikk for dataene.
