Regresjon (betydning, typer) - Hva er regresjonsanalyse?

Innholdsfortegnelse

Hva er regresjon?

Regresjonsanalyse er en statistikkbasert måling som brukes i økonomi, investering, etc., som tar sikte på å sette opp et forhold mellom en avhengig variabel og andre serier av uavhengige variabler, og hovedfokuset er å bestemme styrken til det ovennevnte forholdet.

Forklaringer

  • For å forklare regresjonsanalyse i en lekmannstid, la oss anta at et salgssjef i et selskap prøver hardt å forutsi salg neste måned. Det er mange faktorer involvert som driver salg av produktet, fra været til konkurrentens nye strategi, festival og endring i livsstilen til forbrukerne.
  • Dette er en metode for å justere ut av de mange faktorene som påvirker salget, som er de som har størst innvirkning. Det kan hjelpe med å svare på mange spørsmål som hva som er de viktigste faktorene, hvilke faktorer som er mindre viktige, hva er forholdet mellom disse faktorene, og viktigst av alt, hva som er sikkerheten til disse faktorene.
  • Disse faktorene kalles variabler. Hovedfaktoren som vi prøver å forutsi kalles den avhengige variabelen, og de andre faktorene som har innvirkning på den avhengige variabelen kalles de uavhengige variablene.

Formel

Enkel lineær regresjonsanalyse i excel kan uttrykkes som formelen nedenfor, og den måler forholdet mellom en avhengig variabel og en uavhengig variabel.

Y = a + bX + ϵ

Her:

  • Y - Avhengig variabel
  • X - Uavhengig (forklarende) variabel
  • a - Avskjær
  • b - Skråning
  • ϵ - Rest (feil)

Hvordan tolke regresjonsanalyse?

Dette kan tolkes ved å anta et enkelt scenario. Her tar vi forholdet mellom prisene på antikke samlinger på auksjon og varigheten av dens alder. Jo mer en antikk blir eldre, jo mer får den prisen. Forutsatt at vi har satt data for de siste 50 varene som ble auksjonert, kan vi forutsi hva fremtidige auksjonspriser vil være basert på varens alder. Ved hjelp av disse dataene kan vi bygge en regresjonsligning.

Regresjonsformelen som kan sette opp et forhold mellom alder og pris er som følger:

y = β0 + β1 x + feil
  • Her er den avhengige faktoren Y. Y representerer prisen på hver vare som skal auksjoneres, mens den uavhengige faktoren er X, som bestemmer alderen.
  • Parametrene β0 og β1 er parametere som ikke er kjent og vil bli estimert av ligningen.
  • β0 er en konstant som brukes til å definere den lineære trendlinjen som avlytter Y-aksen.
  • β1 er en konstant som demonstrerer størrelsen på endring i verdien til den avhengige variabelen som en relatert funksjon av endringen som er underforstått for de uavhengige variablene.
  • Dette kalles i utgangspunktet ligningen. Når skråningen er en liner, betyr det at det er et forholdsmessig forhold mellom alder og pris, og der skråningen er omvendt, betyr det at forholdet er indirekte proporsjonalt.
  • Den feilen kan defineres som den støy eller variasjon i målet variable og er tilfeldig i naturen.

Virkelige eksempler på regresjonsanalyse

La oss anta at vi trenger å etablere et forhold mellom salget som har skjedd og mengden brukt på reklame relatert til et produkt.

Vi kan generelt se et positivt forhold mellom salgsmengden og beløpet brukt på annonsering. Ved å legge til enkel lineær regresjonsligning har vi:

Y = a + bX

Anta at vi får verdien som

Y = 500 + 30X

Resultattolkning:

Den forventede stigningen på 30 hjelper oss med å trekke en konklusjon at gjennomsnittlig salg øker $ 30 per år når forbruket på reklame øker.

Typer av regresjonsanalyse

# 1 - Lineær

Dette kan uttrykkes som formelen nedenfor, og det måler forholdet mellom en avhengig variabel og en uavhengig variabel.

# 2 - Polynom

I denne metoden brukes analysen til å måle forholdet mellom enkeltavhengige faktorer og flere uavhengige variabler.

# 3 - Logistisk

Her er den avhengige faktoren eller variabelen binær i naturen. De uavhengige variablene kan være kontinuerlige eller binære. I multinomial logistisk regresjon har vi råd til å ha mer enn to kategorier mens vi velger vår uavhengige variabel.

# 4 - Kvantil

Dette er et additivkonsept med lineær regresjon og brukes primært når avvik og skjevhet er tilstede i dataene.

# 5 - Elastisk nett

Dette er nyttig når man håndterer svært høye korrelerte uavhengige variabler.

# 6 - Regresjon av hovedkomponenter (PCR)

Dette er en teknikk som kan brukes når det er for mange uavhengige variabler eller multikollinearitet finnes i dataene

# 7 - Delvis minste kvadrater (PLS)

Det er en motsatt metode av hovedkomponenten der vi har uavhengige variabler som er sterkt korrelert. Det er også aktuelt når det er mange uavhengige variabler.

# 8 - Støttevektor

Dette kan gi en løsning på lineære og ikke-lineære modeller. Den bruker ikke-lineære kjernefunksjoner for å finne den optimale løsningen for ikke-lineære modeller.

# 9 - Ordinær

Den gjelder for prediksjon av rangerte verdier. I utgangspunktet er det egnet når den avhengige variabelen er ordinær i naturen

# 10 - Poisson

Dette gjelder når den avhengige variabelen har telledata.

# 11 - Negativ binomial

Det er også aktuelt å administrere telledata bare at negativ binomial regresjon ikke antar fordeling av telling som har varians lik gjennomsnittet, mens Poisson-regresjon antar variansen lik gjennomsnittet.

# 12 - Quasi Poisson

Det er en erstatning for negativ binomial regresjon. Det gjelder også for spredte tellingsdata. Variansen til en kvasi-Poisson-modell er en lineær funksjon av gjennomsnittet, mens variansen til en negativ binomial modell er en kvadratisk funksjon av gjennomsnittet.

# 13 - Cox

Den kommer mer i bruk for å analysere tid-til-hendelsesdata.

Forskjellen mellom regresjon og korrelasjon

  • Regresjon etablerer forholdet mellom en uavhengig varians og en avhengig variabel der begge variablene er forskjellige, mens korrelasjonen bestemmer sammenhengen eller avhengigheten av to variabler der det ikke er noen forskjell mellom begge variablene.
  • Hovedmålet med regresjon er å lage en linje som passer best, og estimering av en variabel gjøres på grunnlag av andre, mens det i korrelasjon viser det lineære forholdet mellom to variabler.
  • I dette estimerer vi størrelsen på en viss endring i den gjenkjente variabelen (X) på den estimerte variabelen (Y), mens koeffisienten i korrelasjon brukes til å måle i hvilken grad de to variablene beveger seg sammen.
  • Det er en prosess for å estimere størrelsen på tilfeldige uavhengige variabler basert på størrelsen på en statisk avhengig variabel, mens korrelasjon hjelper oss å bestemme en bestemt verdi for å uttrykke gjensidig avhengighet mellom begge variablene.

Konklusjon

  • Regresjonsanalyse bruker primært data for å etablere et forhold mellom to eller flere variabler. Her antas det at forhold som eksisterte tidligere også vil reflektere i nåtid eller fremtid. Få anser dette som et tidsforsinkelse mellom fortid og nåtid / fremtid.
  • Det er imidlertid en mye brukt prognose- og estimeringsteknikk. Selv om det involverer matematikk, som mange brukere kan synes som tøffe, er teknikken relativt enkel å bruke, spesielt når en modell er tilgjengelig.

Interessante artikler...