Mindste kvadraters regresjon - Hvordan lage linje med best passform?

Definisjon av regressjonsmetode for minste kvadrater

En regresjonsmetode med minste kvadrat er en form for regresjonsanalyse som etablerer forholdet mellom den avhengige og uavhengige variabelen sammen med en lineær linje. Denne linjen er referert til som "linjen som passer best."

Regresjonsanalyse er en statistisk metode ved hjelp av hvilken man kan estimere eller forutsi de ukjente verdiene til en variabel fra de kjente verdiene til en annen variabel. Variabelen som brukes til å forutsi variabel interesse kalles den uavhengige eller forklarende variabelen, og variabelen som blir forutsagt kalles den avhengige eller forklarte variabelen.

La oss se på to variabler, x & y. Disse er tegnet på en graf med verdier på x på x-akseverdiene til y på y-aksen. Disse verdiene er representert med punktene i grafen nedenfor. En rett linje trekkes gjennom prikkene - referert til som linjen som passer best.

Målet med minste kvadraters regresjon er å sikre at linjen trukket gjennom settet med verdier gir det nærmeste forholdet mellom verdiene.

Formular for regresjon av minste kvadrater

Regresjonslinjen under metoden for minste kvadrater beregnes ved hjelp av følgende formel -

ŷ = a + bx

Hvor,

  • ŷ = avhengig variabel
  • x = uavhengig variabel
  • a = y-skjæringspunkt
  • b = linjens helling

Helningen på linje b beregnes ved hjelp av følgende formel -

Eller

Y-skjæringspunkt, 'a' beregnes med følgende formel -

Line of Best Fit in the Least Square Regression

Linjen som passer best er en rett linje trukket gjennom en spredning av datapunkter som best representerer forholdet mellom dem.

La oss se på følgende graf der et datasett er plottet langs x- og y-aksen. Disse datapunktene er representert ved hjelp av de blå prikkene. Tre linjer trekkes gjennom disse punktene - en grønn, en rød og en blå linje. Den grønne linjen går gjennom et enkelt punkt, og den røde linjen går gjennom tre datapunkter. Den blå linjen går imidlertid gjennom fire datapunkter, og avstanden mellom restpunktene til den blå linjen er minimal sammenlignet med de to andre linjene.

I grafen ovenfor representerer den blå linjen linjen som passer best, da den ligger nærmest alle verdiene, og avstanden mellom punktene utenfor linjen til linjen er minimal (dvs. avstanden mellom restene til linjen med best passform - også referert til som summen av kvadrater av rester). I de to andre linjene, den oransje og den grønne, er avstanden mellom restene til linjene større sammenlignet med den blå linjen.

Metoden med minste kvadrater gir det nærmeste forholdet mellom de avhengige og uavhengige variablene ved å minimere avstanden mellom restene, og linjen med best mulig passform, dvs. at summen av kvadratene av residualer er minimal under denne tilnærmingen. Derav begrepet "minste firkanter."

Eksempler på regresjonslinje for minste kvadrater

La oss bruke disse formlene i spørsmålet nedenfor -

Eksempel 1

Detaljene angående erfaringene til teknikere i et selskap (i en årrekke) og deres ytelsesvurdering er gitt i tabellen nedenfor. Bruk disse verdiene til å estimere ytelsesvurderingen for en tekniker med 20 års erfaring.

Erfaring med tekniker (i år) Ytelsesvurdering
16 87
12 88
18 89
4 68
3 78
10 80
5 75
12 83

Løsning -

For å beregne de minste kvadratene først, beregner vi Y-skjæringspunktet (a) og hellingen til en linje (b) som følger -

Skråningen til linje (b)

  • b = 6,727 - ((80 * 648) / 8) / 1018 - ((80) 2- / 8)
  • = 247/218
  • = 1,13

Y-skjæringspunkt (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Regresjonslinjen beregnes som følger -

Erstatter 20 for verdien av x i formelen,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Ytelsesvurderingen for en tekniker med 20 års erfaring er estimert til 92,3.

Eksempel 2

Regressjonsligning for minste kvadrater ved hjelp av Excel

Regresjonsligningen med minste kvadrat kan beregnes ved hjelp av excel ved hjelp av følgende trinn -

  • Sett inn datatabellen i excel.
  • Sett inn et spredningsdiagram ved hjelp av datapunktene.
  • Sett inn en trendlinje i spredningsgrafen.
  • Under trendlinjealternativer - velg lineær trendlinje og velg ligning på skjermen.
  • Regresjonsligningen med minste kvadrat for det gitte settet med excel-data vises på diagrammet.

Dermed beregnes regresjonsligningen med minste kvadrat for det gitte settet med excel-data. Ved hjelp av ligningen kan spådommer og trendanalyser gjøres. Excel-verktøy gir også detaljerte regresjonsberegninger.

Fordeler

  • Metoden med minste kvadrat for regresjonsanalyse er best egnet for prediksjonsmodeller og trendanalyser. Den brukes best innen økonomi, finans og aksjemarkeder hvor verdien av en fremtidig variabel forutsies ved hjelp av eksisterende variabler og forholdet mellom den samme.
  • Metoden med minste kvadrat gir det nærmeste forholdet mellom variablene. Forskjellen mellom summen av kvadrater av rester til linjen som passer best er minimal under denne metoden.
  • Beregningsmekanismen er enkel og enkel å bruke.

Ulemper

  • Metoden med minste kvadrat er avhengig av å etablere det nærmeste forholdet mellom et gitt sett med variabler. Beregningsmekanismen er sensitiv for dataene, og i tilfelle avvik (eksepsjonelle data) kan resultatene ha en stor innvirkning.
  • Denne typen beregninger er best egnet for lineære modeller. For ikke-lineære ligninger brukes mer uttømmende beregningsmekanismer.

Konklusjon

Metoden med minst kvadrat er en av de mest populære metodene for prediksjonsmodeller og trendanalyse. Når det beregnes riktig, gir det de beste resultatene.

Interessante artikler...