Sådan laver du regressionsanalyse i matematik

Af Isabella Viborg Grarup 17-07-2025
Sådan laver du regressionsanalyse i matematik

Vi bruger regression i matematikken til at bestemme, om der er sammenhæng mellem variable. I dette indlæg lærer vi dig, hvordan du selv kan lave lineær regression, og hvordan du laver lineær og andre former for regression i et regneprogram.

Vi kommer ind på:

  • Hvad er regression i matematik?

  • Hvordan forklarer man lineær regression?

  • R2 i regressionsanalyse


Vi gør vores bedste for at hjælpe dig med at forstå regression med dette indlæg, men hvis du stadig mangler hjælp – hvad end det er til regressionsanalyse eller andre emner inden for matematik – tilbyder GoTutor skræddersyet
lektiehjælp i matematik.


Hvad er regression i matematik?

Regression går ud på at finde den funktion, der bedst beskriver, hvordan punkterne i et koordinatsystem ligger. Når man lærer om lineære funktioner, eksponentielle funktioner og potensfunktioner, lærer man, hvordan man bestemmer funktionens forskrift ud fra to punkter: (x₁, x₂) og (y₁, y₂). Her finder man den funktion, som går gennem begge punkter.

Men det kan også være, at man har flere – fx flere hundrede eller flere tusinde – punkter, som ikke ligger på grafen. Ved hjælp af regression kan man finde den graf, der ligger tættest på punkterne, og man kan bestemme, hvorvidt grafen ligger tæt nok på punkterne til, at der er tale om en sammenhæng mellem de to variable.

Lad os kigge på et eksempel. Vi har disse fire punkter i et koordinatsystem:



Som du nok allerede kan se, kan alle punkterne ikke ramme en graf, som ligner dem, vi kender fra lineære, eksponentielle eller potensfunktioner.

Vi prøver at tegne nogle rette linjer mellem punkterne:



Men hvilken ligger tættest på punkterne? Med andre ord: Hvilken graf beskriver vores datasæt bedst?

For at finde den rette linje, der bedst beskriver vores datasæt, skal vi lave lineær regression.


Hvordan forklarer man lineær regression?

Når man skal lave lineær regression (uden hjælp fra et program), kan man bruge den metode, der hedder mindste kvadraters metode. Det går ud på, at man tegner afstandene fra hvert punkt hen til linjen og lader denne linje være en sidelængde i et kvadrat. Herefter går det ud på at beregne, hvor små kvadraterne kan være, for jo mindre de er, des mindre er afstanden mellem punkterne og linjen – deraf navnet mindste kvadraters metode.

Det lyder måske forvirrende, så vi vil nu gennemgå metoden trin for trin.

Først vælger vi at tegne en ret linje mellem punkterne. Det er blot vores bud på, hvordan linjen kan ligge.



Som du kan se, har vi tegnet stiplede linjer fra punkterne hen til den rette linje langs y-aksen. Disse linjer viser afstandene fra punkterne til linjen, og disse punkter kalder vi henholdsvis d1, d2, d3 og d4.

Vi vil nu finde et udtryk for hver afstand. Vi tager udgangspunkt i afstanden d1, men vi kunne lige så godt have valgt en af de andre afstande, da fremgangsmåden er den samme.

Som nævnt går afstanden ad y-aksen, så afstanden viser en forskel i y-værdi mellem punktet og linjen. Linjen har den generelle forskrift for lineære funktioner, nemlig y = ax + b. Vi kan dermed beskrive afstanden d1 med dette udtryk:

  • d1 = a*x1 + b - y1


Vi kan aflæse vores x1 og y1 i punktet (1, 4). Det sætter vi ind på henholdsvis x’s og y’s plads:

  • d1 = a*1 + b - 4

  • d1 = a + b - 4


Nu skal vi opløfte d1 i anden
potens. På den måde tegner vi et kvadrat med d1 som sidelængde:



Det gør vi for at undgå, at man nogensinde får en negativ værdi for afstanden, som både kan ligge over og under linjen, for når man opløfter et tal i anden, vil det altid blive positivt.

Vi har dermed også en værdi for d1 opløftet i anden, som vi skriver om ved hjælp af kvadratsætningerne (hvor man
ganger hvert led med hinanden):

  • d12 = (a + b - 4)2

  • d12 = (a + b - 4)*(a + b - 4)

  • d12 = a2 + ab - 4a + ab + b2 - 4b - 4a - 4b + 16

  • d12 = a2 + b2 + 2ab - 8a - 8b + 16


Dette udtryk ville gælde, uanset hvor vi havde tegnet den rette linje, for værdierne af
a og b er stadig ukendte.

På samme måde beregner vi nu værdierne for d22, d32 og d42, der beskriver kvadraterne af afstanden mellem linjen og punkterne (2, 2), (4, 3) og (7, 5):

  • d22 = (2a + b - 2)2 = 4a2 + b2 + 4ab - 8a - 4b + 4

  • d32 = (4a + b - 3)2 = 16a2 + b2 + 8ab - 24a - 6b + 9

  • d42 = (7a + b - 5)2 = 49a2 + b2 + 14ab - 70a - 10b + 25


Nu har vi arealet af fire kvadrater. Vi kan illustrere de fire kvadrater med dette billede:



Vi lægger de fire arealer sammen for at få det samlede areal
T:

  • T = d12 + d22 + d32 + d42 = 70a2 + 4b2 + 28ab - 110a - 28b + 54


(Disse tal er vi kommet til ved at lægge leddene sammen, fx a2 + 4a2 + 16a2 + 49a2 = 70a2).

Nu skal vi lave en beregning, så det samlede areal bliver så småt som muligt. Dermed finder vi nemlig de mindst mulige afstande fra punkterne til linjen, hvilket betyder, at vi finder den linje, som ligger tættest på punkterne.

Vi kan opfatte
T som en funktion af a med b som en konstant, og på den måde kan vi se T som et andengradspolynomium. Et andengradspolynomium har forskriften f(x) = ax² + bx + c. Når T er en funktion af a, har vi netop et andengradsled (hvor alle a2 indgår), et førstegradsled (hvor alle a indgår) og et konstantled (alle led uden a). Helt præcist har vi:

  • Andengradsleddet: 70a2

  • Førstegradsleddet: 28ab - 110a

  • Konstantleddet: 4b2 - 28b + 54


På samme måde kan vi også opfatte
T som en funktion af b og dermed et andengradspolynomium med disse led:

  • Andengradsleddet: 4b2

  • Førstegradsleddet: 28ab - 28b

  • Konstantleddet: 70a2 - 110a + 54


Vi skal nu finde parablens minimum – det vil sige, at vi skal finde det sted, hvor parablen vender. Når parablen vender, er hældningen lig med 0. Måske husker du fra
differentialregning, at den afledede funktion netop angiver tangenthældningen, så hvis den afledede funktion er lig med 0, er hældningen også lig med 0.

Vi differentierer derfor de to funktioner. Først tager vi funktionen af
a:

  • T(a) = 70a2 + 28ab - 110a + 4b2 - 28b + 54

  • T’(a) = 140a + 28b - 110


Læg mærke til, at hele konstantleddet (her 4b2 - 28b + 54) bliver lig med 0, når man differentierer.

Vi differentierer også funktionen af
b:

  • T(b) = 4b2 + 28ab - 28b + 70a2 - 110a + 54

  • T’(b) = 8b + 28a - 28


Det giver os to afledede funktioner, som vi kan sætte lig 0:

  • 140a + 28b - 110 = 0

  • 8b + 28a - 28 = 0


Nu har vi to
ligninger med to ubekendte. Det betyder, at vi kan løse dem og finde værdierne for a og b.

Først skal vi isolere enten
a eller b i den ene ligning (det er lige meget, hvilken en vi vælger). Vi vælger at isolere b i den øverste ligning:



Læg mærke til, at vi har
divideret 110 med 28 og forkortet brøken mest muligt, så den bliver 55/14. Det er mere præcist at skrive dette som en brøk end at skrive 3,9285714… Omvendt kan vi nemt dividere 140a med 28, så det bare bliver 5a.

Vi har nu et udtryk for
b, som vi sætter ind på b’s plads i den anden ligning:



Selvom du måske allerede har godt styr på ligninger, vil vi forklare lidt grundigere, hvad vi gør, fordi du måske ikke er vant til at løse ligninger med brøker.

Vi skal gange 8 ind på hvert led i parentesen. Når man ganger et
helt tal med en brøk, skal man gange op i tælleren:



Nu flytter vi -40
a og 28a over på højre side af lighedstegnet og ændrer fortegnene. På venstre side forkorter vi brøken:



På højre side kan vi nemt trække 28
a fra 40a. På venstre side skal vi trække 28 fra brøken 220/70, så vi skriver 28 om til en brøk, som i første omgang bliver 28/1:



Nu skal vi trække to brøker fra hinanden. Det kræver, at der står det samme i nævneren. Derfor forlænger vi brøken 28/1 med 7:



Nu kan vi nemt trække brøkerne fra hinanden ved at trække tællerne fra hinanden:



Nu skal vi dividere med 12 på begge sider for at isolere
a. Man dividerer en brøk med et helt tal ved at gange det hele tal ind i nævneren. Til sidst forkorter vi brøken mest muligt:



Nu kender vi
a. Før fandt vi et udtryk for b, så vi sætter værdien for a ind på a’s plads i dette udtryk:



Vi ganger 5 ind i tælleren:



Vi finder en fællesnævner ved at forlænge brøken 10/7 med 2:



Vi trækker tællerne fra hinanden og forkorter brøken mest muligt:



Sådan har vi fundet værdierne for
a og b, så den lineære funktion, der ligger tættest på vores fire punkter, har denne forskrift:



Det kan vi også skrive med
decimaltal:

  • y = 0,2857x + 2,5


a er dog mere præcis som en brøk.

Vi kan tegne vores funktion ind:



Den ligger ikke superlangt væk fra den linje, som vi tegnede først – prøv selv at se:



Men den gule linje ligger altså tættere på de fire punkter end den blå linje gør, den samlede afstand mellem punkterne og den gule linje er kortere.


R2 i regressionsanalyse

Som nævnt kan man også lave regression ved hjælp af et regneprogram. Her viser vi kort, hvordan man gør i GeoGebra.

Vi åbner et regneark og taster vores x- og y-værdier ind. Herefter markerer vi vores data og vælger ‘Regressionsanalyse’:



Nu kan vi se vores punkter:



Nederst til venstre vælger vi ‘Lineær’, hvilket giver os den graf og funktionsforskrift, som vi også fandt frem til før:



Vi vil også vise noget andet. Vi klikker på ‘Σx’ oppe i højre hjørne, som viser os nogle statistiske beregninger:



Her er det særligt relevant at se på R2-værdien (også kaldet determinationskoefficienten). R2 viser, om der er sammenhæng mellem vores to variable
x og y.

R2 vil altid ligge mellem 0 og 1. Jo tættere R2 er på 1, des større er sammenhængen.

Som du kan se på billedet, er vores R2 kun 0,3429. Det betyder, at der er meget lidt sammenhæng mellem vores data, og vi vil konkludere, at denne lille sammenhæng blot skyldes tilfældighed.

Det er forskelligt, hvor høj R2.skal være for at man vil godtage, at der er en sammenhæng. Inden for naturvidenskaben vil man som regel kun godtage en R2-værdi på 0,95 eller højere, fordi man skal være sikker på, at der rent faktisk er en stærk sammenhæng.

Hvis man får en lav R2, betyder det dog ikke nødvendigvis, at der ikke er nogen sammenhæng – det kan være, at dataene ikke passer til en lineær funktion, men derimod fx en eksponentiel funktion eller potensfunktion.

Du skal derfor først starte med at se på dine punkter, om de danner et mønster, der minder om en af de ovenstående funktioner, hvor graferne som bekendt ser forskellige ud:



I stedet for at vælge ‘Lineær’ under ‘Regressionsmodel’ i GeoGebra, kan man bl.a. vælge ‘Eksponentiel’ og ‘Potens’.


Mød forfatteren:

Billede af

Hej, mit navn er Isabella! Jeg skriver indlæg her hos GoTutor. Jeg har en bachelorgrad i lingvistik (sprogvidenskab) og journalistisk formidling, og nu er jeg i gang med en kandidat i lingvistik på Københavns Universitet, så jeg har masser af viden at dele ud af!

Søger du privat lektiehjælp?

  • GoTutor er Danmarks bedst anmeldte

  • Mange års erfaring og en del af Egmont

  • Trænede og uddannede undervisere

  • Fast lav pris og fair vilkår


Eller kontakt os på: info@gotutor.dk

Du vil måske også synes om

Trigonometri: Lær om tangens, sinus og cosinus
Trigonometri: Lær om tangens, sinus og cosinus

Trigonometri er et område inden for matematik, som går ud på at beregne størrelserne på vinkler og s...

Isabella Viborg Grarup 01-02-2024
Lær om binomialfordeling og binomialforsøg
Lær om binomialfordeling og binomialforsøg

Binomialfordeling er en type sandsynlighedsregning, hvor man gentager et forsøg et bestemt antal gan...

Isabella Viborg Grarup 13-03-2024
Minus/subtraktion: Sådan trækker du tal fra andre tal
Minus/subtraktion: Sådan trækker du tal fra andre tal

Minus eller subtraktion er en regneart, som man tit møder i regnestykker. Man kan regne store minuss...

Isabella Viborg Grarup 06-10-2023
Lad os tale sammen

Vi er klar til at svare på dine spørgsmål.
Ring til os på:

71 99 71 90