Lineær regression er et fantastisk værktøj til at lave forudsigelser med Excel. Når du kender hældningen og skæringspunktet for den linje, der relaterer to variable, kan du tage en ny x- værdi og forudsige en ny y- værdi. I det eksempel, du har arbejdet igennem, tager du en SAT-score og forudsiger en GPA for en Sahutsket University-studerende.
Hvad hvis du vidste mere end blot SAT-score for hver elev? Hvad hvis du havde elevens gymnasiegennemsnit (på en 100-skala), og du også kunne bruge den information? Hvis du kunne kombinere SAT-score med HS-gennemsnit, har du måske en mere nøjagtig forudsigelse end SAT-score alene.
Når du arbejder med mere end én uafhængig variabel, befinder du dig i multipel regression. Som ved lineær regression finder du regressionskoefficienter for den bedst passende linje gennem et scatterplot. Endnu en gang betyder best-fitting , at summen af de kvadrerede afstande fra datapunkterne til linjen er et minimum.
Med to uafhængige variable kan du dog ikke vise et scatterplot i to dimensioner. Du skal bruge tre dimensioner, og det bliver svært at tegne.
For SAT-GPA-eksemplet oversættes regressionsligningen til
Forventet GPA =a+b1(SAT)+b2(Gennemsnit for gymnasier)
Du kan teste hypoteser om den overordnede tilpasning og om alle tre regressionskoefficienter.
Lad os se Excel-funktionerne til at finde koefficienter.
Et par ting at huske på:
- Du kan have et hvilket som helst antal x- variable.
- Forvent at koefficienten for SAT ændres fra lineær regression til multipel regression. Forvent, at opskæringen også ændrer sig.
- Forvent, at standardfejlen for estimatet falder fra lineær regression til multipel regression. Fordi multipel regression bruger mere information end lineær regression, reducerer det fejlen.