Lineær regresjon er et flott verktøy for å lage spådommer med Excel. Når du kjenner stigningen og skjæringspunktet til linjen som relaterer to variabler, kan du ta en ny x- verdi og forutsi en ny y- verdi. I eksemplet du har jobbet gjennom, tar du en SAT-poengsum og forutsier en GPA for en Sahutsket University-student.
Hva om du visste mer enn bare SAT-poengsummen for hver student? Hva om du hadde elevens gjennomsnitt på videregående skole (på en 100-skala), og du kunne bruke den informasjonen også? Hvis du kunne kombinere SAT-poengsum med HS-gjennomsnitt, kan du ha en mer nøyaktig prediktor enn SAT-poengsum alene.
Når du jobber med mer enn én uavhengig variabel, er du i riket av multippel regresjon. Som ved lineær regresjon finner du regresjonskoeffisienter for den best passende linjen gjennom et spredningsdiagram. Nok en gang betyr best-tilpasning at summen av kvadrerte avstander fra datapunktene til linjen er et minimum.
Med to uavhengige variabler kan du imidlertid ikke vise et spredningsplott i to dimensjoner. Du trenger tre dimensjoner, og det blir vanskelig å tegne.
For SAT-GPA-eksemplet oversettes regresjonsligningen til
Anslått GPA =a+b1(SAT)+b2(Gjennomsnitt for videregående skole)
Du kan teste hypoteser om den generelle tilpasningen, og om alle tre regresjonskoeffisientene.
La oss se på Excel-funksjonene for å finne koeffisienter.
Et par ting å huske på:
- Du kan ha et hvilket som helst antall x- variabler.
- Forvent at koeffisienten for SAT endres fra lineær regresjon til multippel regresjon. Forvent at avskjæringen endres også.
- Forvent at standardfeilen for estimatet reduseres fra lineær regresjon til multippel regresjon. Fordi multippel regresjon bruker mer informasjon enn lineær regresjon, reduserer det feilen.