Linjär regression är ett utmärkt verktyg för att göra förutsägelser med Excel. När du känner till lutningen och skärningspunkten för linjen som relaterar två variabler, kan du ta ett nytt x- värde och förutsäga ett nytt y- värde. I exemplet du har arbetat igenom tar du ett SAT-poäng och förutsäger ett GPA för en student från Sahutsket University.
Tänk om du visste mer än bara SAT-poängen för varje elev? Tänk om du hade elevens medelvärde på gymnasiet (på en 100-skala) och du kunde använda den informationen också? Om du kunde kombinera SAT-poäng med HS-genomsnitt, kanske du har en mer exakt prediktor än SAT-poäng ensam.
När du arbetar med mer än en oberoende variabel befinner du dig i multipel regression. Precis som vid linjär regression hittar du regressionskoefficienter för den linjen som passar bäst genom ett spridningsdiagram. Återigen betyder bäst passning att summan av de kvadratiska avstånden från datapunkterna till linjen är ett minimum.
Med två oberoende variabler kan du dock inte visa en scatterplot i två dimensioner. Du behöver tre dimensioner, och det blir svårt att rita.
För SAT-GPA-exemplet översätts regressionsekvationen till
Förutspådd GPA =a+b1(SAT)+b2(Högskolegenomsnitt)
Du kan testa hypoteser om den övergripande anpassningen och om alla tre regressionskoefficienterna.
Låt oss kolla in Excel-funktionerna för att hitta koefficienter.
Några saker att tänka på:
- Du kan ha valfritt antal x- variabler.
- Räkna med att koefficienten för SAT ändras från linjär regression till multipel regression. Räkna med att avlyssningen också ändras.
- Räkna med att standardfelet för skattningen minskar från linjär regression till multipel regression. Eftersom multipel regression använder mer information än linjär regression, minskar det felet.