La regressió lineal és una gran eina per fer prediccions amb Excel. Quan es coneix el pendent i la intersecció de la línia que relaciona dues variables, es pot prendre un nou x valor i predir una nova i- valor. A l'exemple en què heu estat treballant, feu una puntuació SAT i prediu un GPA per a un estudiant de la Universitat de Sahutsket.
Què passaria si sabés més que només la puntuació SAT de cada estudiant? Què passaria si tinguéssiu la mitjana de secundària de l'estudiant (en una escala de 100) i també poguéssiu utilitzar aquesta informació? Si poguéssiu combinar la puntuació SAT amb la mitjana HS, és possible que tingueu un predictor més precís que només la puntuació SAT.
Quan treballeu amb més d'una variable independent, esteu en l'àmbit de la regressió múltiple . Com en la regressió lineal, trobareu coeficients de regressió per a la línia que millor s'ajusta a través d'un diagrama de dispersió. Una vegada més, el millor ajust significa que la suma de les distàncies al quadrat des dels punts de dades a la línia és mínima.
Amb dues variables independents, però, no podeu mostrar un diagrama de dispersió en dues dimensions. Necessites tres dimensions, i això es fa difícil de dibuixar.
Per a l'exemple SAT-GPA, l'equació de regressió es tradueix a
GPA previst =a+b1(SAT)+b2(mitjana de secundària)
Podeu provar hipòtesis sobre l'ajust global i sobre els tres coeficients de regressió.
Vegem les capacitats d'Excel per trobar coeficients.
Algunes coses a tenir en compte:
- Podeu tenir qualsevol nombre de variables x- .
- Espereu que el coeficient de SAT canviï de regressió lineal a regressió múltiple. Espereu que la intercepció també canviï.
- Espereu que l'error estàndard d'estimació disminueixi de la regressió lineal a la regressió múltiple. Com que la regressió múltiple utilitza més informació que la regressió lineal, redueix l'error.