Linearna regresija izvrstan je alat za predviđanje s Excelom. Kada znate nagib i presjek linije koja povezuje dvije varijable, možete uzeti novu vrijednost x i predvidjeti novu vrijednost y . U primjeru koji ste radili uzimate SAT ocjenu i predviđate GPA za studenta Sveučilišta Sahutsket.
Što ako znate više od samo SAT bodova za svakog učenika? Što ako imate prosjek učenika u srednjoj školi (na ljestvici od 100), a i vi biste mogli koristiti te podatke? Ako biste mogli kombinirati SAT rezultat s prosjekom HS, mogli biste imati točniji prediktor od samog SAT rezultata.
Kada radite s više od jedne neovisne varijable, nalazite se u području višestruke regresije. Kao i u linearnoj regresiji, koeficijente regresije za najprikladniju liniju nalazite kroz dijagram raspršenja. Još jednom, najbolje pristajanje znači da je zbroj kvadrata udaljenosti od podatkovnih točaka do crte minimalan.
Međutim, s dvije neovisne varijable ne možete prikazati dijagram raspršenja u dvije dimenzije. Potrebne su vam tri dimenzije, a to postaje teško nacrtati.
Za primjer SAT-GPA, jednadžba regresije se prevodi u
Predviđeni GPA =a+b1(SAT)+b2(prosjek srednje škole)
Možete testirati hipoteze o ukupnom uklapanju i o sva tri koeficijenta regresije.
Pogledajmo mogućnosti Excela za pronalaženje koeficijenata.
Nekoliko stvari koje treba imati na umu:
- Možete imati bilo koji broj x- varijabli.
- Očekujte da će se koeficijent za SAT promijeniti iz linearne regresije u višestruku regresiju. Očekujte da će se presretnuti i promijeniti.
- Očekujte smanjenje standardne pogreške procjene od linearne regresije do višestruke regresije. Budući da višestruka regresija koristi više informacija od linearne regresije, smanjuje pogrešku.