Linearna regresija je odlično orodje za napovedovanje z Excelom. Ko poznate naklon in prestrezanje črte, ki povezuje dve spremenljivki, lahko vzamete novo vrednost x in predvidite novo vrednost y . V primeru, ki ste ga obravnavali, vzamete oceno SAT in napovete GPA za študenta univerze Sahutsket.
Kaj pa, če bi za vsakega študenta vedel več kot le rezultat SAT? Kaj pa, če bi imeli dijakovo srednješolsko povprečje (na 100 lestvici) in bi lahko uporabili tudi te podatke? Če bi lahko združili rezultat SAT s povprečjem HS, bi morda imeli natančnejši napovedovalec kot samo rezultat SAT.
Ko delate z več kot eno neodvisno spremenljivko, ste na področju večkratne regresije. Kot pri linearni regresiji, najdete regresijske koeficiente za najbolj prilegajočo se črto prek razpršenega grafikona. Še enkrat, najboljše prileganje pomeni, da je vsota kvadratov razdalj od podatkovnih točk do črte minimalna.
Z dvema neodvisnima spremenljivkama pa ne morete prikazati razpršenega diagrama v dveh dimenzijah. Potrebujete tri dimenzije in to postane težko narisati.
Za primer SAT-GPA se regresijska enačba prevede v
Napovedan GPA =a+b1(SAT)+b2(srednješolsko povprečje)
Preizkusite lahko hipoteze o splošnem prilegovanju in o vseh treh regresijskih koeficientih.
Oglejmo si Excelove zmogljivosti za iskanje koeficientov.
Upoštevati je treba nekaj stvari:
- Imate lahko poljubno število spremenljivk x .
- Pričakujte, da se bo koeficient za SAT spremenil iz linearne regresije v večkratno regresijo. Pričakujte, da se bo tudi prestrezanje spremenilo.
- Pričakujte, da se bo standardna napaka ocene zmanjšala iz linearne regresije v večkratno regresijo. Ker večkratna regresija uporablja več informacij kot linearna regresija, zmanjša napako.