Lineaarinen regressio on loistava työkalu ennusteiden tekemiseen Excelillä. Kun tiedät kahta muuttujaa yhdistävän suoran kulmakertoimen ja leikkauspisteen, voit ottaa uuden x- arvon ja ennustaa uuden y- arvon. Käsittelemässäsi esimerkissä otat SAT-pisteen ja ennustat GPA:n Sahutsketin yliopiston opiskelijalle.
Mitä jos tietäisit enemmän kuin vain kunkin opiskelijan SAT-pisteet? Entä jos sinulla olisi opiskelijan lukion keskiarvo (100 asteikolla) ja voisit myös käyttää näitä tietoja? Jos voisit yhdistää SAT-pisteet HS-keskiarvoon, sinulla voi olla tarkempi ennustaja kuin yksin SAT-pisteet.
Kun työskentelet useamman kuin yhden riippumattoman muuttujan kanssa, olet usean regression alueella. Kuten lineaarisessa regressiossa, löydät regressiokertoimet parhaiten sopivalle suoralle sirontakaavion kautta. Jälleen kerran paras sovitus tarkoittaa, että datapisteiden ja suoran välisten neliöetäisyyksien summa on minimi.
Kahdella riippumattomalla muuttujalla ei kuitenkaan voi näyttää sirontadiagrammia kahdessa ulottuvuudessa. Tarvitset kolme ulottuvuutta, ja sen piirtäminen on vaikeaa.
SAT-GPA-esimerkissä regressioyhtälö tarkoittaa
Ennustettu GPA =a+b1(SAT)+b2(Lukion keskiarvo)
Voit testata hypoteeseja kokonaissovituksesta ja kaikista kolmesta regressiokertoimesta.
Tarkastellaan Excelin ominaisuuksia kertoimien löytämiseksi.
Muutama asia, joka on hyvä muistaa:
- Sinulla voi olla mikä tahansa määrä x- muuttujia.
- Odota SAT:n kertoimen muuttuvan lineaarisesta regressiosta moniregressioon. Odota myös sieppauksen muuttuvan.
- Arvion keskivirheen odotetaan laskevan lineaarisesta regressiosta moninkertaiseen regressioon. Koska moninkertainen regressio käyttää enemmän tietoa kuin lineaarinen regressio, se vähentää virhettä.