Lineárna regresia je skvelý nástroj na vytváranie predpovedí pomocou Excelu. Keď poznáte sklon a priesečník priamky, ktorá spája dve premenné, môžete vziať novú hodnotu x a predpovedať novú hodnotu y . V príklade, na ktorom ste pracovali, vezmete skóre SAT a predpovedáte GPA pre študenta Sahutsket University.
Čo keby ste vedeli viac než len skóre SAT pre každého študenta? Čo keby ste mali stredoškolský priemer študenta (na stupnici 100) a mohli by ste použiť aj tieto informácie? Ak by ste mohli skombinovať skóre SAT s priemerom HS, mohli by ste mať presnejší prediktor ako samotné skóre SAT.
Keď pracujete s viac ako jednou nezávislou premennou, nachádzate sa v oblasti viacnásobnej regresie. Rovnako ako pri lineárnej regresii nájdete regresné koeficienty pre najlepšie vyhovujúcu čiaru pomocou bodového grafu. Ešte raz, najlepšie prispôsobenie znamená, že súčet štvorcových vzdialeností od údajových bodov k čiare je minimálny.
S dvoma nezávislými premennými však nemôžete zobraziť bodový graf v dvoch rozmeroch. Potrebujete tri rozmery, a to je ťažké nakresliť.
Pre príklad SAT-GPA sa regresná rovnica prekladá do
Predpokladaný GPA =a+b1(SAT)+b2(stredoškolský priemer)
Môžete testovať hypotézy o celkovej zhode a o všetkých troch regresných koeficientoch.
Pozrime sa na možnosti Excelu na vyhľadávanie koeficientov.
Je potrebné mať na pamäti niekoľko vecí:
- Môžete mať ľubovoľný počet x- premenných.
- Očakávajte, že koeficient pre SAT sa zmení z lineárnej regresie na viacnásobnú regresiu. Očakávajte, že sa zmení aj zachytenie.
- Očakávajte, že štandardná chyba odhadu sa zníži z lineárnej regresie na viacnásobnú regresiu. Pretože viacnásobná regresia využíva viac informácií ako lineárna regresia, znižuje chybu.