Tiesinė regresija yra puikus įrankis prognozuoti naudojant „Excel“. Kai žinote linijos, kuri sieja du kintamuosius, nuolydį ir susikirtimo tašką, galite paimti naują x reikšmę ir numatyti naują y reikšmę. Pavyzdyje, kurį atlikote, imate SAT balą ir numatote Sahutsket universiteto studento GPA.
O kas, jei žinotumėte daugiau nei tik kiekvieno studento SAT balą? Ką daryti, jei turėtumėte mokinio vidurinį vidurkį (100 balų skalėje) ir galėtumėte pasinaudoti šia informacija? Jei galėtumėte sujungti SAT balą su HS vidurkiu, galite turėti tikslesnį prognozę nei vien SAT balas.
Kai dirbate su daugiau nei vienu nepriklausomu kintamuoju, esate daugkartinės regresijos srityje. Kaip ir tiesinės regresijos atveju, per sklaidos diagramą rasite regresijos koeficientus geriausiai atitinkančiai linijai. Vėlgi, geriausias atitikimas reiškia, kad atstumų kvadratu suma nuo duomenų taškų iki linijos yra minimali.
Tačiau naudojant du nepriklausomus kintamuosius negalima rodyti dviejų matmenų sklaidos diagramos. Jums reikia trijų matmenų, ir tai tampa sunku nubrėžti.
SAT-GPA pavyzdyje regresijos lygtis reiškia
Numatomas GPA =a+b1(SAT)+b2 (vidurinės mokyklos vidurkis)
Galite patikrinti hipotezes apie bendrą tinkamumą ir apie visus tris regresijos koeficientus.
Pažiūrėkime „Excel“ galimybes ieškant koeficientų.
Keletas dalykų, kuriuos reikia turėti omenyje:
- Galite turėti bet kokį x kintamųjų skaičių.
- Tikėtis, kad SAT koeficientas pasikeis iš tiesinės regresijos į daugybinę regresiją. Tikėkitės, kad pertrauka taip pat pasikeis.
- Tikėtis, kad standartinė įvertinimo paklaida sumažės nuo tiesinės regresijos iki dauginės regresijos. Kadangi daugkartinė regresija naudoja daugiau informacijos nei tiesinė regresija, ji sumažina paklaidą.