Kun suoritat data-analyysiä, oletat yleensä, että arvosi klusteroituvat jonkin keskeisen tietopisteen (mediaani) ympärille. Mutta joskus muutama arvo putoaa liian kauas keskipisteestä. Näitä arvoja kutsutaan outliersiksi (ne ovat odotetun alueen ulkopuolella). Poikkeamat voivat vääristää tilastollisia analyysejäsi ja johtaa vääriin tai harhaanjohtaviin johtopäätöksiin tiedoistasi.
Voit käyttää muutamaa yksinkertaista kaavaa ja ehdollista muotoilua korostaaksesi poikkeavia tiedoissasi.
Ensimmäinen askel poikkeavien arvojen tunnistamisessa on paikantaa alueen tilastollinen keskipiste. Tehdäksesi tämän paikantamisen, aloitat etsimällä 1. ja 3. kvartiili. Kvartiilin on tilastollinen alue datajoukon neljään yhtä suureen ryhmään, jokaisen ryhmän muodostavat 25 prosenttia tiedoista. Kokoelman ylintä 25 prosenttia katsotaan 1. kvartiiliksi, kun taas alimman 25 prosentin katsotaan olevan 4. kvartiili.
Excelissä voit helposti saada kvartiiliarvot QUARTILE-funktion avulla. Tämä funktio vaatii kaksi argumenttia: tietoalueen ja haluamasi kvartiililuvun.
Esitetyssä esimerkissä solujen E3 ja E4 arvot ovat 1. ja 3. kvartiili alueella B3:B20 oleville tiedoille.
Kun otetaan nämä kaksi kvartiilia, voit laskea tilastollisen 50 prosenttia tietojoukosta vähentämällä 3. kvartiilin 1. kvartiilista. Tätä tilastollista 50 prosenttia kutsutaan interkvartiilialueeksi (IQR). Kuva 9-18 näyttää IQR-arvon solussa E5.
Nyt kysymys kuuluu, kuinka kaukana keskimmäisestä 50 prosentista arvo voi olla ja silti sitä pitää "kohtuullisena" arvona? Tilastomiehet ovat yleisesti samaa mieltä siitä, että IQR*1.5:tä voidaan käyttää kohtuullisen ylä- ja alaaidan muodostamiseen:
Alempi aita on yhtä suuri kuin 1. kvartiili – IQR*1,5.
Ylempi aita on yhtä suuri kuin 3. kvartiili + IQR*1,5.
Kuten näet, solut E7 ja E8 laskevat lopulliset ylä- ja alaaidat. Mikä tahansa arvo, joka on suurempi kuin ylempi aita tai pienempi kuin alempi aita, katsotaan poikkeavaksi arvoksi.
Tässä vaiheessa ehdollinen muotoilusääntö on helppo toteuttaa.
Voit luoda tämän perusmuotoilusäännön seuraavasti:
Valitse kohdealueen tietosolut (tässä esimerkissä solut B3:B20), napsauta Excel-nauhan Koti-välilehteä ja valitse sitten Ehdollinen muotoilu→ Uusi sääntö.
Tämä avaa Uusi muotoilusääntö -valintaikkunan.
Napsauta valintaikkunan yläosassa olevasta luetteloruudusta Käytä kaavaa määrittääksesi, mitkä solut muotoillaan.
Tämä valinta arvioi arvot määrittämäsi kaavan perusteella. Jos tietyn arvon arvo on TOSI, ehdollista muotoilua sovelletaan kyseiseen soluun.
Syötä kaavan syöttöruutuun tässä näkyvä kaava.
Huomaa, että käytät TAI-funktiota vertaamaan kohdesolusi (B3) arvoa sekä ylä- että alaaitoihin, jotka löytyvät soluista $E$7 ja $E$8. Jos kohdesolu on suurempi kuin ylempi aita tai pienempi kuin alempi aita, sitä pidetään poikkeavana arvona ja sen arvoksi tulee TOSI, mikä käynnistää ehdollisen muotoilun.
=TAI(B3<$e$8,b3>$E$7)
Huomaa, että kaavassa suljet pois absoluuttiset vertailudollarisymbolit ($) kohdesolulle (B3). Jos napsautat solua B3 soluviittauksen kirjoittamisen sijaan, Excel tekee soluviittauksestasi automaattisesti absoluuttisen. On tärkeää, että et sisällytä absoluuttisia viitedollarisymboleja kohdesoluusi, koska tarvitset Excelin soveltamaan tätä muotoilusääntöä kunkin solun oman arvon perusteella.
Napsauta Muotoile-painiketta.
Tämä avaa Muotoile solut -valintaikkunan, jossa sinulla on kaikki vaihtoehdot kohdesolun fontin, reunuksen ja täytön muotoiluun. Kun olet valinnut muotoiluasetukset, napsauta OK-painiketta vahvistaaksesi muutokset ja palataksesi Uusi muotoilusääntö -valintaikkunaan.
Takaisin Uusi muotoilusääntö -valintaikkunassa napsauta OK-painiketta vahvistaaksesi muotoilusääntösi.
Jos sinun on muokattava ehdollisen muotoilun sääntöä, aseta osoitin mihin tahansa muotoillun alueen tietosoluun ja siirry sitten Koti-välilehteen ja valitse Ehdollinen muotoilu → Hallitse sääntöjä. Tämä avaa Ehdollisen muotoilun sääntöjen hallintaikkunan. Napsauta sääntöä, jota haluat muokata, ja napsauta sitten Muokkaa sääntöä -painiketta.