Pareto – Visuaalisen analytiikan työkalut, osa 2
Blogisarjan kakkososan teemana on Pareto-kaavio. Kaavion nimi tulee Pareton periaatteesta, jonka mukaan missä tahansa ilmiössä 80% seurauksista johtuu 20% syistä. Eli useimmat vaikutukset tulevat suhteellisen vähäisistä syistä. Periaatteen keksi herra nimeltä Vilfredo Pareto 1800-luvulla Englannissa. Herran havainto tunnetaan tänä päivänä 80/20 –sääntönä. Käytännössä 80/20-sääntö voisi tarkoittaa, että esim. 80% reklamaatioista johtuu 20% tuotteista, tai 80% poissaoloista johtuu 20% poissaolon syistä. Pareton periaatteesta voi lukea lisää alan kirjallisuudesta tai googletella netistä.
Mutta mites tämä herra Pareto ja Pareton periaate sitten liittyy Pareto-kaavioon? No kyseinen kaavio on oiva työkalu Pareton periaatteen visualisoinnille.
Pareto-kaaviossa yhdistetään palkki- ja viivagraafit niin, että yksittäiset arvot esitetään palkkeina laskevassa järjestyksessä ja kumulatiivinen %-osuus kaikista viivana. Alla esimerkki:
Ylläolevassa kaaviossa on siis palkkeina myynti per maa, järjestettynä laskevaan järjestykseen. Viiva kuvaa kumulatiivista %-osuutta myynnistä. Eli graafista näkee suoraan, että Ruotsin ja Norjan myynti yhteensä muodostaa lähes 70% kokonaismyynnistä ja kun mukaan otetaan Suomi, niin osuus on jo lähes 90% kokonaismyynnistä. Miten tämä nyt sitten liittyy 80/20-sääntöön? No ei välttämättä mitenkään, mutta kyllähän tämä näyttää sen, että “useimmat vaikutukset tulevat suhteellisen vähäisistä syistä”, eli viidestä maasta kaksi (40%) edustaa n. 70% kokonaismyynnistä. Eiks niin?
No loppujen lopuksi Pareto-kaaviolla ei välttämättä tarvitse olla hirveesti tekemistä Pareto-periaatteen kanssa, eikä sitä tarvitse käyttää vain osoittaakseen, että herra Pareto oli oikeassa tai että 80/20-sääntö pätee/ei päde.
Visuaalisessa analytiikassa Pareto-kaavio on kuitenkin verraton tapa esittää asioita, seurauksien/syiden suhteita ja tunnistaa millä asioilla on eniten merkitystä mihinkin ilmiöön.
Jos palataan blogi sarjan osassa 1 esitettyyn tilanteeseen jossa sain johdolta toimeksiannon kehittää katetta parantavia keinoja. Olisiko hyvä idea tarkastella mistä se kate sitten oikein tulee? Eikun, tehdäänkin niin, että tutkitaan mistä se kate ei todellakaan tule!
Rajasin yllä olevaan kaavioon kaikki tuotteet, jotka ovat tuottaneet tappiota tänä vuonna ja joita on myyty joka kuukausi viimeisen 6kk aikana. Eli jokainen punainen palkki on tuote ja palkin pituus sen kate.
Sininen viiva kuvaa %-osuutta tästä tappiosta kumulatiivisesti ja lisäsin keltaisen viivan mikä kertoo missä on 80% raja, eli mitkä tuotteet tekevät 80% kaikesta tappiosta.
Aika hauska, mutta tappiota tekeviä tuotteita oli yhteensä 558 kpl ja 80% kaikista tappioista aiheutti 96 kpl tuotteita. Eli 80% tappioista aiheutti 17,2% tuotteista, aika lähellä 80/20-sääntöä, eikös?
Listasin nämä 96kpl tuotetta itselleni ja rajaan sen kaavioon. Mietin pitäisikö lista lähettää johdolle ja ehdottaa hinnan korotuksia, vai mitäs sitten? Päätän jatkojalostaa kaaviota ottamalla mukaan myös asiakasulottuvuuden:
Aika vinkee eikö totta? Tämä nyt ei toki enää ole Pareto-kaavio, mutta nyt näen kaikkien 96 tuotteen osalta (joilla yhteensä kate on miinuksella) väreillä (stacked bar) jaoteltuina kate asiakkaittain. Eli siis käytännössä tuotteet (palkit), joilla ei ole ollenkaan palkkia nollan yläpuolella ovat sellaisia tuotteita, joita on myyty kaikille asiakkaille tappiolla. Aukesiko?
No mitä sitten? Poimin omalle listalleni kaaviossa näkyvät 10 tuotetta (palkkia), joilla on vähän katetta plussankin puolella, näitä aion tutkia tarkemmin ja tsekata miksi ne on osalle asiakkaista myyty hyvälläkin katteella ja osalle tappiolla, ehkä se johtuu myyjästä ja annetuista alennuksista.
Tämän esimerkin tapauksessa Pareto-kaavio osoittautui arvokkaaksi lisätyökaluksi, jolla isosta datamassasta saatiin kaivettua johdolle arvokasta faktatietoa kannattamattomista tuotteista ja asiakkaista. Visualisoimalla dataa Pareto-kuviolla, saadaan selkeästi esille tärkeimmät taustamuuttujan arvot tarkasteltavalle vasteelle.