Jeg har i over 20 år jobbet med markedsanalyse. For meg er det viktig å forbli relevant. Derfor har jeg alltid stilt spørsmål om markedsanalyse faktisk er i stand til å belyse det som foregår i kundenes liv. Svaret på det spørsmålet er at det vil avhenge av hva som skal kartlegges. Kundenes liv er dynamisk, der både uforutsigbar og forutsigbar atferd oppstår. I et selskap som Ruter må jeg derfor stille spørsmål om hva slags atferd vi ikke kan fange godt nok opp ved hjelp av tradisjonelle markedsundersøkelser, som eksempelvis vår omfattende reisevaneundersøkelse er. For å finne ut mer om kundene må jeg derfor lete i andre datakilder, og i de digitale sporene kundene etterlater seg.
Ny teknologi muliggjør nye typer analyser og innsikt, og dataene som brukes for å forstå kundene blir i stadig større grad håndtert av folk med IT- og programmeringskunnskap fremfor analytikerkompetanse. Jeg vil i denne artikkelen ta for meg noen av de erfaringene jeg har gjort meg gjennom å initiere og gjennomføre et stordata analyseprosjekt hos Ruter.
HVORDAN PREDIKERE TRENGSEL OM BORD PÅ BUSSER VED HJELP AV MASKINLÆRING?
I markedsanalyse er vi opptatt av å forstå kundenes behov. I Ruter vet vi eksempelvis at en god del av kundene ønsker å sitte når de reiser. Det kan være mange grunner til at folk ønsker å sitte; de er dårlig til beins, føler seg utrygg når de må stå, ønsker å slappe av og lese eller har med seg små barn. Med dette behovet i minne, tenk om kundene faktisk kunne få treffsikker informasjon om muligheten for ledig sitteplass på fremtidige avganger, basert på prediksjon? Dette var det spennende utgangspunktet for Ruters stordata analyseprosjekt rundt trengsel om bord på busser.
For å kunne gi kunden tilpasset informasjon trenger vi store mengder data. Vi begynte derfor i eget datavarehus for å se hvilke typer data som fantes der. Passasjertall blir samlet inn via Automatic Passenger Counting (APC). APC teller passasjerer ved at en stråle brytes når passasjerene går inn og ut av dørene på bussene. I Ruter sitt datavarehus blir denne informasjonen lagret, og knyttet til eksempelvis holdeplass. Dermed kan man lage variabler som full eller ikke full på hver eneste holdeplass for hver eneste avgang gjennom å sammenligne hvor mange personer som er om bord med antall sitteplasser som hver buss har. Denne informasjonen ble brukt til å skape en target variabel for dette prosjektet, og denne prosessen kalles innen data science for feature engineering. Gjennom å definere et datasett fra datavarehuset med variabler som tid, dag, helligdag, knutepunkt/ikke knutepunkt, rush/ikke rush, hvor mange som er om bord på samme avgang de fire foregående ukene og forsinkelser over og under tre minutter hadde vi et datasett som også inneholdt mange predictors.
Det strategiske perspektivet er viktig å ta med inn i stordata analyseprosjekter, da disse prosjektene må forankres høyere opp i selskapet
Vi begrenset prosjektet til å se på én busslinje for én måned slik at vi minimerte tidsbruk på kjøringer i pilotprosjektet. Da dette stordataprosjektet ble initiert av meg, som er en «ikke-programmerer, var det hensiktsmessig å bruke teknologi som var brukervennlig nok for oss som ikke er en data scientist. Løsningen ble å bruke Datarobot, som er en app som er «smart» og kan kjøre igjennom en rekke modeller for å så gi sin anbefaling på hvilken modell vi burde bruke. Siden vår target variabel var dikotom (full/ikke full) var dette en klassifikasjonsanalyse, og Datarobot anbefalte en modell som heter eXtreme Gradient Boosted Trees Classifier with Early Stopping. I tillegg testet vi modellen både med et redusert datasett med færre variabler og et fullt datasett der alle variabler var inkludert, for å se hvilken av de som var mest effektiv. I vårt prosjekt viste det seg at den fulle modellen var bedre til å predikere trengsel enn den reduserte modellen.
Hva fant vi så? Det vi fant er at vi med høy grad av sikkerhet kunne predikere om bussen var full eller ikke på hver enkelt holdeplass, og at vi med stor sannsynlighet ville kunne skalere dette prosjektet til å gjelde lengre tidsperioder og for andre busslinjer. Og enda mer interessant med tanke på spredning av informasjonen er at algoritmene kan implementeres i en app, som eksempelvis RuterReise, for på den måten gi informasjon til kundene som søkte etter en avgang om denne bussen er full eller ikke. For de kundene som ønsker sitteplass vil denne typen informasjon naturlig nok kunne forbedre opplevelsen av reisen med offentlig transport!
HVA KAN JEG SOM MARKEDSANALYTIKER TILFØRE MASKINLÆRINGSPROSJEKTER?
Både data science og markedsanalyseprosjekter handler om å gå fra data og modeller til innsikt. Innsikt som kan brukes til å ta gode beslutninger. I begge typer prosjekter handler det om å konvertere et forretningsproblem til et forskningsproblem, for deretter finne en tilfredsstillende forretningsløsning.
Som markedsanalytiker, som er skolert innen vitenskapsteori og -metode, har dette prosjektet vært veldig lærerikt. Jeg lærte mye om nye type verktøy, begreper og typiske utfordringer en data scientist møter. Jeg lærte eksempelvis at her trengte jeg ikke å tenke så mye på at forutsetningene til regresjonsanalyser ble overholdt, at modellene kunne skape egne variabler («black box») og at verktøyene er kraftigere enn de verktøyene som jeg normalt bruker, som SPSS.
Selv om jeg ser på disse to fagområdene som forskjellige finner jeg også noen fellestrekk som:
- Kompetanse. De krever høy grad av kompetanse, og da spesielt kompetanse i kvantitative undersøkelser og metoder.
- Kreativitet. Uten en verktøykasse av ferdigheter vil man ikke finne en løsning på problemet.
- Samarbeid. Du må kunne samhandle med en rekke mennesker fra ulike fagområder.
- Prosess. Prosjektene starter gjerne med et forretningsbehov som skal løses, der man så sørge for at man designer analysen slik at man kan svare på undersøkelsesspørsmålene.
- Nytte. Analyseprosjektene må være relevante for den virksomheten de er utformet for.
- Potensiale. Her ligger det enorme muligheter for å bidra enda mer konstruktivt inn i forretningsutviklingen!
Det jeg mener en markedsanalytiker kan tilføre slike prosjekter er kunnskap om typiske forretningsbehov og modeller for å forstå kundeatferd. I dette prosjektet hadde jeg god kunnskap om kundens behov og hvordan vi kunne løse dette problemet for kundene. I tillegg har jeg god oversikt over hvilke kundeeffekter man kan forvente hvis man gjør noe med dette problemet. Samtidig sitter jeg på gode statistiske kunnskaper og er opptatt av kausalitet. Dette vil også kunne gi grunnlag for å skape gode diskusjoner når resultatene foreligger, og gjøre at man også kan forbedre stordataanalysene både ved å lage mer «gjerrige» modeller som er lettere å forstå, men også benytte seg av eksperimentelle teknikker for å teste og forbedre ulike modeller.
Å TA EN POSISJON I DATADREVNE SELSKAPER
Det er ikke noe tvil om at også for Ruter vil stordataanalyser være viktig i fremtiden, både for å kunne skape mer kundesentriske løsninger og møte konkurransen fra blant annet selskaper som Über. Über sin ambisjon er å bli en «one-stop shop for different modes of travel», og også Ruter diskuterer mulighetene til å bli et plattformselskap for ulike transportmåter. For å ta en slik posisjon er utnyttelse av data veldig viktig.
I Ruter er det satt i gang et endringsprogram for å gjøre selskapet enda mer datadrevet. Dette skjer gjennom å se på blant annet i hvor stor grad vi utnytter dataene vi har per i dag, kvaliteten på data, og i hvor stor grad selskapet evner å samarbeide på tvers av fagenheter for å forbedre prosessene som skaper mer kunnskapsbaserte beslutninger. I dette ligger det et mulighetsrom for markedsanalytikere, som er vant med å holde kunden i fokus, og gjennomføre undersøkelser som både er operative og strategiske. Det strategiske perspektivet er viktig å ta med inn i stordata analyseprosjekter, da disse prosjektene må forankres høyere opp i selskapet. Her møter vi beslutningstakere som ikke er vant med de tekniske verktøyene data scientist-faget bruker, og de trenger å forstå konteksten til stordata-analyser. Når det gjelder kundefokus, oppdager jeg stadig at det er vanskelig for personer som ikke jobber med det til daglig å passe på at kundens perspektiv blir ivaretatt. Eksempelvis har Ruter store mengder med kundedata som ikke blir brukt til å skape innsikt, som eksempelvis kundehenvendelser. Kundefokus glipper hele tiden, men dette bør være godt innarbeidet hos en markedsanalytiker.
Vi som jobber med å sette kunden i fokus, og som kan prosesser for å forstå kundeatferd, har derfor en konkurransefordel. I fremtiden tror jeg vi vil se markedsanalytikere ta prosjektleder-roller i stordata-analyseprosjekter siden vi har god kunnskap om kundeatferd og dermed kan stille de riktige spørsmålene. Vi jobber både med metode og formidling, og vi jobber med forretningsbehov. For å utnytte denne fordelen til fulle forutsetter det selvsagt at vi lærer mer om datascientist-faget, og at vi er pådriver for å sette i gang stordata-analyseprosjekter. For mange markedsanalytikere vil en slik jobb være veldig tilfredsstillende, da vi får jobbe bredere i organisasjonen, og vi vil ofte (re) se konkrete resultater fra den innsatsen vi gjør siden stordata-analyser og maskinlæring handler om å skape fordelaktige endringer i kundeatferd. Derfor vil fremtiden for markedsanalytikere bli enda mer spennende for markedsanalytikere som greier å skape verdi ut av dataene med hjelp av den nye teknologien og stordata-analyser. Mange slike prosjekter henter mye fra prosesser kjent fra markedsanalyse som segmentering ved hjelp av klusteranalyser og bestemme verdien av kundeforholdet gjennom bruk av conjoint. Veien er derfor ofte ikke lang for en markedsanalytiker til å bidra konkret inn i stordata-analyseprosjekter. Så vær nysgjerrig og finn ut hvordan dette kan skape nye muligheter for vårt fagområde