«Det er vanskelig å spå, spesielt om fremtiden» skal matematikeren Niels Bohr ha sagt. I denne artikkelen drister jeg meg likevel til noen refleksjoner rundt enkelte av gjennomgangstemaene på årets konferanse og hvilke endringer vi mulig vil se i den nokså nære framtid. Endringstakten i bransjen er høy nå, ikke minst med inntoget av kunstig intelligens, noe de fleste av foredragsholderne var inne på. Det kan godt hende at den nære fremtid vil se ganske annerledes ut enn den nære fortid.
Evnen til kritisk tenkning vil bli stadig viktigere
Kunstig intelligens er ikke noe nytt, men det store allmenne gjennombruddet må sies å være inntoget av ulike LLMs (Large Language Models), hvor ChatGPT var først ute, men på ingen måte er eneste aktør. En disproporsjonal andel av de omtrent 150 ulike presentasjonene, på 3 parallelle scener, handlet om kunstig intelligens. Der diskusjonen rundt kunstig intelligens i fjor vår handlet mye om effektivisering av manuelle arbeidsprosesser, handler den nå mer om det man kanskje kan kalle «verdiøkende» aspekter ved teknologien – rett og slett at KI kan hjelpe oss gjøre bedre analyser.
Flere foredrag handlet om hvordan KI har blitt brukt til å finne sammenhenger i store datasett, til å gjøre desk research, finne trender i sosiale medier. Foreløpig brukes KI i første rekke til å analysere tekstdata, fra kvalitative studier eller hentet via åpne kilder, men det var også flere foredrag om mer matematisk og prediktiv bruk av kunstig intelligens. Her har markedsanalyseselskapene en spennende posisjon, siden man sitter med mye, strukturerte data, fra ulike benchmark-databaser. Flere av de store internasjonale selskapene har allerede lansert prediktive modeller for testing av reklame konsepttester, og lignende.
Disse mulighetene kommer imidlertid også med utfordringer. Ett av de kanskje mest tankevekkende foredragene handlet om hvor åpne vi (og særlig yngre aldersgrupper) er for å «outsource» hele beslutningsprosessen – fra hverdagslige beslutninger om hva man skal ha på seg, til større livsbeslutninger om karriere, bosted og familie – til kunstig intelligens. All den tid kunstig intelligens har en lei tendens til å hallusinere, lyve og gi en ganske skjev representasjon av verden, kan dette være problematisk.
For oss, som markedsanalytikere, hvor vi vil få stadig flere verktøy som hjelper oss ikke bare med det kjedelige manuelle arbeidet, men også med det intellektuelle tenkearbeidet, vil det bli stadig viktigere å trene opp vår kritiske sans. Vi må forstå hvordan modellene fungerer, hvordan kunstig intelligens egentlig resonerer. Vi må trene opp evnen til å samhandle (hvordan vi bygger promptene våre) med KI på en måte som minimerer sjansen for å skape hallusinasjoner og feilaktig innsikt. Konsensusen fra ESOMAR synes å være at vi ikke kan slippe KI fri, men at det, som et av foredragene så pent sa det i tittelen, må være en symbiose mellom «Man and Machine». Da er det viktig å huske at (Wo-)Man må være i førersetet og ikke ukritisk la Machine gjøre hele jobben.
Markedsanalyseproduktet kan bli betydelig mer presist enn det er i dag
Den store styrken til kvantitativ markedsanalyse er at man har funnet en måte å si noe om en hel befolkning på basis av intervju med en liten andel av den. Likevel er det et stadig tilbakevennende «problem» dette med representativitet og feilmarginer. Det er alltid heftet en viss statisk usikkerhet til dataene våre. Ofte kan vi heller ikke tillate oss å dykke ned i mindre målgrupper, ganske enkelt fordi usikkerheten øker jo mindre grupper man ser på.
Syntetiske data to the rescue. Kanskje.
Det andre gjennomgangstemaet på konferansen var syntetiske data. Kort fortalt markedsanalysedata frembragt av kunstig intelligens. Diskusjonen om syntetiske data har til nå i stor grad dreid seg om rene syntetiske datasett, som altså er 100 % KI-generert. Konsensusen synes å være at man har liten tro på rene syntetiske datasett, i hvert fall på kort sikt. Det handler mest om at datagrunnlaget modellene bruker (i de fleste tilfeller internett) på ingen måte kan sies å være representativt.
Det er imidlertid stor interesse og tro på syntetiske data for å utøke datasett innhentet på mer tradisjonell måte. I praksis vil det si at man bruker syntetiske respondenter som gis visse egenskaper (det kan eksempelvis være kombinasjoner av ulike demografiske, sosiografiske og geografiske forhold) som modellen benytter til å utlede svargivning, basert på hva ekte folk har svart. Man snakker ofte om ekte respondenter og deres syntetiske tvilling-respondenter.
Syntetiske data, brukt for å utøke datasett på denne måten, er allerede i bruk. Et eksempel på et bruksområde er tracking, hvor syntetiske data kan minske feilmarginene fra runde til runde og skape mer stabile trendlinjer. I andre sammenhenger brukes syntetiske data for å skape mer granulære datasett. Et konkret eksempel på sistnevnte er valutamålinger for utendørsreklame, med formål å prise varelageret til de ulike selskapene. Her kombineres klassiske surveydata, passive målinger og en rekke tredjepartsdata som underlag for å skape millioner av syntetiske reiser, noe som igjen gjør det mulig å modellere synligheten til individuelle reklameflater på tvers av et helt marked.
En annen lovende oppgave for syntetiske data er å «representere de urepresenterte». I de fleste markeder er det en utfordring å få troverdig innsikt fra mer marginale grupper, som innvandrere eller andre minoriteter. Dette skaper naturlig nok en systematisk skjevhet i befolkningsundersøkelser. En problemstilling vi snakker for lite om. Syntetiske data kan potensielt brukes til å utøke svarene fra marginaliserte grupper, slik at man får en bedre representativitet. Her er det antakelig en lenger vei å gå. Konkrete tester viser at modellene som brukes for å skape syntetiske data er forutinntatte – de er rett og slett bedre til å predikere hva majoriteten mener, enn minoriteter.
Kundene vil i økende grad evaluere oss på kvaliteten av rådene vi gir
Et stadig tilbakevennende tema på foredrag fra kundesiden på ESOMAR var rådgivning. Det er for så vidt ingenting nytt at kunder etterspør god rådgivning fra leverandørene, ikke «bare» troverdige data og interessant innsikt. Men utviklingstrekkene over gjør leveransene våre stadig mer komplekse. Det vil bli stadig vanskeligere for kundesiden å evaluere den underliggende datakvaliteten når markedsanalyseselskapene i økende grad kombinerer klassiske surveydata med passive målinger, tredjepartsdata og syntetiske data. Det vil også bli vanskeligere for kundene å vurdere analysene som gjøres, når de får et større innslag av maskinlæring og kunstig intelligens. LLMs og andre modeller er lite transparente – man kan forstå de underliggende premissene for modellen, men man kan (i hvert fall med nåværende modeller) ikke ettergå analysene som leder til en konklusjon.
Man beveger seg mot en situasjon hvor kundesiden blir tvunget til å stole på at leverandøren sikrer god data- og analysekvalitet, med få muligheter for faktisk å kunne evaluere om det er tilfelle eller ei. Evalueringskriteriet man da står igjen med er rådgivningskvaliteten. Er rådene man får gode? Fører de til gode beslutninger? Hjelper innsikten selskapet å lykkes? Man vil altså gå fra å evaluere innsatsfaktorene (er dataene og analysene gode) til å evaluere effektfaktorene (fører prosjektet til bedre beslutninger).
En lys fremtid?
Hvor fort vi vil se at disse utviklingstrekkene gjør seg gjeldende, internasjonalt og i Norge, er vanskelig å spå. Personlig er jeg imidlertid ganske overbevist (det er alltid lurt å legge inn en liten feilmargin i egne prediksjoner) om at kunstig intelligens vil få en stadig større rolle i vår bransje, at bruken av syntetiske data vil øke og at det vil gjøre at vi på leverandørside i økende grad vil evalueres på rådgivningskvaliteten vi leverer. I mine øyne er dette en nesten utelukkende positiv utvikling – hvis syntetiske modeller hjelper oss å få mer presise, granulære og representative data og hvis kunstig intelligens hjelper oss å gjøre stadig bedre analyser, vil det bare gjøre markedsanalyseproduktet mer verdifullt. Det vil imidlertid kreve ganske mye av oss. Vi må forstå kunstig intelligens og syntetiske data godt nok til å implementere det på en ansvarlig måte. Samtidig må vi stadig bli bedre rådgivere innenfor de fagområdene vi jobber i. I fremtiden kan vi ikke gjemme oss bak feilmarginer, men må stå for de rådene vi gir. Return On Advice vil i økende grad bli målestokken.