zoeken
+31(0) 40 304 0070bel ons
Contactmail ons
menu

De kans op een conversie bepalen op basis van clickstreams

Terug naar alle blogberichten
Daag ons uit!
  1. Home
  2. Blog
  3. Conversiekans bepalen op basis van clickstreams

In alle vakgebieden wordt de opkomst van Machine Learning/Artificial Intelligence opgemerkt, zo ook in de online marketing. Waarschijnlijk zitten er achter verschillende functies die je dagelijks gebruikt algoritmes die zichzelf constant verbeteren op basis van verkregen antwoorden. Denk hierbij bijvoorbeeld aan chatbots die webshops gebruiken voor hun klantenservice en aanraders op Netflix. Het gaat er bij deze algoritmes om dat ze van hun fouten leren. Op basis van de fouten die ze in hun eigen voorspellingen maken, passen de modellen hun coëfficiënten of gewichten aan en proberen het bij de volgende inschatting beter te doen om het hele verbeterproces daarna opnieuw in te gaan.

Wat zijn clickstreams en welke conclusies kun je hieruit trekken?

Op je website zitten dagelijks gebruikers die verschillende pagina’s bezoeken. Deze pagina’s gebundeld noemen we een clickstream. Zulke paden vertellen ons soms meer dan dat we in eerste instantie inschatten. Anders verwoord: slimme algoritmes kunnen patronen herkennen die wij op het blote oog niet direct zullen zien.

In onderstaande figuur zien we 2 paden van klanten X en Y op een webshop voor kleding. Klant X gaat vanaf de homepage naar de eerste pagina voor dameskleding, om vervolgens door te klikken naar de tweede en de derde. Klant Y zoekt op de homepage meteen naar een specifiek product om vervolgens naar de webpage van dit specifieke product te gaan. Waarschijnlijk heb je nu zelf al een mening gevormd over welke van de 2 klanten al verder is in het proces en welke je verwacht dat sneller zal converteren! 

Als zowel klant X als Y na de getoonde paden de website verlaten en we één euro hebben om uit te geven aan het retargeten van één van deze klanten, heb je vast een voorkeur voor aan wie je die euro zou willen uitgeven. Maar hoe fijn zou het zijn als er een ‘kans op conversie’ wordt berekend op basis van historische data? Dat is waar Machine Learning de hoek om komt kijken.

Algoritme Neural Networks

Eén van de bekende algoritmes die wordt gebruikt voor de toepassing van Machine Learning zijn de Neural Networks. Dit algoritme prefereert cijfers om te verwerken. Daarom is de eerste stap om iedere URL om te schrijven naar een getal en zo cijferreeksen te creëren die de clickstreams vertegenwoordigen. Eenmaal omgeschreven naar cijferreeksen, kunnen we paden door het model laten lopen. Daarnaast vertellen we het model of het pad hoorde bij een klant of niet. Het model dat we hiervoor gebruiken heet een ‘Neural Network’, gebaseerd op het werken van het brein.

In onderstaande figuur zien we een neural networks met de bolletjes (cellen) en de draden (neuronen). De eerste bolletjes bevatten de data: de paden die de klanten hebben afgelegd. De neuronen hebben gewichten die bepalen hoe veel informatie van de cellen doorgegeven wordt aan de volgende cel. Dit zorgt ervoor dat alle oranje cellen nieuwe waarden krijgen om vervolgens via nieuwe neuronen informatie door te geven aan de groene cellen. Dit proces herhaalt zich zo vaak als je wilt over zoveel cellen als je wilt. Het complexer maken van het brein, zorgt echter voor een langere ‘nadenktijd’ waardoor je model te zwaar kan worden. In de laatste cellen (blauw) komen waarden te staan. In het geval van classificering (klant of niet) is dit een blauwe cel die de kans vertegenwoordigt dat dit pad een klant is. 

Stel dat het algoritme aan het einde inschat dat de klant met een kans van 0.75 koper is en het was ook daadwerkelijk een koper (waarde = 1), dan is de foutmarge: 1 – 0.75 = 0.25. Met behulp van deze foutmarge updatet het model zichzelf door de gewichten (neuronen) aan te passen. 

Verschil in intentie, verschil in data

Voor het trainen en testen van deze modellen zijn verschillende datasets gebruikt. Het is belangrijk om je het gedrag van klanten voor te stellen in webshops en hier ook onderscheid te maken in ‘Hoe zou een koper zich gedragen?’ en ‘Hoe zou iemand zich gedragen die alleen komt kijken?’. We leggen het verschil uit door middel van 2 soorten datasets.

Webshops voor gereedschap

Ben je op zoek naar gereedschap om een klus thuis af te maken, dan zul je vrij snel de zoekbalk gebruiken om dit gereedschap te vinden en direct daarna afrekenen. Maar, kom je alleen kijken naar wat de webshop te bieden heeft zonder duidelijk doel, dan bezoek je veel meer pagina’s.

Webshops voor kleding

Bij het shoppen voor kleding – ook wanneer men vastberaden is een aankoop te gaan doen – zullen we nog steeds vrij vaak ‘surfgedrag’ zien. Om het nogmaals te vergelijken met gereedschap: een klant die op zoek is naar een grasmaaier, zal niet snel met een zaag eindigen. Bij het shoppen voor een jurk, is de kans een stuk groter om met een (extra) shirtje of in plaats van de jurk met een rok  te eindigen. Klanten kijken hier vaker nog even verder dan op webshops voor gereedschap. Kortom, het gedrag van ‘kopers’ lijkt veel meer op het gedrag van ‘niet-kopers’.

Dus?

Uit dit gegeven blijkt dat je bij iedere dataset goed moet kijken naar wat voor website is en hoe je je model wil trainen. Uit de resultaten van de testset bleek inderdaad dat het makkelijker is om de kopers te vinden op de shops met gereedschap dan op de kleding webshops. We zouden daarom kunnen kiezen voor een lichter model voor de gereedschap shops en een zwaarder model voor de kleding.

Wanneer wordt een potentiële klant interessant?

Aangezien er natuurlijk veel meer niet-kopers op een website komen dan kopers, is het heel makkelijk om 99% precisie te halen. Daar heb je namelijk helemaal geen model voor nodig! De truc is dan namelijk ‘gooi alles op niet-kopers en je hebt 99% precisie’. Hier streven we natuurlijk niet naar en daarom vergelijken we vooral de sensitiviteit (het aantal positieven dat we vinden) en specificiteit (het aantal negatieven dat we vinden). 

Het model voorspelt een kans tussen 0 en 1 dat de klant een koper is. Als de kans 0.8 is, verwacht het model dus met 80% dat de klant iets gaat kopen. Als deze klant dan zonder aankoop van de website verdwijnt, is dit een interessant doel voor je remarketing, maar vanaf welke conversiekans wordt een potentiële klant interessant? Normaal pak je 0.5 als grens, maar het kan dat je ‘bucket’ met klanten hierdoor te klein of te groot wordt. Hier vindt een menselijke keuze plaats:

  • Kies je voor een hoge grens, bijvoorbeeld: alles boven 0.75 noem ik een potentiële koper en ga ik extra in investeren, dan heb je waarschijnlijk een kleine bucket om op te focussen. Dit groepje zal echter wel de hoogste potentiële klanten targeten en hier zullen relatief weinig niet-kopers tussen zitten. Overigens zul je een aantal potentiële kopers die tussen de 0.5 en 0.75 zweven, niet bereiken.
  • Kies je voor een lage grens, dan gebeurt het tegenovergestelde. Je zult veel mensen bereiken, maar ook veel die er niet echt toe doen.

Je moet hier dus een afweging maken op basis van het marketingbudget. Ga je voor een hoge grens, dan zullen de kosten van marketing lager zijn, maar zitten er opportuniteitskosten in de potentiële klanten die je mist. Is de keuze gemaakt, dan kan het ingezet worden om de meest interessante klanten te retargeten. Zien we dat deze klanten uiteindelijk converteren of niet, dan hebben we nieuwe data om ons model nóg slimmer mee te maken! Zo wordt het model beter en beter, en wordt de marketingeuro steeds beter besteed.

Hulp nodig bij het bepalen van conversiekansen van je doelgroep?

Bij Happy Idiots hebben we een aantal slimme datacollega’s in dienst. Ben jij toe aan wat meer inzicht in je data en het toepassen ervan? Neem contact met ons op, we helpen je graag verder.

Verzenden

Blog

Relevant blog posts

Hoe je met data kosten bespaart

10 april 2020

Daag jij ons uit voor je volgende project?

Daag ons nu uit!

Op de hoogte blijven van het laatste online nieuws?

Schrijf je in voor de nieuwsbrief

Druk op ENTER om te zoeken of ESC om de zoek overlay te sluiten.