Customer segmentation with machine learning

Machine learning (ML) is gaining in acceptance as a useful tool for boosting customer loyalty and reducing errors. ML techniques can be applied in a wide range of customer segmentation and customer profiling tasks, such as:

segmentation and clustering
customer profile synthesis
customer-facing technologies
customer-facing applications

Customer segmentation and customer profiling tasks are all important for boosting customer satisfaction and boosting conversion rates.

Customer segmentation

Customer segmentation is the process of segmenting customers based on e.g., their purchase behaviour over the previous time (e.g., years), or on preferred products offered by the company. Examples for main characteristics of a possible customer segment are as follows:

They are highly mobile customers, usually residing in urban areas.
They are typically customers of a mobile operator.
They generally have a low income and / or members of a demographic group that is equivalent to more mobile customers.
They are generally loyal customers, who renew their subscriptions at the same time they can receive promotional offers from their mobile operators.

Machine Learning

Machine Learning (ML) is an effective and common method of data collection and processing in the data mining field. As a result, it is often referred to as data mining.

But is it right for customer segmentation?

The short answer is yes. Customer segmentation results from the right mix of factors. For example, it can be due to the offer made by the company, the product received by the customer, the environment in which the customer was located at the time the offer was made, and the product or service performed by the product or service recipient. For example, a poorly performing customer relationship can be attributed to a number of different factors, such as the offer made by the company. Good customer profiling results from strong ML methods to cluster the mix of factors right for customer profiling.

There are many ways to perform clustering. The typical technique is to first analyze the data on various data points and dimensions. Then, you perform clustering on these data points, learning new things about the customers through the clusters (i.e., their interactions with the products offered by the company). This is called latent-space based data mining, since in various methods, high dimensional attributes are projected into a low dimensional space. In general, research on models has also focused on dimensionality reduction, i.e. on the number and types of features that the model can process at once in computing to get a meaningful supplied data clustering.

One of the most popular techniques for dimensionality reduction in customer segmentation is Principal Component Analysis (PCA). This is a popular technique in data mining as it allows you to cluster the data and obtain good clustering results with a relatively small number of features. It is a technique that works for continuous and discrete data. Principal Component Analysis (PCA) is a popular method of data mining because of the wide range of features that it can process at once. You can process data in a certain number of dimensions and still get interesting and meaningful clusters. You can then perform linear or non-linear analyses in order to get the most out of your machine learning model and segmentation.

Deep Embedded Clustering (DEC) is a deep learning technique that was originally developed to perform dimensionality reduction in data mining. It has since spread to other areas. A recent analysis of deep learning and clustering concluded that Deep Clustering (DC) is an effective high-performance machine learning method for clustering of data. Deep Embedded Clustering (DEC) is a novel deep learning technique because it allows you to embed data representations in higher dimensional data. In technical terms, embedding data is where you compress and transform the data before you analyze it. In general, data compression and data transformation are very important for moving data from one format to another. In customer segmentation, data compression and data transformation are very important because it allows you to learn more about the customers through their interactions with the products offered by the company. This allows you to e.g., make better product recommendations.

Some research into segmentation and customer profiling has focused on models, where the input data is a single variable to e.g., only illustrate a single process, or product-customer relationships. However, most recent research has concentrated on multi-variable models, where the input data consists of multiple variables to e.g., to illustrate multi-processes in customer, product, service, or financial relationships. Here, the whole the whole input data and output is more complex to process and more abstract.

Time series are more spatially and temporally varied than discrete time courses. It is therefore also possible and efficient to perform clustering on time-series, which allows you to obtain realistic and reliable clustering results.

What are the pros and cons of each approach?

There are many more approaches for clustering specifically used in marketing. In the previous sections of this article, we tried to describe some of the pros and cons of each approach in detail.

Name	Zweck	Ablauf	Anbieter
CookieConsent	Speichert Ihre Einwilligung zur Verwendung von Cookies.	30 Tage	WU
site-popup	Speichert ob ein Popup ausgefüllt oder geschlossen wurde.	30 Tage	WU
BACH_PRXY_ID	Zur Anzeige von einigen WU-spezifischen Inhalten müssen Informationen teilweise von nachgelagerten WU-System abgefragt werden. Notwendig um die Antwort einer Anfrage zuordnen zu können.	20 Jahre	WU
BACH_PRXY_SN	Zur Anzeige von einigen WU-spezifischen Inhalten müssen Informationen teilweise von nachgelagerten WU-System abgefragt werden. Notwendig um die Antwort einer Anfrage zuordnen zu können.	Session	WU
fe_typo_user	Notwendig für die Anmeldung und Zugriff auf geschützte Inhalte oder zur Bearbeitung des eigenen Profils.	Session	WU
be_typo_user	Notwendig für die Anmeldung und Bearbeitung von Inhalten im TYPO3 Backend.	Session	WU
be_lastLoginProvider	Speichert die zuletzt verwendete Methode zur Anmeldung für das TYPO3-Backend.	90 Tage	WU
ASP.NET_SessionId	Notwendig, um die Zuordnung von Besucher zu Formulareingabe sicherstellen zu können.	Session	WU (forms.wu.ac.at)
__RequestVerificationToken	Notwendig, um die Formulareingabe gegenüber Angriffen abzusichern.	Session	WU (forms.wu.ac.at)
ESRASOFTSID	Notwendig zur Identifizierung des angemeldeten Benutzers im Kursanmeldungsystem des Business Language Centers.	Session	WU (esrasoft.wu.ac.at)
esraSoftWiData	Notwendig um ausgewählte Sprache und Sprachkurse eines Besuchers nachverfolgen zu können.	Session	WU (esrasoft.wu.ac.at)
esraSimpleSAMLAuthToken	Notwendig zur Identifizierung als WU-Angehörige/r für Kursanmeldung.	Session	WU (esrasoft.wu.ac.at)
esraSimpleSAML	Notwendig zur Identifizierung als WU-Angehörige/r für Kursanmeldung.	Session	WU (esrasoft.wu.ac.at)
SimpleSAML	Notwendig zur Identifizierung als WU-Angehörige/r für Kursanmeldung.	Session	WU (esrasoft.wu.ac.at)

Name	Zweck	Ablauf	Anbieter
_pk_id	Eindeutige Kennzeichnung eines Besuchers durch Matomo.	30 Tage	WU (piwik.wu.ac.at)
_pk_ref	Speicherung des Referrers durch Matomo.	6 Monate	WU (piwik.wu.ac.at)
_pk_ses	Speicherung von Informationen über den aktuellen Webseitenbesuch durch Matomo.	1 Stunden	WU (piwik.wu.ac.at)
_gcl_au	Enthält eine zufallsgenerierte User-ID.	3 Monate	Google
AMP_TOKEN	Enthält ein Token, das verwendet werden kann, um eine Client-ID vom AMP-Client-ID-Service abzurufen. Andere mögliche Werte zeigen Opt-out, Anfrage im Gange oder einen Fehler beim Abrufen einer Client-ID vom AMP Client ID Service an.	1 Jahr	Google
_dc_gtm_--property-id--	Wird von DoubleClick (Google Tag Manager) verwendet, um die Besucher nach Alter, Geschlecht oder Interessen zu identifizieren.	2 Jahre	Google
_ga	Contains a randomly generated user ID. Using this ID, Google Analytics can recognize returning users on this website and merge the data from previous visits.	2 Jahr	Google
_gat_gtag	Certain data is only sent to Google Analytics a maximum of once per minute. As long as it is set, certain data transfers are prevented.	1 Minute	Google
_gid	Contains a randomly generated user ID. Using this ID, Google Analytics can recognize returning users on this website and merge the data from previous visits.	24 Stunde	Google
_gac_gb	Contains campaign-related information for the user. If Google Analytics and Google Ads accounts are linked, the conversion tags on the Google Ads website read this cookie.	90 Tag	Google
_dc_gtm	Used to throttle the request rate.	1 Minute	Google
IDE	Enthält eine zufallsgenerierte User-ID. Anhand dieser ID kann Google den User über verschiedene Websites domainübergreifend wiedererkennen und personalisierte Werbung ausspielen.	1 Jahr	Google
player	Dieses Cookie speichert nutzerspezifische Einstellungen, bevor ein eingebettetes Vimeo-Video abgespielt wird. Das bedeutet, dass beim nächsten Anschauen eines Vimeo-Videos die bevorzugten Einstellungen geladen werden.	1 Jahr	Vimeo
vuid	Dieser Cookie wird dazu eingesetzt, um den Nutzungsverlauf des Benutzers zu speichern.	2 Jahr	Vimeo
__cf_bm	Dieses Cookie wird verwendet, um zwischen Menschen und Bots zu unterscheiden. Dies ist für Vimeo notwendig, um, um gültige Daten über die Nutzung des Service zu sammeln	1 Tag	Vimeo
_uetvid	Dieses Cookie wird gesetzt, um die Nutzung des Vimeo Videoplayers zu ermöglichen	1 Jahr	Vimeo
_tt_enable_cookie	Dieses Cookie wird verwendet, um die Vimeo-Videoeinbettung auf der WU-Website zu ermöglichen und für andere nicht näher bezeichnete Zwecke.	1 Jahr	Vimeo
afUserId	Dieses Cookie sammelt Daten von Nutzer*innen, die mit eingebetteten Vimeo-Videos interagieren.	2 Jahre	Vimeo
_abexps	Dieses Cookie speichert getroffene Einstellungen des/ der Nutzerin, zB. voreingestellte Sprache, Region oder Benutzernamen sowie Interaktionsdaten des/ der Nutzerin	10 Monate	Vimeo
_clck	Dieses Cookie ermöglicht die Nutzung des eingebetteten Vimeo Video Players	1 Jahr	Vimeo
has_logged_in	Dieses Cookie speichert Anmeldeinformationen und ob sich der/ die Nutzer*in jemals angemeldet hat.	10 Jahre	Vimeo
language	Dieses Cookie merkt sich die Spracheinstellung des/ der Nutzer*in. So wird sichergestellt, dass Vimeo in der vom Nutzer ausgewählten Sprache erscheint.	11 Jahre	Vimeo
_ttp	Dieser Cookie wird gesetzt, um die Nutzung des Vimeo Videoplayers zu ermöglichen	1 Jahr	Vimeo
sd_client_id	Dieses Cookie speichert Daten über die aktuellen Videoeinstellungen des/ der Benutzer*in und einen persönliches Identifikationstoken	2 Jahr	Vimeo
_rdt_uuid	Dieses Cookie sammelt Daten über die Interaktionen der Benutzer*innen auf Websites, auf denen ein Vimeo-Video eingebettet ist.	3 Monate	Vimeo
vimeo_cart	Dieses Cookie wird verwendet, um zu überprüfen, wie oft ein Video abgespielt wurde	10 Jahre	Vimeo
OptanonConsent	Dieses Cookie speichert Informationen über den Zustimmungsstatus (Consent) eines Besuchers.	1 Jahr	Vimeo
_scid	Dieses Cookie wird verwendet, um einem/einer Benutzer*in eine eindeutige ID zuzuweisen	10 Monate	Vimeo
hjSessionBenutzer_	Wird gesetzt, wenn ein Benutzer zum ersten Mal eine Seite aufruft. Speichert die Hotjar-Benutzer-ID, die für diese Seite eindeutig ist. Hotjar verfolgt Benutzer nicht über verschiedene Websites hinweg.Stellt sicher, dass Daten von nachfolgenden Besuchen auf derselben Website derselben Benutzer-ID zugeordnet werden.	1 Jahr	Hotjar
_hjid	Dies ist ein altes Cookie, das wir nicht mehr setzen, aber wenn ein Benutzer es noch in seinem Browser hat, werden wir seinen Wert wiederverwenden und zu _hjSessionUser_{site_id} migrieren. Wird gesetzt, wenn ein Benutzer zum ersten Mal eine Seite aufruft. Behält die Hotjar-Benutzer-ID bei, die für diese Seite eindeutig ist. Stellt sicher, dass die Daten von nachfolgenden Besuchen derselben Seite derselben Benutzer-ID zugeordnet werden.	1 Jahr	Hotjar
_hjFirstSeen	Identifiziert die erste Sitzung eines neuen Benutzers. Wird von Aufzeichnungsfiltern verwendet, um neue Benutzersitzungen zu identifizieren. Speicherdauer Verlängert sich bei Benutzeraktivität.	30 Minuten	Hotjar
_hjHasCachedUserAttributes	Ermöglicht es nachzuvollziehen, ob die Daten in _hjUserAttributes Local Storage auf dem neuesten Stand sind oder nicht.	Session	Hotjar
_hjUserAttributesHash	Ermöglicht es nachzuvollziehen, wann sich ein Benutzerattribut geändert hat und aktualisiert werden muss.	2 Minuten	Hotjar
_hjBenutzerAttribute	Speichert Benutzerattribute, die über die Hotjar Identify API gesendet werden. Keine explizite Gültigkeitsdauer.	Session	Hotjar
hjViewportId	Speichert Benutzer-Viewport-Details.	Session	Hotjar
hjActiveViewportIds	Speichert die IDs der aktiven Benutzer-Viewports. Speichert einen expirationTimestamp, der zur Validierung aktiver Ansichtsfenster bei der Skriptinitialisierung verwendet wird.	Session	Hotjar
_hjSession_	Enthält die aktuellen Sitzungsdaten. Stellt sicher, dass nachfolgende Anfragen im Sitzungsfenster der gleichen Sitzung zugeordnet werden.	30 Minuten	Hotjar
_hjSessionTooLarge	Veranlasst Hotjar, die Datenerfassung zu beenden, wenn eine Sitzung zu viel wird. Wird automatisch durch ein Signal des Servers bestimmt, wenn die Sitzung das Limit überschreitet.	1 Stunde	Hotjar
_hjSessionResumed	Wird gesetzt, wenn eine Sitzung/Aufzeichnung nach einer Unterbrechung der Verbindung wieder mit den Hotjar-Servern verbunden wird.	Session	Hotjar
_hjCookieTest	Prüft, ob der Hotjar Tracking Code Cookies verwenden kann. Wenn ja, wird ein Wert von 1 gesetzt. Wird fast sofort nach seiner Erstellung gelöscht.	Session	Hotjar
_hjLocalStorageTest	Prüft, ob der Hotjar Tracking Code Local Storage verwenden kann. Wenn ja, wird der Wert 1 gesetzt. Die in _hjLocalStorageTest gespeicherten Daten haben keine Verfallszeit, werden aber fast sofort nach ihrer Erstellung gelöscht.	Keine	Hotjar
_hjSessionStorageTest	Prüft, ob der Hotjar Tracking Code Session Storage verwenden kann. Wenn ja, wird ein Wert von 1 gesetzt.	Keine	Hotjar
_hjIncludedInPageviewSample	Wird gesetzt, um festzustellen, ob ein Nutzer in die Datenstichprobe einbezogen wird, die durch das Seitenaufruflimit Ihrer Website definiert ist.	2 Minuten	Hotjar
_hjIncludedInSessionSample_	Wird gesetzt, um festzustellen, ob ein Nutzer in die Datenstichprobe einbezogen wird, die durch das tägliche Sitzungslimit Ihrer Website definiert ist.	2 Minuten	Hotjar
_hjAbsoluteSessionInProgress	Wird verwendet, um den ersten Seitenaufruf eines Benutzers zu erkennen.	30 Minuten	Hotjar
_hjTLDTest	_hjTLDTest-Cookie für verschiedene URL-Teilstrings, bis dies fehlschlägt. Ermöglicht, den allgemeinsten Cookie-Pfad zu ermitteln, der anstelle des Hostnamens der Seite zu verwenden ist. Das bedeutet, dass Cookies über Subdomänen hinweg gemeinsam genutzt werden können (sofern zutreffend). Nach dieser Prüfung wird das Cookie entfernt.	Session	Hotjar

Name	Zweck	Ablauf	Anbieter
test_cookie	Wird testweise gesetzt, um zu prüfen, ob der Browser das Setzen von Cookies erlaubt. Enthält keine Identifikationsmerkmale.	15 Minute	Google
IDE	Enthält eine zufallsgenerierte User-ID. Anhand dieser ID kann Google den User über verschiedene Websites domainübergreifend wiedererkennen und personalisierte Werbung ausspielen.	1 Jahr	Google
_gcl_au	Enthält eine zufallsgenerierte User-ID.	90 Tag	Google
_gcl_aw	Dieses Cookie wird gesetzt, wenn ein User über einen Klick auf eine Google Werbeanzeige auf die Website gelangt. Es enthält Informationen darüber, welche Werbeanzeige geklickt wurde.	90 Tag	Google
xs	Wird verwendet, um eine Facebook-Sitzung aufrechtzuerhalten. Es funktioniert in Verbindung mit dem c_user-Cookie, um die Identität des Users bei Facebook zu authentifizieren.	1 Jahr	Facebook
fr	Wird verwendet, um Werbeanzeigen auszuliefern und ihre Relevanz zu messen und zu verbessern.	90 Tag	Facebook
m_pixel_ratio	Performance-Cookie, das von Facebook mit Facebook-Pixel verwendet wird.	Session	Facebook
wd	Wird für Analyse-Zwecke verwendet. Unter Anderem werden technische Parameter protokolliert (z.B. Seitenverhältnis und Abmessungen des Bildschrims), damit facebook Apps korrekt dargestellt werden können.	7 Tag	Facebook
dpr	Wird für Analyse-Zwecke verwendet. Unter Anderem werden technische Parameter protokolliert (z.B. Seitenverhältnis und Abmessungen des Bildschirms), damit facebook Apps korrekt dargestellt werden können.	7 Tag	Facebook
sb	Wird verwendet, um Browser-Details und Sicherheitsinformationen des Facebook-Kontos zu speichern.	2 Jahr	Facebook
dbln	Wird verwendet, um Browser-Details und Sicherheitsinformationen des Facebook-Kontos zu speichern.	2 Jahr	Facebook
spin	Cookie für Werbezwecke und die Berichterstattung über soziale Kampagnen.	Session	Facebook
presence	Enthält den "Chat"-Status eines angemeldeten Benutzers.	1 Monat	Facebook
x-referer	Performance-Cookie, das von Facebook in Kombination mit Facebook-Pixel verwendet wird.	Session	Facebook
cppo	Cookie für statistische Zwecke.	90 Tag	Facebook
datr	Identifiziert den Browser für Zwecke der Sicherheit und Website-Integrität, einschließlich der Kontowiederherstellung und Identifizierung von möglicherweise kompromittierten Konten.	2 Jahr	Facebook
locale	Speichert Spracheinstellungen	Session	Facebook
_fbp	Ein Cookie für Facebook-Werbung, das verwendet wird, um die Relevanz zu tracken und zu verbessern sowie Serienanzeigenprodukte auf Facebook bereitzustellen.	90 Tag	Facebook
_fbc	Ein Cookie für Facebook-Werbung, das verwendet wird, um die Relevanz zu tracken und zu verbessern sowie Serienanzeigenprodukte auf Facebook bereitzustellen.	90 Tag	Facebook
UserMatchHistory	Mit diesem Cookie werden die IDs von LinkedIn Ads synchronisiert.	30 Tag	LinkedIn
AnalyticsSyncHistory	Mit diesem Cookie wird der Zeitpunkt der Synchronisierung des Nutzers mit dem Cookie „lms_analytics“ gespeichert.	30 Tag	LinkedIn
li_oatml	Mit diesem Cookie werden LinkedIn Mitglieder außerhalb von LinkedIn zu Werbe- und Analysezwecke identifiziert.	30 Tag	LinkedIn
lms_ads	Mit diesem Cookie werden LinkedIn Mitglieder außerhalb von LinkedIn identifiziert.	30 Tag	LinkedIn
lms_analytics	Mit diesem Cookie werden LinkedIn Mitglieder zu Analysezwecken identifiziert.	30 Tag	LinkedIn
li_fat_id	Bei diesem Cookie handelt es sich um eine indirekte Mitgliederkennung, die für Conversion-Tracking, Retargeting und Analysen verwendet wird.	30 Tag	LinkedIn
li_sugr	Mit diesem Cookie werden wahrscheinlichkeitstheoretische Übereinstimmungen der Identität eines Nutzers festgestellt.	90 Tag	LinkedIn
U	Bei diesem Cookie handelt es sich um eine Browserkennung für Nutzer.	3 Monat	LinkedIn
_guid	Mit diesem Cookie wird ein LinkedIn Mitglied für Werbung über Google Ads identifiziert.	90 Tag	LinkedIn
BizographicsOptOut	Mit diesem Cookie wird der Ablehnungsstatus für das Tracking durch Drittanbieter ermittelt.	10 Jahr	LinkedIn
lidc	Dieses Cookie erleichtert die Auswahl des Datenzentrums von LinkedIn.	24 Stunden	LinkedIn
aam_uuid	Dieses Cookie dient der ID-Synchronisierung mit Adobe Audience Manager.	30 Tage	LinkedIn
AMCV_XXX_at_AdobeOrg	Dieses Cookie enthält eine eindeutige Kennung für die Adobe Experience Cloud.	180 Tage	LinkedIn
li_mc	Dieses Cookie wird als temporärer Cache verwendet. Es dient dazu, Einwilligungsinformationen des/ der Nutzer*in aus der Datenbank client-seitig verfügbar zu haben.	2 Jahre	LinkedIn
lang	Dieses Cookie merkt sich die Spracheinstellung des/ der Nutzer*in. So wird sichergestellt, dass die LinkedIn.com-Website in der vom Nutzer ausgewählten Sprache erscheint.	Session	LinkedIn
twll	Dieses Cookie wird gesetzt, wenn X auf der Seite eingebettet ist. X sammelt Daten, die hauptsächlich für Tracking und Targeting verwendet werden.	4 Jahr	X
secure_session	Dieses Cookie wird gesetzt, wenn X auf der Seite eingebettet ist. z.B. X's Like- oder Sharing-Funktionen.	14 Jahr	X
guest_id	Dieses Cookie wird von X gesetzt, wenn ein Besucher Inhalte der WU-Website auf X teilt.	2 Jahr	X
personalization_id	Dieses Cookie wird von X gesetzt, um die Leistung von X-Werbekampagnen in Browsern und Geräten eines Benutzers zu messen.	2 Jahr	X
remember_checked	Dieses Cookie wird gesetzt, wenn X auf der Seite eingebettet ist. X sammelt Daten, die hauptsächlich für Tracking und Targeting verwendet werden.	4 Jahr	X
remember_checked_on	Dieses Cookie wird gesetzt, wenn X auf der Seite eingebettet ist. z.B. X's Like- oder Sharing-Funktionen.	4 Jahr	X
mbox	Dieses Cookie dient der Identifizierung von X-Benutzer*innen, der Analyse der Interaktion mit dem X-Dienst und der Werbung innerhalb des Dienstes	2 Jahre	X
guest_id_ads	Dieses Cookie wird aufgrund der X-Integration auf der Website und zum Teilen von Inhalten in sozialen Medien gesetzt	10 Monate	X
d_prefs	Dieses Cookie wird verwendet, um den LogIn Status zu überprüfen	90 Tage	X
ct0	Dieses Cookie wird aufgrund der X-Integration auf der Website und zum Teilen von Inhalten in sozialen Medien gesetzt	10 Monate	X
kdt	Dieser Cookie wird verwendet, um den Anmeldestatus des/ der Nutzer*in auf X zu überwachen	10 Monate	X
guest_id_marketing	Dieses Cookie wird für Tracking und Analyse-Zwecke gesetzt.	10 Monate	X
twid	Dieses Cookie überprüft ob Sie während einer Browser Session auf X eingelogged sind.	1 Jahr	X
auth_token	Dieses Cookie wird für die Authentifizierung benötigt und überprüft, ob der/ die Nutzer*in eingelogged ist	10 Monate	X
external_referer	Dieses Cookie sammelt Statistik-Daten, unter anderem wie oft Sie X besuchen und wie lange ein/e Nutzer*in auf X verweilt	1 Tag	X
NID	Dieses Cookie enthält eine eindeutige ID, über die nutzerspezifische Einstellungen und andere Informationen gespeichert werden, insbesondere Ihre bevorzugte Sprache, wie viele Suchergebnisse pro Seite angezeigt werden sollen und ob der Google SafeSearch-Filter aktiviert sein soll.	6 Monat	YouTube
1P_JAR	Dieser Google-Cookie wird zur Optimierung von Werbung eingesetzt, um für Nutzer relevante Anzeigen bereitzustellen, Berichte zur Kampagnenleistung zu verbessern oder um zu vermeiden, dass ein Nutzer dieselben Anzeigen mehrmals sieht.	1 Monat	YouTube
CONSENT	Dieses Cookie wird verwendet, um die Werbedienste von Google zu unterstützen.	20 Jahr	YouTube
OTZ	Aggregierte Analyse der Webseiten Besucher.	17 Tag	YouTube