3 Cuprins Introducere… [625889]
UNIVERSITATEA DIN ORADEA FACULTATEA DE INGINERIE ELECTRICĂ ȘI TEHNOLOGIA INFORMAȚIEI PROGRAMUL DE STUDIU MANAGEMENT IN TEHNOLOGIA INFORMATIEI DISERTATIE COORDONATOR ȘTIINȚIFIC Conf. Dr. Ing. PATER MIRELA ABSOLVENT: [anonimizat] 2018
UNIVERSITATEA DIN ORADEA FACULTATEA DE INGINERIE ELECTRICĂ ȘI TEHNOLOGIA INFORMAȚIEI PROGRAMUL DE STUDIU MANAGEMENT IN TEHNOLOGIA INFORMATIEI Segmentarea utilizatorilor unui magazin online folosind data mining COORDONATOR ȘTIINȚIFIC Conf. Dr. Ing. PATER MIRELA ABSOLVENT: [anonimizat] 2018
UNIVERSITATEA DIN ORADEA FACULTATEA DE INGINERIE ELECTRICĂ ȘI TEHNOLOGIA INFORMAȚIEI DEPARTAMENTUL CALCULATOARE ȘI TEHNOLOGIA INFORMAȚIEI TEMA Lucrare de Finalizare a studiilor a student: [anonimizat] 1). Tema lucrării de finalizare a studiilor: Segmentarea utilizatorilor unui magazin online folosind data mining 2). Termenul pentru predarea lucrării: 03.07.2018 3). Elemente inițiale pentru elaborarea lucrării de finalizare a studiilor: Baze de date, marketing si statistica 4). Conținutul lucrării de finalizare a studiilor: Introducere 1. Data mining 2. Segmentarea clienților și minarea datelor 3. Studiu de caz: Segmentarea utilizatorilor unui magazin online folosind data mining 4. Concluzii Bibliografie 5). Material grafic: Figuri, Diagrame și Capturi de ecran 6). Locul de documentare pentru elaborarea lucrării: Biblioteca Universității din Oradea, Internet și Laboratorul de calculatoare 7). Data emiterii temei: 01.10.2017 Coordonator științific Conf. Dr. Ing. PATER MIRELA
3 Cuprins Introducere ……………………………………………………………………………………………………………….. 4 Capitolul I. Data mining ……………………………………………………………………………………………. 6 1.1 Descoperirea cunoștințelor și exploatarea datelor ………………………………….. 6 1.2 Sarcinile de exploatare a datelor ……………………………………………………………. 7 1.3 Data mining și analiza RFM ………………………………………………………………….. 8 1.4 Data mining în CRM …………………………………………………………………………….. 9 Capitolul II. Segmentarea clienților și minarea datelor …………………………………………….. 12 Capitolul III. Studiu de caz: Segmentarea utilizatorilor unui magazin online ……………. 18 3.1 Introducere …………………………………………………. Error! Bookmark not defined. 3.2 Stadiul de afaceri și datele asociate ……………………………………………………… 20 3.3 Pre-procesarea datelor ………………………………………………………………………… 21 3.4 Analiză cluster bazată pe model RFM …………………………………………………. 23 3.4 Înțelegerea clusterelor …………………………………………………………………………. 28 3.4 Recomandări ………………………………………………………………………………………. 34 3.5 Concluzii studiu ………………………………………………………………………………….. 35 Capitolul IV. Concluzii ……………………………………………………………………………………………. 36 Bibliografie ……………………………………………………………………………………………………………… 37
4 Introducere Clienții sunt cea mai importantă parte a unei organizații. Nu pot exista perspective de afaceri fără clienți mulțumiți care rămân loiali și care își dezvoltă relația cu organizația. De aceea, o organizație ar trebui să utilizeze o anumită strategie pentru tratarea clienților. Scopul principal al fiecărei industrii este înțelegerea fiecărui client individual si utilizarea acesteia pentru a ușura decizia clientul de a face afaceri cu aceștia, nu cu concurenții. Subiectul multor subiecte de carte este Gestionarea relațiilor cu clienții (CRM). CRM se concentrează în mod natural asupra clienților stabiliți. CRM este strategia pentru construirea, gestionarea și consolidarea relațiilor cu clienții loiali și de lungă durată. CRM ar trebui să fie o abordare centrată pe client și bazată pe cunoașterea clienților [1]. Multe companii utilizează adesea tehnici de extragere a datelor pentru CRM, care ajută la oferirea unui serviciu personalizat care să vizeze nevoile clienților individuali, în loc de marketing în masă. Prin studierea modelelor de cumpărare și a legăturilor pe web, companiile pot face reclame și promoții la profilurile clienților, astfel încât clienții să fie mai puțin probabil să fie deranjați de cereri nedorite cum ar fi mesajele nedorite. Aceste acțiuni pot duce la economii substanțiale de cost pentru companii. Clienții continuă să beneficieze de faptul că este mai probabil să fie informați cu privire la ofertele care sunt în realitate de interes, ceea ce duce la o mai mică pierdere a timpului personal și o mai mare satisfacție [2]. Există mai multe pachete software CRM și de regulă acestea sunt utilizate pentru a urmări interacțiunile cu clienții, inclusiv gestionarea campaniilor de marketing și a centrelor de apel. Aceste pachete suportă de obicei procese în vânzări, marketing și servicii pentru clienți, automatizând comunicările și interacțiunile cu clienții. Cu toate acestea, aceste pachete sunt unelte în care ar trebui să fie utilizate pentru a sprijini strategia de gestionare eficientă a clienților [3]. Organizațiile trebuie să obțină o perspectivă asupra clienților, nevoilor lor și doresc prin analiza datelor să reușească să obțină aceasta. Cu alte cuvinte, organizațiile analizează informațiile despre clienți pentru a răspunde mai bine obiectivelor și pentru a transmite mesajul corect clientului potrivit [4]. Aceasta implică utilizarea metodelor de extragere a datelor pentru a evalua valoarea clienților, a înțelege și a prezice comportamentul acestora. Ei
5 analizează modele pentru a extrage cunoștințe pentru a optimiza relațiile cu clienții. Rolul metodelor de extragere a datelor în marketing este destul de nou. Deși acest domeniu se extinde rapid, extracția de date este încă o chestiune străină pentru mulți dintre cei care au încredere în experiențele lor. Tehnicile de extragere a datelor nu pot înlocui rolul semnificativ al experților în domenii și cunoștințele lor de afaceri. Putem obține rezultate utile prin combinarea tehnicilor de extragere a datelor și a expertizei în afaceri. De exemplu, putem combina experiența personală în domeniu sau informațiile afacerii cu un model de exploatare a datelor, pentru a obține rezultate mai reușite. Mai mult, aceste rezultate ar trebui întotdeauna evaluate de experți în afaceri. Astfel, cunoștințele de afaceri pot contribui la îmbogățirea rezultatelor de data mining [5] [6]. Pe de altă parte, tehnicile de extragere a datelor pot descoperi modele pe care chiar și cei mai experimentați oameni de afaceri le-ar fi ratat. Ca rezultat, combinarea expertizei în domeniul afacerilor cu puterea tehnicilor de extragere a datelor poate ajuta organizațiile să obțină un avantaj competitiv în eforturile lor de a optimiza managementul clienților. Această lucrare se concentrează pe subiectul segmentării clienților folosind tehnici de extragere a datelor. Următorul capitol este dedicată tehnicilor de modelare în extragerea datelor. Capitolul curent reprezintă o introducere în conceptele cheie folosite în această lucrare. Segmentarea clientului prin tehnicile de extragere a datelor este subiectul capitolului 2. Capitolul 3 prezintă un studiu de caz prin care se exemplifică segemntarea clientilor unui magazin online folosind extragerea datelor utilizand tehnica RFM și clustere de tip k. Ultimul capitol este cel dedicat concluziilor.
6 Capitolul I. Data mining 1.1 Descoperirea cunoștințelor și exploatarea datelor Explorarea datelor este considerată cel mai important pas în procesul de descoperire a cunoștințelor. Extracția de date este procesul de extragere a modelelor interesante din cantități mari de date [7]. Extracția datelor vizează rezolvarea problemelor prin analizarea datelor deja existente în seturile de date. Oferă instrumente pentru învățarea automată din datele istorice și modele în curs de dezvoltare pentru a prezice tendințele și comportamentele viitoare. Esența minelor de date este procesul netrivial de identificare a modelelor valide, noi, potențial utile și în cele din urmă ușor de înțeles în date. Funcționalitățile de exploatare a datelor sunt utilizate pentru a specifica tipul de modele care se găsesc în sarcinile de extragere a datelor [8]. În general, sarcinile de extragere a datelor pot fi clasificate în două categorii: descriptive și predictive. Modelele descriptive de explorare a datelor încearcă să extragă modele utile care pot descrie datele minate și pot explora proprietățile și caracterizează proprietățile generale ale datelor din baza de date. Sarcinile miniere predictive efectuează inferență asupra datelor curente pentru a face predicții, cu alte cuvinte, să încerce să prezică valori necunoscute sau tendințe sau comportamente viitoare, în funcție de alte variabile sau valori istorice prezentate în baza de date minată [7]. Exploatarea datelor este folosită pe scară largă de diferite companii și organizații, în special în domeniul medical, retail, marketing, finanțe, comunicare și știință. Permite acestor companii să obțină informații despre boli, comportamentul vânzărilor, satisfacția clienților și profiturile corporațiilor. Folosind exploatarea datelor, organizațiile pot crește rentabilitatea interacțiunilor cu pacienții, clienții și pot îmbunătăți managementul riscului în marketing. Modelele extrase folosind miningul de date ajută organizațiile să aibă decizii mai bune. În subcapitolul următor, vom examina o serie de sarcini de extragere de date diferite.
7 1.2 Sarcinile de exploatare a datelor Folosirea sarcinii de extragere a datelor depinde de domeniul de aplicare și de structura modelelor care urmează a fi extrase. Trebuie să știm că nu există o singură metodă potrivită pentru toate problemele posibile. Metoda universală este o fantezie idealistă. Există câteva sarcini de bază de extragere a datelor, cum ar fi regulile de asociere, modelul secvențial, gruparea și clasificarea. Descoperirea tiparelor frecvente, a asocierii și a relațiilor de corelație între cantități uriașe de date sunt utile în multe aplicații. Regulile de extracție a algoritmilor de asociere utilizează una dintre cele două abordări comune: abordarea Breadth First Search (BFS) și abordarea Depth First Search (DFS). Au fost elaborați mulți algoritmi eficienți și scalabili pentru exploatarea regulată, din care pot fi derivate reguli de asociere și corelare. Modelele secvențiale miniere sunt foarte asemănătoare cu regulile asociației miniere. Principala diferență între modelele secvențiale și regulile de asociere este că elementul de timp este luat în considerare (ordinea evenimentelor). Modelele secvențiale indică corelația dintre tranzacții, în timp ce regulile de asociere reprezintă relații intra-tranzacționare. Modelele secvențiale pot fi utilizate pe scară largă în domenii diferite, cum ar fi modelele de acces minier pentru utilizatori unui site web, folosind istoricul simptomelor pentru a prezice anumite tipuri de boli, de asemenea prin utilizarea minelor secvențiale, comercianții cu amănuntul pot eficientiza controlul inventarului. Clustering reprezintă procesul de grupare a obiectelor în clustere astfel încât obiectele din același cluster sunt similare, iar obiectele din diferite clustere sunt diferite. Majoritatea eforturilor de a produce o structură de grup destul de simplă pornind de la date complexe necesită încă o măsură de apropiere sau similitudine. Clustering-ul este folosit în multe domenii, inclusiv inteligența artificială, biologie, CRM, procesarea imaginilor, învățarea mașinilor, marketingul, medicina și statisticile. Clustering-ul are multe metode și tehnici diferite, cum ar fi metodele de partiționare, metode ierarhice, metode bazate pe densitate, metode bazate pe grilă și metode bazate pe modele. Clasificarea și predicția sunt două forme de analiză a datelor care pot fi folosite pentru a extrage modele care descriu clase de date importante sau pentru a prezice tendințele viitoare ale datelor. Clasificarea, cunoscută și sub numele de învățare supravegheată, este procesul de identificare a unui set de modele sau funcții care descriu și disting clase de date sau concepte în care modelele derivă pe baza unui set de date de antrenament. Clasificatorii de arbori de decizie, clasificatorii Bayesieni și clasificatorii bazați pe reguli sunt tehnici de bază și bine cunoscute pentru clasificarea datelor. Există niște algoritmi de clasificare complexă, cum ar fi mașina de suport vector (SVM).
8 1.3 Data mining și analiza RFM RFM reprezintă valori de recurență, frecvență și valori monetare. Analiza RFM este o tehnică de marketing utilizată pentru analiza comportamentului clienților, cum ar fi cât de recent a cumpărat un client (recenta), cât de des achiziționează clientul (frecvența) și cât costă clientul (monetar). Este o metodă utilă de a îmbunătăți segmentarea clienților prin împărțirea clienților în diverse grupuri pentru servicii de personalizare viitoare și identificarea clienților care au mai multe șanse de a răspunde la promoții. În ultimii ani, au fost propuse și aplicații de exploatare a datelor bazate pe concepte RFM pentru diferite domenii, cum ar fi securitatea calculatorului, pentru industria automobilelor și pentru industria electronică. Cazurile de cercetare a extracției de date cu variabilele RFM includ diferite tehnici de exploatare a datelor, cum ar fi rețeaua neuronală și arborele de decizie, teoria setului brut, harta autoorganizării, CHAID, algoritmul genetic și mineritul secvențial. Integrarea analizelor RFM și a tehnicilor de extragere a datelor oferă informații utile pentru clienții actuali și noi. Clustering bazat pe atributele RFM oferă cunoștințe mai comportamentale ale nivelurilor reale de marketing ale clienților decât alte analize de cluster. Regulile de clasificare descoperite de variabilele demografice ale clienților și variabilele RFM oferă cunoștințe utile managerilor pentru a anticipa comportamentul viitor al clienților, cum ar fi cât de curând va cumpăra clientul, cât de des va cumpăra clientul și ce valoare va achiziționa. Asocierea regulilor de asociere bazate pe măsurile RFM analizează relațiile dintre proprietățile produsului și contribuțiile / loialitățile clienților pentru a oferi o recomandare mai bună pentru a satisface nevoile clienților.
9 1.4 Data mining în CRM Suntem capabili să folosim tehnici de extragere a datelor pentru a analiza informațiile despre clienți, dar minierele de clustere și de asociere sunt cele mai populare în acest domeniu. Ideea principală a minelor de date pentru CRM este că datele din trecut pot conține informații care vor fi utile în viitor. Funcționează deoarece comportamentul clientului capturat în datele companiei nu este întâmplător, ci reflectă nevoile, preferințele, tendințele și tratamentele diferite ale clienților. Scopul minelor de date este de a extrage modele în date istorice. Sarcina nu este ușoară, deoarece modelele nu sunt întotdeauna puternice, iar semnalele trimise de clienți sunt zgomotoase și confuze. Separarea semnalului de zgomot este un rol important și dificil al minelor de date. De exemplu, extracția de date poate ajuta la afișarea unor segmente distincte de clienți, facilitând dezvoltarea de noi produse personalizate și ofertele de produse care să răspundă mai bine priorităților specifice ale clienților. Minatul de date poate oferi o perspectivă a clienților, care este vitală pentru a crea o strategie CRM eficientă. Aceasta poate ajuta la interacțiunile personalizate cu clienții și, prin urmare, creșterea satisfacției și a relațiilor profitabile cu clienții prin analiza datelor. Acesta poate sprijini un management optimizat al clienților pe parcursul tuturor etapelor ciclului de viață al clientului, de la dobândirea și stabilirea unei relații puternice cu prevenirea uzurii și cu câștigarea clienților pierduți. Cuvintele simple sunt responsabile pentru obținerea, dezvoltarea și păstrarea clienților. Modelele de extragere a datelor vă pot ajuta în toate aceste sarcini, după cum se arată în Tabelul 1.1. Sarcini de modelare Tehnici de modelare Exemple de aplicații Asociații Aprioritate, FP-Growth Analiza coșului de cumpărături Secvențe de minare Aprioritate, FP-Growth Analiză utilizare Web Grupare K-means, Modele hierarhice Segementare Clasificare Arbori de decizie Predicție Tabel 1.1 Sarcini ale extragerii datelor .
10 Agenții de marketing utilizează campanii de marketing direct pentru a comunica un mesaj clienților prin poștă, prin Internet, prin e-mail, telefon și prin alte canale directe. Etapele campaniilor de marketing direct sunt explicate mai jos [1]: 1. Colectați și curățați datele necesare din diferite surse. 2. Analiza și segmentarea clienților (gruparea) în diferite grupuri. 3. Dezvoltarea de campanii de marketing orientate în scopul selectării clienților potriviți. 4. Executarea campaniei prin alegerea canalului adecvat, a timpului potrivit și a ofertei corespunzătoare pentru fiecare campanie. 5. Evaluarea campaniei prin utilizarea grupurilor de testare și de control. Evaluarea implică împărțirea populației în grupuri de testare și de control și compararea răspunsurilor pozitive. 6. Analiza rezultatelor campaniei pentru a îmbunătăți campania pentru următoarea rundă în ceea ce privește direcționarea, ora, oferta, produsul, comunicarea și așa mai departe. Explorarea datelor poate juca un rol semnificativ în toți acești pași în identificarea clienților potriviți pentru a fi contactați. Proiectele de proiectare a datelor nu sunt simple. Acestea încep, de obicei, cu așteptări înalte, dar se pot încheia în cazul eșecului în afaceri dacă echipa angajată nu este ghidată de un cadru metodologic clar. Modelul de proces CRISP-DM prezintă pașii care trebuie urmăriți pentru implementările reușite de exploatare a datelor [9]. Acești pași sunt după cum urmează: 1. Înțelegerea afacerii: Proiectul de explorare a datelor ar trebui să înceapă cu o înțelegere a obiectivului de afaceri și o evaluare a situației actuale și a problemelor. Parametrii proiectului ar trebui luați în considerare, inclusiv resursele și limitările. Obiectivul de afaceri ar trebui să fie transpus într-un scop de exploatare a datelor. Criteriile de succes ar trebui definite și trebuie elaborat un plan de proiect. 2. Înțelegerea datelor: această fază implică examinarea cerințelor privind datele pentru a răspunde în mod corespunzător obiectivului definit și o investigație a disponibilității datelor solicitate. Această fază include, de asemenea, colectarea și explorarea datelor inițiale, cu statistici sumare și instrumente de vizualizare pentru a înțelege datele și pentru a identifica potențialele probleme legate de disponibilitate și calitate.
11 3. Pregătirea datelor: datele care trebuie utilizate trebuie identificate, selectate și pregătite pentru a fi incluse în modelul de exploatare a datelor. Această etapă implică colectarea, integrarea și formatarea datelor în funcție de nevoile proiectului. Datele consolidate trebuie apoi să fie curățate și transformate corespunzător în conformitate cu cerințele algoritmului care urmează să fie aplicat. Noi câmpuri de agregare, cum ar fi sume, medii, rapoarte, steaguri și așa mai departe, ar trebui să fie derivate din câmpurile brute pentru a îmbogăți informațiile despre clienți, pentru a rezuma mai bine caracteristicile clienților și, prin urmare, pentru a îmbunătăți performanța modelelor. 4. Modelarea: setul de date pregătit este apoi utilizat pentru formarea modelului. Analiștii trebuie sa selecteze tehnica de modelare adecvată pentru obiectivul de afaceri special. Înainte de formarea modelelor și mai ales în cazul modelării predictive, setul de date pentru modelare ar trebui împărțit astfel încât performanța modelului să fie evaluată pe un set de date separat. Această fază implică examinarea algoritmilor de modelare alternativă și setările parametrilor și o comparație a potrivirii și a performanței acestora pentru a găsi cea care oferă cele mai bune rezultate. Pe baza unei evaluări inițiale a rezultatelor modelului, setările modelului pot fi revizuite și ajustate. 5. Evaluare: Modelele generate sunt apoi evaluate în mod oficial nu numai în ceea ce privește măsurile tehnice, ci și, mai important, în contextul criteriilor de succes în afaceri stabilite în faza de înțelegere a afacerilor. Echipa proiectului trebuie să decidă dacă rezultatele unui model dat se adresează în mod adecvat obiectivelor inițiale ale afacerii. Dacă da, acest model este aprobat și pregătit pentru implementare. 6. Implementare: concluziile și concluziile proiectului sunt rezumate într-un raport, dar acest lucru nu este aproape sfârșitul proiectului. Chiar și cel mai bun model se va dovedi a fi un eșec al afacerii dacă rezultatele sale nu vor fi desfășurate și integrate în operațiunile de marketing de zi cu zi ale organizației. Ar trebui proiectată și dezvoltată o procedură care să permită notarea clienților și actualizarea rezultatelor. Procedura de implementare ar trebui să permită, de asemenea, distribuirea rezultatelor modelului pe întreaga întreprindere și încorporarea acestora în bazele de date ale organizației și în sistemul operațional CRM. În cele din urmă, trebuie elaborat un plan de întreținere, iar întregul proces trebuie revizuit. Lecțiile învățate ar trebui luate în considerare și trebuie planificate pașii următori.
12 Capitolul III. SEGMENTAREA CLIENȚILOR ȘI MINAREA DATELOR Segmentarea clienților este procesul de divizare a clienților în subgrupe distincte, semnificative și omogene, bazate pe diverse atribute și caracteristici. Este folosit ca instrument de marketing de diferențiere . Permite organizațiilor să-și înțeleagă clienții și să elaboreze strategii diferențiate [3]. Organizațiile tradiționale, indiferent de industria în care activează, tind să utilizeze scheme de segmentare a pieței bazate pe informații demografice și valori. De-a lungul ultimelor decenii, organizațiile au decis activități de marketing și dezvoltarea de noi produse și servicii bazate pe aceste segmente simple, reguli de afaceri. Una dintre marile provocări în cercetarea tradițională a studiilor de piață este că oferă o mulțime de informații despre câțiva clienți. Cu toate acestea, utilizarea eficientă a rezultatelor cercetării de piață necesită adesea înțelegerea caracteristicilor tuturor clienților. Totuși această cercetarea poate găsi segmente interesante de clienți. Acestea trebuie apoi proiectate pe baza de clienți existentă folosind datele disponibile. Datele comportamentale pot fi deosebit de utile pentru acest lucru; astfel de date comportamentale sunt în mod obișnuit rezumate din istoricul tranzacțiilor și al facturării. O cerință a cercetării de piață este că clienții trebuie să fie identificați, astfel încât comportamentul participanților la cercetarea de piață este cunoscut. În piețele competitive de astăzi , această abordare nu este suficientă și eficientă. Dimpotrivă, organizațiile trebuie să aibă o viziune completă asupra clienților lor pentru a obține un avantaj competitiv. De asemenea, trebuie să se concentreze asupra nevoilor, dorințelor, atitudinilor, comportamentelor, preferințelor și percepțiilor clienților lor și să analizeze datele relevante pentru a identifica segmentele de bază. Identificarea grupurilor cu caracteristici unice va permite organizației să le gestioneze și să le vizeze mai eficient, printre altele ofertele și promoțiile personalizate ale produselor. Segmentarea clienților este o aplicație populară de exploatare a datelor cu clienții stabiliți. Un proiect de segmentare începe cu definirea obiectivelor de afaceri și se încheie cu livrarea de strategii de marketing diferențiate pentru segmente. Există multe tipuri de segmentare diferite pe baza criteriilor sau atributelor specifice utilizate pentru segmentare. În mod specific, clienții pot fi segmentați în funcție de valoarea lor. Tipul de segmentare utilizat depinde de obiectivul de afaceri specific [1].
13 Există diferite tipuri de segmentare în funcție de criteriile de segmentare utilizate. În special, clienții pot fi segmentați în funcție de valoarea lor, de informațiile socio-demografice și de stadiul de viață, precum și de caracteristicile lor comportamentale, de nevoi / atitudine și de loialitate. Tipul de segmentare utilizat depinde de obiectivul specific al afacerii și de țintă. Diferitele criterii și metode de segmentare sunt adecvate pentru diferite situații și obiective de afaceri. În segmentarea comportamentală, clienții sunt grupați după caracteristici comportamentale și de utilizare. Deși segmentele de comportament pot fi create cu reguli de afaceri, această abordare are dezavantaje inerente. Ea poate gestiona eficient doar câteva câmpuri de segmentare, iar obiectivitatea sa este discutabilă, deoarece se bazează pe percepțiile personale ale unui expert în afaceri. Extracția datelor, pe de altă parte, poate crea segmente de comportament bazate pe date. Algoritmii de clustering pot analiza datele comportamentale, pot identifica grupările naturale ale clienților și pot sugera o soluție bazată pe modelele de date observate. Cu condiția ca modelele de extragere a datelor să fie construite în mod corespunzător, acestea pot descoperi grupuri cu profiluri și caracteristici distincte și conduc la sisteme de segmentare bogate cu semnificație și valoare de afaceri. În general, este necesară aplicarea unui model de cluster pentru a dezvălui segmentele, în special dacă avem nevoie să combinăm un număr mare de atribute de segmentare. Spre deosebire de regulile de afaceri, un model de cluster este capabil să gestioneze un număr mare de atribute și să dezvăluie segmente bazate pe date care nu sunt cunoscute în prealabil. Extracția de date poate fi utilizată, de asemenea, pentru elaborarea schemelor de segmentare pe baza valorii curente sau așteptare a clienților. Aceste segmente sunt necesare pentru a acorda prioritate intervențiilor de manipulare și de marketing ale clienților în funcție de importanța fiecărui client. Mai mult, deoarece o parte vitală a unui proiect de segmentare este o înțelegere a clusterelor derivate și o înțelegere a semnificației acestora, vom propune și modalități de profilare a clusterelor și de evidențiere a caracteristicilor lor diferențiatoare. O modalitate de a găsi segmente comportamentale este de a utiliza tehnicile de grupare descrise în [8]. Aceste metode conduc la grupuri de clienți similari, dar poate fi greu de înțeles modul în care aceste clustere sunt legate de afacere. Mai degrabă, o afacere ar dori să efectueze o segmentare care pune fiecare client într-un segment ușor descris. Adesea, aceste segmente sunt construite în funcție de scopul de marketing, cum ar fi reînnoirea abonamentului sau niveluri ridicate de cheltuieli. Tehnicile arborelui decizional descrise în [10] sunt ideale pentru acest tip de segmentare.
14 Segmentarea în marketing poate fi utilizată pentru următoarele [3]: • O mai bună înțelegere a clienților pentru a sprijini identificarea noilor oportunități de marketing. • Proiectarea și dezvoltarea de noi produse / servicii și pachete de produse adaptate la caracteristicile fiecărui segment , mai degrabă decât pe piața masivă. • Proiectarea de strategii de oferire a produselor personalizate clienților existenți în funcție de necesitățile identificate de fiecare segment . • Oferirea de recompense și stimulente personalizate. • Selectarea mesajului și canalului de publicitate și de comunicare adecvate. • Selectarea canalului de vânzări și servicii adecvate. • Determinarea imaginii mărcii și a beneficiilor produsului cheie care trebuie comunicate pe baza caracteristicilor specifice fiecărui segment. • Diferențierea în serviciul clienți în funcție de importanța fiecărui segment . • Alocarea mai eficientă a resurselor în funcție de potențialul de returnare din fiecare segment. • Prioritizarea inițiativelor de marketing care urmăresc menținerea și dezvoltarea clienților în funcție de importanța și valoarea fiecărui segment . Există diferite criterii pentru segmentarea clienților care pot fi utilizate pentru a optimiza marketingul de consum. După cum am menționat mai devreme, diferite tipuri de segmentare sunt utilizate pentru diferite situații de afaceri. Următoarele tipuri de segmentare sunt cele mai utilizate pe scară largă [1]: 1. Bazat pe valori : În segmentarea bazată pe valoare, clienții sunt grupați în funcție de valoarea lor. Acesta este unul dintre cele mai importante tipuri de segmentare, deoarece poate fi folosit pentru a identifica clienții cei mai valoroși și pentru a urmări variațiile valorii și valorii în timp. De asemenea, este folosit pentru a diferenția strategiile de furnizare a serviciilor și pentru a optimiza alocarea resurselor în inițiativele de marketing. Segmentarea bazată pe valoare este procesul de împărțire a bazei de clienți în funcție de valoare. Trebuie subliniat că aceasta nu este o sarcină unică. Este vital ca organizația să poată urmări schimbările de valoare în timp. Organizația ar trebui să monitorizeze și, dacă este posibil, să intervină pentru a preveni scăderea și pentru a încuraja migrațiile ascendente.
15 O condiție prealabilă pentru această schemă de segmentare constă în elaborarea unei proceduri corecte și credibile pentru determinarea valorii fiecărui client, periodic, de preferință cel puțin lunar, folosind datele de intrare zilnice cu privire la venituri și costuri. Segmentarea bazată pe valoare se realizează prin calcule simple și nu implică aplicarea unui model de exploatare a datelor . Mai exact, identificarea segmentelor de valoare implică clienții comenzii în funcție de valoarea lor și de minarea lor în grupuri de dimensiuni egale. Aceste grupuri reprezintă baza pentru dezvoltarea segmentelor de valoare ale formelor mici n%, medii n%, top n%. 2. Comportamental: Acesta este un tip de segmentare foarte eficient și util. De asemenea, este utilizat pe scară largă, deoarece prezintă dificultăți minime în ceea ce privește disponibilitatea datelor. Datele solicitate includ proprietatea asupra produselor și datele de utilizare care sunt, de obicei stocate și disponibile în bazele de date ale organizației . Clienții sunt împărțiți în funcție de modelele de comportament și de utilizare identificate. Acest tip de segmentare este utilizat în mod obișnuit pentru a dezvolta strategii personalizate de oferire a produselor și pentru dezvoltarea de produse noi și proiectarea schemelor de loialitate. În segmentarea comportamentală, segmentele sunt identificate cu aplicarea modelelor adecvate de grupare a datelor de utilizare / comportamentale care se găsesc de obicei în depozitul de date a alorganizației sau în bazele de date ale organizației. Astfel, segmentarea comportamentală poate fi implementată cu un înalt grad de încredere și un cost relativ scăzut. Atributele care pot fi utilizate pentru segmentarea comportamentală includ proprietatea și utilizarea produsului, volumul / tipul / frecvența tranzacțiilor, istoricul plăților și veniturilor și așa mai departe. Deoarece segmentarea comportamentală este un tip de segmentare util, abordarea metodologică detaliată a segmentării comportamentale este prezentată în secțiunea următoare. 3. Bazat pe predilecție: În segmentarea bazată pe predilecție, clienții sunt grupați în funcție de scorurile de predilecție, cum ar fi scorurile de câștig, scorurile de vânzare încrucișată etc., care sunt estimate de modelele de clasificare (propensitate) respective. Acest tip de segmentare presupune calcule simple și corelarea clienților în grupuri în funcție de scorurile lor de predilecție. De exemplu, clienții pot fi împărțiți în grupuri de rău, bune și foarte bune. Scorurile de predilecție pot fi, de asemenea, combinate cu alte scheme de segmentare pentru a viza mai bine acțiunile de marketing. De exemplu, schema de segmentare a valorii la risc este dezvoltată prin combinarea înclinațiilor cu segmentele de valoare pentru a prioritiza acțiunile de reținere .
16 Segmentarea bazată pe segmentare de predilecție utilizează rezultatele modelelor de clasificare, cum ar fi modelele churn sau cross-up și up-selling. Acest tip de segmentare presupune calcule simple și corelarea clienților în grupuri în funcție de scorurile lor de predilecție. Analiza cluster poate fi aplicată scorurilor de predilecție respective pentru a dezvălui segmentele de clienți cu nevoi viitoare similare pentru un anumit produs. Analiștii pot combina mai multe modele de predilecție și scoruri pentru a crea scheme de segmentare compuse. Această procedură necesită de obicei aplicarea unui model de grupare. Odată ce scorurile de predilecție sunt estimate de modelele relevante , ele pot fi utilizate ca câmpuri de intrare în modelul de grupare. 4. Bazat pe loialitate: Segmentarea loialității presupune investigarea stării de loialitate a clienților și identificarea segmentelor bazate pe fidelitate, cum ar fi loiali și migratori. Acțiunile de reținere pot fi apoi axate pe clienți cu valoare ridicată cu profil neloial, în timp ce vânzările încrucișate pe clienți prospectiv fideli. Segmentarea de loialitate este utilizată pentru a identifica diferite grupuri de clienți în funcție de starea lor de loialitate și pentru a separa loial față de migranți / switch-uri. Segmentele sunt create prin aplicarea regulilor simple de afaceri și / sau a modelelor de cluster pe baza datelor din sondaj sau din baza de date. Segmentele de loialitate pot fi asociate comportamentelor specifice de utilizare și atributelor bazei de date ale clienților. Pentru a realiza acest lucru, o organizație poate începe cu un studiu de piață pentru a dezvălui segmentele de loialitate și apoi a construi un model de clasificare cu segmentele de loialitate "ca ținta [1]. 5. Stadiul socio-demografic și de viață: Acest tip relevă diferite grupuri de clienți bazate pe informații socio-demografice și / sau de viață, cum ar fi sexul, rasa, vârsta, statutul social, educația, ocupația, venitul și starea civilă. Acest tip de segmentare este adecvată pentru promovarea unor produse bazate pe stadiul vieții, precum și pentru susținerea marketingului în stadiul de viață. În segmentarea demografică, clienții sunt grupați în funcție de datele lor demografice. Este o segmentare utilizată pe scară largă, deoarece datele demografice sunt considerate a avea o influență puternică asupra nevoilor, preferințelor și comportamentelor de consum / utilizare. Trebuie să subliniem însă că , în multe cazuri, persoanele din același grup demografic pot avea nevoi și nevoi diferite în calitate de clienți.
17 6. Nevoi / atitudinale: Acest tip de segmentare se bazează de obicei pe date de cercetare de piață și identifică segmente de clienți în funcție de nevoile lor, atitudini, preferințe, și percepții referitoare la societate, servicii și produse. Acesta poate fi utilizat pentru a sprijini dezvoltarea de produse noi și pentru a determina imaginea mărcii și caracteristicile produsului cheie care trebuie comunicate. Necesitățile / segmentarea bazată pe atitudine este utilizată pentru a investiga nevoile, dorințele, atitudinile, percepțiile și preferințele clienților. Informațiile relevante pot fi colectate numai prin sondaje de piață și segmentele sunt identificate în mod obișnuit prin aplicarea unui model de cluster privind răspunsurile la chestionare colectate. În cadrul extragerii de date , nevoile / segmentarea atitudinii se utilizează în principal în combinație cu segmente comportamentale și bazate pe valoare pentru a îmbogăți profilul segmentelor revelate, pentru a oferi o perspectivă asupra caracteristicilor lor calitative și, prin urmare, a sprijini: • Design / dezvoltare de produse noi • Comunicarea dintre caracteristicile produsului / imaginea de marcă importantă pentru fiecare segment • Mesaje de comunicare personalizate • Promoții noi
18 Capitolul III. Studiu de caz: Segmentarea utilizatorilor unui magazin online 3.1 Introducere În ultimii anii am avut parte de o creștere constantă și puternică a vânzărilor în mediul online. Consumatorii au o tendință ascendentă de a efectua comenzi și cumpărături online în detrimentul celor clasice. Datorită acestui comportanment vânzările în mediul online au crescut semnificativ și se poate spune că modul în care consumatorii folosesc serviciile financiare s-a schimbat fundamental. În comparație cu cumpărăturile tradiționale din magazinele de vânzare cu amănuntul, cumpărăturile online au câteva caracteristici unice: procesul și activitățile efectuate de fiecare client pot fi urmărite instantaneu și precis, comanda fiecărui client fiind de obicei asociată cu o adresă de livrare și o adresă de facturare, iar fiecare client are un în magazinul online un cont de informații esențiale de contact și de plată. Aceste caracteristici ale cumpărăturilor online dorite și speciale au permis comercianților online să trateze fiecare client ca un individ cu o înțelegere personalizată a fiecăruia și să se bazeze pe informații de afaceri bazate pe client. În ceea ce privește informațiile de business bazate pe clienți, comercianții cu amănuntul online sunt în mod obișnuit preocupați de următoarele probleme de afaceri: 1. Paginile web ale elementelor / produselor pe care le-a vizitat un client? Cât timp a rămas un client pe fiecare pagină web și în ce succesiune clientul a vizitat un set de pagini web de produse? 2. Cine sunt clienții cel mai puțin / cel mai puțin valoroși pentru afacere? Care sunt caracteristicile lor distincte? 3. Care sunt modelele de comportament ale clienților? Ce produse / elemente au cumpărat clienți împreună adesea? În ce succesiune au fost achiziționate produsele? 4. Ce tipuri de clienți au mai multe șanse să răspundă la o anumită campanie promoțională? și care sunt modelele de vânzări în funcție de diferite perspective, cum ar fi produsele / articolele, regiunile și timpul (săptămânal, lunar, trimestrial, anual și sezonier) și așa mai departe?
19 Pentru a aborda aceste probleme de afaceri, tehnicile de extragere a datelor au fost adoptate pe scară largă în cadrul sectorului de comerț cu amănuntul online, împreună cu un set de metrici bine cunoscute în ceea ce privește profitabilitatea și valorile clienților, de exemplu recenta, frecvența și moneda (modelul RFM) și modelul valorii de viață a clientului. Pentru multe magazine online de top din întreaga lume cum ar fi companii ca și Amazon, Walmart, Tesco, Sainsbury’s, Argos, Marks and Spencer, John Lewis, și EasyJet extragerea datelor a devenit o practică obișnuită și o parte integrantă a proceselor de afaceri în crearea de informații de afaceri bazate pe clienți și sprijinirea marketingului centrat pe client. Deși numeroasele branduri on-line de vânzare cu amănuntul celebrează tehnicile de exploatare a datelor ca instrumente esențiale pentru a obține avantaje competitive pe piață, există încă multe dintre cele mai mici, iar noii intrați sunt dornici de a practica marketingul orientat către consumatori, dar lipsesc din punct de vedere tehnic cunoștințele și expertiza necesare . În acest capitol este prezentat un studiu de caz privind utilizarea tehnicilor de extragere a datelor în inteligența afacerilor centrate pe utilizator, pentru un comerciant online. Retailerul online, considerat aici, este unul tipic: o afacere mică și o companie relativ nouă în sectorul comerțului online, cunoscând importanța crescândă de a fi analitic în afacerile online de astăzi și tehnicile de exploatare a datelor, cu toate acestea, lipsit de cunoștințe și resurse tehnice. Scopul principal al acestei analize este de a ajuta compania să-și înțeleagă mai bine clienții și, prin urmare, să conducă mai eficient marketingul orientat spre client. Pe baza modelului RFM, clienții afacerii au fost segmentați în diferite grupuri semnificative utilizând algoritmul de grupare k-means, iar principalele caracteristici ale consumatorilor din fiecare segment au fost identificate în mod clar. În consecință, un set de recomandări este oferit afacerii cu privire la marketingul centrat pe client și la alte sarcini de analiză a datelor. Restul acestui studiu este organizat după cum urmează. Următoarea secțiune furnizează informațiile de bază despre comerciantul online studiat împreună cu setul de date asociat care trebuie explorate. Secțiunea care urmează descrie în detaliu pașii și sarcinile principale de prelucrare a datelor pentru a crea un set de date țintă adecvat pentru analizele ulterioare necesare. În secțiunea următoare se efectuează analiza clusterizării k și s-a identificat un set de grupuri și segmente semnificative și se face o discuție detaliată cu privire la fiecare cluster. Secțiunea penultimă rezumă informațiile esențiale și pe baza rezultatelor analizei oferă câteva recomandări concrete comerciantului online cu scopul de a maximiza profiturile pentru afacere. În cele din urmă, concluziile sunt prezentate în ultima secțiune.
20 4.2 Stadiul de afaceri și datele asociate Retailer-ul online luat în considerare în acest studiu este unul care are sediu în România și reprezintă o afacere care se ocupă cu vânzarea filtrelor de apă și a consumabilelor folosite de acestea. Pentru mulți ani firma s-a bazat doar pe magazin fizic dar in urmă cu 5 ani magazinul a intrat în mediul online iar de atunci a avut o creștere a vânzărilor constantă și o restructurare a website-ului de 3 ori având de fiecare dată o interfață bazată pe funcționalitate și operativitate. Numărul clienților magazinul online a avut o creștere constantă iar cifra de afaceri a avut și ea un trend ascendent. Utilizatorii țintă ai magazinul sunt cei din România. Nume variabilă Descriere id Id-ul tranzacției user_id Id-ul utilizatorului products Id-urile produselor concatenate folosind un descriptor specific weight_price Prețul calculat în funcție de greutatea produselor ramburs_price Costul transportului subtotal_price Preț final fără cost greutate și transport final_price Preț final cu toate taxele order_id Codul comenzii enc_order_id Codul comenzii encriptat date_buy Data achizițiiei date_sent Data în care comanda a fost trimisă name Nume utilizator surename Prenume utilizator cnp Cnp utilizator city Oraș county Județ address Adresă transport email Emai utilizator phone Număr telefon utilizator juridic Câmp care prezintă dacă utilizatorul este persoana juridică sau nu (0 sau 1) firm Denumire firmă cui Cuod unic de identificare firmă reg_comert Cod registrul comerțului
21 adress_deliver Adresă de livrare payment Mod de plată Tabel 3.1 Câmpurile din tabela care reține date despre comenzi Setul de date despre tranzacțiile cu clienții deținut de comerciant are 25 de variabile, după cum se arată în Tabelul 3.1, și conține toate tranzacțiile care au loc în anii 2013 și 2018. Trebuie remarcat faptul că variabila user_id este esențială pentru afacere deoarece furnizează informații vitale care fac fiecare consumator individual poate fi recunoscut și trasabil și, prin urmare, face posibilă o analiză aprofundată în studiul de față. În acest articol sunt studiate toate tranzacțiile efectuate între august 2013 și mai 2018. În această perioadă au fost efectuate 1420 de comenzi asociate cu un număr de 1030 de utlizator unici. Un fapt interesat este că în medie în fiecare comandă există 2 produse iar valoarea medie a unei comenzi este de 371 lei. Ca și utilizatori se poate observa că de regulă aceștia sunt persoane fizice cu o pondere de aproximativ a% față de utilizatori persoane juridice. 3.3 Pre-procesarea datelor Pentru a efectua analiza de grupare bazată pe modele RFM necesare, setul de date original trebuie să fie pre-procesat. Pașii principali și sarcinile relevante implicate în pregătirea datelor sunt următoarele: • Selectarea variabilele de interes corespunzătoare din setul de date dat. În cazul nostru s-au ales următoarele șase variabile: user_id, order_id, final_price, date_buy, county, city și adress. • Separarea variabilei date_buy in două variabile Date și Time. Acest lucru permite ca diferite tranzacții create de același consumator în aceeași zi, dar la momente diferite, să fie tratate separat. • Sortarea setului de date prin cod utilizator și se crează trei variabile esențiale, recență, frecvență și monetară. Calcularea valorilor acestor variabile pe fiecare cod utilizator. În urma acestor pași, a fost generat un set de date țintă pentru analiză. Setul de date original a fost în format sql și transformat în setul de date țintă final în format SAS din SAS Enterprise Guide. O parte a setului de date țintă este prezentată în figura 3.1, iar variabilele din setul de date țintă și statisticile acestora sunt descrise în tabelele 2 și 3. O serie de două
22 scripturi php au fost utilizate pentru a transforma setul de date inițtial ca să fie utilizat de SAS Guide și pentru a calcula valorile variabilelor Frecvență, Recență și Monetar, pentru fiecare cod utilizator, respectiv. În final, setul de date țintă a fost încărcat în SAS Enterprise Miner pentru analiză. Nume variabilă Descriere Buyer Curespunde fiecărui id de utilizator Recency Recența în luni First_Purchase Timpul în luni de la prima achiziție Frequency Frecvența de achiziție pe utilizator Monetary Total cheltuit pe utilizator Minimum Minimum cheltuit pe utilizator Maximum Maximum cheltuit pe utilizator Mean Mediana cheltuielilor pe utilizator Tabel 3.2 Variabilele din setul de date țintă Nume variabilă Minim Median Maxim Recency 0 22 56 Frequency 1 1,37 17 Monetary 23 545 7223 Tabel 3.3 Sumar al datelor din setul de date țintă
23
Fig. 3.1 Valori din setul de date țintă 3.3 Analiză cluster bazată pe model RFM Clustering Cu setul de date țintă pregătit intenționăm să identificăm dacă consumatorii pot fi segmentați în mod semnificativ din punctul de vedere al recentei, frecvenței și valorilor monetare. Algoritmul de grupare k-means a fost folosit în acest scop și poate fi realizat cu ușurință utilizând nodul Cluster în SAS Enterprise Miner. După cum se știe, algoritmul de clustering k-means este foarte sensibil la o set de date care conține valori exagerate (anomalii) sau variabile care au scale sau magnitudini incomparabile. Examinând histogramele variabilelor Recență, Frecvență și Monetar a setului de date țintă din SAS Enterprise Miner, așa cum este ilustrat în Figura 3.2, este evident că în cazul datelor noastre, fiind relativ puține date nu există unele anomalii foarte evidente. În cazul în care există aceste anomalii acestea sunt valide din punct de vedere al afacerii deoarece sunt înregistrări autentice ale tranzacțiilor; cu toate acestea, ele sunt invalabile din punctul de vedere al analizei datelor. Prin urmare, aceste cazuri trebuie izolate de majoritate și tratate separat. Ca atare, aceste variabile ar trebui normalizate înainte de analiza de grupare.
24
25 Fig. 3.2 Distrubuția variabilelor Recency, Frequency și Monetary Pe baza analizei inițiale a setului de date, în SAS Enterprise Miner a fost creată o diagramă de proiect pentru analiza de grupare așa cum este prezentată în figura 3.3. În diagramă există patru noduri. În nodul Surse de date (set de date țintă), cele trei variabile Recență, Frecvență și Monetar au fost alese ca intrări pentru analiza de grupare. Nodul filtrului a fost setat să excludă din analiză orice instanță având o valoare rară pentru orice variabilă implicată și valoarea minimă de cutoff pentru valori rare a fost stabilită la 1% din numărul total de cazuri examinate.. În nodul Cluster, a fost utilizată transformarea intervalului standard pentru normalizare cu numărul de clustere specificate ca 3, 4 și respectiv 5, iar în final, nodul Profile segment a fost utilizat pentru a asista la interpretarea fiecărui cluster găsit.
26 Fig. 3.3 Diagrama proiectului in SAS Miner Rezultatele clusterizării și segmentului cu cinci grupuri sunt prezentate în tabelele 3.4 și 3.5, iar distribuția instanțelor din cadrul fiecărui grup este detaliată în Figurile de la 3.4 la 3.14. Această segmentare cu cinci clustere pare să aibă o interpretare mai clară a setului de date țintă decât una cu trei și patru clustere. Nume variabilă Minim Median Maxim Recency 0 22 56 Frequency 1 1,37 17 Monetary 23 545 7223 Tabel 3.4 Sumar al datelor din setul de date țintă după filtrare Cluster Număr de clienți Procentaj 1 11 1.1567% 2 369 38.8013% 3 49 5.1525% 4 63 6.6246% 5 459 48.2650% Tabel 3.5 Număr de elemente din fiecare cluster
27 Valoare Rang Cluster 1 monetary 0.013823 1 frequency 0.003153 2 recency 0.001241 3 Cluster 2 recency 0.41662 1 monetary 0.05112 2 frequency 0.02059 3 Cluster 3 frequency 0.084181 1 monetary 0.011123 2 recency 0.004363 3 Cluster 4 monetary 0.079152 1 recency 0.004051 2 frequency 0.001654 3 Cluster 5 recency 0.34276 1 monetary 0.06972 2 frecuency 0.02976 3 Tabel 3.6 Statistica fiecărui cluster
28 3.4 Înțelegerea clusterelor Interpretarea și înțelegerea fiecărui grup identificat este esențială pentru generarea de informații de afaceri centrate pe client. Examinând Tabelul 3.6 și Figurile 3.4 până la 3.14, este interesant de observat că fiecare cluster conține într-adevăr un grup de consumatori care au anumite trăsături distincte și intrinsece, după cum este detaliat mai jos. Clusterul 1 se referă la un număr de 11 clienți și reprezintă o valoare modică de doar 1.1 la sută din numărul întreg de utilizatori.Acest grup este cel mai puțin interesant deoarece nu se evidențiază nici printr-o recentă sau o frecventă ridicată cumpăraturilor. Acest grup reprezintă grupul cu cea mai mica rata de cheltuială pe cap de utilizator și este cel mai neprofitabil pentru afacere. Spre deosebire de grupul 1, grupul 3 are un număr mai mare de componenți fiind 49 și totalizând 5.15 la sută din numărul total de utilizatori. Acest grup se evidențiază printr-o rată de monetar destul de mare fiind mult peste medie. Grupul 4 contine 63 de membrii reprezentând 6.62 din totalul de utilizatori. Acest grup iese in evidență prin valoare monetar mult peste medie și de altfel acest grup reprezintă acei utilizator care au avut comenzile cu cea mai mare valoare per comandă.
Fig. 3.4 Dsitributia clusterelor
29 Fig. 3.5 Rezultate profile segment
Fig. 3.6 Importanța variabilelor segementelor 5 și 2
30 Fig. 3.7 Importanța variabilelor segementelor 4 și 3
Fig. 3.8 Importanța variabilelor segementului 1 Există în jur de 369 clienți în grupul 2 și care reprezintă 38.8 la sută din totalul de utilizatori din setul de date de test. În comparație cu celelalte grupuri acesta are o valoare media a frecvenței destul de mică și totodată și suma cheltuită per utilizator este undeva la valoarea medie. Ceea ce scoate în evidență acest grup estte recența ridicată astfel acesti utilizatori sunt cei care au o recența ridicată, frecvență scăzută și valoare cheltuită per utilizator medie. Grupul 2 este grupul cel mai mare având în componență 449 reprezentând 48.26 la sută din total de clienți ai magazinului. Consumatorii din acest grup au o valoare rezonabilă de frecvență. În comparație celelalte grupuri, acest grup are o valoare mai mică, dar rezonabilă de monetar, deoarece grupul include mulți consumatori nou înregistrați care au început să cumpere foarte recent. Acest grup pare să reprezinte consumatori obișnuiți și, prin urmare, are un anumit nivel de incertitudine în ceea ce privește rentabilitatea. În perspectiva pe termen lung, unii dintre consumatori ar putea fi foarte profitabili sau nerentabili.
31 Putem rezuma analiza noastră făcută până acum astfel: în întreaga populație a consumatorilor, 48% dintre aceștia erau cumpărători obișnuiți cu cheltuieli și frecvențe rezonabile, 38% au profituri medii și mari, 7% profit, iar restul de 7% au fost profituri extrem de scăzute. Aproximativ 22% dintre consumatori au contribuit cu aproximativ 60% din totalul vânzărilor. În general, afacerea pare să fie destul de sănătoasă în ceea ce privește rentabilitatea.
Fig. 3.9 Distribuția rezultatelor pentru recență
32 Fig. 3.10 Distribuția celor mai recente date de tranzacție
Fig. 3.11 Distribuția frecvenței în funcție de recență
33 Fig 3.12 Distribuția numărului de tranzacții în funcție de recență
Fig 3.13 Distribuția valorii tranzacțiilor în funcție de recență și frecvență
34
Fig 3.14 Hartă de monetizare 4.5 Recomandări Cei mai valoroși consumatori ai afacerii au contribuit cu mai mult de 60% din totalul vânzărilor, în timp ce cele mai puțin valoroase au reprezentat doar 7% din totalul vânzărilor. Pentru fiecare dintre aceste grupuri de consumatori, este esențial să se afle în continuare ce produse au cumpărat clienții din fiecare grup, care produse au fost cumpărate împreună cel mai frecvent și în ce succesiune au fost achiziționate produsele. Afacerea poate obține o mai bună înțelegere a consumatorilor prin explorarea asociațiilor între grupurile de consumatori și produsele pe care le-au achiziționat. Asociația poate fi examinată și pe categorii de produse / articole și pe categorii de produse.
35 Mulți dintre consumatorii afacerii au fost consumatori organizaționali cu o cantitate mică de produs pe tranzacție. Examinând în ce moment (anotimpuri), ce produse și tipurile de produse pe care le-au achiziționat în mod frecvent vor beneficia de afacere. Va fi, de asemenea, interesant să vedem dacă există diferențe între diferite tipuri de clienți, adică clienți organizaționali și individuali, în ceea ce privește modelele de cumpărături. Monitorizarea diversității celui mai variat grup de clienți și prezicerea clientului care va deveni afiliat grupului cel mai puțin sau cel mai puțin profitabil este foarte util pentru afacere pe termen lung. Identificarea predictorilor sau indicatorilor adecvați pentru astfel de predicții este de neprețuit. Un alt aspect care merită investigat este legarea grupurilor de consumatori de locațiile geografice. Această corelare, dacă există, poate ajuta compania să privească alți factori, cum ar fi cultura, obiceiurile și economia, care ar putea afecta intenția și preferințele de cumpărare ale consumatorului. 4.6 Concluzii studiu Un studiu de caz a fost prezentat în acest capitol pentru a demonstra modul în care se pot crea informații de afaceri bazate pe clienți pentru comercianții cu amănuntul online prin intermediul tehnicilor de extragere a datelor. Grupurile distincte de clienți caracterizate în studiul de caz pot ajuta compania să-și înțeleagă mai bine clienții în ceea ce privește rentabilitatea și, în consecință, să adopte strategii de marketing adecvate pentru diverși consumatori. În această analiză s-a arătat că există două etape în procesul de extracție a datelor, care sunt foarte importante și care consumă cele mai mari timpuri: pregătirea datelor și interpretarea și evaluarea modelului. Cercetările ulterioare pentru afacere includ: efectuarea de analize de asociere pentru a stabili modele de cumpărare a clienților cu privire la care produse au fost achiziționate împreună frecvent prin care clienții și care grupuri de clienți; îmbunătățirea site-ului comerciantului pentru a permite captarea și urmărirea instantanee și exacte a activităților de cumpărături ale consumatorului; și estimarea valorii ciclului de viață al fiecărui client pentru a cuantifica nivelul de diversitate al fiecărui client.
36 Capitolul V. Concluzii Lucrarea curentă subliniază modul în care extragerea datelor poate ajuta o organizație să abordeze mai bine obiectivele CRM și să obțină o gestionare individuală și mai eficientă a utilizatorilor prin cunoașterea clienților. În primul capitol am prezentat diferitele elemente despre extragerea datelor și am trecut în revistă niște elemente cum ar fi extragerea datelor esențiale dintr-o serie de date existe, utiizarea tehnicii RFM în extragerea datelor și cum sunt folosite tehnicile de extragere a datelor în cadrul CRM. Capitolul doi reprezintă o trecere în revistă a modului în care segmentarea clienților prin extragerea datelor este folositoare și prezentând unele caracteristici sugestive acestei direcții. Prezentarea studiului efectiv se găsește în cadrul capitolului 3 unde am exemplificat pașii urmați pentru ca datele să fie pregătite pentru a fi analizate și totodată am și interpretat rezultatele studiului sugerând o serie de acțiuni pe care firma le-ar putea lua în viitor. Segmentarea clienților este procesul de identificare a grupurilor care au caracteristici comune. Obiectivul principal al segmentării clienților și chiar al acestei lucrări este de a înțelege baza de clienți și de a câștiga cunoștințe despre clienți. Ca și o dezvoltare a acestei analize am putea menționa o segmentarea mai profundă a rezultatelor folosind arbori de decizie pe segmentele cele mai profitabile. În concluzie consider că această lucrare și-a îndeplinit multitudinea de obiective propuse și prezintă într-o manieră facilă de înțeles un studiu de segmentare a utilizatorilor unui magazin online și prezintă un set de măsuri de luat pentru a eficientiza afacerea și a maximiza profitul.
37 Bibliografie [1] K. Tsiptsis and A. Chorianopoulos, “Data Mining Techniques in CRM: Inside Customer Segmentation”, John Wiley and Sons, Ltd., Publication, 2009. [2] Peelen, Ed. Customer Relationship Management. Upper Saddle River: Financial Times/Prentice Hall, 2005. [3] Ph. Kotler and K. Lane Keller. Marketing Management (12th Edition) (Marketing Management). Upper Saddle River: Prentice Hall, 2005. [4] A. Kristin. Customer Relationship Management. New York: McGraw-Hill, 2002. [5] J.A. Berry and S. Gordon Linoff, Mastering Data Mining: The Art and Science of Customer Relationship Management. New York: Wiley, 1999. [6] J.A. Berry and S. Gordon Linoff, Data Mining Techniques for Marketing, Sales, and Customer Relationship Management. Second Edition, Wiley Computer, 2004. [7] J. Han and M. Kamber. Data Mining Concepts and Techniques. Morgan Kaufmann, Edition 2, 2006. [8] P.N. Tan, M. Steinbach, V. Kumar, Introduction to Data Mining. (2005) Addison-Wesley, Boston. [9] Peter Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinart, Colin Shearer, and Rudiger Wirth, CRISP– DM Step-by-Step Data Mining Guide, 2000. http://www.crisp-dm.org. [10] L. Rokach, O. Maimon, “Data Mining with Decision Trees: Theory and Applications”, World Scientific Publishing, Series in Machine Perception and Artificial Intelligence, Vol. 69, 2008.
DECLARAȚIE DE AUTENTICITATE A LUCRĂRII DE FINALIZARE A STUDIILOR Titlul lucrării: Segmentarea utilizatorilor unui magazin online folosind data mining Autorul lucrării: Pintea Ionel Gabriel Lucrarea de finalizare a studiilor este elaborată în vederea susținerii examenului de finalizare a studiilor organizat de către Facultatea de Inginerie Electrică și Tehnologia Informației din cadrul Universității din Oradea, sesiunea iulie a anului universitar 2017-2018. Prin prezenta, subsemnatul Pintea Ionel Gabriel 1930127055054, declar pe proprie răspundere că această lucrare a fost scrisă de către mine, fără nici un ajutor neautorizat și că nici o parte a lucrării nu conține aplicații sau studii de caz publicate de alți autori. Declar, de asemenea, că în lucrare nu există idei, tabele, grafice, hărți sau alte surse folosite fără respectarea legii române și a convențiilor internaționale privind drepturile de autor. Oradea, Data Semnătura
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: 3 Cuprins Introducere… [625889] (ID: 625889)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
