2 Metode folosite de sistemele de recomandare 4 2.1 Filtrare colaborativ˘ a . . . . . . . . . . . . . . . . . . . [609197]
Cuprins
1 Introducere 2
2 Metode folosite de sistemele de recomandare 4
2.1 Filtrare colaborativ˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Definit ,ie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Filtrare colaborativ˘ a bazat˘ a pe utilizatori . . . . . . . . . . . 5
2.1.3 Filtrare colaborativ˘ a bazat˘ a pe elemente . . . . . . . . . . . . 6
2.1.4 Dezavantaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.5 Implement˘ ari . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Filtrare bazat˘ a pe cont ,inut . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Definitie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Vector Space Model – TF-IDF . . . . . . . . . . . . . . . . . . 9
2.2.3 Dezavantaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.4 Implement˘ ari . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Sisteme de recomandare hibride . . . . . . . . . . . . . . . . . . . . 13
2.3.1 Sisteme de recomandare hibride ponderate . . . . . . . . . . 14
2.3.2 Sisteme de recomandare hibride cu comutare . . . . . . . . . 14
2.3.3 Sisteme de recomandare hibride mixte . . . . . . . . . . . . . 14
2.3.4 Sisteme de recomandare hibride cu combinare de caracteristici 15
2.3.5 Sisteme de recomandare hibride in cascad˘ a . . . . . . . . . . 15
Bibliografie 16
1
Capitolul 1
Introducere
Sistemele de recomandare (cunoscute de asemenea ca s ,i motoare sau platforme
de recomandare) au rolul de a prezice cât de mult un anumit obiect îi va pl˘ acea
unui utilizator. Sistemele de recomandare au devenit din ce în ce mai populare
în ultimii ani s ,i sunt folosite pentru a sugera utilizatorilor elemente din diverse
domenii: de la muzic˘ a sau filme, sugestii de c˘ autare pe motoare de c˘ autare, pân˘ a
la c˘ art ,i sau articole s ,tiint ,ifice.
Sistemele de recomandare produc, în general, o list˘ a de recomand˘ ari folosind
una din urm˘ atoarele metode:
collaborative filtering – filtrare colaborativ˘ a
content-based filtering – filtrare pe baz˘ a de cont ,inut
hybrid filtering – filtrare hibrid˘ a ce combin˘ a elemente de filtrare colaborativ˘ a
cu elemente de filtrare pe baz˘ a de cont ,inut
Unul din cele mai importante evenimente din ultimii ani, care a adus o
noua doz˘ a de atent ,ie asupra sistemelor de recomandare a fost concursul Net-
flix Prize[1], organizat de c˘ atre compania american˘ a de distribuire s ,i product ,ie
de materiale cinematografice, Netflix. Aces ,tia ofereau un premiu de un milion
de dolari echipei care reus ,ea s˘ a ofere recomand˘ ari cu 10% mai precise utilizato-
rilor decât sistemul folosit în acel moment. Participant ,ilor li s-a oferit un set de
100.480.507 de note oferite de c˘ atre 480.189 de utilizatori unui num˘ ar de 17.770
de filme.
Pe data de 21 septembrie 2009, marele premiu a fost acordat echipei BellKor’s
Pragmatic Chaos, care a reus ,it s˘ a ofere recomand˘ ari cu 10,06% mai precise. Solut ,ia
2
lor final˘ a combin˘ a 107 rezultate într-unul singur. Conform experient ,ei acestora
[2], acuratet ,ea predictiv˘ a este îmbun˘ at˘ at ,it˘ a substant ,ial atunci când se folosesc
mai multe metode. În opinia lor, majoritatea eforturilor ar trebui concentrate în
g˘ asirea de abord˘ ari substant ,ial diferite, în loc de a încerca de a rafina o singur˘ a
tehnic˘ a deja cunoscut˘ a.
3
Capitolul 2
Metode folosite de sistemele de
recomandare
Dup˘ a cum a fost precizat în capitolul anterior, metodele de recomandare se
bazeaz˘ a în principal pe filtrare colaborativ˘ a, filtrare pe baz˘ a de cont ,inut sau filtrare
hibrid˘ a pentru a crea liste de recomand˘ ari.
2.1 Filtrare colaborativ˘ a
2.1.1 Definit,ie
Filtrarea colaborativ˘ a ("collaborative filtering") este o metod˘ a popular˘ a de
recomandare care îs ,i bazeaz˘ a prezicerile pe notele sau comportamentul utilizato-
rilor unei aplicat ,ii. Presupunerea fundamental˘ a din spatele metodei este cea c˘ a
opiniile altor utilizatori pot fi selectate s ,i agregate într-un asemenea fel încât s˘ a
furnizeze o recomandare rezonabil˘ a utilizatorului curent. [3]
Filtrarea colaborativ˘ a se poate împ˘ art ,i în filtrare colaborativ˘ a bazat˘ a pe utili-
zatori s ,i filtrare colaborativ˘ a bazat˘ a pe elemente.
Sistemele colaborative bazate pe utilizatori se bazeaz˘ a pe urm˘ atorii pas ,i:
1. se caut˘ a utilizatorii care au acelas ,i model de notare al elementelor ca s ,i
utilizatorul curent
2. se folosesc notele utilizatorilor g˘ asit ,i la primul pas pentru a g˘ asi o prezicere
pentru utilizatorul curent
4
2.1. Filtrare colaborativ˘ a
Sistemele colaborative bazate pe elemente (de tipul, utilizatorul care a cump˘ a-
rat elementul X va cump˘ ara s ,i elementul Y, de exemplu) se bazeaz˘ a pe urm˘ atorii
pas ,i:
1. se construies ,te o matrice între elemente pentru a determina relat ,iile dintre
perechile de elemente
2. se deduce o prezicere pentru utilizatorul curent prin examinarea matricei
de elemente s ,i prin potrivirea acesteia cu datele legate de utilizator
2.1.2 Filtrare colaborativ˘ a bazat˘ a pe utilizatori
Un sistem de colaborare bazat pe utilizatori necesit˘ a:
o matrice Rreprezentând notele date de utilizatori elementelor
o funct ,ie de similaritate s:UU!R, unde Ureprezint˘ a mult ,imea
utilizatorilor, folosit˘ a pentru a calcula similaritatea dintre doi utilizatori
o funct ,ie care se foloseste de similarit˘ at ,i s,i notele acordate elementelor pen-
tru a calcula o prezicere
Pentru a calcula o recomandare pentru un utilizator u, se foloseste funct ,ia
spentru a calcula multimea NUde vecini similari cu acesta. Dup˘ a ce se
calculeaz˘ a mult ,imea N, sistemul combin˘ a notele utilizatorilor din acea mult ,ime
pentru a calcula preferint ,a utilizatorului upentru un element i. Preferint ,a se
calculeaz˘ a, în mod tipic, prin aflarea mediei ponderate a notelor date de c˘ atre
vecini elementului ifolosind funct ,ia de similaritate pentru ponderi (se noteaz˘ a
curunotele acordate de utilizatorul ututuror elementelor, cu rinotele acordate
elementului i, cu ru;inota acordat˘ a de utilizatorul uelementului i, cu rumedia
aritmetic˘ a a notelor acordate de utilizatorul us,i cu rimedia aritmetic˘ a a notelor
acordate elementului i):
pu;i=ru+P
u02Ns(u;u0)(ru0;i ru0)P
u02Njs(u;u0)j
În literatura de specialitate sunt definite mai multe funct ,ii de similaritate:
corelat ,ia Pearson
s(u;v)=P
i2Iu\Iv(ru;i ru)(rv;i rv)
qP
i2Iu\Iv(ru;i ru)2qP
i2Iu\Iv(rv;i rv)2
5
Capitolul 2. Metode folosite de sistemele de recomandare
corelat ,ia Pearson constrâns˘ a – rzreprezint˘ a valoarea medie pe scara de notare
s(u;v)=P
i2Iu\Iv(ru;i rz)(rv;i rz)
pP
i2Iu\Iv(ru;i rz)2pP
i2Iu\Iv(rv;i rz)2
similitudinea cosinus
s(u;v)=rurv
jjrujj2jjrvjj2=P
iru;irv;iqP
ir2
u;iqP
ir2
v;i
Pentru urm˘ atorul exemplu, vom calcula nota pentru "R˘ azboi s ,i pace" pentru
Utilizatorul 1, acesta avându-i ca s ,i vecini pe Utilizatorul 2 s ,i Utilizatorul 3,
folosind corelat ,ia Pearson ca s ,i funct ,ie de similaritate.
Pe aripile vântului Crim˘ a s ,i pedeaps˘ a R˘ azboi s ,i pace
Utilizator 1 8 9 ?
Utilizator 2 7 10 5
Utilizator 3 9 9 6
Avem ru1=8;5,ru2=7;3 siru3=8.
Obt ,inem:
s(u1;u2)=(8 8:5)(7 7:3)+(9 8:5)(10 7:3)p
(8 8:5)2+(9 8:5)2p
(7 7:3)2+(10 7:3)2=0:77
s(u1;u3)=(8 8:5)(9 8)+(9 8:5)(9 8)p
(8 8:5)2+(9 8:5)2p
(9 8)2+(9 8)2=0
Nota estimat˘ a pe care o va da utilizatorul c˘ art ,ii este:
pu1;i3=ru1+s(u1;u2)(ru2;i3 ru2)+s(u1;u3)(ru3;i3 ru3)
js(u1;u2)j+js(u1;u3)j=8:5+0:77(5 7:3)
0:77=8:5 2:3=6:2
2.1.3 Filtrare colaborativ˘ a bazat˘ a pe elemente
Filtrarea colaborativ˘ a bazat˘ a pe utilizatori, des ,i ofer˘ a rezultate satisf˘ ac˘ atoare,
sufer˘ a de probleme de scalabilitate odat˘ a cu cres ,terea bazei de utilizatori[3]. C˘ a-
utarea vecinilor este o metod˘ a cu complexitatea de O(jUj). Aceast˘ a problem˘ a este
rezolvat˘ a de filtrarea colaborativ˘ a bazat˘ a pe elemente.
Similar cu filtrarea bazat˘ a pe utilizatori, filtrarea bazat˘ a pe elemente are nevoie
de:
6
2.1. Filtrare colaborativ˘ a
o funct ,iesde similaritate s:II!R
o metod˘ a de a prezice rezultatul din notele acordate s ,i similarit˘ at ,i
Dup˘ a ce se genereaz˘ a mult ,imea Sde elemente similare cu elementul i, proba-
bilitatea se poate calcula folosind urm˘ atoarea funct ,ie:
pu;i=P
j2Ss(i;j)ru;jP
j2Sjs(i;j)j
Pentru a calcula similaritatea, se poate folosi una din urm˘ atoarele funct ,ii:
similitudinea cosinus
s(i;j)=rirj
jjrijj2jjrjjj2
corelat ,ia Pearson – similitudinea cosinus ofer˘ a rezultate mai bune
2.1.4 Dezavantaje
Filtrarea colaborativ˘ a prezint˘ a urm˘ atoarele dezavantaje[5]:
raritatea datelor – în practic˘ a, multe sisteme de recomandare sunt bazate
pe seturi foarte mari de date, ceea ce m˘ ares ,te considerabil dimensiunea
matricei de note acordate de utilizatori, lucru care îngreuneaz˘ a perfomant ,a
algoritmului. O problem˘ a general˘ a cauzat˘ a de raritatea datelor este pro-
blema "cold start". Astfel, pentru c˘ a sistemul face recomandari pe baza
notelor mai vechi acordate de utilizator, acesta nu va putea primi recoman-
d˘ ari relevante pân˘ a când nu va acorda nis ,te note. În mod similar, elementele
noi nu vor putea fi oferite ca s ,i recomand˘ ari pân˘ a când acestea nu primesc
nis ,te note de la utilizatori.
scalabilitate – odat˘ a cu cres ,terea num˘ arului de utilizatori s ,i num˘ arului de
elemente, algoritmii bazat ,i pe filtrare colaborativ˘ a sufer˘ a de probleme de
scalabilitate. De exemplu, Twitter foloses ,te clustere de mas ,ini cu cantit˘ at ,i
mari de memorie pentru sistemul s˘ au de recomandare, Who To Follow.
problema "gray sheep" – aceast˘ a problem˘ a se refer˘ a la utilizatorii ale c˘ aror
opinii nu sunt suficient de similare în mod consistent cu al altor grupuri de
utilizatori, astfel încât aces ,tia nu pot beneficia de pe urma recomand˘ arilor
create de filtrarea colaborativ˘ a.
7
Capitolul 2. Metode folosite de sistemele de recomandare
shilling attack – aceast˘ a problem˘ a poate ap˘ area atunci când utilizatorii îs ,i
acord˘ a note mari propriilor elemente s ,i note mici elementelor apart ,inând
competitorilor. Este necesar ca sistemele de recomandare pe baz˘ a de fil-
trare colaborativ˘ a s˘ a introduc˘ a m˘ asuri de precaut ,ie împotriva unor astfel de
manipul˘ ari.
diversitate – deoarece sistemele colaborative produc recomand˘ ari bazate pe
note anterioare, acestea nu pot recomanda în mod uzual produse cu date
istorice limitate
2.1.5 Implement˘ ari
MovieLens este un site care ofer˘ a utilizatorilor recomand˘ ari de filme. Utiliza-
torii acestui site pot acorda filmelor o not˘ a de la 1 la 5, s ,i în funct ,ie de preferint ,ele
lor primesc noi recomand˘ ari.
Last.fm este un site care poate crea o "stat ,ie" de melodii recomandate prin ob-
servarea trupelor s ,i melodiilor individuale pe care un utilizator le ascult˘ a în mod
regulat s ,i prin compararea acestora cu melodiile ascultate de c˘ atre alt ,i utilizatori.
Last.fm va recomanda melodii care nu apar în biblioteca utilizatorului, dar care
au fost redate suficient de mult de c˘ atre alt ,i utilizatori cu gusturi similare.
8
2.2. Filtrare bazat˘ a pe cont ,inut
Amazon ofer˘ a sugestii de cump˘ arare utilizatorilor în funct ,ie de ce au cump˘ arat
alt,i utilizatori cu gusturi similare.
2.2 Filtrare bazat˘ a pe cont ,inut
2.2.1 Definitie
Sistemele de recomandare bazate pe filtrare de cont ,inut (cunoscut˘ a de aseme-
nea ca s ,i filtrare cognitiv˘ a) recomand˘ a elemente bazate pe o comparat ,ie dintre
cont ,inutul elementelor s ,i un profil de utilizator. Cont ,inutul fiecarui element este
reprezentat ca o mult ,ime de descriptori sau termeni. Profilul fiec˘ arui utilizator
este reprezentat de aceeas ,i termeni s ,i construit prin analiza cont ,inutului elemen-
telor ce au fost vizualizate de c˘ atre acest utilizator. [6]
Majoritatea sistemelor de recomandare cu filtrare bazat˘ a pe cont ,inut se folo-
sesc de metode simple, precum potrivirea cuvintelor cheie ("keyword matching")
sau Vector Space Model (VSM) cu pondere TF-IDF.
2.2.2 Vector Space Model – TF-IDF
VSM este o reprezentare spatial˘ a a documentelor text[7]. În acest model, fie-
care document este reprezentat ca un vector n-dimensional, unde fiecare dimen-
siune corespunde unui termen din întregul vocabular al colect ,iei de documente.
Formal, fiecare document este reprezentat ca un vector de ponderi ai termeni-
lor, unde fiecare pondere indic˘ a gradul de asociere între respectivul document
s,i respectivul termen. Fie D=fd1;d2; :::;dNgmult ,imea tuturor documentelor si
T=ft1;t2; :::;tngmult ,imea tuturor termenilor posibili. Fiecare document djeste
reprezentat ca un vector n-dimensional dj=n
w1j;w2j; :::;wnjo
, unde wkjreprezint˘ a
ponderea termenului tkîn documentul dj.
9
Capitolul 2. Metode folosite de sistemele de recomandare
Reprezentarea documentelor in VSM ridica dou˘ a probleme[7], ponderea ter-
menilor s ,i m˘ asurarea similarit˘ at ,ii între vectori. Cea mai folosit˘ a schema pentru
calcularea ponderilor termenilor este TF-IDF (Term Frequency – Inverse Docu-
ment Frequency), care e bazat˘ a pe urmatoarele observat ,ii empirice în ceea ce
prives ,te textul:
termenii rari nu sunt mai putin relevant ,i decât termenii care apar mai des
multiple aparit ,ii ale aceluias ,i termen în cadrul unui document nu sunt mai
put ,in relevante decât aparit ,iile singulare
documentele lungi nu sunt de preferat documentelor scurte
Pe scurt, termenii care apar foarte des într-un document, dar rar în restul
documentelor, au s ,anse s˘ a fie mai relevant ,i în legatur˘ a cu subiectul documentului.
În plus, normalizarea vectorilor de ponderi previne ca documentele mai lungi s˘ a
aib˘ a o s ,ans˘ a mai mare de descoperire. Aceste presupuneri sunt bine exemplificate
în funct ,ia TF-IDF:
TF IDF(tk;dj)=TF(tk;dj)logN
nk
unde Ndenot˘ a num˘ arul de documente s ,inkdenot˘ a num˘ arul total de docu-
mente în care apare termenul tkcel put ,in o dat˘ a.
TF(tk;dj)=fk;j
max zfz;j
unde maximul este calculat peste frecvent ,elefz;jtuturor termenilor tzcare apar
în documentul dj. Pentru ca toate ponderile sa apar˘ a în intervalul [0;1], acestea
sunt normalizate:
wk;j=TF IDF(tk;dj)
qPjTj
s=1TF IDF(ts;dj)2
Cea mai folosit˘ a metod˘ a de a g˘ asi similaritatea între vectori este (prezent˘ a s ,i
la filtrarea colaborativ˘ a) similaritatea cosinus:
sim(di;dj)=P
kwkiwkjqP
kw2
kiqP
kw2
kj
10
2.2. Filtrare bazat˘ a pe cont ,inut
De exemplu, pentru urm˘ atoarele documente care cont ,in urm˘ atorii termeni:
Document 1 moned˘ a parc floare
Document 2 moned˘ a parc pod
Document 3 lac stejar banc˘ a
Avem mult ,imea termenilor T=banc ;f loare ;lac ;moned ;parc ;pod ;stejar .
Pentru fiecare termen calcul˘ am valoarea IDF, logN
nk.
Termen banc˘ a floare lac moned˘ a parc pod stejar
IDF 1.584 1.584 1.584 0.584 0.584 1.584 1.584
Pentru fiecare termen calcul˘ am frecvent ,a în fiecare document.
banc˘ a floare lac moned˘ a parc pod stejar
Document 1 0 1 0 1 1 0 0
Document 2 0 0 0 1 1 1 0
Document 3 1 0 1 0 0 0 1
Înmult ,im frecvent ,ele cu valorile IDF s ,i obt ,inem:
banc˘ a floare lac moned˘ a parc pod stejar
Document 1 0 1.584 0 0.584 0.584 0 0
Document 2 0 0 0 0.584 0.584 1.584 0
Document 3 1.584 0 1.584 0 0 0 1.584
Pentru un query cu termeniimoned ;stejar ;f loare obt ,inem urm˘ atoarele valori
TF-IDF:
banc˘ a floare lac moned˘ a parc pod stejar
Query 0 1.584 0 0.584 0 0 1.584
Pentru fiecare document s ,i pentru query calcul˘ am distant ,a euclidian˘ aqP
iw2
i
DE(d1)=p
1:5842+0:5842+0:5842=p
3:191=1:786
DE(d2)=p
0:5842+0:5842+0:5842=p
1:023=1:011
11
Capitolul 2. Metode folosite de sistemele de recomandare
DE(d3)=p
1:5842+1:5842+1:5842=p
7:527=2:743
DE(q)=p
1:5842+0:5842+1:5842=p
4:892=2:211
Calcul˘ am similarit˘ at ,ile între documente s ,i query.
sim(d1;q)=1:5842+0:5842
1:7862:211=2:85
3:984=0:715
sim(d2;q)=0:5842
1:0112:211=0:341
2:235=0:152
sim(d3;q)=1:5842
2:7432:211=2:509
6:064=0:413
Se observ˘ a c˘ a primul document este cel mai similar cu query-ul c˘ autat.
2.2.3 Dezavantaje
Filtrarea bazat˘ a pe cont ,inut prezint˘ a urm˘ atoarele dezavantaje[8]:
elementele s ,i atributele acestora trebuie s˘ a poat˘ a s˘ a fie recunoscute automat
absent ,a de recomand˘ ari personale din cauza faptului c˘ a sistemele de reco-
mandare pe baz˘ a de filtrare de cont ,inut nu iau în considerare experient ,ele
altor utilizatori
lipsa descoperirilor "uluitoare" – de exemplu, dac˘ a un sistem recomand˘ a o
carte de acelas ,i autor unui utilizator, acesta nu va fi surprins. Recomandarea
ar fi "uluitoare" dac˘ a sistemul ar recomanda o carte dintr-un alt gen s ,i de un
alt autor, iar recomandarea aceasta i s-ar p˘ area surprinz˘ ator de interesant˘ a
utilizatorului.
sinonime – atunci când sunt folosite sinonime, acestea sunt tratate ca s ,i
termeni independent ,i, f˘ ar˘ a similaritate
2.2.4 Implement˘ ari
Pandora este un site de streaming de muzic˘ a. Fiecare artist sau melodie
cont ,ine o submult ,ime a unei mult ,imi de 400 de termeni (furnizate de c˘ atre Musical
Genome Project). Pandora foloses ,te aceste propriet˘ at ,i pentru a crea o stat ,ie radio
care red˘ a muzic˘ a cu aceleas ,i propriet˘ at ,i. Feedback-ul de la utilizator este folosit
12
2.3. Sisteme de recomandare hibride
pentru a rafina rezultatele stat ,iei, utilizatorul având opt ,iunea de a da like sau
dislike melodiilor.
Rotten Tomatoes este un site de agregare de recenzii pentru filme s ,i seriale.
Utilizatorul poate primi recomand˘ ari în funct ,ie de tipul de filme care îi plac, în
funct ,ie de actorii pe care vrea s˘ a îi vad˘ a sau în funct ,ie de alte criterii.
IMDb – Internet Movie Database este un site ce cont ,ine informat ,ii despre
filme, seriale s ,i jocuri video, inclusiv despre oamenii care au participat la realiza-
rea acestora. IMDb acord˘ a recomand˘ ari în funct ,ie de filmul sau serialul c˘ autat,
net ,inând cont de notele pe care utilizatorul le-a acordat în trecut.
2.3 Sisteme de recomandare hibride
Sistemele de recomandare hibride combin˘ a mai multe tehnici de recomandare
pentru a obt ,ine o performant ,˘ a mai bun˘ a, cu mai put ,ine dezavantaje, fat ,˘ a de o
tehnic˘ a individual˘ a de recomandare. [9]
13
Capitolul 2. Metode folosite de sistemele de recomandare
Exist˘ a mai multe tipuri de sisteme de recomandare hibride.
2.3.1 Sisteme de recomandare hibride ponderate
Un sistem hibrid ponderat de recomandare se foloses ,te de rezultatele mai
multor sisteme de recomandare în calcularea rezultatului final[9]. De exemplu,
sistemul P-Tango ofera init ,ial ponderi egale sistemelor colaborative si a celor
bazate pe cont ,inut, îns˘ a le ajusteaz˘ a pe parcurs în funct ,ie de cât de mult ,umit e
utilizatorul. Beneficiul unui sistem hibrid ponderat este c˘ a toate capabilit˘ at ,ile
unui sistem sunt folosite în crearea unui recomand˘ ari într-un mod simplu. De
asemenea, schimbarea ponderilor s ,i ajustarea sistemului hibrid este un procedeu
facil.
2.3.2 Sisteme de recomandare hibride cu comutare
Un sistem de recomandare hibrid cu comutare se foloses ,te de un set de criterii
pentru a comuta între diverse sisteme interne de recomandare[9]. De exemplu,
sistemul folosit de DailyLearner foloses ,te un sistem de recomandare pe baz˘ a de
cont ,inut prima oar˘ a. Daca recomandarea nu este suficient de bun˘ a, se încearc˘ a
crearea unei recomand˘ ari pe baza unui sistem cu filtrare colaborativ˘ a. Sistemele
cu comutare introduc extra complexitate în procesul de recomandare din cauza
faptului c˘ a este necesar ca mult ,imea de criterii de comutare s˘ a fie definit˘ a.
2.3.3 Sisteme de recomandare hibride mixte
Acolo unde este practic ca un num˘ ar mare de recomand˘ ari s˘ a fie f˘ acute simul-
tan, este posibil s˘ a se foloseasca un sistem hibrid mixt, în care recomand˘ ari de la
mai multe sisteme sunt prezentate împreun˘ a[9]. Sistemul PTV foloseste aceast˘ a
metod˘ a pentru a face recomand˘ ari TV . Se foloses ,te de un sistem bazat pe cont ,inut
care foloses ,te descrierile emisiunilor precum s ,i de un sistem colaborativ bazat pe
notele acordate de ceilalt ,i utilizatori.
14
2.3. Sisteme de recomandare hibride
2.3.4 Sisteme de recomandare hibride cu combinare de caracte-
ristici
O alt˘ a metod˘ a de combinare o reprezint˘ a folosirea rezultatelor unui sistem
colaborativ ca s ,i date adit ,ionale în obt ,inerea unei recomand˘ ari folosind un sistem
bazat pe cont ,inut[9]. Acest tip de combinare permite sistemului s˘ a se foloseasc˘ a
de recomand˘ arile f˘ acute de sistemul colaborativ, f˘ ar˘ a a se baza îns˘ a pe acestea,
lucru care reduce sensibilitatea sistemului la cât ,i utilizatori au votat un element.
2.3.5 Sisteme de recomandare hibride in cascad˘ a
Sistemele de recomandare în cascad˘ a funct ,ioneaz˘ a în doi pas ,i. Prima oar˘ a
se iau rezultatele unui sistem de recomandare. Apoi, asupra acestor rezultate se
aplic˘ a un al doilea sistem de recomandare[9]. Cascadarea permite sistemului s˘ a
nu foloseasc˘ a sistemul de recomandare din al doilea pas asupra elementelor care
au fost bine diferent ,iate în primul pas sau care sunt notate atât de sc˘ azut încât
nu au nicio s ,ans˘ a s˘ a fie alese. Deoarece al doilea pas se concentreaz˘ a doar pe o
anumit˘ a submult ,ime de elemente, un astfel de sistem este mai eficient decât, de
exemplu, un sistem hibrid ponderat care aplic˘ a algoritmii de recomandare asupra
tuturor elementelor.
15
Bibliografie
[1] ***, The Netflix Prize –
http://www.netflixprize.com/
[2] Robert M. Bell & Yehuda Koren & Chris Volinsky, The BellKor 2008 Solution
to the Netflix Prize –
http://www.netflixprize.com/assets/ProgressPrize2008_BellKor.
pdf
[3] Michael D. Ekstrand & John T. Riedl & Joseph A. Konstan, Collaborative
Filtering Recommender Systems –
http://herbrete.vvv.enseirb-matmeca.fr/IR/CF_Recsys_Survey.pdf
[4] Pankaj Gupta & Ashish Goel & Jimmy Lin & Aneesh Sharma & Dong Wang
& Reza Zadeh, WTF: The Who to Follow Service at Twitter –
https://stanford.edu/~rezab/papers/wtf_overview.pdf
[5] Xiaoyuan Su & Taghi M. Khoshgoftaar, A Survey of Collaborative Filtering
Techniques –
https://www.hindawi.com/journals/aai/2009/421425/
[6] ***, Content-based filtering –
http://recommender-systems.org/content-based-filtering/
[7] Pasquale Lops & Marco de Gemmis & Giovanni Semeraro, Content-based
Recommender Systems: State of the Art and Trends –
http://facweb.cs.depaul.edu/mobasher/classes/ect584/Papers/
ContentBasedRS.pdf
[8] ***, Content-Based Filtering Recommender Systems – Benefits and Disadvantages –
http://recommender.no/info/content-based-filtering-recommender-systems/
16
Bibliografie
[9] Robin Burke, Hybrid Recommender Systems: Survey and Experiments –
http://josquin.cs.depaul.edu/~rburke/pubs/burke-umuai02.pdf
17
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: 2 Metode folosite de sistemele de recomandare 4 2.1 Filtrare colaborativ˘ a . . . . . . . . . . . . . . . . . . . [609197] (ID: 609197)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
