•Decizia și procesul decizional •Sisteme BI -Arhitectură și componente generice BI –>Definiție Vizează decidenții, ajutându -isărezolve diverse… [631390]

Business Intelligence
(BI)
•Definiții și caracteristici
•Decizia și procesul decizional
•Sisteme BI -Arhitectură și componente generice

BI –>Definiție
Vizează decidenții, ajutându -isărezolve diverse probleme de
afaceri
Îmbină procesarea automată ainformației deafaceri cu
judecata umană
Motivație primară :creșterea calității procesului decizional

Mediul economic volatil
Intensificarea competiției
Valorificarea oportunităților debusiness
Dezvoltarea comerțului electronic șie-business
Dificultăți în gestionarea tuturor aspectelor de business
(organizaționale)
Necesitatea unor analize specializate privind eficiența și
profitabilitatea
Sistemele operaționale nuoferă suport adecvat procesului decizionalAsistarea deciziei –>Determinanți (Business & IT)

BI –> Impactul asupra procesului decizional
Eficacitate
•Identificarea corectă aproblemelor
•Acces ladate relevante
•Abilitatea deagenera șievalua multiple soluții alternative
•Tehnologii ,instrumente șiaplicații dedicate pentru asistarea deciziei
•Feedback furnizat decidenților
Eficiență
•Reducerea timpului necesar adoptării deciziilor ,chiar șiîncondițiile unor
analize cuocomplexitate ridicată ,care vizează unvolum mare dedate
•Reducerea costurilor asociate procesului decizional

BI–> Avantaje
Asist ădecidenții înobținerea șiprelucra rea datelor necesare
adoptării deciziilor
Control mai bun asupra problemelor complexe, acăror rezolvare
necesită importante resurse detimp
Reducerea duratei procesului decizional
Permite noi abordări ale spațiului problemei sau contextului
decizional
Permite explorarea unui mare număr dealternative, învederea
identificării unei soluții
Poate genera avantaje competitive șistrategice

BI–> Limite
Rol important jucat deabilitățile umane înprocesul decizional
(intuiție, creativitate, experiență profesională/de management
etc…)
Limitări tehnice :tehnologia disponibilă, maniera încare sistemele
sunt modelate șiimplementate, volumul șicorectitudinea datelor
procesate
Soluții limitate laanumite tipuri deprobleme sauanalize, nupotfi
extinse lanoiutilizări, prin generalizare

Tipologia problemelor & deciziilor –> Nivelul decizional
Strategic e –> Vizează responsabilitățile de planificare ale
managementului strategic (top-management)
Tactic e
•Permit alocarea șicontrolul resurselor pentru managementul de
nivel mediu (middle -management)
•Orizontul detimp –>delaolună pană la2ani
Operaționale
•Implică tranzac țiileșiprocesele curente
•Orizont detimp limitat –>deregulă, până laolună

Tipologia problemelor decizionale –> Gradul de structurare
Structurate –>Probleme repetitive, pentru care există
metode derezolvare standard
Nestructurate –>Probleme complexe, pentru care nuexistă
metode derezolvare consacrate
Semi -structurate –>Probleme care conțin atât elemente
structurate, câtșinestructurate

Tipologia problemelor decizionale / Structurate
Pentru probleme cuungrad destructurare înalt –>ușor declasificat,
deanalizat, deabstractizat
Facobiectul teoriei managementului (cercetări operaționale)
Etapă -cheie înrezolvarea problemelor structurate –>clasificarea
problemei într-ocategorie standard –>modele standard pentru
generarea soluției, bazate peexpresii cantitative –>ex:pentru
controlul stocurilor, pentru aprovizionare, distribuție etc.
Problemele decizionale structurate presupun urmarea sistematică a
unor pași standard –>procesul decizional poate fiparțial
automatizat
Automatizarea procesului decizional –>sisteme bazate pereguli,
care furnizează soluții pentru anumite categorii de probleme
repetitive, specifice unui domeniu –>ex:stabilirea prețului
bunurilor/serviciilor

Nestructurate
•Doar parțial asistate demetode cantitative standard –>trebuie dezvoltate soluții
dedicate, adaptate lacontext
•Necesită date dinsurse multiple (interne șiexterne organizației)
•Intuiția ,experiența, raționamentul profesional auunrolimportant
•Tehnologii colaborative șimanagementul cunoștințelor (KM -Knowledge
Management )
Semi -structurate
•Mix între procedurile șimodelele standard desoluționare aproblemelor și
raționamentul uman
•Aspectele structurate –>gestionate prin intermediul unor modele standard
•Aspectele nestructurate –>soluțiile BIpotîmbunătăți calitatea datelor folosite în
procesul decizional, potfacilita obținerea unui setdesoluții alternative șitestarea
impactului acestoraTipologia problemelor decizionale

Sisteme BI –> Caracteristici principale
Ajută decidenții, nuîiînlocuiesc
Aflate subcontrolul utilizatorilor finali –>decidenți /intermediari
Vizează toate nivelurile decizionale –>strategic, tactic, operațional
Vizează toate tipurile dedecizii –>structurate, semi -structurate, nestructurate
Suport pentru diferite contexte decizionale –>decizii individual esaudegrup ;decizii
disparate sauinterdependente
Recurg lamodele pentru rezolvarea problemelor decizionale șilasoluții dedicate de
gestionare șiexploatare aunor mari volume dedate
Interactive șiușor deutilizat
Facilitează învățarea
Aplicații detipgeneric –vs–aplicații dezvoltate lacerere, înfuncție denecesitățile
beneficiarului
Asistă decidenții întoate fazele procesului decizional

Procesul decizional
Scop –>Selectarea unei anumite căideacțiune, dintre două sau
mai multe alternative posibile, învederea atingerii unui anumit
scop
Exemplu –>funcția de planificare (pentru diferite domenii
funcționale /subdiviziuni dintr -oorganizație )–>Cetrebuie
realizat? Când? Cum? Decătre cine?….
Sistem BI=orice aplicație care oferă suport procesului decizional
Etapizare specifică

Procesul decizional –> Etape
Implementare
& evaluarea rezultatelorProbleme /OportunitățiInformare generală
(Intelligence )
Soluția selectatăAlegereSoluții potențiale
Acțiune
(business) Problema
decizionalăAnaliză
Mediu / Procese / Sisteme
-> care este problema care
trebuie rezolvată?
Posibile soluții?
Cea mai bună soluție?
Soluția este funcțională?
Cum poate fi implementată
și îmbunătățită ?Modele & alternative
decizionale
DecizieConcepere

Procesul decizional / Etape –>1.Informare generală
Analiza mediului pentru identificarea deprobleme/oportunități
Deosebiri necesare :problemă -vs-simptom/consecință
problem ă-vs-element necontrolabil
Deciziile sunt condiționate de calitatea șicantitatea datelor
disponibile
Obiective :
•Clasificarea problemelor –>gradul destructurare ,prioritizare
•Stabilirea responsabilităților –>cine seocupă derezolvare
•Enunțarea formală aproblemelor derezolvat

Surse dedate interne șiexterne :
•Sistemele tranzacționale, ERP , BPM –>identificarea problemelor
care vizează procesele șitranzacțiile curente
•Aplicațiile SCM &CRM (ex:identificarea categoriilor declienți
pentru caresăfieconcepute anumite produse/servicii )
•Depozitele dedate șitehnologia data mining
•Surse dedate disponibile peInternet șiinstrumente web pentru
analiza datelor –>Webmining &Webanalytics
Sisteme pentru managementul cunoștințelor (KM) –>diagnoza
problemelorProcesul decizional / Etape –> 1.Informare generală
Suport software

Definirea, validarea ,testarea unui model privind rezolvarea problemei
decizionale
Generarea șianaliza căilor deacțiune posibile
Modele decizionale :
•Abstractizări aleproblemelor decizionale, înformă cantitativă și/sau
calitativă –>seimpune unraport echitabil între simplificare și
reprezentarea realității
•Îmbină știința șicreativitatea –>metode șitehnici cufundament
științific +intuiție șiexperiență profesionalăProcesul decizional / Etape –>2.Concepere

Modelele decizionale –Elemente :
Variabile decizionale –>alternativele care fac obiectul
evaluării (nivelul adecvat alproducției, alstocurilor, decizia de
aproduce -vs-aachiziționa anumite bunuri etc.)
Variabile -rezultat –>scopuri pentru modelul decizional (profit,
costuri,cotă depiață etc.)
Variabile necontrolabile –>parametrii modelului ;înmod
frecvent ,vizează mediul economic extern (rata dobânzii, cursul
valutar etc.)Procesul decizional / Etape –>2.Concepere

Mode le decizionale :
Normative –>Permit generarea celei mai bune alternative dintre
cele posibile :
•Maximizarea rezultatelor ,încondițiile utilizării unui anumit
setderesurse
•Minimizarea costurilor
•Maximizarea raportului rezultate -costuri (ex:rata profitului,
productivitatea etc.)
Descriptive –>Pentru investigarea consecințelor alternative lor
decizionale ,fără agaranta soluția optima (ex:simularea )Procesul decizional / Etape –>2.Concepere

Seimpune definirea unui principiu deselectare asoluției –>când poate fi
acceptată soluția ?–>soluții optime &soluții satisfăcătoare
Decizii sub-optime –>potderiv adinsimplificările impuse deposibilitățile
practice dearezolva problemele decizionale .Teoria raționalității limitate
–>tendința deaconsidera mai puține alternative posibile, criterii,
restricții etc.decât exist ăînrealitate .
Generarea soluțiilor satisfăcătoare :
•Când optimul nueste posibil/este dificil deatins –>secompară
beneficiul marginal alunei soluții mai bune șicostul marginal al
obținerii ei
•Rolimportant jucat deintuiție șiexperiența profesionalăProcesul decizional / Etape –>2.Concepere

Generarea alternativelor posibile
Sepoate realiza înmod automat (ex:optimizare prin algoritmul de
programare liniară )saunu(ex:sesiuni debrainstorming )
Impune evaluarea rezultatelor fiecărei alternative –>trebuie corelate cu
scopurile definite înprealabil (minimizare cost,creșterea satisfacției
clienților…)
Dificultăți specifice :scopurile multiple, unnumăr mare desoluții alternative ,
factorul risc
Perspectiva riscului :
•Decizii încondiții decertitudine –>mediu economic stabil
•Deci ziiîncondiții derisc–>riscul poate fiestimat (modele probabilistice)
•Decizii încondiții deincertitudine –>riscul este necunoscut /nupoate fi
estimatProcesul decizional / Etape –>2.Concepere

Generarea alternativelor posibile –> Utilizarea scenariilor
Scenariile definesc ipotezele considerate pentru generarea
alternativelor –>starea mediului organizațional sau contextul
economic launmoment dat
Permit validarea soluțiilor potențiale –>verificarea senzitivitații
alternativelor, înraport cuschimbările dinmediul deafaceri
Abordări uzuale :celmai favorabil/nefavorabil scenariu, scenariul cel
mai probabil, scenarii care utilizează valori medii pentru variabilele
necontrolabileProcesul decizional / Etape –>2.Concepere

Software BI:
•Analiza datelor deafaceri, data mining –>identificarea corelațiilor
necesare pentru definirea modelului șigenerarea alternativelor
decizionale
•Generarea alternativelor pentru problemele decizionale structurate, pe
baza modelelor utilizate
KM–>pentru problemele complexe, identificarea unor situații similare în
trecut șiasoluțiilor aferente
Sisteme expert (AI) –>genera rea alternativelor decizionale pentru
problemele semi -structurate &nestructurate
Sisteme tranzacționale, ERP , SCM ,CRM, …–>validarea modelului șitestarea
alternativelorProcesul decizional / Etape –> 2.Concepere
Suport software

Explorarea șievaluarea alternativelor decizionale
Opțiunea pentru oanumită cale de acțiune/alternativă decizională
–>reprezintă doar orecomandare privind soluționarea problemei decizionale
––––––––––––––––––––––––––––––––––––
Diverse abordări privind căutarea soluțiilor –>metode analitice (bazate pe
formule ),algoritmi ,euristici ,căutări neinformate (blind search )etc.
Aspecte problematice :
•Armonizarea scopurilor (pentru problemele complexe, cuscopuri multiple )
•Validarea alternativei selectate :
•Analize desenzitivitate –>variații minore ale parametrilor modelului
determină variații nesemnificative alerezultatelor
•Analize detipul what-if–>testează impactul unor variații semnificative
aleparametrilor modeluluiProcesul decizional / Etape –>3.Alegere

Software BI:
•Selectare automată soluție (ex:pentru modele deoptimizare, în
cazul problemelor structurate )
•Analize detipul what -if,analize desenzitivitate
KM &sisteme expert (AI) –>Identificarea unor situații similare din
trecut, validare soluții
Sisteme tranzacționale, ERP , SCM ,CRM ,…–>Teste privind impactul
soluției selectateProcesul decizional / Etape –>3.Alegere
Suport software

Utilizarea efectivă asoluției selectate
Poate impune reingineria proceselor șimanagementul schimbăriiProcesul decizional / Etape –>4.Implementare
Sisteme tranzacționale, ERP , SCM, CRM, BI…–>monitorizarea
implementării soluției –>identificarea de noi probleme și
oportunități
KM&sisteme expert –>suport șiconsultanță privind problemele
deimplementare (ex:rezistența laschimbare )Suport software

SIAD
Sisteme
Informatice
pentru
Asistarea
Deciziei
Arhitectura
GeneralăGestiunea
modelelorGestiunea
datelorModele
Gestiunea
cunoștințelor
Interfața
cu utilizatorulInternet,
intranet,
extranetAlte sisteme
informatice
UtilizatorBaza de cunoștințe
a organizației

Subsisteme SIAD
Gestiunea datelor

Subsisteme SIAD –>Gestiunea datelor
Surse dedate :multiple șieterogene, interne șiexterne organiza ției,surse
web
Depozite dedate =structuri cepermit stocarea unor mari volume dedate
istorice, non-volatile ,care vizează necesitățile deanaliză șiraportare, nu
procesele șitranzacțiile curente
Facilități deinterogare –>prelucrarea cererilor dedate primite delaalte
componente SIAD –>limbaje specializate (SQL) &interfețe pentru
comunicarea cualte componente
Dicționarul datelor =catalog aldatelor (metadate )–>disponibilitate,
semnificație, structură ,tipdate
SIAD fără baze dedate –>SIAD ah-hoc,utilizează date introduse direct în
modele

Subsisteme SIAD –>Gestiunea modelelor
Dicționarul
modelelorBaza de
modele
Sistem
de gestiune
a bazei
de modeleProcesor
execuție & integrare
modele
Subsistem
de gestiune
a datelorSubsistem
de gestiune
a cunoștințelorSubsistem
de gestiune
a dialogului

Baza demodele –>furnizează funcțiile analitice aleunui SIAD
Clase demodele –>generice (matematice șistatistice, algoritmi dedata
mining etc.);specifice unui domeniu (modele financiare, pentruvânzări,
marketing etc.);specifice unei zone degestiune/proces dintr -oorganizație
(planificarea producției, managementul stocurilor etc.)
Gradul despecificitate alproblemelor decizionale trebuie corelat cucelal
modelelor –>ex:problemele detransport sunt untipspecific deprobleme de
programare liniară, carereprezintă untipspecific deoptimizare matematică
Selectarea modelelor necesită expertiză –>control uman și/sau KMșisisteme
expert (AI)Subsisteme SIAD –>Gestiunea modelelor

Modelele delanivelul unui SIAD sunt preponderent matematice (cantitative)
Modele deterministe -vs-Modele probabilistice –>inputuri cunoscute (sau
nu)cucertitudine
Dicționarul modelelor =catalog almodelelor –>date despre disponibilitate,
scop, structură modele
Execuția &integrarea modelelor –>controlul execuției unui model,
combinarea demodele multiple (ex:rezultatele unui model depreviziune
utilizate cainput pentru unmodel deoptimizare )Subsisteme SIAD –>Gestiunea modelelor

Instrumente de modelare & elemente reutilizabile ale modelelor:
Vizează creșterea adaptabilității modelelor
•Rutine șifuncții reutilizabile încadrul modelelor –>ex:funcții
pentru determinarea valorii prezente aveniturilor înmodelele de
investiții ,analiz aderegresie pentru modele ledepreviziune etc.
•Componente reutilizabile –>complexitate superioară rutinelor și
funcțiilor –>ex:analiza predictivă(înmodelele probabilistice),
programarea liniară (înmodelele deoptimizare) etc.
Disponibile însoftware dedicat /generic –>ex:funcții &add-insînMS
ExcelSubsisteme SIAD –>Gestiunea modelelor

Cerințe generale pentru informațiile gestionate de SIAD
(date & modele)
Acuratețe –>Reprezentarea corespunde realității?
Integritate –>Elementele șirelațiile dintre elesunt corect definite?
Validitate –>Datele seîncadrează înlimitele corecte? Modelele sunt valide
pentru contextul decizional vizat?
Completitudine –>Informațiile disponibile sunt complete?
Consistență –>Consistente logic?
Accesibilitate –>Comprehensibile șiutilizabile?
Operativitate –>Disponibile când este nevoie deele?
Scalabilitate –>Sistemul operează conform cerințelor, când volumul de
informații șinumărul utilizatorilor crește?
Securitate –>Acces controlat?

Subsisteme SIAD –>Gestiunea cunoștințelor
Knowledge Management (KM)
Vizează problemele nestructurate &semi -structurate
Raționament șiexpertiză pentru susținerea șicompletarea celor
specifice decidentului, prin:
•Baza de cunoștințe a organizației
•Sisteme expert
•Tehnologii din domeniul inteligenței artificiale (AI)

Subsisteme SIAD –>Interfața cu utilizatorul
Tendințe actuale:
Interfețe web–>familiaritate, ușurința înutilizare, independența de
platformă
Interfețe subformă deportaluri șitablouri debord
Funcții de tip drill-down &afișaj de tip ‘semafor’ pentru
monitorizarea indicatorilor relevanți
Facilități pentru comunicare șicolaborare (forumuri, grupuri de
discuții )–>suport pentru deciziile degrup

Subsisteme SIAD –>Utilizatorul
Raționamentul profesional, expertiza înbusiness șimanagement sunt critice
–>indivizi diferiți vorfolosi același sistem înmod diferit, curezultate diferite
–>decizii diferite
UnSIAD poate fiutilizat direct dedecidenți saudeintermediari :
•Utilizatori profesionali (specialiști) –>experiență îndomeniul deanaliză și
înutilizarea SIAD, asistă decidenții
•Utilizatori experți –>cunoștințe avansate deutilizare SIAD, pentru
operații pecare decidenții nulepotexecuta înmod direct
•Analiști debusiness –>bună cunoaștere adomeniului șiorganizației,
participă ladefinirea modelelor șistructurilor dedate
•Moderatori –>pentru SIAD destinate deciziilor degrup, coordonează
sesiunile delucru

Arhitectura SIAD –> Tipologia SIAD
(în funcție de scop/subsistemul -cheie)
Bazate pemodele –>pentru rezolvarea unor probleme decizionale
concrete –>ex:folosind instrumentele pentru analize statistice ,
programare liniară ,modele financiare etc.disponibile înMSExcel
Bazate pedate –>pentru stocarea, analiza șiprezentarea informațiilor de
afaceri
Bazate pecunoștințe –>folosesc inteligența artificială –>ex:sisteme
expert bazate pereguli pentru automatizarea procesului decizional
––––––––––––––––––––––––––––––––––
SIAD hibrid –>ex:SIAD bazat pedate, carefurnizează input -uripentru
modele deoptimizare șisimulare implementate înMSExcel
SIAD degrup –>suport pentru comunicare șicolaborare

Mod ele pentru asistarea deciziei
(modelare în context decizional)

Modele pentru asistarea deciziei
Pentru procese ledecizionale care vizează situații cuunanumit grad
derepetabilitate –>există saupotfiadaptate metode degenerare a
unei soluții
SIAD bazate pemodele :
Execută sarcini definite în avans
Impun selecția unui model adecvat fiecărei probleme decizionale
Intervenția umană este decisivă

Modelarea (în context decizional )
Conceptualizarea unei probleme decizionale (identificată și
definită întermeni generici înetapa deinformare aprocesului
decizional)
Abstractizarea problemei caset deexpresii cantitative și/sau
calitative

Modele decizionale –> Structura
Variabile dedecizie –>Posibile acțiuni alternative .Valorile
aferente sunt responsabilitatea decidenților .
Variabile necontrolabile (parametri) –>Date care influențează
rezultatul, dar nupot ficontrolate dedecidenți .Corespund
restricțiilor problemei, care limitează soluțiile posibile .
Variabile -rezultat –>Scopul procesului decizional .Depind de
acțiunile potențiale (variabilele decizionale) &parametrii
modelului .

Modele decizionale
Teoria deciziei –>modele matematice
Clase demodele &metode specializate pentru rezolvarea
problemelor decizionale –>ex:economie aplicată, finanțe,
cercetări operaționale (programare matematică ,teoria
stocurilor ,teoria grafurilor, teoria jocurilor etc.)
Aplicabilitate îndiferite domenii deactivitate &subdomenii
de gestiune (ex:aprovizionare, producție ,distribuție,
financiar, marketing, resurse umane etc.)

Model =Abstractizare (reprezentare simplificată )arealității
Niveldeabstractizare :
•Modele iconice –>captează realitatea laoscară mai mică (ex:
fotografii )
•Modele analogice –>reprezentări simbolice ale realității (ex:
diagrame ,grafice )
•Modele cantitative (matematice)
Informațiile disponibile (inexistente -vs-complete) –>modele pentru :
•Adoptarea deciziilor încondiții deincertitudine
•Adoptarea deciziilor încondiții derisc
•Adoptarea deciziilor încondiții decertitudineModele decizionale

Adoptarea deciziilor în condiții de certitudine
Când evenimentele economice viitoare potfianticipate cucertitudine
Bazate pereguli economice care vizează variabilele -rezultat :costul minim,
profitul maxim, creșterea productivității șieficienței etc.
Adoptarea deciziilor în condiții de risc
Evenimentele viitoare nu sunt cunoscute cucertitudine, dar sunt
disponibile informații privind evoluția contextului economic
Sepoate stabili probabilitatea cavariabilele necontrolabile săaibă
anumite valori –>trebuie evaluate rezultatele fiecărei alternative
decizionale
Deciziile sebazează pecriteriul speranței matematice –>sefavorizează
alternativa cuceamai bună speranță matematicăModele decizionale

Adoptarea deciziilor în condiții de incertitudine
Nuproduc întotdeauna osingură soluție sau cea mai bună soluție –>
decizii „deorientare”
Crierii de selectare a soluției :
•Obiective, cufundament logic –>Teoria deciziei oferă modele
matematice &criterii –>ex:media ponderată avalorilor extreme
(scenariul optimist &pesimist)
•Subiective, dependente deașteptările decidenților cuprivire la
viitor –>seatribuie probabilități pentru evenimentele viitoareModele decizionale

Modele decizionale
Clase de modele ObiectiveMetode de
rezolvare probleme
Optimizarea problemelor
cu puține alternativeGăsirea soluției celei mai bune soluții pebaza unui număr redus de
alternative decizionaleTabele de decizie
Arbori de decizie
Optimizarea
bazată pe un algoritmGăsirea celei mai bune soluții dintr -unnumăr mare (sau infinit) de
alternative decizionale, printr -ununproces deoptimizare iterativProgramarea liniară
Optimizarea
bazată pe formuleGăsirea celei mai bune soluții într-unsingur pas, pebaza unei
formuleModele de tip stoc
Simularea Găsirea soluției optime sau aunei soluții satisfăcătoare, prin
testarea unui setdealternative posibileDiverse metode de simulare
(ex: Monte Carlo )
Euristici Găsirea unei soluții satisfăcătoare utilizând reguli Programarea euristică
Sistemele expert
Predictive Previzionarea valorilor unor indicatori pentru unanumit scenariu Modele de previziune
Alte modele Ex:Rezolvarea problemelor detipul “what -if”cuajutorul unei formule –>Modelare financiară

Modele decizionale
Optimizarea problemelor cu puține alternative decizionale
Structura modele :
Alternativele –>acțiunile alternative (exclusive) care facobiectul
evaluării șiselecției
Criteriile decizionale –>perspectivele considerate pentru analiza
alternativelor decizionale
Stările naturii –>ansamblu decondiții exterioare necesare pentru
producerea anumitor evenimente –>contextul economic &de
business
Variabilele -rezultat (consecințele decizionale) –>efectul global al
alternativelor, criteriilor decizionale șistărilor naturii

Tipul deciziilor /procesului decizional înfuncție destările naturii :
Decizii încondiții decertitudine –>contextul decizional este
cunoscut –>stările naturii nusunt relevante
Decizii încondiții derisc –>multiple stări ale naturii –>
contextul debusiness nueste cunoscut înavans, dareste posibil
săseestimeze probabilitatea deapariție afiecărei stări
Decizii încondiții deincertitudine –>multiple stări alenaturii
–>contextul debusiness nueste cunoscut înavans șinueste
posibil săseestimeze probabilitatea deapariție afiecărei stăriModele decizionale
Optimizarea problemelor cu puține alternative decizionale

Tipul
investițieiStările naturii
Rentabilitate
așteptatăCreștere
economică
p=50%Stagnare
p = 30%Recesiune
p =20%
i1 12.0 6.0 3.0 8.4
i2 15.0 3.0 -2.0 8.0
i3 6.5 6.5 6.5 6.5
Alternative
decizionaleCriterii decizionale
–> aici, criteriu unic = rentabilitateaStările naturii & probabilitățile asociate
–> Decizie în condiții de risc
Consecințele
decizionaleModele decizionale
Optimizarea problemelor cu puține alternative decizionale

Alternative
decizionaleStările naturii
SN 1 … SN n
C1 … Cm C1 … Cm
A1

AiCriteriilor
decizionale le pot fi
atașate ponderi
care indică
importanța fiecărui
criteriu
Utilitate = indicator subiectiv , exprimă preferința
decidentului pentru o anumită alternativă
Se calculează pentru fiecare criteriu : U = (val.Efectivă –val.Min )
(val.Max –val.Min )
)* ( max
1jm
jij i ku A
Modele decizionale
Optimizarea problemelor cu puține alternative decizionale

Modele decizionale
Optimizarea problemelor cu puține alternative decizionale
Decizii în condiții de risc –> formule bazate pe conceptul de utilitate &
probabilitățile stărilor naturii –> criteriul utilității maxime
Decizii încondiții deincertitudine –>diferite criterii matematice pentru
identificarea celei mai bune alternative :
-MaxAvg
-MaxMax –> abordarea optimistă
-MaxMin –> abordarea pesimistă
-Matricea regretelor
-Coeficientul de optimism

Decizii în condiții de incertitudine
Exemplu –> metoda MaxMax :
= Rezultatul cel mai favorabil pentru criteriul j& starea naturii n
= Rezultatul cel mai puțin favorabil pentru criteriul j& starea naturii nModele decizionale
Optimizarea problemelor cu puține alternative decizionale
0 10
j jj ij
ijaaaau
1
ja
0
ja
n
n
nn
nn
nn

Modele decizionale
Optimizarea bazată pe un algoritm (programarea matematică )
Set demetode șiinstrumente utilizate pentru rezolvarea
problemelor care vizează alocarea unei cantități limitate de
resurse pentru activități multiple, învederea optimizării unui
obiectiv (indicator cantitativ) .
Metodă reprezentativă :programarea liniară –>determinarea
optimului (max/min) pentru unindicator specificat cafuncție
liniară deuna saumai multe variabile (alți indicatori) .

Structura modele :
Variabile dedecizie –>Setdeelemente măsurabile, pentru care
secaută valori
Funcție obiectiv –>Expresie liniară care implică variabilele de
decizie șicoeficienți ;valoarea satrebuie maximizată/minimizată
Restricții model –>Relații liniare care limitează valorile
variabilelor dedecizie –>sistem deinecuațiiModele decizionale
Optimizarea bazată pe un algoritm –>Programarea liniară

Forma generică amodelelor deprogramare liniară :
max(min) f(x 1,×2,x3…xn)=c1x1+c2x2+…+cnxn
a11x1+a12x2+…….+a1nxn<=b1
a21x1+a22x2+…….+a2nxn>=b2


am1x1+am2x2+…….+amnxn<=bmModele decizionale
Optimizarea bazată pe un algoritm –>programarea liniară

Modele decizionale -Simularea
Presupune asumarea apariției anumitor aspecte alerealității
Tehnică deexperimentare –>analize detipul “what if”aplicate
unui context decizional –>testarea valorilor adiferite variabile
dedecizie sauvariabile necontrolabile
Modelele de simulare definesc comportamentul și
caracteristicile unui sistem, prin considerarea adiferite ipoteze ;
înfuncție derezultatele obținute ,vafiselectată ceamai bună
soluție (dintre alternativele testate )
Adecvată pentru problemele complex e,când optimizarea nu
poate fiaplicată

Etapizare:
Definirea problemei
Realizarea modelului de simulare –>variabile & relații
Testarea și validarea modelului
Stabilirea modului în care se vor derula experimentele (durata,
limitele –>cel mai bun & cel mai nefavorabil scenariu)
Realizarea experimentelor și evaluarea rezultatelor –> folosirea
efectivă a modelului de simulareModele decizionale -Simularea

Simularea Monte Carlo
Sebazează peefectuarea deiterații multiple, pentru adetermina valoarea
așteptată aunei variabile afectată defactori aleatori
Etape :
•Stabilirea distribuției probabilităților pentru variabilele aleatoare
(intervale devalori &probabilitățile aferente)
•Stabilirea numărului deiterații pentru generarea valorilor aleatoare
(pentru variabilele ceafectează indicatorul cetrebuie estimat)
•Generarea numerelor aleatoare
•Înfiecare iterație –>recalcularea variabilei -rezultat, folosind valorile
generate anterior
•Valoarea așteptată arezultatului este media valorilor calculate în
pasul precedentModele decizionale –Simularea

Simularea Monte Carlo
Determină valoarea așteptată a unei variabile și estimează nivelul de eroare –>
invers proporțional cu numărul de iterații
e–eroarea estim ării
b–abaterea standard a variabilei aleatoare
N–numărul de iterațiiModele decizionale –Simularea
Nbe3

Avantaje :
Facilitează încercarea mai multor variante pentru rezolvarea unei
probleme, fără riscurile pecare lapresupune implementarea
acestora înmediul deafaceri real
Captează complexitatea reală aunei problem e,nusunt necesare
simplificări
Oferă oimagine condensată asupra timpului
Aplicabilă pentru omare diversitate aproblemelor decizionale
Disponibilitatea suportului software –>accesibilitate ,opțiuni
multipleModele decizionale -Simularea

Limite:
Nueste garantată obținerea unei soluții optime, cidoar a
unei soluții satisfăcătoare
Modelele auutilitate limitată –>oproblemă particulară
Timpul necesar pentru realizarea simulărilor ;costul definirii
modelelor desimulare
Familiară șiaccesibilă pentru decidenți –>metodă
descriptivă, poate fipreferată îndetrimentul metodelor
analitice (posibil mai adecvate)Modele decizionale -Simularea

Modele decizionale -Previziunea
Anticipează viitorul prin considerarea datelor disponibile pentru
anumite scenarii
Implică metode statistice care stabilesc relații între diferite
variabile, pentru aledetermina evoluția
•Corelație =legătura între două saumai multe variabile
•Analiză deregresie –>utilizată pentru stabilirea (tipului )
relației unei variabile (=dependentă )față deoaltă variabilă
saufață demai multe variabile (=independent e)

Regresie liniară & neliniară (ex. exponențială)
Regresie liniară
•Liniară simplă: Y = mX+ b + u
•Liniară multiplă: Y = m1X1+ … + mnXn+ bModele decizionale -Previziunea
u = influen ța factorilor nespecificați –> valoare medie = 0 (factori care se anulează reciproc )

Modele decizionale -Previziunea –> Regresia liniară
m b
5,801233 16,1433Timp
(Trimestru)Q
1Q
2Q
3Q
4Q
5Q
6Q
7Q
8Q
9Q
10Q
11Q
12
Vânzări
(valori efective )22 28 22 26 34 18 30 38 30 40 50 46
Buget
Marketing 0,8 1 1,6 2 2,2 2,6 3 3 4 4 4 4,6
Vânzări
(valori teoretice )20,78 21,94 25,43 27,75 28,91 31,23 33,55 33,55 39,35 39,35 39,35 42,83
0102030405060
123456789101112Vânzările
Publicitatea
Dreapta calculată
R2(coeficient de determinare) = 0,7343Vânzări –Valori efective
Buget m arketing
Vânzări –Valori teoretice Y = 5,801X + 16,143

Modele decizionale -Previziunea
Etapizare :
Identificare –>posibile dependențe șirelații care trebuie
formalizate
Specificare –>găsirea celei mai potrivite forme pentru
reprezentarea variabilelor șirelațiilor dintre acestea
Estimarea parametrilor modelului
Testarea parametrilor estimați
Validarea modelului
Utilizarea modelului pentru realizarea predicțiilor

Avantaje :
Număr mare derelații matematice utilizate caipoteze inițiale
–>ușor detestat cusoftware adecvat
Fundament teoretic solid –>rezultate credibile, utilizabile
pentru fundamentarea deciziilor
Disponibilitate software –>posibilitatea efectuării decalcule
șianalize statistice complex e
Aplicabilitate extinsă înmediul debusinessModele decizionale -Previziunea

Limite :
Volumul mare dedate (șicostul colectării acestora) necesar
pentru obținerea ecuației deregresie șipentru a-ianaliza
validitatea întimp –>uzuale sunt predicțiile petermen lung,
care vizează indicatori agregați (ex:vânzări totale lanivel de
companie ,rata medie adobânzii lanivel macroeconomic
etc.)Modele decizionale -Previziunea

Modele decizionale -Programarea euristică
Ansamblu destrategii utilizate pentru explorarea spațiului de
căutare asoluției pentru oproblemă complexă șinestructurată,
pentru identificarea unei soluții satisfăcătoare –>abordări detipul
încercare șieroare
Recurge lareguli care ghidează rezolvarea unei probleme ;
rezultatele fiecărei faze din acest proces =input pentru faza
următoare
Tipologie :
•Euristici cantitative –>SIAD
•Euristici calitative –>sistemele expert

Modele decizionale -Programarea euristică
Scenarii deutilizare :
Date insuficiente sau inexacte
Probleme prea complexe pentru a fi abordate prin metode
algoritmice sau simulări
Probleme care implică procesare simbolică
Decizii care nu au caracter repetitiv sau care trebuie adoptate
rapid –>definirea unui algoritm de obținere a soluției optime nu
este fezabilă sau justificabilă prin prisma calculelor de eficiență

Modele decizionale -Programarea euristică
Avantaje :
Ușor deînțeles șiimplementat
Produce multiple soluții acceptabile (satisfăcătoare ),nu una
singură (precum metodele algoritmice )
Influențează pozitiv creativitatea decidenților, care pot valorifica
experiența anterioară înrezolvarea problemelor similare
Posibilitatea deaevalua calitatea unei soluții (empiric sauteoretic)
Căutarea soluției poate încorpora inteligență (umană sauartificială)

Limite :
Nueste garantată obținerea unei soluții
Posibile excepții delareguli
Riscul cadecidenții sănupoată anticipa corect sau complet
consecințele unei alegeriModele decizionale -Programarea euristică

Reprezentarea șistocarea unor modele multiple, cuunnivel de
abstractizare adecvat
Suport pentru utilizarea modelelor existente –>selectare ,
instanțiere ,execuție, stocarea rezultatelor
Asigurarea adaptabilității –>diferite contexte debusiness –>
posibilitatea demodificare acondițiilor șiscenariilor aferente
modelelor
Suport pentru definirea unor modele noi, cueforturi considerabil
reduse, prin utilizarea modelelor existente
Minimizarea redundanțelor șiasigurarea consistenței –>aceleași
modele +date ,accesibile pentru utilizatori multipliGestiunea modelelor SIAD

Gestiunea modelelor SIAD
Implementarea modelelor –>diferite limbaje deprogramare și
aplicații
Software generalist pentru implementarea șigestionarea
modelelor –>procesoare tabelare (ex.MS Excel )–>oferă
instrumente demodelare puternice șiflexibile, dartotodată ușor
deutilizat
MS Excel –>modelare decizională, analiză șiplanificare de
business (subaspect operațional, financiar etc.)

Aspecte problematice :
Numeroase clase demodele standard, fiecare având ostructură
diferită
Pentru fiecare clasă demodele pot fidisponibile mai multe
metode derezolvare aproblemelor (înfuncție decomplexitate
&structură )
Utilizarea modelelor necesită expertiză –>selectarea
modelului ,ametodei derezolvare aproblemei, stabilirea
valorilor pentru parametrii modeluluiGestiunea modelelor SIAD

Business Intelligence
–––––––––––––––––-
Depozite de date

BI –Perspectiva Datelor
Depozite dedate &procesare multidimensională
adatelor (OLAP =Online Analytical Processing )
Forarea datelor (data mining )–>găsirea
informațiilor „ascunse” îndatele disponibile
Raportare a&prezentarea informațieideafaceri
–>rapoarte ,tablouri debord

Depozite dedate
Facilitează analiza informațiilor debusiness
Colecții integrate dedate istorice, extrase din surse
multiple șieterogene
Stochează volume mari dedate, produse înprincipal de
sistemele operaționale –>aplicațiile BIșisistemele
tranzacționale operează independent, fără aseafecta
negativ înutilizare

Depozite de date –> Caracteristici
Integrarea –>Surse multiple dedate pentru același depozit –>
favorizează consistența informației debusiness –>înainte de
încărcarea îndepozit, datele trebuie curățate pentru eliminarea
inconsistențelor (ex:chei sau nume diferite pentruaceleașientități
informaționale )
Non -volatilitatea –>Caregulă, după popularea periodică cudate ,
depozite lesunt accesate înmodul read -only –>Nufacobiectul
operațiilor de ștergere &actualizare (cu titlu de excepție :
actualizarea impusă demodificări lanivelul surselor dedate,
ștergerea datelor eronate sau aunor date arhivate, despre care se
consideră cănumai sunt necesare)

Orientarea pesubiecte –>Depozitele sunt organizate înjurul unor
criterii relevante pentru analizele debusiness (ex:clienți, produse, timp
etc.)-vs.-sursele dedate operaționale organizate înjurul tranzacțiilor
(ex:contracte, facturi, documente deplată etc.)
Orientarea întimp
-Depozitele stochează date istorice (orizont detimp deordinul anilor)
-vs.-sistemele tranzacționale (vizează intervale mai scurte detimp &
date actualizabile întimp real;datele care numai sunt necesare sunt
arhivate periodic) .
-Timpul =criteriu -cheie pentru analizele debusiness, indiferent de
domeniul deactivitate –>repere detimp redunda ntestocate explicit
îndepozit (data, luna, trimestru, sezon,sărbători legale etc.)Depozite de date –> Caracteristici

Stochează date operaționale colectate de-alungul anilor
+date dinsurse externe (ex:privindconcurența, statistic ioficiale
etc.),utilizate careferințe pentru comparații șianalize debusiness
Dezvoltare incrementală –>oricând posibile extinderi șidezvoltări
(prin considerarea unor noisurse dedate )
Populare periodică (=inserare dedate din surse prestabilite ),fără
intervenția explicită autilizatorilor finali
Conținutul depozitelor poate fiseparat înmultiple magazii dedate
(structuri distincte lanivel fizic) –>creșterea performanței la
accesarea datelor
Implementarea uzuală –>tehnologie Client -Server &BDrelaționale
(ex:Microsoft SQL Server, Oracle )Depozite de date –> Dezvoltare & Utilizare

Definirea structurii depozitelor dedate –>Denormalizare :
•Conversia codurilor îndate explicite
•Integrarea datelor care vizează tranzacțiile cudate descriptive sau
clasificări
•Redundanța este permisă –>timp mai scurt pentru generarea
rapoartelor –>ex:alături devalorile date/time ,componentele lor
(an, luna etc.)potfistocate caatare încâmpuri distincte
•Date agregate sau derivate (ex:totaluri ,procente etc.)memorate
explicit, pentru creșterea performanței interogărilor
Curățarea șitransformarea datelor –>înainte cadatele săfieîncărcate
îndepozit –>vizează asigurarea calității informației debusinessDepozite de date –> Dezvoltare & Utilizare

Depozite de date –> Niveluri logice în utilizarea depozitelor

Depozite de date –> Surse de date
Surse multiple &eterogene (tehnologii ,structuri dedate )pentru același
depozit dedate
Tipologia surselor/datelor :
Date operaționale produse desistemele tranzacționale înexploatare
(ex:sisteme pentru contabilitate ,HR,producție ,vânzări ,sisteme ERP
etc.)
Date istorice –>date operaționale arhivate (produse desistemele
tranzacționale înexploatare sauscoase dinuz)
Date operaționale din documente tabelare sau fișiere text
nestructurate (ex:date demarketing, bugete ,planificări etc.)
Date externe :BD pentru marketing (ex:datele decontact ale
potențialilor clienți ),date financiare, statistic ioficiale etc.

Depozite de date –> ETL /Extraction (Extragere date)
Extragere totală :
Vizează toate sursele dedate disponibile șiconținutul acestora
Ușor derealizat, dar arecosturi importante (timp &resurse de
prelucrare )
Doar pentru popularea inițială adepozitului dedate
Extragere incrementală :
Vizează doar schimbările intervenite însursele dedate, dela
ultima extragere –>volum dedate mai redus comparativ cu
extragerea totală
Problemă –>identificarea precisă aschimbărilor delanivelul
surselor dedate
Pentru popularea periodic ăadepozitului dedate

Extragerea incrementală a datelor –> Identificarea schimbărilor la nivelul
surselor de date :
Câmpuri detipul “Ultima modificare ”întabelele -sursă ,pentru amemora
când survin operațiile deactualizare –>informație furnizată deSGBD (de
regulă lanivel deînregistrare, nudistinct pentru fiecare valoare)
Salvarea modificărilor întabele detipistoric –>posibilitatea deastoca
toate valorile pentru anumite câmpuri dinbaza dedate -sursă, nunumai
valorile curente –>tabele specializate pentru stocarea valorilor istorice șia
perioadei detimp pentru care s-auaplicat aceste valori (“DeLaData ”,
“PânăLaData ”)–>necesită elemente deprogramare BD(obiecte detip
trigger) &spațiu destocare mai mare
Mecanisme specifice SGBD pentru monitorizarea șisalvarea modificărilor
dedate delanivel decâmp/înregistrare încadrul anumitor tabele -sistemDepozite de date –> ETL /Extraction (Extragere date)

Depozite de date –> ETL/Transformation (Transformare date)
Presupune maparea
structurilor de date
(câmpurilor) din surse
prestabilite
la câmpurile –
destinație din
depozitul de date

Cașiextragerea, transformarea este abordată distinct pentru popularea inițială a
depozitului, respectiv pentru încărcarea periodică cudate noi
Popularea inițială poate necesita date neuniforme șistatice (ex:surse externe,
date produse desistemele interne scoase dinuzetc.)care sunt folosite osingură
dată –>ignorate deprocesele deîncărcare ulterioară adepozitului
Surse dedate șilogică detransformare diferite, înfuncție deprocesul ETL:
Populare inițială –>Volume mai mari șisurse neomogene dedate –>
transformări mai complexe decât pentru încărcarea ulterioară cudate –>
logică detransformare dedicată
Populare periodică (incrementală) –>Procese repetitive detransformare a
datelor –>logică detransformare reutilizabilă –>implementată osingură
dată, apelată înmod repetat
Cerințe dementenanță –>derivă din necesitatea deautiliza surse dedate
actuale (identificarea surselor noișiacelor care numai prezintă interes )Depozite de date –> ETL/Transformation (Transformare date)

Localizarea &durata procesului depind de:resursele hardware
(procesor, memorie, spațiu destocare etc.),gradul deîncărcare al
rețelei, arhitectura sistemelor implicate (sistemele operaționale și
bazele dedate aferente acestora, DW șimagaziile dedate)

Transformarea datelor –>Localizare :
Peaceeași platformă cusistemele operaționale
Peaceeași platformă cudepozitul
Peoplatformă distinctăDepozite de date –> ETL/Transformation (Transformare date)

ETL & procesele operaționale
partajează aceleași resurse hardware
&software
Pro:Reducerea traficului înrețea ;
eventuale anomalii detectabile în
date determină doar reluarea
transformărilor, fără să implice
rețeaua șirepetarea transportului
Contra :Impact negativ asupra
performanței sistemelor operaționale
Depozite de date –> ETL/Transformation (Transformare date)

ETL &depozitele partajează aceleași
resurse hardware &software
Pro:Reducerea traficului înrețea
Contra: Afectarea performanței
interogărilor pe depozit
Abordarea standard, înipoteza că:
Intervalele de timp pentru
transformarea datelor șipentru
accesarea depozitului nu se
suprapun
Datele din depozite nu sunt
accesate direct, cisub forma
subseturilor dedate disponibile
înmagazii dedateDepozite de date –> ETL/Transformation (Transformare date)

Resurse hardware &software dedicate pentru transformarea datelor
Pro:Flexibilitatea –>celmai mic impact asupra surselor dedate &asupra
depozitului
Contra :Creșterea costurilor cuechipamentele &licențele software ;
creșterea traficului înrețea ;creșterea duratei proceselor ETLDepozite de date –> ETL/Transformation (Transformare date)

Depozite de date
Arhitectura generică –>Niveluri logice în utilizarea depozitelor

Depozite de date
Nivelul de acces la date –>Aplicații -client
Aplicații OLAP (On-lineAnalytical Processing )–>Agregarea datelor în
timp real +descompunerea valorilor agregate până lacelmai mic
nivel dedetaliu +utilizare scenarii
Aplicații dedata mining (DM) –>Acțiuni &Tehnici &Instrumente DM
–>Căutarea informațiilor relevante, „ascunse” îndatele disponibile
(ex:tipareșicorelații, identificare posibilități deapariție aanumitor
evenimente etc.)–>producerea denoicunoștințe
Aplicații de raportare șiprezentare informații de afaceri
–>Rapoarte predefinite /ad-hoc +tablouri debord

Organizează datele din depozitele dedate înfuncție dediferite criterii și
subiecte deanaliză
Concepte -cheie :
Măsuri (ale activității) –>Aspecte cantitative (măsurabile) aledomeniului de
analiză, exprimate înunități demăsură fizice sau monetare .Sunt rezultatul
agregării datelor produse de sistemele tranzacționale, prin utilizarea
funcțiilor detiptotal (ex:Sum, Avg,Count ,Max etc.)
Dimensiuni –>Puncte devedere (perspective) dincare poate fianalizată
activitatea unei organizații .Structura unei dimensiuni poate include mai
multe niveluri deagregare adatelor (launnivel superior celui considerat
inițial, pentru memorarea datelor numerice îndepozit)
Fapte –>Colecții demăsuri identificabile prin dimensiuni șistocate într-o
tabelă relațională –>Tabela defapteDepozite de date –> Modele (de date) multidimensionale

Structuri detip„stea” –>Fiecare cheie folosită (alături dealte chei)la
identificarea măsurilor dintabela defapte este detaliată printr -otabelă –
dimensiune –>fiecare dimensiune corespunde unei chei dintabela de
fapteDepozite de date –> Modele (de date) multidimensionale

Depozite de date –> Modele (de date) multidimensionale
Model Stea

Structuri detip„fulg denea” –>Fiecare cheie din tabela defapte
poate fiasociată cudimensiuni multiple ȘI/SAU fiecare dimensiune
poate fiextinsă prin subdimensiuni
Depozite de date –> Modele (de date) multidimensionale

Depozite de date –> Modele (de date) multidimensionale
Model Fulg de Nea

Structuri detip„constelație”
(integrarea unor structuri stea /fulg denea)
Grupează multiple aspecte cuantificabile șitotodată distincte ale
activității analizate, corelate prin elemente contextuale comune,
care sunt utilizate pentru acalifica (descrie) datele cantitative .
Includ mai multe tabele defapte, care partajează același dimensiuni
–>exemplul celmai comun vizează dimensiunea Timp –>furnizează
multiple criterii (niveluri) deagregare pentru diferite date numerice,
indiferent denatura acestora sausemnificația debusiness .Depozite de date –> Modele (de date) multidimensionale

Depozite de date –> Modele (de date) multidimensionale
Model Constelație

Depozite de date –> Modele (de date) multidimensionale
Model Constelație

Business Intelligence
––––––- –––––-
Depozitele de date &Tehnologia OLAP
(On-line Analytical Processing )

Depozite de date –> Niveluri logice în utilizarea depozitelor

OLAP = On-line Analytical Processing
Tehnologia OLAP recurge lastructuri de date &procesări
multidimensionale –>analize rapide ,pevolume mari dedate &
explorarea datelor decătre utilizatorii finali
Analize multidimensional easupra datelor dindepozite :
•Fiecare perspectivă deanaliză este abstractizată cadimensiune
•Perspective multiple asupra acelorași măsuri/fapte –>faptele
seregăsesc laintersecția tuturor dimensiunilor
•Ex:vânzările unei companii, analizate pedimensiuni (din
perspective) multiple :timp, produs, piață distribuție etc.

OLAP –> Caracteristici
E.F.Codd aenunțat unsetdeprincipii care guvernează sistemele OLAP
–>uzualreduse latestul FASMI :
Fast –>acces rapid ladate
Analysis –>flexibilitate extinsă înrealizarea analizelor și
prelucrărilor dedate
Shared –>suport pentru utilizarea înregim concurent
Multidimensional –>suport pentru unnumăr nelimitat de
dimensiuni șiniveluri deagregare, încadrul fiecărei dimensiuni
Information –>acces transparent lainformații relevante,
indiferent devolumul sausursa acestora

OLAP –>(Hiper )Cuburi de date
Perspective
multiple asupra
datelor –>
(hiper )cuburi
de date
–>cuburi N –
dimensionale ,
ca extensii ale
noțiunii de cub
(tridimensional )

P4 –Săpun lichid –Igienă
HealthP3 –Fructe –Alimente
P2 –Panificație –Alimente
P1 –Panificație –Alimente
1 2 1
Feb

TIMPBV
Predeal
C4PH
Ploiești
C2PH
Ploiești
C1CLIENT
1
Ian
2016PH
Câmpina
C3 ……
Ian
2015

Cub „desfășurat” –> reprezentare tabelară (bidimensională)OLAP –>(Hiper )Cuburi de date

OLAP –Vedere multidimensională asupra datelor
Multidimensional –>Perspective multiple (ex:temporală, geografică etc.)
necesare pentru acalifica indicatorii debusiness (măsurile activității ).
Dimensiunile sunt complet independente șiconstau învalori (=membri i
dimensiuni i)cepotfiorganizate înierarhii cumai multe niveluri .
Membrii depefiecare nivel ierarhic potfiutilizați pentru agrupa saufiltra
măsurile, înfuncție denecesitățile deanaliză .
Ierarhiile dimensiunilor permit operații de agregare (zoom -out)&
descompunere (zoom -in)adatelor numerice .
Granularitate =nivelul dedetaliu aldatelor –>nupotfiaccesate date mai
detaliate decât cele aflate penivelul cugranularitatea cea mai fină
(poziționat celmai josînierarhia unei dimensiuni –>„frunzele” ierarhiei ).

Relația dintre membrii aflați pe niveluri
diferite în ierarhia unei dimensiuni :
Nivel superior (1) –Nivel inferior (m.mulți )
Relațiile n-m(m.mulți –m.mulți ) –> multiple ierarhii alternativeAn
Trimestru
Lună
Zi/DatăOLAP –Vedere multidimensională asupra datelor

Încadrul fiecărei dimensiuni, oricare
membru situat peunanumit nivel
ierarhic trebuie săcorespundă unui
anumit membru aflat pe nivelul
imediat superior .
Pentru ierarhiile incomplete ,se
adaugă membri detipul categoriilor
generice –>„Alții/Altele” .OLAP –Vedere multidimensională asupra datelor

Timpul =dimensiune universală ,indiferent despecificul depozitului –
sursă –>comparații șianalize privind tendințele
Cuburi multiple pentru aceeași sursă dedate –>dimensiuni private și
partajate (ex:timp &geografie )
Dimensiunile comune permit evitarea duplicării datelor, dar complică
mentenanța cuburilor OLAP
Dimensiunile pot exista caatare încadrul sursei dedate sau pot fi
specifice structurilor OLAP –>noi membri necesari pentru simulări
(pentru planificare ,bugetare etc.),chiar dacă nusunt disponibili în
depozitul -sursă (ex:produse ceurmează săfielansate )OLAP –Vedere multidimensională asupra datelor

OLAP –> Stocarea datelor
ROLAP –>Recurge labaze dedate relaționale –>neoptimizate pentru
acces rapid –>indecșii definiți petabela defapte nusunt osoluție
(câmpuri -cheie multiple, pot depăși numărul măsurilor –>dimensiunea
tabelei deindecși comparabilă cuatabelului pecare aufost definiți )
MOLAP –>Recurge lastructuri dedate multidimensionale –>optimizează
performanța interogărilor
HOLAP =OLAP Hibrid –>Datele cugranularitatea cea mai fină sunt
stocate înbaze dedate relaționale, iardatele agregate ladiferite niveluri
sunt stocate înstructuri multidimensionale .
•Avantaje :acces direct ladatele dedetaliu +performanța agregărilor
șianalizelor OLAP
•Dezavantaj :timpul necesar comutării ROLAP -MOLAP

OLAP –> Stocarea datelor
MOLAP –>Utilizează baze dedate multidimensionale
•Facilitează agregări șianalize executate întimp real
•Implică structuri dedicate (tabele bitmap ),care realizează
corespondența între metadatele unui cub (membrii dimensiunilor )și
datele dincelulele cubului (măsurile ).
•Tabelele bitmap indică toate combinațiile de valori aferente
membrilor dimensiunilor, respectiv adresele unde sunt stocate
măsurile corespondente .

OLAP -Stocarea datelor –> MOLAP
Structura
metadatelor
Tabela
bitmap
Ex. interogare :
Vânzări produse
panificație,
în Ploieș ti,
Februarie 2016
Măsurile ce
trebuie agregate
–> disponibile la :
Adresele unde sunt stocate măsurileMasca de biți

OLAP -Stocarea datelor –>MOLAP
Structura tabelelor bitmap :
•Coloane –>Toate valorile posibile pentru membrii dimensiunilor, dela
fiecare nivel dinierarhiile aferente acestora –>structura metadatelor
•Rânduri –>Valori binare corespunzătoare adreselor unde sunt stocate
măsurile
•Celule tabel –>Valori detipbit(0/1),indicând membrii dimensiunilor
care seaplică (sau nu) cadescriptori pentru măsurile memorate la
fiecare adresă
Masca debițipentru interogarea cuburilor –>structura metadatelor este
utilizată pentru specificarea datelor cetrebuie accesate .Masca debițieste
suprapusă peste tabela bitmap ,pentru identificarea adreselor care conțin
măsurile vizate .

OLAP –>Analize și prelucrări
Principalul obiectiv OLAP –>analiza datelor dindepozite, într-oabordare
multidimensională șiintuitivă
Analize comparative :
•Comparații întimp –>valorile anumitor indicatori sunt comparate cu
valorile înregistrate înperioadele anterioare echivalente
•Comparații înspațiu –>pentru indicatorii vizați ,implică repere teritoriale
diferite (ex:filiale, puncte delucru, localități parteneri etc.)
•Comparații întimp șispațiu –>combină reperele temporale șispațiale
•Comparații care recurg lacriterii predefinite –>seutilizează valori de
referință (ex:valori planificate sau bugetate /valori -obiectiv ),care vor fi
comparate curezultatele efective

Analize comparative
Comparațiile potfiimplementate sub forma operațiilor dediferență, care implică
variabilele vizate –>platformele OLAP permit efectuarea decalcule ad-hoc.
Calcule ad-hoc –>audrept consecință cuburile calculate (cuburi -formulă ):
•Cașicuburile stocate, sunt descrise cuajutorul dimensiunilor, dar nu
necesită spațiu destocare, valorile numerice fiind generate pebaza unor
formule decalcul ;
•Pentru definirea formulelor seutilizează tipurile defuncții oferite de
platforma OLAP ;
•Ex:determinarea variației procentuale aunui indicator, față deperioada anterioară
echivalentă –>valori returnate pentru toate reperele descriptive +toate nivelurile de
agregare specifice cubului OLAP .OLAP –>Analize și prelucrări

Analize What -If:
•Permit determinarea valorilor anumitor indicatori ,încondițiile schimbărilor
care afectează diferiți parametri (factori deimpact );
•Utile pentru activitățile debugetare șiplanificare –>simulări pentru
identificarea valorilor parametrilor care conduc lacele mai bune rezultate ;
•Cuburile OLAP stochează atât datele folosite pentru simulare, cât și
rezultatele fiecărui scenariu ;
•Modelele desimulare bazate peOLAP facilitează explorarea datelor cu
diferite granularități .OLAP –>Analize și prelucrări

Pivotarea :
•„Întoarcerea ”cubului pediferite laturi, pentru cautilizatorii săaibă diferite
perspective asupra datelor dincub
•Interfețele grafice facilitează doar perspectiva bidimensională (tabelară )
asupra cuburilor OLAP (N-dimensionale) –>Tabele pivot :
-Rânduri –>mapate dimensiunil or(șiierarhiilor aferente )
-Coloane –>mapate dimensiunil or(șiierarhiilor aferente )
-Filtre –>mapate dimensiunil or(șiierarhiilor aferente)
-Celule tabel –>permit afișa reamăsurilorOLAP –>Analize și prelucrări

OLAP -Analize & prelucrări
Tabele Pivot
Slicing / Dicing
Roll Up/ Drill Down

Pivotarea :
•Rândurile &coloanele &filtrele sunt interschimbabile –>pot fi
inversate, pentru operspectivă diferită asupra datelor –>aplicațiile
OLAP oferă interfețe grafice pentru definirea tabelelor pivot prin
tehnica „drag -and-drop ”.
•Imbricarea dimensiunilor (=proiectarea unei dimensiuni peoalta)
–>dimensiuni diferite pot ficombinate pe aceeași latură a
cubului/pivotului (ex:repere temporale +geografice pentru coloane
–>totaluri anuale defalcate petrimestre șipeluni, apoi pelocalități
etc.)OLAP –>Analize și prelucrări

Roll-up:
•Produce totaluri ,prin agregarea datelor peunnivel superior din
ierarhia unei dimensiuni
•Recurge lafuncții matematice detiptotal (sum, average, max etc.)
Drill -down :
•Produce date detaliate ,prin expandarea totalurilor delaunanumit
nivel dinierarhia unei dimensiuni învalori multiple ,care corespund
membrilor aflați penivelul inferior
•Permite identificarea factorilor care afectează (pozitiv/negativ) un
anumit indicator șicuantificarea impactului acestora (analize cauză –
efect)OLAP –>Analize și prelucrări

Slicing =Selectarea datelor care corespund unui anumit membru alunei
dimensiuni (ex:structura datelor dincub, limitată laluna mai, anul curent )
–>vizibilitate restrânsă laoanumită secțiune acubului (laun„sub-cub”)
Dicing =Multiple operații desecționare acubului, după diferite criterii aplicate
simultan (ex:temporale ,repere produs etc.)–>sunt vizați anumiți membri, din
dimensiuni diferite –>rezultatul este totun„sub-cub”decupat dincubul inițial
Abordări slicing /dicing :
•Indicarea unui subset almembrilor unei dimensiuni (ex:indicatorii pt.luna mai, anii 2003 și2007 );
•Comparații cuoanumită valoare (ex:membrii unei dimensiuni cunumele incluzând unsubșir –>
produse care conțin „hand -made” îndenumire );
•Relațiile ierarhice (ex:părintele/copiii/descendenții/etc .unui anumit membru alunei dimensiuni );
•Excepțiile (ex:indicatorii care vizează toțianii disponibili, mai puțin 2007 și2010 );
•Repere Min-Max –>membrii unei dimensiuni pentru care anumite măsuri înregistrează nivelul cel
mai ridicat/cel mai scăzut .OLAP –>Analize și prelucrări

Raportarea de afaceri
Vizual izarea informației de afaceri
Managementul performanței

Cultură organizațională bazată peexploatarea datelor :
•Focus pe clienți
•Management ghidat de viziunea strategică
•Transparență decizională
Pe de altă parte …
“Mai mult deotreime dintre manageri adoptă decizii
bazându -sepepropriul raționament, iaraproape 50%nu
asigură transparența necesară pentru procesul decizional .”
(Harvard Business Review Analytic Services, 2015 )Business Intelligence

Raportarea de afaceri
Raport –>Artefact din sfera comunicării, care
permite transmiterea deinformații
Raportare deafaceri –>Rapoarte deafaceri &
aplicații BI –>reprezentarea șicomunicarea
anumitor metrici debusiness (înfuncție descop,
utilizatori etc.)
•Surse :date deproveniență internă &externă,
înraport cuorganizația dereferință
•Utilitate :fundamentarea șicreșterea calității
deciziilor

Raportarea de afaceri

Vizualizarea informației de afaceri
Reprezentări și instrumente
pentru explorarea, interpretarea și comunicarea
informației de afaceri
Vizualizare date -VS-informații deafaceri
Informație =rezultat aloperațiilor dereorganizare (frecvent,
consolidare/centralizare ),contextualizare șiinterpretare adatelor
Poate impune recurgerea lagrafice șireprezentări denatură
statistică sauștiințifică
Tendințe :
•Internet ul,camediu devizualizare ainformației deafaceri
•Vederi interactive, animație, grafice 3D,date actualizabile în
timp real

Analize descriptive
–Natură retrospectivă & descriptivă & investigativă
–Ce? De ce? s -a întâmplat / se întâmplă
Analize predictive
–Natură predictivă , orientare spre viitor
–Ce? De ce? se va întâmpla Vizualizarea informației de afaceri

Reprezentări grafice
Adecvarea la context : Grafic de utilizat ?Când ?Cum ?
Grafice specializate:
•Histogram a
•Scatter plot
•Bubble
•Gantt
•PERT
•Geografic
•Gauge
•Tree map
•Heat map
•……Grafice uzuale:
•Line
•Column /Bar
•PieVizualizarea informației de afaceri

Exemplu : Venitul mediu & speranța de viață la nivel mondial
Sursa : gapminder.orgVizualizarea informației de afaceri

Rapoarte
•Informații istorice &statice ,privind anumite aspecte
debusiness
•Utilizatori –>decidenții
Tablouri de bord
•Informații actualizabile frecvent/în timp real, care
permit monitorizarea activității unei companii
•Utilizatori –>decidenții &toate rolurile care vizează
monitorizarea ,controlul șianaliza proceselorVizualizarea informației de afaceri

Tipologie rapoarte :
–Structură :Predefinite /Ad-hoc
–Format :Text &Tabele &Grafice
–Scop :Informative /Investigative
–Distribuție :Tipărite /Electronice –>e-mail/intranet/portal web
–Periodicitate :Periodice /Lacerere
–Paginație :Copertă +Sinteză +Conținut detaliat /Tipscrisoare sau
notificare
–Conținut :Formal /Informal
Cerințe generale :
–Corectitudine
–Claritate
–Completitudine
–ConcizieRapoarte de afaceri

Tablouri de bord
Instrumente devizualizare aunor informații relevante,
consolidate, într-ofereastră deecran unică
Indicatorii cei mai relevanți
Componente de natură grafică
Actualizări frecvente / în timp real
Facilitează navigarea la datele de detaliu
Instrumente -suport în procesul decizional
–>reflectă statusul înraport cuobiectivele
fixate

Tablouri de bord

Cerințe specifice deproiectare –>toate informațiile
trebuie afișate într-ofereastră unică ,clar șifără elemente
inutile, într-omanieră care permite asimilarea rapidă
Funcții :
•Monitorizare –>Date înformat numeric &grafic,
utilizate pentru monitorizarea metricilor deperformanță
•Analiză –>Date numerice corelate cumultiple repere
descriptive –>investigarea unei anumite stări defapt
•Acces ladate operaționale dedetaliu –>identificarea
cauzelor problemelor, stabilirea acțiunilor deîntreprinsTablouri de bord

Tipologie –>înfuncție de destinație & natura datelor
STRATEGICE TACTICE OPERAȚIONALE ANALITICE
Repere
cheieCE ?CÂND ?
UNDE ?CINE ?
CUM ?DE CE ?
ConținutDate consolidate
pentru
top-managementDate consolidate
pentru
middle -managementDate de detaliu
(tranzacționale)Date de detaliu
(tranzacționale)Tablouri de bord

Combină date care provin dinsurse diferite –>vedere
consolidată, perspectivă globală asupra organizației
Vedere dinamică –>date actualizabile întimp real
Elemente denatură grafică –>evidențiază datele și
excepțiile care reclamă măsuri concrete
Funcții drill-down –>acces ladate dedetaliu, dindiferite
surse (tranzacții, documente etc.)
Ușordeutiliza t–>reclamă training minimal ,intuitive
Competențe tehnice pentru proiectare, implementare,
mentenanță –>nufoarte specifice sau denivel înalt,
suport important oferit deplatformele specializateTablouri de bord
-Caracteristici generale –

Vederi multiple asupra acelorași indicatori
•Posibilitatea comutării între diferite tipuri dereprezentări
grafice
•Îmbinarea metricilor cudiferite metadate contextual e(repere
specifice analizei multidimensionale )
•Diferite niveluri dedetaliu
Ierarhizarea șiprioritizarea excepțiilor șialertelor
Analize comparative ,prin raportarea lastandardele
specifice domeniului deactivitate
Rezultatele proiectării trebuie validate deexperți dinzona
debusiness șideutilizatorii finaliTablouri de bord
-Bune practici –

Integrarea datelor din surse externe –>Interfețe
specializate (Application Programming Interface –
API)pentru accesul ladatele disponibile pe
platforme multiple (inclusiv date furnizate deservicii
web )
Analize complexe –>explorări aledatelor șianalize
predictive bazate pe algoritmi complecși (data
mining )Tablouri de bord
-Tendințe –

Managementul performanței
Business Performance Management (BPM)
Metodologii ,procese, metrici ,tehnologii utilizate lanivel
organizațional pentru măsurarea, monitorizarea și
managementul performanței debusiness .
Componente BPM:
Metode și instrumente pentru definirea obiectivelor
organizației și indicatorilor de performanță asociați
–>fundamentul conceptual BPM (repere economice &de
management &specifice domeniului)
Instrumente șitehnologii pentru monitorizarea performanței
Procese analitice șidemanagement –>integrate, ciclice,
suportul ITeste esențial

Managementul performanței
Etapizare generică :
1.Definire strategie
2.Planificare
3.Monitorizare &
Analiză
4.Acțiune / Ajustări

Definire strategie :
Direcția de urmat pentru organizație ?
Repere generale :
•Analiza statusului curent alorganizației
•Analiza mediului deafaceri
•Identificarea factorilor -cheie pentru succes
•Analiza disparităților (gap analysis )
•Conturarea unei viziuni strategice
•Stabilirea orizontului detimp vizat
•Definire aobiective lorstrategiceManagementul performanței

Planificare :
Cum se pot atinge țintele prestabilite ?
Traducerea obiectivelor strategice într-unsetdetactici
șiacțiuni, identificarea resurselor necesare șidefinirea
rezultatelor așteptate înperioada următoare (deregulă,
1-2ani).
Dimensiuni ale planificării :
•Tactică –>obiectivele petermen scurt șimaparea
lorlanivel operațional (procesele curente)
•Bugetară –>vizează aspectele financiareManagementul performanței

Monitorizare & Analiză :
Care este stadiul actual ?
Ce trebuie monitorizat ?
•Obiective
•Factori critici pentru succes
•……
Cum se realizează monitorizarea ?
•……Managementul performanței

Succesul /supraviețuirea unei organizații depinde de:
Ajustări: procese de afaceri / politică marketing /
……
Opțiunile strategice :
•lansarea unor produse noi
•intrarea pe noi piețe
•reorganizare (fuziuni, achiziții, …)
•……Acțiune și ajustări :
Ce trebuie schimbat ?Managementul performanței

Facilitează implementarea strategiei debusiness
–> utilizarea sistematică a metodelor
comparative , pentru analiza evoluției
indicatorilor (vs.valori -obiectiv /valori din
perioadele anterioare)
Alertează managerii cuprivire laoportunități și
probleme, facilitând reacții adecvate contextului
deafaceri curentManagementul performanței
-Sisteme suport –

Managementul performanței
-Metrici și indicatori –
Metrici
•Valori (calculabile sau observabile direct) care cuantifică un
anumit atribut /aspect debusiness ,launmoment dat
•Tipologie : nominale (calitative) , ordinale (pentru
clasamente) ,detipinterval (scalănumeric ă)
Indicatori
•Metrici completate deunsistem dereferință saudeoțintă
deperformanță, cepermite aprecierea valorilor cafiind
satisfăcătoare saunu
•Permit evaluarea performanței (succes/eșec) îndiferite
aspect e/subdomenii aleunei organizații
•Corela țicuobiectivele debusiness

Indicatori detip„leading ”(„conducători ”/„avansați” )
•Deanticipare /avertizare
•Caracter predictiv, precursori aianumitor rezultate
–>vizea zăactivități/procese care nu au fost încă
finalizate
Indicatori detip„lagging ”(„conduși ”/„întârzia ți”)
•Reactivi ,detiprezultat
•Vizează activități/procese încheiate
Anumiți indicatori pot fiincluși în ambele categorii
–>„leading ”sau„lagging ”,înfuncție decontextManagementul performanței
-Tipologia indicatorilor –

Indicatori -cheie de tip rezultat
Key Result Indicators (KRI)
•Vizează obiectivele strategice șimetricile asociate
•Permit evaluarea rezultatelor implementării strategiei ,
înraport cusetul obiectivelor fixate
•Exemple :vânzările aferente trimestrului precedent,
gradul desatisfacție alclienților lanivelul anului
anterior, ……Managementul performanței
-Tipologia indicatorilor –

•Vizează obiectivele strategice șimetricile asociate
•Arată progresul înatingerea obiectivelor fixate
•Precursori șideterminanți airezultatelor unei organizații
•Definiți șimonitorizați detop-management
•Repere pentru întreaga organizație, prin aliniere
strategică –>dinKPIderivă indicatori specializați, pentru
diferite funcții organizaționale șiniveluri decizionale
•Specifici fiecărei organizațiiIndicatori -cheie de performanță
Key Performance Indicators (KPI)Managementul performanței
-Tipologia indicatorilor –

KPI–Cerințe standard
•Caracter anticipativ pentru rezultatele unei organizații
–>Ex.subdomenii tipice :management clienți, calitate
servicii, operațiuni vânzare, planificare vânzări, ….
•Strategici –>indicatori cuplați înmod direct ladirecția
strategică, trebuie asumați detoțiangajații
•Măsurabili –>metrici clare șicomparabile întimp
•Actuali –>indicatori relevanți pentru contextul deafaceri
curent
•Convertibili însarcini concrete –>cine șicum poate
influența KPI?
•Ușor deînțeles –>Fiecare KPIcâtmai simplu cuputințăManagementul performanței
-Tipologia indicatorilor –

Indicatori derezultate (RI) –>caracter retrospectiv,
informații istorice privind activitatea organizației
Indicatori de performanță (PI)–>caracter
anticipativ, ghidează activitatea curentă
––––––––––––––
•Fără legătură directă custrategia organizației
•Repere pentru middle &low management șiangajații cu
poziții deexecuție
•Relevanță limitată laprocesele șitranzacțiile curenteManagementul performanței
-Tipologia indicatorilor –

Managementul performanței
-Tipologia indicatorilor –
Câțiindicatori ? Repere generale:
KPI înnumăr redus –>strategie clară, „țintită”
Ex:British Airways –marja operațională ,nr.decolări
fără întârziere, nr.recomandări clienți, nivel implicare
angajați
Regula 10/80/10 (David Parmenter )
(10 K PI/80 PI& RI/10 K RI)
Utilitate reală KPI–>Fiecare KPIsuplimentar trebuie să
genereze unimpact mai mare caimpactul mediu al
indicatorilor deja considerați

Data Mining
––––––––––––
Căutarea informațiilor „ascunse”
&
Extragerea cunoștințelor

Data Mining (DM)
DM =Analiza unor volume extinse dedate ,pentru găsirea denoi
semnificații șiutilizări, dincolo descopul inițial care aghidat
colectarea și stocarea datelor –>extragerea de noi
informații/cunoștințe pebaza datelor dindiferite surse
Principiul fundamental DM –>prin examinarea situațiilor din
trecut, cuefecte deja cunoscute, sepot identifica elemente
utilizabile înconstruirea demodele aplicabile unor contexte noi,
similar ecelor inițiale

Data Mining –>Factori favorizanți
Volumele mari dedate gestionate deorganizații +disponibilitatea
surselor externe –>date istorice pentru perioade extinse detimp
–>Complementaritatea DM -DW &OLAP :
•DW =posibilă sursă dedate pentru DM șiposibilă destinație a
datelor produse prin DM
•OLAP facilitează explorarea multidimensională aconținutului DW,
inclusiv asubsetului datelor generate prin DM
Evoluția generală IT–>disponibilitatea resurselor șiplatformelor
pentru calcul intensiv șiprocesarea unor volume extinse dedate
inter -corelate
Dezvoltarea dealgoritmi specializați șiaplicații dedicate pentru DM

Data Mining –>Web Mining & Analytics
DM pentru analiza datelor dindiferite surse web :
Explorarea datelor privind istoricul deaccesare alpaginilor
web –>web analytics ,casursă pentru data mining
Analiza datelor privind utilizarea platformelor desocializare
–>social media analytics ,casursă pentru data mining
Text mining ,pentru explorarea conținutului sub formă detext
nestructurat, disponibil înpaginile web șilanivelul
platformelor social media

Data Mining –>Utilizări și aplicații
Probleme descriptive –>Ex:încazul tranzacțiilor bancare
frauduloase –>analiza datelor privind tranzacțiile derulate în
trecut, pentru identificarea unui tipar privind comportamentul
„normal” alclienților –>pentru fiecare tranzacție, datele sunt
comparate cuacest tipar
Probleme predictive –>Ex:pentru campanii depublicitate mai
bine direcționate –>datele privind email -urile promoționale
utilizate pentru identificarea prospecților cușanse deadeveni
clienți

Data Mining –>Abordări generale
DM descendent –>Confirmarea
unor ipoteze formulate înavans
DM ascendent –>Extragerea de
informații șicunoștințe dindatele
disponibile :
•Căutare dirijată (cea mai
comună ) –> explicarea
valorilor dintr -uncâmp pebaza
celor disponibile în alte
câmpuri
•Căutare nedirijată –>
identificarea relațiilor dintre
date, fără ase viza cu
predilecție unanumit câmp

Data Mining –>Procese DM
1.Identificarea problemelor/oportunităților –>căutarea deinformații nueste
scop însine, utilitatea derivă din acțiunile pe care lepotențează
–>explorarea DM este dirijată deprobleme/oportunități debusiness
2.Explorarea datelor –>complexă &neliniară :
•combinarea detehnici DM pentru rezultate optime –>tehnicile selectate
depind decontextul debusiness &datele disponibile
•potențiala eterogenitate adatelor impune pregătirea lorcorespunzătoare,
înainte deutilizare
•cele mai multe tehnici DM reclamă unproces deînvățare, înainte de
aplicarea efectivă
•deregulă, rezultatele nusunt aplicabile direct –>interpretare &adaptare
lacontextul debusiness –>intervenția experților umani

Data Mining –>Procese DM
3.Adoptarea deciziilor –>pebaza informațiilor rezultate din DM
–>acumularea decunoștințe privind mediul debusiness intern șiextern
4.Evaluarea rezultatelor –>succesul acțiunilor DM &gradul deadecvare al
deciziilor derivate dinacestea –>demersuri deDM mai bine direcționate
–>cicluri DM:

Data Mining –>Explorarea datelor -Etape
1.Definirea problemei de DM
2.Identificarea datelor relevante
3.Colectarea și selecția datelor
4.Pregătirea datelor
5.Definirea modelului de DM
6.Evaluarea modelului
7.Integrarea modelului

Data Mining –>Explorarea datelor -Etape
1.Definirea problemei deDM –>Oportunitatea sau cerința de
business –>stabilirea scopurilor șirezultatelor așteptate +
exprimarea problemei într-oformă adecvată (ex:testarea unui
nou produs -VS-care clienți arputea fiinteresați denoul
produs? )
2.Identificarea datelor relevante –>Definirea structurilor dedate
pentru rezolvarea problemei deDM +identificarea surselor de
date :DW,baze dedate &fișiere ,surse dedate externe .

Data Mining –>Explorarea datelor -Etape
3.Colectarea șiselecția datelor –>până la80%dintimpul necesar
procesului deexplorare adatelor .
Abordări privind selecția datelor :
-toate datele din sursele identificate anterior
-eșantioane de date (definite pe baze statistice )
4.Pregătirea datelor –>deoarece datele din sursele identificate
anterior aufost colectate șistocate înscopuri diferite deDM.Deși
aplicațiile pentru DM oferă funcții generice depregătire adatelor,
potfinecesare șiacțiuni dedicate, derulate înacest scop .

Data Mining –>Explorarea datelor -Etape
4.Pregătirea datelor –>Transformările uzuale vizează :
Valorile extreme sau anormale –>Seutilizează valorile aflate
între medie șiunanumit număr deabateri standard –>prin
excluziune, izolarea valorilor extreme etc.Precauție :uneori,
astfel devalori pot reprezenta caracteristici șiaspecte de
business relevante .
Valorile lipsă –>Respingerea înregistrărilor incomplete sau
înlocuirea datelor lipsă cuvalori medii /cele mai frecvente
valori /valori calculate /valori predefinite .
Valorile text –>Eliminate, dacă este posibil ;dacă nu,se
utilizează tabele decorespondențe pentru codificarea uniformă
avalorilor distincte cuaceeași semnificație .

Data Mining –>Explorarea datelor -Etape
4.Pregătirea datelor –>Transformările uzuale vizează :
Reprezentările inconsistente –>Reprezentări distincte pentru
aceleași entități/concepte
Consolidarea –>Aplicată datelor dedetaliu, irelevante cavalori
distincte /când volumul datelor analitice este insuficient /când
excede capacitatea deprelucrare .
Incompatibilitățile tehnice –>Diferențe între reprezentările
interne aledatelor

Data Mining –>Explorarea datelor -Etape
5.Definirea modelului deDM –>Modelul utilizat înmod efectiv pentru
explorarea datelor –>depinde deabordarea DM (căutare dirijată/nedirijată)
Datele selectate inițial sunt separate în3seturi –>70-80%date pentru
învățare ,restul seutilizează pentru testare șievaluare model .
Etapa deînvățare necesită unsetdeexemple complete, folosite pentru
identificarea relațiilor dintre date șiseconsideră finalizată când
rezultatele produse demodel sunt suficient deapropiate desoluțiile
disponibile însetul datelor deînvățare .Nuexistă însă certitudinea că
modelul poate fifolosit pentru situații noi–>trebuie validat folosind
date detest.

Data Mining –>Explorarea datelor -Etape
6.Evaluarea modelului deDM –>Capacitatea modelului dea
determina corect valorile pentru cazurile noi–>modelul seaplică
peal3-leasubset aldatelor selectate pentru DM (=date pentru
evaluare) –>marja deeroare identificată vaficonsiderată și
pentru cazurile noi.Calitatea modelului poate fievaluată folosind
omatrice deconfuzie –>compară cazurile reale cusoluțiile
generate demodel :
calitate globală model =nr.rezultate exacte /nr.total calcule
7.Integrarea modelului –> Integrarea cu sistemele BI
–>utilizarea efectivă amodelului DM pentru prelucrarea dedate
noi

Data Mining –>Explorarea datelor
Validitate modele DM –>Modelele DM sunt construite folosind
relațiile dintre date, valabile launanumit moment întimp –>
modelele trebuie actualizate pentru areflecta schimbările din
mediul debusiness .
Combinare modele DM –>Pentru agestiona complexitatea din
mediul debusiness –>soluția laoproblemă deDM poate impune
utilizarea mai multor modele, bazate pe diferite tehnici și
algoritmi .

Data Mining –>Acțiuni și tehnici
Tehnici DM:
•Rețele neuronale
•Arbori de decizie
•Algoritmi genetici
•Analiza grupurilor (clustering )
•Raționamentul bazat pe cazuriAcțiuni DM:
•Clasificarea
•Estimarea
•Previziunea
•Gruparea
•Analiza grupurilor
Fiecare acțiune DM se realizează cu ajutorul unor tehnici specifice
Ex: Clasificarea –> arbori de decizie, raționamentul bazat pe cazuri

Data Mining –>Acțiuni specifice
Clasificarea –>Datele sunt încadrate într-un set de clase
(categorii) predefinite –>Ex:nivelul derisc asociat solicitanților
decredite -ridicat ,mediu ,scăzut .
Estimarea –>Stabilirea valorii unei variabile ,pebaza anumitor
date deintrare –>Ex:estimarea venitului unei familii, înfuncție
derepere geografice, demografice etc.

Data Mining –>Acțiuni specifice
Predicția
•Clasificarea datelor pebaza valorilor previzionate aleunei
anumite variabile .
•Seutilizează ocolecție devalori înregistrate întrecut pentru
variabila ceface obiectul previziunii –>definirea unui model
care explică comportamentul observat –>vafiutilizat pentru
predicția noilor valori .

Data Mining –>Acțiuni specifice
Gruparea –>Identificarea obiectelor care apar frecvent
împreună –>Ex:pentru analiza coșului decumpărături .
Analiza grupurilor (clustering )–>Împarte opopulație
eterogenă, îngrupuri relativ omogene .Nuseraportează laun
setpredefinit declase –>serealizează pebaza similitudinilor
identificate înpopulația analizată –>Ex:segmentarea
clientelei .

Data Mining -vs-Machine Learning (ML)
ML–>Subdomeniu AI–>sistem ecare aucapacitatea deaînvăța
Intervenția umană :
•ML –Limitată lasetare algoritm inițial, ulterior sistemul îșiîmbunătățește singur
performanțele, înfuncție dedatele pecare leprocesează –>ajustare automată algoritm
•DM –Decisivă ,prinalegere acțiuni DM, setare parametri model DM, interpretare
rezultate
Scop/orientare predilectă :
•ML–reproducerea/utilizarea cunoștințelor disponibile
•DM–descoperirea decunoștințe noipebaza datelor disponibile
Interacțiuni -Data Science :
•MLutilizează căutarea nedirijată specifică DM pentru aîmbunătăți algoritmul deînvățare
(creșterea preciziei)
•DM=domeniu deaplicabilitate ML(tehnicile MLutilizate pentru acțiuni deDM)
Exemple utilizări ML:VPA (virtual personal assistants), motoare decăutare, recomandări produse ,
social media ,filtrare spam &malware, suport clienți (chatbots ),….vehicule autonome ….domeniul
medical (diagnostic, tratament) ….

Similar Posts