Organizațiile moderne nu numai că doresc să știe ce s -a întâmplat și de ce s -a întâmplat, ci și [604104]

1. Introducere

‘’ Organizațiile moderne nu numai că doresc să știe ce s -a întâmplat și de ce s -a întâmplat, ci și
să știe ce se întâmplă acum și ce este probabil să se întâmple în continuare ’’ (LaValle et al., 2011).
‘’Întrucât organizațiile concureaz ă pentru aceste informa ții și adoptarea World Wide Web, generarea
de date și viteza de colectare a crescut exponențial ’’ (Chen et al., 2012). Dublarea aproximativă
bianuală a puterii de calcul și a stocării la același preț, cunoscută și sub numele de legea lui Moore, a
făcut și lucruri remarcabile – de exemplu, în 1994, oamenii plăteau 1000 USD pentru un gigabyte de
stocare, în timp ce în 2010 costurile unui Gigabyte de stocare erau doar 0,10 $ si mai mic de 4
eurocen ți în 2017.
Cererea p entru toate aceste informații și toate aceste evoluții tehnologice rapide au permis
companiilor să capteze, să stocheze și să analize ze cantități mari de date. Putem examina , de
exemplu, Flickr, un site public unde po ți partaja liber fotografii , care a primit în 2014 o medie de
1,83 milioane de fotografii în fiecare zi (Flickr, 2014). Presupunând că mărimea de stocare a fiecărei
fotografii variază în tre 1,5 și 3 megabyte, era nevoie de un spa țiu de stocare de 3,9 Terabyte în
fiecare zi.
Datori tă acestor evoluț ii rapide, mai multe companii își concentrează atenția asupra explorării
și exploatării tuturor acestor date. Acest fenomen este numit "Big Data" și este identificat ca fiind ‘’
unul dintre cele mai mari trenduri IT din ultimii ani ‘’ (Gartner, 2014). Di n moment ce Big Data este
încă î n trend, oamenii utilizează Big Data pentru a descrie cantitatea masivă de informații care sunt
prea dificil de procesa t de o bază de date veche sau de tehnici software tradiționale.
În general, compa niile văd Big Data ca pe un bun. Unele organizații fac comparația cu petrolul,
deoarece , ca și petrolul, aceste date mari trebuie perfecționate înainte de a obține o valoare. Cu
toate acestea, aici este locul în care majoritatea organizațiilor se luptă chiar dac ă nu de țin puterea
de a o perfec ționa . De exemplu, când mergem la o conferință Big Data, unele organizații susțin că:
"Big Data este ca sexul adolescent in, toată lumea vorbește despre asta, nimeni nu știe cum să o facă,
toată lumea crede că toată lume a o face , așa că toată lumea susține că face "(Ariely, 2013). Prin
urmare, scopul multor organizații de astăzi este de a crea o abordare mai practică pentru Big Data
pentru a încerca să se depă șeasc ă starea initial ă și să se ob țină o perfec ționare d in ce în ce mai bun ă.
Istoria Big Data ca termen poate fi scurtă – dar multe dintre fundațiile pe care se construiește au
fost date cu mult timp în urmă.
Cu mult înainte ca să devin ă un lucru obisnuit să ai un calculator care s ă dețină mult ă
informa ție și să aibe acces la internet , ideea de a crea un corp de cunoștințe mereu extins e pentru
analiză a fost popular în mediul academic.
Deși ar fi ușor să uităm, capacitatea noastră crescândă de a stoca și de a analiza informațiile a
avut o evoluție treptată – deși lucrurile au urcat cu siguranță la sfârșitul secolului trecut, odat ă cu
inventarea stocării digitale și a internetului.

Istoria antică a datelor

Aproximativ 18.000 î. Hr.
Primele exemple pe care le avem despre stocarea și analizarea datelor de către oameni sunt
bastoane le. Ishango Bone a fost descope rit în 1960 în Uganda de astă zi și se crede a fi una dintre
primele dovezi ale stocării pre istorice a datelor. Palestinienii din periada paleolitic au marca t
crestături în bastoane sau oase, ca să țină evidența activității de tranzacționare sau a bunurilor.
Aceștia au comparat bastoanele și crestăturile pentru a efectua cal cule rudimentare, ceea ce le -a
permis să facă previziuni, cum ar fi durata consumului de alimente.
Aproximativ 2400 î.H.
Abacul – primul dispozitiv dedicat construit special pentru efectuarea calculelor – intră în
folosință în Babilon . Primele biblioteci au apărut în această perioadă, reprezentând primele
încercări de stocare a datelor în masă.
Perioada : 300 î.H. – 48 d. Hr.
Biblioteca din Alexandria a fost probabil cea mai mare colecție de date din lumea ant ică, a
adăpostit aproximativ jumătate de milion de suluri , care acoperă mult din ceea ce am învățat până
acum, despre aproape toate lucrurile. Din nefericire, în anul 48 se crede că a fost distrusă de romani i
invadatori, probabil accidental. Contrar mitul ui comun, nu s -au pierdut totul – părți semnificative din
colecțiile bibliotecii au fost mutate în alte clădiri din oraș sau furate și dispersate în lumea antică.
Perioada : 100 – 200 d.Hr.
Mecanismul Antikythera, cel mai vechi computer mecanic descoperit, este produs, probabil, de
oameni i de știință greci. Este "CPU" constă din 30 de unelte de bronz interconectate și se crede că a
fost proiectat pentru scopuri astrologice și urmărirea ciclului Jocurilor Olimpice. Designul său
sugerează că este probabil o evoluție a unui dispozitiv anterior – dar până acum toate acestea au
rămas nedescoperite.

Apariția statisticilor
1663
În Londra, John Graunt efectuează primul experiment înregistrat în analiza datelor statistice.
Prin înregistrarea informațiilor despre mortalitate, el a susținut că poate proiecta un sistem de
avertizare timpurie pe ntru ciuma bubonică care devasta Europa.

1865
Termenul "business intelligenc e" este folosit de Richard Millar De vens în Enciclopedia sa de Anun țuri
comerciale și de afaceri, descriind modul în care bancherul Henry Furnese a obținut un avantaj față
de concurenți prin colectarea și analizarea informațiilor relevante pentru activităț ile sale de afaceri
într-o manieră structurată. Acesta este considerat a fi primul studiu al unei afaceri care pune analiza
datelor în scopuri comerciale.
1880
Biroul american de recensământ are o problemă – estimează că va dura 8 a ni pentru a distruge
toate datele colectate în recensământul din 1880 și se preconizează că datele generate de
recensământul din 1890 vor dura peste 10 ani, ceea ce înseamnă că nu va chiar să fie gata să se uite
până când este depășită de recensământul di n 1900. În 1881, un inginer tânăr angajat de Birou –
Herman Hollerith – produce ceea ce va deveni cunoscut sub numele de Masina de tabulare H ollerith .
Folosind cartele perforate , el reduce munca de 1 0 ani la trei luni și își c âstigă locul în istorie ca tată
al unui calcul automat modern. Compania pe care o înființează va continua să devină cunoscută sub
numele de IBM.
Zilele timpurii ale stocării datelor moderne
1926
Intervievat de revista Colliers, inventatorul Nikola Tesla afirmă că atunci când tehnologia fără
fir este "aplicată perfect, întregul Pământ va fi transformat într -un creier uriaș, care de fapt este,
toate lucrurile fiind particule ale unui î ntreg real și ritmic … și instrumentele prin care vom fi capabili
să facem acest lucru va fi uimitor de simplu în comparație cu telefonul nostru actual. Un băr bat va
putea să o poarte în buzunarul de la vestă ’’.
1928
Fritz Pfl eumer, inginer germano -austriac, inventează o metodă de stocare magnetică a
informațiilor pe bandă. Principiile pe care le dezvoltă sunt încă în uz astăzi, marea majoritate a
datelor digitale fiind stocate magnetic pe discurile hard disk.
1944
Fremont Rider, bibliotecar la Universitatea Wesleyan, Connecticut, SUA, a publicat o lucrare
intitulată " Școlarul și viitorul bibliotecii de cercetare".
Într-una dintre primele încercări de cuantificare a cantității de informații care se pro duc, el observă
că, pentru a stoca toate lucrările academice și populare de valoare, bibliotecile americane ar trebui
să își dubleze capacitatea la fiecare 16 ani. Acest lucru la determinat să speculeze că până în 2040,
Biblioteca Yale va conține 200 de mi lioane de cărți distribuite pe rafturi de 6000 mile.

Începuturile Inteligenței Afacerilor

1958
Cercetătorul IBM, Hans Peter Luhn, definește Business Intelligence ca fiind "abilitatea de a
înțelege relațiile intermediare ale faptelor prezentate astfel încât să îndrume acțiunea către un scop
dorit".
1962
Primii pași sunt luați spre recunoașterea vorbirii, când ingi nerul IBM William C Dersch
prezintă Masina Shoebox la Târgul Mondial din 1962. Poate interpreta numere și șaisprezece cuvinte
vorbite în limba engleză în informații digitale.
1964
Un articol în New Statesman se refer ă la dificultatea de a gestiona cantitatea tot mai mare
de informații devenind disponibile.
Începerea centrelor mari de date
1965
Guvernul SUA planifică primul centru de date din lume pentru a stoca 742 de milioane de
declarații fiscale și 175 de milioane de seturi de amprente digitale pe bandă magnetică.
1970
Matematicianul IBM Edgar F Codd își prezintă cadrul pentru o "ba ză de date relațională".
Modelul oferă cadrul pe care îl folosesc astăzi multe servicii de date moderne pentru a stoca
informații într -un format ierarhic, accesibil oricui cunoaște ceea ce caută. Înainte de a accesa datele
de pe memoria computerului, bănci le au solicitat, de obicei, un expert.
1976
Sistemele de planificare a cerințelor materialelor (MRP) devin din ce în ce mai frecvent
utilizate în lumea afacerilor, reprezentând una dintre primele utilizări comerciale principale ale
computerelor pentru a accelera procesele de zi cu zi și a face eficiența. Până acum, majoritatea
oamenilor le -au văzut probabil doar în cercetare și dezvoltare sau în medii academice.
1989
Posibil prima utilizare a termenului Big Data (fără capitalizare) în modul în care este folosit
astăzi. Cel mai bine vândut autor internațional Erik Larson prezintă un articol pentru Harpers
Magazine, care speculează originea corespondenței nedorite pe care o primește. El scrie: "Cei care
păstrează datele mari spun că o fac pentru beneficiul consumatorului. Dar datele au o modalitate de
a fi folosite în alte scopuri intenționate. "

În plus, "business intelligence" – deja un concept popular de la sfârșitul anilor '50 – vede o creștere a
popularității cu software -ul și sistemele nou apărute pentru analiza performanțelor comerciale și
operaționale.
Apariția internetului
1991
Știința informatică Tim Berners -Lee a anunțat nașterea a ceea ce va deveni Internetul așa
cum o știm astăzi. Într -un post din grupul Usenet alt.hypertext el stabilește specificațiile pentru o
rețea de date interconectată, accesibilă oric ui de oriunde.
1996
Potrivit lui R J T Morris și lui B J Truskowski în cartea din 2003 "Evoluția sistemelor de
stocare", acesta este punctul în care stocarea digitală a devenit mai rentabilă decât hârtia.
1997
Michael Lesk își publică lucrarea ‘’Cât de multe informații există în lume? ‘’Teoretizând că
existența a 12.000 petabytes "poate nu este o presupunere nerezonabilă". El subliniază, de
asemenea, că chiar și la acest punct de început al dezvoltării sale, web -ul crește de 10 ori în fiecare
an. O mare parte din aceste date, subliniază el, nu vor fi văzute niciodată de nimeni și, prin urmare,
nu dau nicio perspectivă.
De asemenea, Google Search debutează în ace st an – și pentru următorii 20 de ani (cel puțin) numele
său va deveni stenografie pentru căutarea pe internet a datelor.
Idei timpurii de date mari
1999
Câțiva ani mai t ârziu apare și termenul Big Data în Visual Explorarea seturilor de date
Gigabyte în timp real, publicat de Asociația pentru Calculatoare. Din nou, se caută tendința de
stocare a unor cantități mari de date, fără a fi posibil ă o analiză adecvată . Lucrarea continuă să citeze
pionierul de calcul Richard W Hamming spunând: "Scopul calculului este înțelegerea, nu numerele".
De ase menea, s -a utilizat mai întâi termenul "Internetul obiectelor", pentru a descrie numărul tot
mai mare de dispozitive online și posibilitatea de a comunica între ele, adesea fără un "om de mijloc"
uman. Termenul este folosit ca titlul unei prezentări date de Procter și Gamble de către pionierul
RFID Kevin Ashton.
2000
Peter Lyman și Hal Varian (acum economist -șef la Google) au încercat să calculeze
pentru prima dată cantitatea de informații digitale din lume și rata de creștere a acesteia. Ei au
concluzionat: "Producția anuală globală de materi ale imprimate, de film, optice și magnetice va
necesita aproximativ 1,5 miliarde de gigaocteți de stocare. Acesta este echivalentul a 250 de
megaocteți pe persoană pentru fiecare bărbat, femeie și copil de pe Pământ. "

2001
În lucrarea sa, 3D Data Management: Controlling Volume Data, Velocity și VarietyDoug
Laney, analist la Gartner, definește trei dintre ceea ce vor deveni caracteristicile obișnuite ale Big
Data.
În acest an, se vede și prima utilizar e a termenului "software ca serviciu" – un concept fundamental
pentru numeroase aplicații bazate pe cloud, care sunt astăzi standard în industrie – în articolul
Strategic Backgrounder: Software ca un serviciu prin software și informații Asociația Industrie i.
Web 2.0 mărește volumele de date
2005
Comentatorii informează că suntem martorii nașterii "Web 2.0" – web -ul generat de
utilizatori, unde majoritatea conținutului va fi furniza t de utilizatorii de servicii, și nu de furnizorii de
servicii înșiși. Acest lucru se realizează prin integrarea paginilor web tradiționale în stil HTML cu baze
de date back -end bazate pe SQL. 5.5 milioane de persoane folosesc deja Facebook, lansat cu un a n
mai devreme, pentru a încărca și a împărtăși propriile date prietenilor.
Tot atunci apare Hadoop – cadrul open source creat special pentru stocarea și analiza seturilor Big
Data. Flexibilitatea sa o face deosebit de utilă pentru gestionarea datelor nes tructurate (voce, video,
text brut etc.) pe care le generăm și colectăm din ce în ce mai mult.
Folosirea de astăzi a termenului "date mari" apare tot atunci.
2007
Prin cablu, conceptul de Big Data ad uce masele cu articolul lor Sfârșitul teoriei:
Delugeul de date face ca modelul științific să fie învechit.
2008
Serverele din lume procesează 9,57 zeta (9,57 trilioane de gigabytes) de informații –
echivalentul a 12 gigaocteți de informații per persoană, pe zi), în funcție de cât de multe informații?
Raportul din 2010. În producția internațională și diseminarea informației, se estimează că în acest an
vor fi produse 14,7 exabyte de informații noi.
2009
Compania americană cu o medie de peste 1.000 de angajați stochează mai mult de 200
de terabyte de date conform raportului Big Data: The Next Frontier pentru Inovare, Concurență și
Productivitate de c ătre McKinsey Global Institute.
2010
Eric Schmidt, președintele executiv al Google, declară într -o conferință că, la fiecare două
zile, se creează atât de multe date, așa cum a fost creată de la începutul civilizației umane până în
anul 2003.

2011
Raportul McKinsey afirmă că până în 2018 Statele Unite se vor confrunta cu un deficit
între 140.000 și 190.000 de oameni de știință din domeniul datelor profes ionale și afirmă că
problemele, inclusiv viața privată, securitatea și proprietatea intelectuală, vor trebui soluționate
înainte de realizarea întregii valori a Big Data.
2014
Creșterea mașinilor mobile – pentru prima dată, mai multe persoane utilizează
dispozitive mobile pentru a accesa date digitale decât computerele de birou sau de acasă. 88%
dintre directorii de companii chestionați de GE, care lucrează cu Accenture, arată că analizele de
date mari r eprezintă o prioritate pentru afacerea lor.
Gând de încheiere
Ceea ce ne învață acest lucru este big data nu sunt un fenomen nou sau izolat, ci unul care face parte
dintr -o evoluție îndelungată de captare și utilizare a datelor. Ca și alte dezvoltări esențiale în
stocarea datelor, prelucrarea datelor și Internetul, Big Data este doar un pas suplimentar care v a
aduce schimbări în modul în care conducem afacerile și societatea. În același timp, va pune bazele pe
care vor fi construite multe evoluții. (https:/ /www.weforum.org/agenda/2015/02/a -brief -history -of-
big-data -everyone -should -read/ )
Prezentarea sumar ă a celor patru capitole de Teorie
1 Business Inteligence (BI)
2 Data warehouse (DW)
3 Data mining
4 Data visualisation

1 Business Inteligence (BI)

Inteligența business (BI) este un termen umbrelă care include o varietate de aplicații IT
care sunt folosite pentru a a naliza datele unei organizații și pentru a comunica informațiile
utilizatorilor relevanți. (Figura 2.1).

Figura 2. 1: Ciclul BIDM
Natura celor dou ă : a vie ții si a afacerii este să crească. Informația este precum
sângele pentru via ța în afaceri. Întreprinderile folosesc multe tehnici pentru a înțelege mediul in
care activeaza și de a prezice viitorul pentru pentru a beneficia de creștere. Deciziile sunt luate prin
două filtre : cel al sentim entelor și c el al informatiilor concrete. Deciziile care sunt luate pe baza
unor date concrete sunt adesea superioare celor luate sentimental. Acțiunile bazate pe date,
informații, cunoștințe, experimentări și teste exacte care utilizează date noi, pot a duce un succes
mai mare și pot duce la o creștere susținută. Datele personale pot fi cele mai eficiente. Prin urmare,
organizațiile ar trebui să adune date, să le analizeze , sa le sorteze , pentru a găsi informații ca sa le
încorporeze în procedurile lor d e funcționare.
Există un nou sentiment de importanță și de urgență în ceea ce privește datele,
deoarece este privită ca o nouă resursă naturală. Acesta poate fi exploatat pentru valoare,
perspective și avantaj competitiv. Într -o lume hiperconectată, unde totul este potențial conectat la
orice altceva, datele reprezintă un impuls natural sub forma anumitor evenimente și atribute. O
persoană de afaceri calificată este motivată să folosească această memorie cache a datelor pentru a
valorifica natura și să găsească nișe noi spre noi oportunități care ar putea deveni profitabile.
Viitorul este nesigur. Rezultatul unei lumi probabiliste , unde nu sunt certit udini iar
complexit ățile abund ă, este riscul. Oamenii fo losesc globurile de cristal, a strologia, chiroman ția, de
asemenea matematica si cifrele pentru a dimin ua riscul în luarea deciziilor. Scopul este s ă luăm
decizii folositoare, eficace , care să ne ajute în vederea reduceri i riscului. Afacerile calculeaz ă
riscurile si iau decizii bazate pe un set larg de date si intui ții.
Viteza de acționare a crescut expone nțial odat ă cu dezvoltarea Internetulu i. Într-o
lume extra -competitiv ă, viteza unei decizii și acțiunea urmatoare pot consti tui un avantaj cheie.
Internetul si tehnologiile mobile permit lu area deciziilor oriunde și oricâ nd. Ignorarea schimbă rilor
rapide pot amenința viitorul unei organizații. Studii au arătat că un comentariu nefavorabil despre o
companie ș i produsele acesteia în medi ul online nu ar trebui să rămană nesoluționat prea mult timp.
Băncile au avut de pl ătit penalita ți uria șe către OPFC ( Oficiul de Protectie Financiara a
Consumatorului ) în anul 2013 în SUA din cauza pl ângerilor facute p e website -urile OPFC. Pe de alt ă
parte, un sentiment pozitiv exprimat în mediul online ar trebui folosit de asemenea d rept o
oportunitate de v ânzare și promovare , atâta timp c ât dureaz ă oportunitatea.

Tipuri de decizie
Exista 2 tipuri principale de decizii: decizii strategice și decizii opera ționale. Intelig ența
în afaceri(IA) le poate îmbunata ți pe ambele. Deciziile strategice sunt acelea care au un impact
asupra direc ției în care merge compania. Decizia de a ajunge la un nou cerc de clien ți este una de tip
strategic. Deciziile opera ționale sunt mai tactice și mai obisnuite , concentrate pe dezvol tarea unei
eficiente mai b une.Un exemplu de decizie opera ționala ar putea f i actualizarea cu noi proprieta ți a
unui vechi website.
In luarea deciziilor strategice, scopul in si ne poate fi mai mult sau mai pu țin clar, iar acelasi lucru
este valabil si pent ru calea prin c are iti atingi scopul. Consecin țele deciziei vor fi vizibile dupa ceva
timp. Asadar omul ar trebui sa exp loreze constant noi posibilita ți si cai prin care sa i și indeplineasca
scopul.
IA poate ajuta in ana lizarea de tip what -if a multor scenarii posibile. IA poate ajuta si in crearea altor
idei bazate pe noi modele/tipare ga site prin extragerea de informa ții.
Deciziile opera ționale pot fi mai eficiente prin f olosirea unei analize a informa țiilor din trecut. Un
sistem de clasificar e poate fi cr eat si modelat folosind informaț ia din trecut pentru a dezvolta un bun
model de domeniu. Acest model ajuta la imbunatatirea deciziilor operationale viitoare. IA poate
automatiza nivelul de operare in luarea deciziilor printr -un mod stabilit de un model/tipar/sablon.D e
exemplu, ar putea dori sa ia decizii in vederea unor imprumuturi f inanciare intr -un mod mai stiin țific
folosit un model bazat pe informatie. O decizie bazata pe un model de tip copac poate furniza decizii
de imprumut constant core cte. Dezvoltand astfel de decizii de tip copac este una dintre principalele
aplica ții ale te hnicilor de extragere a informa ției.
O IA eficineta are un component evolutionar, pe masura ce modelele de a facere se dezvolta. Noi
informa ții sunt generate atunci cand oameni i si organiza țiile organizeaza. Modelele de afacere
actuale pot fi testate impotriva noii informa ții, si este posibil ca acele modele sa nu reziste. In acest
caz tipul de hotarare trebuie revizuit iar noi intelegeri trebuie incorporate.
Un proce s continuu de generare a noi in țelesuri in timp real poate ajuta in luare a unor decizii mai
bune si astfel poate contitui un avantaj competitiv semnificativ
Uneltele IA
IA inc lude o varietate de unelte de software si tehnici care furnizeaza noi informatii si intelesuri
necesare ca menegerul sa administreze mai bine afacerea. Informatia poate fi asigurata de starea
curenta a facerilor cu capacitatea de a dezvolta detaliile, si d e asemenea intelesuri despre structuri
in curs de dezvoltare care conduc la proiectia in viitor. Uneltele IA includ depozitarea de date,
procesarea analitica online, analitica in mediul online, informarea, dashbord -urile, interogarile si
explorarea datelor .
Instrumentele IA pot varia de la unele foarte simpliste care sunt considerate ca unelte end -user
(utilizator final), pana la unele foarte sofisticate care pot oferi un set larg si complex de functii. Astfel
, executorii pot fi proprii lor experti in IA , ori se pot baza pe specialisti in IA care sa stabileasca
mecanismul de IA pentru ei. In asa fel, mari organizatii investesc in solutii de IA costisitoare si
sofisticate pentru a furniza date corecte in timp real.

O unealta de foaie de calcul, cum ar fi Microsoft Excelmpoate actiona pe cont propriu ca o unealta
usoara dar eficace. Informatia poate fi descarcata s i stocata in foaia de calcul ,a poi analizata pentru
producerea de intelesuri , iar in cele din urma prezenta in forma de grafic sau tabel. Caract eristicile
analitice ofera automatizare limitata folosind macro -uri si alte trasaturi. Caracteristicile analitice
includ functii statistice si financiare de baza. Tabelele pivot ajuta in a executa analize sofisticate de
tip what -if. Modulele de completare pot fi instalate pentru a activa o analiza statistica destul de
sofisticata.

Un sistem dashboard, cum ar fi IBM poate oferi un set de instrumente sofisticate care pot strange,
analiza si prezenta informatia. La capatul utilizatorului dashboard -uri modulare pot fi desemnate si
redesemnate cu usurinta printr -o interfata grafica de util izator. Informatia analitica de back -end
include multe functii statistice. Dashboard -urile sunt corelate cu depoziturile de date la capatul din
spate pentru a asigura ca tabelele, graficele si alte elemente ale dashboar -ului sunt actualizate in
timp real.
Sistemele de extragere a date lor, cum ar fi IBM SPSS Modeler , sunt sisteme cu putere industriala
care furnizeaza abilitati de aplicare intr -o gama larga de modele analitice despre seturi mari de
informatie. Sistemele cu sursa deschisa, spre exemplu Weka, s unt platforme celebre desemnate sa
ajute la extragerea unei cantitati mari de informatie pentru a descoperi noi sabloane.
Abiliatile IA
Pe masura ce informatia creste si depaseste capacitatea noastra de a o intelege, uneltele trebuie sa
evolueze si asa ar trebui sa faca si imaginatia specialistului in IA. Cel mai tare job al acestui deceniu
este cunoscut sub numele de ‚cercetator de date’.
Un specialist priceput si experimentat in IA trebuie sa fie deschis in asa fel incat sa nu gandeasca la
fel ca ceilalti ,sa aiba o deschidere in asa fel incat sa vada perspectiva largita care include mai multe
dimensiuni si variatii cu scopul de a descoperii sisteme si intelesuri importante. Problema trebuie

vazuta dintr -o perpectiva mai larga pentru a lua in cosiderare ma i multe unghiuri care nu sunt
evidente imediat. O solutie imaginativa ar trebui propusa problemei ca rezultate interesante si
folositoare sa iasa la suprafata .
O buna extragere de informatie incepe prin rezovarea unei probleme interesante. Problema
select arii unei extrageri de informatie corecta este o indemanare importanta. Problema ar trebui sa
fie atat de valoroasa incat rezolvarea ei sa isi merita timpul si cheltuiala. E nevoie de mult timp si
energie pentru a aduna, organiza, curata si pregati informa tia pentru extragere si alte analize.
Minerul de date trebuie sa persiste in explorarea sistemelor de informatie. Nivelul de calificare
destul de ridicat pentru a te angaja in adunarea de informatie si transunerea acesteia in noi
intelesuri.
Aplicatiile IA
Unelte de IA sunt necesare in aproximativ toate functiile si industriile. Natura informatiei si viteza de
actionare difera de la o afacere la alta, insa orice manager are nevoie in ziua de astazi de unelte de IA
pentru a avea valori la zi despre performan ta in afaceri. Afacerile trebuie sa incorporeze noi
intelesuri in procesele de operare pentru a asigura ca activitatile lor continua sa evolueze prin
practici mai eficiente. Domeniile ce vor urma sunt aplcatii ale IA si ale extragerii de date
Maganementul relatie cu clientul
O afacere exista pentru a servi clientului. Un client fericit va deveni un client frecvent. O afacere ar
trebui sa inteleaga nevoie de sentiment a clientului , sa vanda mai mult decat decat ceea ce ofera
clientilor existenti si de asemenea sa extinda varietate de clienti pe care ii serveste. Aplicatiile IA pot
influenta multe aspecte ale marketing -ului.
1. Mareste la maxim intoarcerea la campaniile de marketing: intelegerea punctelor slabe ale
clientului din analize bazate pe informatie pot asigura ca mesajele marketing -ului sunt bine
filtrate catre o mai buna rezonanta cu clientul.
2. Impunatatirea retinerii clientilor: este mult mai dificil si costisitor sa castigi noi clien ti decat
sa ii retii pe cei existenti. Castigarea fiecarui client pe baza probabilitatii lui de abandon
poate ajuta afacerea sa desemneze interventii eficiente , cum ar fi reducerile sau serviciile
gratuite, pentru a retine clienti profitabili intr -o manie ra rentabila.
3. Mareste la maxim valoarea clientului: fiecare contact cu clientul trebuie vazut ca o
oportunitate de a prevedea nevoile lui actuale. Oferirea de noi produse sau solutii bazate pe
aceste nevoi imputate cresc rata de venit pe client. Chiar si o plangere poate fi folosita ca o
oportunitate de uimire a clientului. Folosind cunostinte despre istoria si valoarea clientului,
afacerea poate vinde clientului un serviciu -premiu .
4. Identifica si incanta clientul mult valoros. Poti identifica clientii prin segmenarea acestora. Ei
pot fi contactati proactvi si incantati cu o mai mare atentie si un serviciu mai bun.
Programele de loialitate pot fi administrate mai eficient.
5. Administrarea imaginii brand -ului. Un brand poate crea un post de ascultarea comentari ilor
despre el insusi in mediul online. Mai ap oi,poate face analiza textului pentru a intelege
natura comentariilor si pentru a raspunde in coformitate cu clientii.

Concluzie
IA este un set cuprinzator de unete IA care sprijina luarea deciziilor prin solutii imaginative pentru o
varietate de probleme. IA poate ajuta la imbunatatirea informatiei in aproximativ toate industriile si
aplicatiile.

DW
Un depozit de date (DW) este o colecție organizată de baze de date integrate, concepute pentru
susținerea funcțiilor de suport al deciziilor. DW este o rganizat la un nivel adecvat pentru a furniza
date clare la nivel de întreprindere într -un format standardizat pentru rapoarte, interogări și analize.
DW este fizic și funcțional separat de o bază de date operațională și tranzacțională. Crearea unui DW
pentru analiză și interogări rep rezintă o investiție semnificativă în timp și efort. Trebuie să fie
constant menținută la zi pentru ca aceasta să fie utilă.
DW oferă multe beneficii de afaceri și tehnice. DW sprijină raportarea de afaceri și a activităților
miniere de date. Poate facili ta accesul distribuit la cunoștințele de afaceri actualizate pentru
departamente și funcții, îmbunătățind astfel eficiența afacerii și servicii pentru clienți. DW poate
prezenta un avantaj competitiv prin facilitarea procesului de luare a deciziilor și pri n facilitarea
proceselor de afaceri.
DW permite o vizualizare consolidată a datelor corporative, toate curățate și organizate. Astfel,
întreaga organizație poate vedea o viziune integrată de sine. DW oferă astfel informații mai bune și
mai rapide. Acesta simplifică accesul la date și permite utilizatorilor finali să efectueze analize ample.
Îmbunătățește performanța generală a informațiilor prin faptul că nu împovărează bazele de date
operaționale utilizate de Enterprise Resource Planning (ERP) și alte sis teme.
Exemplu :
Indiana University Health (IUH), un mare sistem academic de îngrijire a sănătății, a decis să
construiască un depozit de date pentru întreprinderi (EDW) pentru a promova o adevărată cultură
de management bazată pe date. IUH a angajat un fur nizor de date de depozitare pentru a dezvolta
un EDW care se integrează, de asemenea, cu sistemul lor electronic de înregistrări de sănătate (EHR).
Ei au încărcat 14 miliarde de rânduri de date în EDW – pe deplin 10 ani de date clinice din întreaga
rețea I UH. Au fost incluse evenimente clinice, întâlniri ale pacienților, laboratoare și radiologie și alte
date ale pacienților, precum și datele privind gestionarea performanțelor, ciclul veniturilor și
satisfacția pacienților de către IUH. Ei au introdus în cu rând un nou tablou de bord interactiv,
folosind EDW, care a oferit conducerii IUH informațiile zilnice de operare de care au nevoie pentru a
rezolva ecuația de calitate / cost. Oferă vizibilitate în metrici și tendințe operaționale cheie pentru a
urmări cu ușurință măsurile de performanță esențiale pentru controlul costurilor și menținerea
calității. EDW poate fi utilizat cu ușurință în cadrul departamentelor IUH pentru a analiza, urmări și a
măsura rezultatele clinice, financiare și de pacient. (Sursa: hea lthcatalyst.com)

Considerații de proiectare pentru DW
Obiectivul DW este de a oferi cunoștințe de afaceri pentru a sprijini luarea deciziilor. Pentru ca DW
să își îndeplinească obiectivul, ar trebui să fie aliniată în jurul acestor decizii. Ar trebui să fie
cuprinzătoare, ușor de accesat, și până la zi. Iată câteva cerințe pentru un DW bun:
1. Orientarea la subiect: Pentru a fi eficient, un DW ar trebui să fie proiectat în jurul unui domeniu,
adică să ajute la rezolvarea unei anumite categorii de probleme .
2. Integrat: DW ar trebui să includă date din mai multe funcții care pot arunca o lumină asupra unei
anumite subiecte. Astfel, organizația poate beneficia de o viziune cuprinzătoare asupra domeniului.
3. Varianta de timp (serii de timp): Datele din DW ar trebui să crească la intervale zilnice sau la alte
intervale alese. Aceasta permite cele mai recente comparații în timp.
4. Nonvolatile: DW ar trebui să fie persistentă, adică nu ar trebui să fie cr eat rapid din bazele de date
de operații. Astfel, DW e ste în mod constant disponibil pentru analiză, în întreaga organizație și în
timp.
5. Sumarizat: DW conține date de tip roll -up la nivelul corect pentru interogări și analize. Procesul de
rulare a datelor contribuie la crearea unei granularități consecven te pentru comparații eficiente. De
asemenea, ajută la reducerea numărului de variabile sau dimensiuni ale datelor pentru a le face mai
relevante pentru factorii de decizie.
6. Nu este normalizat: DW utilizează adesea o schemă stea, care este o masă centra lă
dreptunghiulară, înconjurată de niște mese de căutare. Vizualizarea unui singur tabel mărește
semnificativ viteza interogărilor.
7. Metadate: Multe din variabilele din baza de date sunt calculate din alte variabile din baza de date
operațională. De exe mplu, vânzările zilnice totale pot fi un câmp calculat. Metoda de calcul a
acesteia pentru fiecare variabilă trebuie documentată în mod eficient. Fiecare element din DW ar
trebui să fie suficient de bine definit.
8. În timp real și / sau în timp real (act iv): DW -urile ar trebui să fie actualizate în timp real aproape în
multe industrii cu volum mare de tranzacții, cum ar fi companiile aeriene. Costul implementării și
actualizării DW în timp real ar putea fi descurajator. Un alt dezavantaj al DW în timp rea l sunt
posibilitățile de n econcordanță în rapoartele inregistrate la doar câteva minute.
Abordări de dezvoltare DW
Există două abordări fundamentale diferite ale dezvoltării DW: de sus în jos și de jos în sus.
Abordarea de sus în jos este de a face un DW cuprinzător care acoperă toate nevoile de raportare
ale întreprinderii. Abordarea de jos în sus este de a produce martori de date mici, pentru nevoile de
raportare ale diferitelor departamente sau funcții, după cum este necesar. Mărcile de date mai mici
se vor alinia, în cele din urmă, pentru a oferi capabilități extinse pentru EDW. Abordarea de sus în jos
asigură consistență, dar necesită mai mult timp și resurse. Abordarea de jos în sus duce la o
proprietate locală sănătoasă și la menținerea datelor (tabe lul 3.1).

Arhitectura DW
DW are patru elemente cheie (Figura 3.1). Primul element este sursele de date care furnizează
datele brute. Al doilea element este procesul de transformare a acestor date pentru a răspunde
nevoilor decizionale. Cel de -al treilea element sunt metodele de încărcare regulată și precisă a
acestor date în EDW sau martor de date. Al patrulea element este partea de acces și analiză a
datelor, în care dispozitivele și aplicațiile utilizează datele de la DW pentru a furniza informații și a lte
beneficii utilizatorilor.

Sursele de date
Sursele de date sunt create din surse de date structurate. Datele nestructurate, cum ar
fi datele de text, ar trebui să fie structurate înainte de inserarea în DW.

1. Date privind operațiunile: Acestea includ date din toate aplicațiile de afaceri, inclusiv din sistemele
ERP care formează coloana vertebrală a sistemelor informatice ale unei organizații . Datele care vor fi
extrase vor depinde de obiectul depozitului de date. De exemplu, pentru datele despre vânzări /
marketing, vor fi extrase numai datele despre clienți, comenzi, servicii pentru clienți și așa mai
departe.
2. Aplicații specializate: Ace stea includ aplicații cum ar fi terminale Point of Sale (POS) și aplicații de
comerț electronic, care oferă și date cu care se confruntă clienții. Datele furnizorilor ar putea proveni
din sistemele de gestionare a lanțului de aprovizionare. Datele de plani ficare și de buget ar trebui
adăugate, de asemenea, după cum este necesar pentru a face comparații cu obiectivele.
3. Date sindicalizate externe: Acestea includ date publice disponibile, cum ar fi date despre vreme
sau despre activitatea economică. De ase menea, ar putea fi adăugat la DW, după cum este necesar,
pentru a oferi informații contextuale bune factorilor de decizie.
Procesele de încărcare a datelor
Inima unui DW util este procesele pentru a popula DW cu date de bună calitate. Aceasta se
numește extractul -Transform -Load (ETL) ciclu.

1. Datele ar trebui extrase din surse operaționale (tranzacționale), precum și din alte aplicații, în mod
regulat.

2. Datele extrase ar trebu i aliniate împreună cu câmpurile cheie și integrate într -un singur set de
date. Ar trebui să fie curățat de orice nereguli sau valori lipsă. Ar trebui să fie laminate împreună l a
același nivel . Câmpurile dorite, cum ar fi totalul zilnic de vânzări, ar tre bui calculate. Întreaga
informație trebuie să fie adusă la același format ca și tabelul central al DW.
3. Aceste date ar trebui să fie transformate apoi încărcate în DW.
Acest proces ETL ar trebui să funcționeze la o frecvență regulată. Datele de tranzac ție zilnice pot fi
extrase din ERP -uri, transformate și încărcate în baza de date în aceeași noapte. Astfel, DW este
actualizată în fiecare dimineață. Dacă este necesar un DW pentru accesul la informații aproape în
timp real, procesele ETL ar trebui să fie executate mai frecvent. Lucrările ETL se efectuează, de
obicei, utilizând automate folosind scripturi de programare care sunt scrise, testate și apoi
implementate pentru actualizarea periodică a DW.
Schema de date : Warehouse Schema
Star este arhitectura de date preferată pentru majoritatea DW -urilor. Există un tabel central care
oferă majoritatea informațiilor de interes. Există tabele de căutare care furnizează valori detaliate
pentru codurile utilizate în tabelul central. De exemplu, tabelul central poate utiliza caractere pentru
a reprezenta o persoană de vânzări. Tabelul de căutare va ajuta să furnizați numele acelui cod de
persoană de vânzare. Iată un exemplu de schemă stea pentru o monitor izare a datelor pentru
monitorizarea performanței vânzărilor

Alte scheme includ arhitectura fulg de zăpadă. Diferența dintre o stea și fulg de zăpadă este aceea că
în tabelul de căutare, tabelele de căutare pot avea propriile tabele suplimentare.

Există mai multe opțiuni de tehnologie pentru dezvoltarea DW. Aceasta include selectarea sistemului
de gestionare a bazelor de date potrivite și setul corespunzător de instrumente de gestionare a
datelor. Există câțiva furnizori de mari și de încredere ale sistemelor DW. Furnizorul de SGBD
operaționale pot fi alese pentru DW, de asemenea. Alternativ, ar putea fi folosit un furnizor de cel
mai bun din rasa DW. Există, de asemenea, o varietate de instrumente acolo pentru migrarea
datelor, încărcarea datelor, recuperarea datelor și analiza datelor.
Accesul DW
DW poate fi accesat în mai multe scopuri, de către mulți utilizatori, prin multe
dispozitive.
1. O utiliz are primară a DW este de a produce rapoarte de rutină de gestionare și monitorizare. De
exemplu, un raport al performanței vânzărilor ar arăta vânzări prin mai multe dimensiuni și în
comparație cu planul. Un sistem de tablouri de bord va folosi datele din depozit și va prezenta
analiza utilizatorilor. Datele de la DW pot fi folosite pentru a popula tablouri personalizate de
performanță pentru directori. Tabloul de bord ar putea include capabilități de analiză a datelor de
performanță pentru analiza cauzelor rădăcinilor.
2. Datele de la DW ar putea fi utilizate pentru interogări ad -hoc și orice alte aplicații care utilizează
datele interne.
3. Datele de la DW este utilizat pentru a furniza date în scopuri miniere. O parte din date ar fi extrase
și apoi vor fi combinate cu alte date relevante pentru extragerea de date.
DW Best Practices
Un proiect de depozitare a datelor reflectă o investiție semnificativă în tehnologia informației (IT).
Trebuie respectate toate cele mai bune practici în implementarea oricăr ui proiect IT.
1. Proiectul DW ar trebui să se alinieze cu strategia corporativă. Conducerea superioară ar trebui
consultată pentru stabilirea obiectivelor. Ar trebui stabilită viabilitatea financiară (ROI). Proiectul
trebuie gestionat atât de către profes ioniștii în domeniul IT, cât și de cei din mediul de afaceri.
Proiectul DW trebuie să fie testat cu atenție înainte de a începe lucrările de dezvoltare. Deseori este
mult mai costisitor să reproiectăm după începerea lucrărilor de dezvoltare.
2. Este impor tant de a gestiona așteptările utilizatorilor. Depozitul de date ar trebui construit
crescator . Utilizatorii ar trebui să fie instruiți în utilizarea sistemului astfel încât să poată absorbi
numeroasele caracteristici ale sistemului.
3. Calitatea și adaptabilitatea ar trebui să fie construit de la început. Trebuie încărcate numai date
relevante, curățate și de înaltă calitate. Sistemul ar trebui să se poată adapta la noile instrumente de
acces. Pe măsură ce nevoile afacerii se schimbă, ar putea fi necesar să se creeze noi date de date
pentru nevoile noi.
Concluzii
Datele de depozit sunt facilități speciale de gestionare a datelor destinate creării de rapoar te și
analize pentru a sprijini luarea deciziilor manageriale. Acestea sunt concepute pentru a face ca

raportarea și interogarea să fie simple și eficiente. Sursele de date sunt sisteme operaționale și surse
externe de date. DW trebuie să fie actualizat cu date noi în mod regulat pentru a -l menține util.
Datele de la DW oferă o contribuție utilă pentru activitățile de extracție a datelor.

Similar Posts