TEHNOLOGII ȘI INSTRUMENTE SPECIFICE BIGDATA [605331]

CAPITOLUL 2.
TEHNOLOGII ȘI INSTRUMENTE SPECIFICE BIGDATA

2.1 Introducere Big Data
Atât tiŵp Đât iŶterŶetul este îŶ ĐoŶtiŶuă edžpaŶsiuŶe și este o ŶeĐesita te îŶ zilele Ŷoastre
peŶtru a fi ĐoŶeĐtați uŶii Đu Đeilalți , Đu Đele ŵai Ŷoi știri , ultiŵele iŶforŵații și ŵulte altele,
atrage uŶ Ŷuŵăr foarte ŵare de utilizatori .
Termenul de „baza de date ” a apărut peŶtru priŵa dată îŶ aŶii ϭ9ϲϬ, și este defiŶită Đa o
ĐoleĐție orgaŶizată de date.
Apariția ĐalĐulatoarelor a adus o priŵă revoluție a ďazelor de date, fiind folosite benzi
ŵagŶetiĐe priŶ Đare se putea derula priŶ seĐveŶța de date, după Đare au fost urŵate de
disĐurile ŵagŶetiĐe Đare aveau o viteză ŵult ŵai ŵare de aĐĐesare a datelor.
La îŶĐeput era foarte greu să se Đreeze o ďază de date deoareĐe peŶ tru fieĐare apliĐație
trebuia definit propriul cod de manipulare. Astfel s- a ajuŶs la ĐoŶĐluzia Đă treďuie să edžiste uŶ
sistem separat pentru manipularea datelor diŶ apliĐații. PriŶ urŵare, îŶ ϭ9ϳϬ, a apărut sisteŵul
de gestiuŶe a datelor, iar odată Đu apariția SGBD -ului1 , au apărut și două ŵodele , ŵodelul
ierarhiĐ și ŵodelul rețea.
A doua revoluție a ďazelor de date a fost Đrearea ŵodelului relațioŶal al ďazei de date
de Đătre Codd Đare a urŵat să fie ŵodelul uŶiversal folosit la sĐară largă .
A trei a revoluție a ďazelor de date este îŶĐepută de cel mai mare site, acesta fiind
reŶuŵitul Google, Đare îŶ ϮϬϬϱ Đhiar daĐă ŵodelul relațioŶal era ďiŶe pus la puŶĐt, aĐest ŵodel
Ŷu făĐea față voluŵului ŵare de date pe Đare Google îl dețiŶea. AĐeste ĐoŶdiț ii a dus la
realizarea proiectului Hadoop Đare avea la ďază ĐoŶĐepte preĐuŵ MapReduce și Big Table . După
Google , au urmat Facebook care utiliza un sistem pri Ŷ Đare partițioŶa priŶ separare a datelor în
mai multe baze de date, iar Amazon a creat modelul Dynamo .
Au apărut terŵeŶi preĐuŵ NoSql ,care repreziŶtă ďaze de date ŶerelațioŶale și ajută la
stocarea unor baze mari de date. NewSql , care este un sistem de gestiune a datelor mai
ŵoderŶ. Iar îŶ sfârșit terŵeŶul de Big Data a apărut îŶ aŶul ϮϬϭϮ și se referea la mijloacele prin
Đare datele suŶt puse îŶ valoare, iar priŶ aĐest terŵeŶ Ŷe referiŵ la te hŶologiile și soluțiile pe
Đare le oferă peŶtru a ŵaŶipulă seturi ŵari de date.

a) BeŶefiĐiile utilizării soluțiilor Big Data
În momentul în care mijloacele tradi țioŶale de aŶalizare a datelor, de proĐesare și de
stoĐare Ŷu ŵai făĐeau față ĐaŶtității ŵari de iŶforŵație, au apărut so luțiile Big Data care
reușesĐ să ĐoŵďiŶe seturi de date Đare Ŷu au legătură îŶtre ele și să preluĐreze ĐaŶtități ŵari de
date nestructurate într-un timp scurt.
În general datele pentru mediile Big Data sunt acumulate în cadrul unei întreprinderi
priŶ apliĐaț ii, senzori sau diferite surse externe. Aceste date sunt stocate ori într-un d epozit de
date p eŶtru a îŵďogăți datele edžisteŶt e , ori utilizate direct prin tr-o apliĐație a îŶtrepriŶderii.
Rezultatele oďțiŶute priŶ proĐesarea Big Data duĐe la o gaŵă largă de ďeŶefiĐii și
perspective cum ar fi:
 Optimizare operațională
 Inteligență acționabilă
 Identificarea de noi piețe
 Predicții corec te
 Detectarea pierderilor și a fraudelor
 Înregistrări foarte detaliate
 Îmbunătățirea procesului decizional
 Descoperiri științifice

ÎŶ ŵod Đlar , soluțiile Big Data oferă ŵulte ďeŶefiĐii poteŶțiale, dar pe lâŶgă aĐeste
ďeŶefiĐii suŶt și foarte ŵulte dezavaŶtaje ĐâŶd aŶaliza Big Data este adoptată. AĐeste
dezavaŶtaje treďuiesĐ Đoŵparate Đu ďeŶefiĐiile oferite , iar priŶ urŵare să fie aleasă Đea ŵai
ďuŶă deĐizie.

b) Definirea și caracteristicile Big Data
Big Data Ŷu este o siŵplă tehŶologie Đi este o ĐoŵďiŶație de tehŶologii veĐhi și Ŷoi priŶ
Đare firŵele pot gestioŶa ușor ĐaŶtitățile ŵari de date la viteză ŵare și îŶ tiŵp real .
Ca uŶ set de date să poată fi ĐoŶside rat Big Data , treďuie să îŶdepliŶeasĐă Đâteva
ĐaraĐteristiĐi. Câteva diŶ aĐeste ĐaraĐteristiĐi au fost ideŶtifiĐate iŶiți al de Đătre Doug LaŶeLJ îŶ
aŶul ϮϬϬϭ. AĐesta a puďliĐat uŶ artiĐol despre iŵpaĐtul voluŵului, vit ezei și varietatea datelor
ale unui magazin electronic adunate într-un depozit de date.
Un set de date pentru a fi considerat Big Data treďuie săîŶdepliŶeasă 5 caracteristici iar
acestea sunt:

 Volumul. Volumul de date trebuie anticipat deoarece un volum foarte mare de date
impune un alt sistem de depozitare și prelucrare a datelor. Zilnic o menirea generează
aproximativ 2.5 exabytes de date. Spre exemplu câteva surse de date care sunt
responsabile pentru generarea acestui volum mare de date sunt: tranzacțiile online,
experimente științifice, sen zori, și mediile de socializare .
 Viteza. În mediile Big Data , datele pot circula cu viteze foarte mari, iar seturile de
date se pot acumula într- o perioadă extrem de scurtă într -o cantitate enormă. Din
punct de vedere al întreprinderii, viteza datelor se traduce ca perioada de timp din
momentul în care datele intr ă în interiorul întreprinderii, până în momentul când sunt
prelucrate. Pentru acest lucru, întreprinderea trebuie să aibă soluții de prelucrare
extrem de elastice și capacități corespunzătoare de stocare a datelor.
 Varietatea. Varietatea datelor se referă la diferitele formate și tipuri de date pe care
Big Data trebuie să le suporte. Varietatea datelor este o adevărată provocare pentru
întreprinderi deoarece trebuie găsite soluții de integrare, transformare, prelucrare și de
stocare.
 Veridicitate. Veridic itatea datelor reprezintă calitatea acestora. Datele ce sunt
prelucrate trebuie evaluate pentru calitatea acestora pentru a elimina datele eronate
pentru a avea o analiză corectă și precisă. Spre exemplu trebuie eliminate datele fără
valoare.
 Valoarea. Val oarea reprezintă utilitatea datelor pentru firmă. Valoarea datelor este
strâns legată de veridicitatea datelor, cu cât valorile sunt mai calitative ele vor fi
păstrate. Valoarea și timpul sunt invers proporționale , cu cât timpul de prelucrare a
datelor este mai mare pentru a fi transformat într- o informație semnificativă cu atât
are mai puțină valoare pentru întreprindere.

c) Tipuri de date prelucrate
Datele pe care soluțiile Big Data le prelucrează, pot fi generate atât de om cât și de
calculator. Datele generate de om sunt în general date despre interacțiunea unui utilizato r cu
sistemul utilizat, iar dat ele generate de calculator sunt înregistrări despre activitatea
utilizatorului, spre exemplu: data când s- a autentificat. Datele generate de om și de calculator pot
fi sub diferite formate. Principalele tipuri de date sunt:
 Date structurate. Datele structurate sunt de obicei stocate sub formă de tabele, ele sunt
reținute sub această formă deoarece conțin relații cu alte tabele și sunt reprezentate de
obicei în baze de date relaționale.
 Date nestructurate. Datele nestructurate sunt datele care nu au un model sau o schemă, ele
pot fi textuale, binare sau legături către alte fișiere. Un fișier text poate conține știri sau
postări, iar fișierele binare pot cuprinde fișiere media precum imagini, audio și video.
Aceste date nestructurate nu pot fi interogate folosind SQL, dar dacă dorim să atașăm un
fișier audio într -o tabela relațională , se poate pune în tabela ca BLOB2sau utilizând
NoSQL , care este utilizat pentru a stoca date structurate alături de date nestructurate.

 Date semi- structurate. Acest tip de date nu este de tip relațional, ci este de obicei
structurat ierarhic și este reținut în fișiere text, cum ar fi JSON sau XML . Datorită faptului
că sunt reținute sub formă de text, acestea sunt prelucrate mult mai ușor ca datele
nestructurate.
 Metadate. Metadatele furnizează informații cum ar fi caracteristicile și structura unui set
de date. Aceste date sunt în general generate de calculator. Utilizarea lor în soluțiile Big
Data este foarte importantă în timpul prelucrării fiindcă oferă informații despre
proveniența datelor.

d) Gestionarea și arhitectura Big Data
Până acum câțiva ani pentru multe companii era foarte costisitor să stocheze toate datele
de care aveau nevoie pentru a le prelucra. Dar de când au apărut soluțiile Big Data , stocarea și
prelucrarea cantităților mari de date nu mai este dificilă. Deasemen ea acum stocarea datelor se
poate realiza în Cloud iar cu o viteză foarte bună de internet este foarte eficient și mult mai ieftin.
Dacă întreprinderile pot analiza pentabytes de date, cu o asemenea cantitate pot realiza modele și
anomalii, afacerile pot profita de pe urma acestor soluții. Dar utilizarea soluțiilor Big Data nu se
oprește doar la ajutorul afacerilor ci sunt utilizate în foarte multe domenii, în știință, în cercetări ,
în activități guvernamentale, în astronomie și nu numai.
În figura alăturată se observă că datele mai întâi trebuie capturate după care organizate și
integrate. Dacă această fază a fost realizată cu succes, se poate trece la analizare a lor după
problema propusă.
Pentru a realiza gestiunea unei baze mari de date trebuie o arhitectură foarte performantă.
Este necesară o cantitate mare de putere și viteză de calcul deoarece pe lângă faptul că datele
trebuie analizate, în același timp cantități mari de date sunt generate și trebuie stocate, iar acest
lucru poate duce la încetinirea sistemului sau nefuncționare.

Figura 1:Ciclul gestionării Big Data (***)
(Sursa: ”Big data for dummies ”)

Componente importante din arhitectura Big Data , sunt interfața și fluxurile de date.
Trebuie înțeles faptul că datele și fluxurile de date provin din diferite surse externe iar pentru asta
este nevoie de utilizarea API-urilor3 care stau la baza arhitecturii, fără servicii integrate nu ar
putea exista Big data .
Un prim nivel al arhitecturii este infrastructura fizică. Infrastructura fizică este
componenta fundamentală pentru funcționarea și scalabilitatea unei arhitecturi Big Data . Pentru
a reține un volum greu de anticipat și imprevizibil, arhitectura fizică trebuie să fie diferită față de
cea tradițională. Această arhitectură se bazează pe un model distribuit de calcul și semnifică
faptul că datele pot fi stocate în diferite locații și pot fi legate între ele prin internet.
Un al doilea element extrem de important este securitatea informațiilor, cu cât mai
importantă este analiza datelor pentru o companie, cu atât de importantă trebuie să fie și
securitatea datelor. Un exemplu este menținerea datelor despre utilizatori privată. Așadar
securitatea ar trebui implementată de la început și nu o idee ulterioară.
O altă componentă importantă este sursa de date operațională . Tradițional , su rsa de date
operațională constă în baze de date relaționale foarte structurate. Dar acum sursele de date
operaționale cuprind și datele nestructurate .
Serviciile și instrumentele de organizare a datelor este o altă componentă a arhitecturii.
Datele în can tități foarte mari provin din foarte multe surse, aceste date, în trecut era foarte
costisitor stocarea lor sau chiar dacă o companie avea capabilitatea să stocheze cantitatea uriașă
de informații, nu aveau instrumentele necesare pentru a folosi acele informații. Instrumentele din
acea vreme erau foarte greu de utilizat și costisitoare din punct de vedere a timpului.

e) Instrumente utilizate î n Big Data
Cu evoluțiile tehnologiei de calcul, acum este posibilă gestionarea cantităților uriașe de
date ceea ce în trecut era posibilă doar cu supercalculatoarele iar acestea erau foarte scumpe.
Pasul spre Big Data s-a realizat atunci când companii precum Yahoo!, Google și Facebook au
realizat că trebuie să își pună în valoare volumul de date creat. Astfel au fost nevoite să creeze
noi teh nologii care reușeau să stocheze, să acceseze și să analizeze cantitățile mari de date în
timp real pentru a putea genera bani p e baza informațiilor adunate oferind beneficii utilizatorilor.
Primele instrumente care au reușit să facă acest lucru au fost MapReduce , Hadoop și Big Table.
 MapReduce a fost creat de Google ca o cale eficientă de executare a unui set de funcții
asupra unui volum mare de date. Componenta „Map” este utilizată pentru a distribui
probleme și sarcini și are rolul de a gestiona plasarea sarcinilor astfel încât să echilibreze
sistemul și să fie evitată supraîncărcarea. După ce pasul de distribuire a fost terminat ,
funcția „ Reduce ”, unește la un loc toate elementele pentru a furniza rezultatul.
 Big Table a fost dezvoltat de Google și este un sistem distribuit de stocare destinat
gestionării datelor structurate foarte scalabile. Datele sunt organizare în rânduri și
coloane, spre deosebire de o bază de date relațională tradițională , Big Table este o hartă
multidimensională distribuită și persistentă utilizată pentru a reține volume imense de
date.
 Hadoop este un framework administrat de Apache și este dezvoltat pe conceptul
MapReduce și Big Table. Acest proiect este fundația ce stă la baza arhitecturii de ca lcul a
companiei Yahoo!. Hadoop a fost conceput astfel încât să paralizeze prelucrarea datelor
pe noduri de calcul pentru a intensifica viteză de calcul și pentru a ascunde latența.

f) Tehnici tradiționale și avansate de analiză
Pentru ca aceste date să aibă sens pentru o companie, necesită diferite abordări de analiză,
depinzând de rezolvarea problemei. Unele analize folosesc depozite de date tradiționale, în timp
ce alte analize folosesc analiză predictivă avansată. Gestionarea datelor mari necesită dife rite
abordări pentru a ajuta firma să aibă un plan de succes pe viitor.
 Analiza depozitelor de date. După ce o companie sortează prin cantitatea mare de date,
este deseori necesar să se ia un subset de date ce dezvăluie un model și care poate fi pus
într-o formă disponibilă pentru firmă. Aceste depozite de date asigură compresia ,
partiționarea pe mai multe nivele și arhitectură de prelucrare a masivelor de date în
paralel.
 Analiza Big Data. Capacitatea de a gestiona și a analiza pentabytes de date, permite
companiilor să lucreze cu date care ar putea avea un impact semnificativ pentru
companie. Acestea necesită motoare analitice ce pot gestiona date distribuite și pot oferi
rezultate ce pot fi optimizate pentru a rezolva o problemă e afaceri. Spre exemplu unele

organizații folosesc modele predictive ce unește la un loc date structurate și nestru cturate
pentru a prezice si evita fraudele.
 Rapoarte și vizualiză ri. Organizațiile se bazează pe capacitatea de a crea rapoarte pentru
a putea înțelege datele adunate de la crearea tabelelor cu vânzările lunare până la
previziuni de creștere. Big Data schimbă modul în care datele sunt gestionate și utilizate.
Dacă o companie poate colecta , gestiona și prelucra date, acestea pot utiliza o nouă
generație de instrumente ce ajută organizația nu numai să stocheze datele ci și înțelegerea
modului în care ac este date oferă un context bazat pe problema adresată. Cu Big Data ,
rapoartele și vizualizarea datelor devin instrumente pentru analiză în contextul în care
datele au un impact asupra viitorului.
 Aplicaț iile Big Data. În general companiile se așteaptă ca datele să fie utilizate pentru o
analiză și să prezică cu exactitate perioada următoare . Datele au fost integrate în
domeniu pentru a îndeplini un scop general pentru afacere, dar cu apariția Big Data , asta
sa schimbat. Acum, sunt dezvoltate aplicații care sunt concepute în special pentru a
profita de caracteristicile unice ale datelor mari.
Câteva dintre aplicațiile în curs de dezvoltare sunt pentru domenii cum ar fii asistență
medicală, gestio narea traficului, gestionarea fabricării și multe altele. Spre exemplu în domeniul
asistenței medicale , aplicațiile Big Data pot fi utilizate pentru a monitoriza sugarii prematuri
pentru a determina momentul când este nevoie de intervenție. În fabricație, aplicațiile Big Data
pot fi utilizate pentru a preveni mașinile să se închidă în timpul producției. În trafic aceste
aplicații ar putea reduce numărul de blocaje , pentru a reduce accidentele, salvarea
combustibilului șireducereapoluării .

g) Avantaje și dezavantaje î n utilizarea Big Data
 Analiza. Este știut faptul că calculatorul a fost adoptat pentru a înlocui eforturile
manuale. Spre exemplu, „Google Analytics ” , scanează orice progresie sau regresie din
experiența utilizatorului. De -a lungul timpului, păstrarea activităților desfășurate pe un
anumit site poate f i un instrument de abilitare pentru a obține noi strategii de -a atrage
trafic.
Avantaje: Big Data este un depozit exc lusiv de date care ajută la formarea milioanelor de
idei creative și inovative. Analiza datelor poate sta la baza oricărei afaceri.
Dezav antaje: Uneori analiza acestor date poate fi înșelătoare.
 Accesul la date cu ajutorul sondajelor. Cercetarea prin sondaje, se urmărește accesare
la tot mai multe informații. Aceste sondaje oferă baze de date autentice de la utilizatorii
finali.
Avantaje: Big Data reprezintă un instrument uimitor pentru obținerea comportamentului
și tendințele clienților. Prin aplicarea unui sondaj de către o firmă, aceasta poate descoperi
ceea ce ar trebui schimbat sau îmbunătățit în cadrul firmei.

Dezavantaje: Este destul de costisitor desemnarea analiștilor , experților în exploatarea
datelor.
 Viteza de actualizare
Avantaje: Actualizarea datelor este esențială pentru obținerea informațiilor exacte.
Dezavantaje: Uneori, actualizarea este prea rap idă iar aplicația nu corespunde cu datele
reale.
 Big Data este enorm. În timp ce este scris un cuvânt în câmpul de căutare Google, un
mare volum de date este primit ca rezultat. Este suficient de anticipat cât de mari sunt
datele accesate.
Avantaje: O pl atformă poate avea informații nelimitate.
Dezavantaje: Este greu de adunat informațiile relevante.

2.2.2 Big Data în afaceri

a) Vedere de ansamblu
Prin extinderea seturilor de date obișnuite care acum includ Big Data , date structurate și
nestructurare cum ar fi mediile sociale, jurnale de navigare, date provenite de la senzori și prin
aplicarea analizelor de text și alte instrumente , companiile sunt capabile să înțeleagă
comportamentul și preferințele clienților.
În domeniul de telecomunicații, util izând analiza Big Data pentru a crea modele de
previziune, companiile au reușit să obțină un avantaj uriaș utilizând datele deținute care le ajută
să prevadă și să gestioneze mai bine clienții. În această industrie menținerea clienților a fost o
problemă serioasă, deoarece clienților le place să schimbe furnizorii căutând cele mai bune
telefoane și cele mai bune oferte, iar companiile de telecomunicație au vrut să înțeleagă acești
clienți să -i poată identifica și să -i poată opri. Ei aveau date pe care le analizau dar niciodată nu au
analizat modul în care clienții apelează. Spre exemplu clienții care în general apelează și cli enții
care în general primesc apeluri, firmele nu știau cât timp vorbeau și care era momentul zilei în
care aceștia vorbeau mai mult. Aceste informații sunt foarte importante pentru firme , ele au
reușit să identifice un model prin care să identifice persoanele care au o probabilitate mai mare
de plecare, iar companiile încearcă să le ofere acestor persoa ne oferte speciale pentru a- i
împiedica să plece .

Organizațiile de servicii financiare utilizează Big Data din interacțiunile clienților , iar cu
ajutorul acestora îi poate clasifica în mai multe segmente. După clasificarea clienților, aceste
organizații de servicii financiare pot crea oferte mai relevante și sofisticate.
Companiile de asigurări utilizează și ele analiză datelor pentru a înțelege clientul și
pentru a- i oferi o soluție de asigurare mult mai adaptată după comportamentul actual al acestuia,
în loc să îl plaseze într -o categorie extinsă. Prin încercarea de a înț elege piața și oamenii care
caută o asigurare, a condus la colectarea unei noi baze de date și la inovarea produselor. Spr e
exemplu, șoferii tineri pot opta pentru o asigurare premium redusă, prin purtarea unei cutii negre
amplasate în mașină sau o aplicație mobilă, prin care se poate monitoriza modul în care acești a
conduc și capacitățile individuale decât să -i încadreze într- un segment de vârstă. Sau companiile
de asigurări mai utilizează Big Data pentru a știi în momentul în care eliberează o asigurare
pentru casă, dacă aceasta are nevoie de vizita unui agent.
Afacerile bazate pe internet dezvoltă produse de informații care combină date provenite
de la clienți pentru a oferi recomandări și reduceri mai atrăgătoare și mai reușite. Agențiile de
publicitate urmăresc mediile sociale pentru a înțelege reacția la unele campanii, promoții și alte
forme de publicitate.
Chiar și hotelurile utilizează analize ale datelor pentru a înțelege clienții și să
îmbunătățească oferta lor. Spre exemplu un lanț de hoteluri a înlocuit metoda tradițională de a
oferi un chestionar c lienților atunci când aceștia eliberau camera , cu date care proveneau din
mediile sociale unde analizau părerea oamenilor despre hotelul lor .
În sport, spre exemplu în fotbal, cluburi precum Chelsea și Manchester United, angajează
firme care se ocupă cu prelucrarea datelor și cercetători de date care înregistrează fiecar e mișcare
a jucătorilor pentru a căuta alte moduri de a câștiga. Jucătorii fiind foarte scumpi, orice
modalitate de a găsi tinere talente este foarte utilă pentru a evită salariile exagerate. Cu ajutorul
analizei datelor, într-un meci de fotbal se poate înregistra fiecare alunecare, fiecare pa s, fiecare
mișcare, ajungându -se la un număr de 2000 evenimente pe meci. Cu ajutorul camerelor se pot
înregistra mișcările, distanța parcursă, viteza și accelerația fiecărui jucător în parte, iar aceste
date ajută cluburile mari pentru a descoperi jucători buni din ligile inferioare .

b) Exemple de implementare a soluțiil or Big Data îŶ luŵea reală
Companiile pot obține beneficii atunci când utilizează datele în mod corect și aplicând
instrumente de analiză pentru a transforma datele în informații critice pentru afacere. Iar în
continuare va voi prezența câteva exemple care s -au întâmplat în lumea reală .
 O bancă a reușit să își înjumătățească costurile cu personalul într -o anumită zonă. În
trecut această bancă se baza pe faptul că performanțele cele mai bune proveneau de la

indivizii care absolveau o universitate de elită din zonă. Analiza datelor a arătat clar că se
înșelau. S -a do vedit că candidații de la universitățile care nu erau de prestigiu au depășit
candidații din acea universitate de top, ceea ce a permis companiei să recruteze cei mai
talentați indivizi pentru bani mai puțini .
 O companie de bunuri și servicii utilizează analiza mediilor sociale combinată cu alte
instrumente de analiză pentru a găsi candidații potriviți de care au nevoie. Ei prin analiza
profilului de pe mediile de socializare pot preciza cu acuratețe nivelul de inteligență cât și
stabilitatea emoțională a candidatului potențial .
 Altă companie a utilizat diferite analize asupra datelor, pentru a găsi tipul individului pe
care vrea să -l recruteze și tipul individului pe care vrea să -l evite. Această firmă a
descoperit faptul că tipul de motor de căutare folosit de potențialii candidați este foarte
important. Astfel candidații care nu utilizau motorul de căutare pre -instalat și utilizau
motoare de căutare precum ar fi Firefox sau Chrome, ar fi mult mai potriviți .
 O altă companie de bunuri, este capabilă să prezică modul în care anumite elemente cheie
din implicarea personalului , influențează performanța operațională, satisfacția clienților
și performanța financiară. În plus, compania respectivă poate anticipa măsura în care o
anumită creștere de satisfacție a personalului determină creșterea veniturilor.
 Un call center a descoperit că unele persoane din departamentul de vânzări, care aveau
cazier judiciar au avut performanțe mult mai satisfăcătoare de cât persoanele care nu
aveau cazier judiciar. Această companie a mai sesizat că persoanele care au mai puține
conexiuni pe Facebook au performanțe mult mai bune de cât persoanele cu multe
conexiuni pe Facebook.
 O altă organizație a utilizat instrumente de analizare prin care au scanat și analiza t
conținutul e -mail- urilor trimise de către angajați, de asemenea au analizat și postările
făcute de către aceștia în mediile de socializare precum Facebook sau Twitter, ceea ce a
permis organizației să știe cu precizie nivelul de implicare a angajaților .
 LinkedIn este o rețea socială orientată pe afaceri, fondată în 2002, este utilizată în
principal pentru crearea de rețele profesionale. LinkedIn folosește Big Data prin care
dezvoltă servicii precum: găsește oamenii pe care ai putea să îi cunoști, job -uri pe care te-
ar inter esa, cine ți -a vizualizat profilul și multe altele .
O echipă de Formula 1 din Marea Britanie, McLaren Racing, utilizează senzori instalați
pe mașină de curse ce înregistrează date în timp real pentru a identifica anumite probleme
utilizând analiza predicti vă ceea ce îi conduce la corectarea anumitor probleme înainte ca
acestea să se întâmple și să fie prea târziu de rezolvat.
 Verizon este o companie de telecomunicații din Statele Unite ale Americii. Aceasta
utilizează Big Data pentru a spori reclamele pe telefonul mobil. Acesta utilizează un
identificator unic, încât atunci când utilizatorul se autentifică pe site, acest identificator
trece la acțiune și permite agentului de publicitate să utilizeze informațiile de pe
calculato r, astfel mesajele publicitare vor fi trimise utilizând aceste informații.

 Mint.com este un site gratuit creat pentru Statele Unite ale Americii și Canada ce oferă
servicii de gestiune financiară personală. Acest site utilizează Big Data ce le oferă
utiliz atorilor informații despre cheltuieli pe categorii și oferă o perspectivă a banilor
cheltuiți pe săptămână, lună sau an .
 Tesla este o companie care se ocupă cu construcția de mașini. Această companie
implementează senzori pe mașini, datele culese sunt trimise și colectate la sediul central.
Datele culese sunt utilizate de către departamentul de cercetare și dezvoltare pentru
îmbunătățirea performanței, mentenanța mașinii și satisfacerea clientului. Un exemplu
este faptul că, în momentul când mașina nu funcționează corespunzător, compania este
notificată cu acest lucru iar aceasta va notifica la rândul ei clientul să meargă la un
service.

2.2.3 Concluzii
În concluzie Big Data este o soluție de analiză a datelor mari foarte necesară. În urmă cu
câțiva ani nu aveam tehnologia necesară sau era foarte costisitoare păstrarea tuturor datelor
capturate. Chiar dacă reușeam să păstrăm toate datele, instrumentele tradiționale din acea vreme
nu erau capabile să facă o analiză. Astfel companiile mari precum Google care colectează o
cantitate uriașa de date zilnic, a fost nevoită să dezvolte noi instrumente pentru a putea prelucra
Big Data.
În zilele de astăzi, Big Data este utilizat în aproape toate domeniile. În domeniul
sănătății, pacienții pot fi monitorizați pentru a preveni diferite boli și pentru a fi tratate la timp. În
sport seutilizează diferiți senzori pentru a înregistra abilitățile unui sportiv. Alte companii se
folosesc de istoricul pe internet al unui utilizator pentru a- i crea reclame potrivite. Chiar și l a
mașini sunt utilizați diferiți senzori pentru a preveni diferite probleme și a anunța proprietarul
când trebuie să viziteze un service. Acestea sunt doar unele domenii în care se folosesc soluții
Big Data .
Așadar utilizarea soluțiilor Big Data în zilele noastre este foarte importantă pentru
dezvoltarea companiilor cât și pentru oamenii care au diferite activități zilnice .

Similar Posts