Politica Regionala la Nivelul Uniunii Europene

CUPRINS

CAPITOLUL I – Politica regională la nivelul Uniunii Europene: elemente introductive

1.1. Introducere

1.2. Europa 2020

EU – SILC

1.4 Coeziunea teritorială

1.5 Al 7-lea raport al Uniunii Europene

1.6 Indicatorii politicii de coeziune

CAPITOLUL II – Analiza componentelor principale

2.1 Componente principale

2.1.1 Proprietățile componentelor principale

2.1.2 Alegerea numărului de componente principale

2.1.3 Modelul matematic al componentelor principale

2.2 Tehnici de clasificare / clusterizare

2.2.1 Algoritmi de tip ierarhic

2.2.2 Algoritmul de partiționare K-medii

CAPITOLUL III – Studiu de caz pe regiunile Uniunii Europene

3.1. Statistici descriptive

3.1.1 Planul distribuției de probabilitate

3.1.2 Planul variabilității

3.1.3 Planul legăturilor

3.2. Reducerea dimensionalității

3.3. Analiza Cluster

3.3.1 Analiza Cluster pe matricea observațiilor cu ajutorul metodei agregării Ward

3.3.2 Algoritmul celor K-medii

3.5. Concluzii

BIBLIOGRAFIE

ANEXE

Capitolul I – Politica regională la nivelul Uniunii Europene: elemente introductive

1.1 Introducere

Uniunea Europeană este una dintre cele mai bogate și prospere zone de pe glob, dar cu toate acestea există diferențe ce nu pot fi neglijate între standardele de viață atât la nivel european, cât și la nivel național. Cel mai bun exemplu în acest caz este cel al celei mai prospere țări din Uniunea Europeană, Luxemburg, care este de peste șapte ori mai bogată decât România și Bulgaria, cele mai sărace state membre și ultimele care au aderat la Uniunea Europeană. Cu toate acestea, efectele dinamice ale apartenenței la UE, la care se adaugă o politică de investiții solidă și bine orientată, pot genera rezultate pozitive și pot reduce aceste mari diferențe existente între regiunile Uniunii Europene. Politica regională a Uniunii Europene este o politică de investiții, care își propune să susțină competitivitatea și creșterea economică, îmbunătățirea calității vieții, crearea de locuri de muncă și dezvoltarea durabilă. Investițiile contribuie la îndeplinirea obiectivelor Strategiei Europa 2020. Politica regională își concentrează fondurile în zone și sectoare în care rezultatele pot fi semnificative, fiind astfel și expresia solidarității Uniunii Europene cu țări și regiuni mai puțin dezvoltate. Obiectivul politicii regionale este de a reduce disparitățile economice, sociale și teritoriale majore dintre regiunile Europei. În cazul în care aceste măsuri nu ar fi implementate, realizărilor majore ale UE ar fi afectate, ca de asemenea și piața unică și moneda euro. De exemplu o măsură importantă o constituie fondurile, ce servesc, de exemplu, la îmbunătățirea infrastructurii de transport și extinderea rețelelor de internet până în zone îndepărtate, la stimularea întreprinderilor mici și mijlocii din zone dezavantajate, la implementarea unor proiecte de mediu și la îmbunătățirea nivelului de educație și a competențelor. De asemenea, se investește în inovare, în realizarea de noi produse și metode de producție, în eficiența energetică și combaterea schimbărilor climatice. Pentru fiecare regiune a UE se aplică două sau trei din principalele obiective ale politicii de coeziune (convergență, competitivitate regională și ocuparea forței de muncă și cooperare teritorială europeană). Totuși, cea mai mare parte a fondurilor este direcționată către regiunile care au mai multă nevoie de ele: regiunile în care PIB-ul pe cap de locuitor se situează sub 75% din media la nivelul UE.

Figura 1.1 Disparitățile regionale în UE (http://ec.europa.eu/regional_policy/what/index_ro.cfm)

1.2 Europa 2020

Europa 2020 este strategia de dezvoltare pe zece ani a Uniunii Europene. Este vorba despre mai mult decât doar depășirea crizei care continuă să afecteze multe dintre economiile noastre. Este vorba despre abordarea deficiențelor modelului nostru de creștere economică și crearea de condiții pentru un alt tip de creștere, care este mai inteligent, mai durabil și mai incluziv.

Pentru a face acest lucru mai concret, au fost stabilite cele cinci obiectivele-cheie pe care UE trebuie să le atingă până la sfârșitul acestui deceniu. Acestea acoperă experiența de muncă, educație, cercetare și inovare, incluziune și reducerea sărăciei și climă / energie.

Strategia include, de asemenea, șapte „inițiative emblematiceˮ oferind un cadru prin care UE și autoritățile naționale să consolideze reciproc eforturile în domenii care sprijină prioritățile Strategiei Europa 2020, cum ar fi inovarea, economia digitală, ocuparea forței de muncă, tinerii, politica industrială, sărăcia și resurse de eficiență.

Strategia Europa 2020 va fi un succes numai dacă acesta face obiectul unui efort hotărât și concentrat atât la nivelul UE, cât și la nivel național. La nivelul UE, deciziile-cheie sunt luate pentru a finaliza realizarea pieței unice a serviciilor, energiei și produselor digitale și să investească în legăturile transfrontaliere esențiale. La nivel național, există multe obstacole în calea concurenței și crearea de locuri de muncă ce trebuie eliminate. Dar numai în cazul în care aceste eforturi sunt combinate și coordonate vor avea impactul dorit asupra creșterii locurilor de muncă.

Acesta este motivul pentru care furnizarea proiectului Europa 2020 se bazează foarte mult pe noile structuri de guvernământ și pe procesele pe care UE le-a pus în aplicare începând din 2010. În centrul acestora se află Semestrului European, un ciclu anual de coordonare a politicilor economice care implică orientarea politicilor UE la nivel de Comisia Europeană și Consiliul, angajamentele de reformă asumate de statele membre și de recomandările specifice fiecărei țări elaborate de Comisie și aprobate la cel mai înalt nivel de către liderii naționali din cadrul Consiliului European. Aceste recomandări ar fi luate în considerare în politicile și bugetele statelor membre.

Strategia Europa 2020 urmărește să reducă numărul persoanelor amenințate de sărăcie sau excluziune cu 20 de milioane până în 2020, corespunzând unei reduceri de la 23% din populația UE la 19%. Procentul de populație expusă riscului de sărăcie sau excluziune este de peste 50% în trei regiuni bulgare și de 49% în Sicilia. Cele mai mici rate pot fi găsite în Ǻland, Trento, Navarra și Praga, unde procentul este de 10% sau mai mic.

1.3 EU-SILC

Din statisticile Uniunii Europene privind venitul și condițiile de viață, EU-SILC este un instrument care vizează colectarea în timp util și comparabil transversal și longitudinal multidimensional a microdatelor pe venit, sărăcie, excluziune socială și condiții de viață. Acest instrument este ancorat în Sistemul Statistic European (SSE).

EU-SILC a fost lansat în 2003, pe baza unui acord tacit între Eurostat și șase state membre (Austria, Belgia, Danemarca, Grecia, Irlanda, Luxemburg) și Norvegia. Acesta a fost lansat oficial în 2004, în cincisprezece țări și extins în 2005 pentru a acoperi toate statele membre UE, atunci în numar de 25, împreună cu Norvegia și Islanda. Bulgaria a lansat EU-SILC în 2006, în timp ce România, Elveția și Turcia au introdus studiul din 2007.

Conform statisticillor UE privind venitul și condițiile de viață, EU-SILC reprezintă sursa de referință a UE pentru statisticile comparative asupra distribuției veniturilor și a incluziunii sociale la nivel european. Acesta oferă două tipuri de date anuale privind cele 27 de țări ale Uniunii Europene, Croația, Islanda, Norvegia, Elveția și Turcia:

Date transversale referitoare la un anumit moment sau unei anumite perioade de timp, cu variabile privind veniturile, sărăcia, excluderea socială și alte condiții de viață, și

Datele longitudinale referitoare la schimbări la nivel individual de-a lungul timpului, observate periodic pe o perioadă de patru ani.

EU-SILC nu se bazează pe un chestionar comun sau un studiu, ci pe ideea unui „cadruˮ. Acesta din urmă definește listele armonizate primare țintă (anuale) și secundare variabile (la fiecare patru ani sau mai rar), pentru a fi transmise la Eurostat, linii directoare și proceduri comune, concepte comune (de uz casnic și venituri) și clasificări ce vizează maximizarea comparabilității informațiilor produse.

EU-SILC a fost înființată în scopul furnizării de date pentru a fi utilizate de indicatorii structurali de coeziune socială (rata riscului de sărăcie, S80/S20 și diferența de remunerare între femei și bărbați), precum și în contextul celor două metode deschise de coordonare în domeniul incluziunii sociale și a pensiilor.

Pentru incluziunea socială, cel mai important output este calculul așa-numiților „indicatori Laekenˮ, inclusiv rata sărăciei, rata sărăciei persistente (vârstă, sex, tip de gospodărie, starea de activitate, intensitatea muncii și statutul de ocupare), S80/S20, coeficientul Gini, sărăcia în muncă. În viitor, cele mai multe informații cu privire la „venitul și condițiile de viațăˮ în domeniul „Populație și condiții socialeˮ se vor regăsi în tema EU-SILC.

Excluziunea socială și informațiile privind starea locuințelor sunt colectate la nivel de gospodărie pentru persoanele în vârstă de 16 și peste în funcție muncă, educație și sănătate. Elementul central al instrumentului, veniturile la un nivel foarte detaliat sunt colectate în principal la nivel personal, dar câteva componente sunt incluse în partea de gospodărie a SILC.

1.4 Coeziunea teritorială

Coeziunea teritorială este expresia dezvoltării echilibrate, coerente și armonioase a teritoriului, sub aspectul activităților economice, sociale, al dotărilor, al accesibilității și al calității mediului, al existenței unor condiții de viață și de muncă echitabile pentru toți cetățenii, indiferent de locul în care se află, prin punerea în valoare a specificității fiecărei categorii de teritoriu, contribuind astfel la realizarea unei Europe prospere, durabile din punct de vedere economic, social și ecologic.

Mijloacele prin care se poate realiza coeziunea teritorială sunt atât cele care se adresează direct teritoriului (valorificarea diversității teritoriale și regionale, stimularea performanțelor teritoriilor, utilizarea în mod optim a potențialului de care dispun, consolidării capacității de competitivitate), cât și cele care vizează coerența politicilor sectoriale cu impact teritorial. Realizarea coeziunii teritoriale necesită instituirea unei reale coordonări orizontale, între diferitele politici sectoriale, atât la nivel comunitar cât și național, precum și a unei coordonări verticale, între diferitele instituții, de la nivelul european, până la nivelul local.

1.5 Al 7-lea raport al Uniunii Europene

La fiecare trei ani, UE publică un raport privind coeziunea economică, socială și teritorială, detaliind progresele înregistrate în aceste domenii și contribuția Uniunii Europene, a guvernelor naționale și regionale. Al 7-lea raport privind coeziunea a fost publicat în 2011 și vizează următoarele aspecte:

• analiza decalajelor regionale;

• cuantificarea eforturilor depuse de UE și de guvernele naționale și regionale și contribuția acestora la îndeplinirea obiectivelor Europa 2020;

• măsurarea impactului politicii de coeziune;

• implementarea politicii de coeziune după 2013.

Concluziile celui de-al 7 raport sunt:

1. S-au redus decalajele între regiunile din UE având în vedere că diferențele PIB-ului pe cap de locuitor s-au diminuat substanțial.

2. Regiunile dezvoltate sunt mai competitive deoarece: o sunt mai inovatoare; o au rate mai mari de angajare;

o au o infrastructură mai bună.

3. Există o diferență între gospodăriile din zonele dezvoltate și cele din zonele mai puțin dezvoltate în sensul că doar în zonele slab dezvoltate bunăst cât și național, precum și a unei coordonări verticale, între diferitele instituții, de la nivelul european, până la nivelul local.

1.5 Al 7-lea raport al Uniunii Europene

La fiecare trei ani, UE publică un raport privind coeziunea economică, socială și teritorială, detaliind progresele înregistrate în aceste domenii și contribuția Uniunii Europene, a guvernelor naționale și regionale. Al 7-lea raport privind coeziunea a fost publicat în 2011 și vizează următoarele aspecte:

• analiza decalajelor regionale;

• cuantificarea eforturilor depuse de UE și de guvernele naționale și regionale și contribuția acestora la îndeplinirea obiectivelor Europa 2020;

• măsurarea impactului politicii de coeziune;

• implementarea politicii de coeziune după 2013.

Concluziile celui de-al 7 raport sunt:

1. S-au redus decalajele între regiunile din UE având în vedere că diferențele PIB-ului pe cap de locuitor s-au diminuat substanțial.

2. Regiunile dezvoltate sunt mai competitive deoarece: o sunt mai inovatoare; o au rate mai mari de angajare;

o au o infrastructură mai bună.

3. Există o diferență între gospodăriile din zonele dezvoltate și cele din zonele mai puțin dezvoltate în sensul că doar în zonele slab dezvoltate bunăstarea și satisfactia vieții sunt strâns legate de creșterea veniturilor.

4. Este nevoie de o coordonare mai bună între dezvoltarea regională și politicile implementate la nivel european și național.

5. În ceea ce privește sustenabilitate de mediu s-au constatat următoarele:
o unele regiuni sunt expuse unui risc ridicat de schimbări climatice;

o altele au un potențial puternic de a produce mai multă energie regenerabilă;

o multe centre de oraș au o calitate slabă a aerului;

o unele dintre țările estice din UE dispun de suficientă capacitate de tratare a apelor reziduale.

Definirea problemei

Piața europeană consolidează polarizarea activităților economice pre-existente și, astfel, accelerează procesul de aglomerare și de concentrare. În cazul în care măsurile nu s-ar lua la nivel național și european, piața internă ar tinde mai mult să crească inegalitățile existente în ceea ce privește distribuția activităților economice pe întreg teritoriul UE. De aceea, obiectivul de coeziune economică și socială, implică dorința de a reduce diferențele între diferitele regiuni ale Comunității, conform SEA (The Single European Act). Perspectivele realizării uniunii economice și monetare sunt pozitive atât pentru regiunile dezvoltate, cât și pentru cele mai puțin favorizate. Reducerea costurilor tranzacțiilor transfrontaliere și eliminarea riscului cursului de schimb poate promova specializarea regională și comerțul intra-comunitar cu bunuri și servicii. Regiunile slab dezvoltate pot beneficia de această specializare exploatând avantajele lor comparative. În cadrul EMU (European Monetary Unification), creșterea mobilității capitalului susținută de introducerea monedei unice și tendința inflației spre rate cvasi-uniforme duce la uniformizarea ratelor dobânzilor pentru orice nivel dat de risc. Acest lucru ar trebui să favorizeze regiunile mai puțin dezvoltate ce nu dispun de capital.

În același timp, cu toate acestea, statele membre din zona euro pierd anumite opțiuni de politică fiscală și monetară, precum și posibilitatea de a regla rata de schimb. Flexibilitatea cursului de schimb este importantă deoarece, în principiu, ea permite unei țări, prin depreciere, compensa unei pierdere de competitivitate internațională într-un mod relativ nedureros. Ca atare, se facilitează ajustarea pe termen scurt la șocurile economice generale sau specifice țării. Eliminarea posibilității de reglare a cursului de schimb, prin urmare, reprezintă o pierdere mai importantă pentru țările cel mai puțin dezvoltate din zona euro, care trebuie să efectueze cele mai importante schimbări structurale. Aceste țări trebuie să investească mai mult, în timp ce cheltuielile trebuie să scadă, astfel încât să se conformeze criteriilor de la Maastricht și cu cerințele Pactului de stabilitate și de creștere.

În plus, aceste țări ar putea pierde avantajul dat de costurile salariale mai scăzute. Atâta timp cât piețele au fost protejate de către autoritățile vamale și alte bariere, salariile din anumite țări s-au menținut mai mici decât în altele, compensând de altfel productivitata redusă a forței de muncă slab calificate. Dar, într-o piață comună, și chiar mai mult într-o uniune economică și monetară, libertatea de circulație a forței de muncă, o mai bună informare cu privire la situațiile respective au tendința de a alinia veniturile către nivelurile deja atinse în regiunile mai prospere. Acest lucru poate fi un rezultat pozitiv din punct de vedere social, dar care generează tendințe inflaționiste și creează dificultăți pentru întreprinderi, în zonele în care productivitatea este scăzută. În cazul în care aceste întreprinderi trebuie să își înceteze activitatea, muncitorii pierd locurile de muncă și creșterea veniturilor lor este doar o iluzie.

Atât din punct de vedere economic și social, nici cele mai slabe state membre, nici Uniunea Europeană nu pot tolera ca o parte importantă a patrimoniului lor să fie lăsată subdezvoltată din cauza integrării economice. Prosperitatea anumitor regiuni ale Uniunii nu poate fi suportată de către declinul sau stagnarea altor zone. Marile diferențe sunt intolerabile într-o comunitate, în cazul în care pe termen lung sunt lipsite de semnificație. În plus, diferențele nu implică doar o calitate săracă a vieții pentru regiunile defavorizate, dar indică incapacitatea de a profita de oportunitățile economice de care ar putea beneficia Uniunea în ansamblu.

Din aceste considerente, unul dintre obiectivele Uniunii este promovarea coeziunii economice, sociale și teritoriale, precum și solidaritatea între statele membre. În scopul promovării unei dezvoltări armonioase, Uniunea își dezvoltă și desfășoară activitatea care conduce la consolidarea coeziunii sale economice, sociale și teritoriale care vizează reducerea decalajelor dintre nivelurile de dezvoltare ale diferitelor regiuni și a rămânerii în urmă a regiunilor defavorizate. Formularea și punerea în aplicare a politicilor și acțiunilor și punerea în aplicare a pieței interne a Uniunii trebuie să ia în considerare aceste obiective și să participe la realizarea acestora. Uniunea susține realizarea acestor obiective prin acțiunea pe care o întreprinde prin intermediul fondurilor structurale, prin Banca Europeană de Investiții (BEI) și celelalte instrumente financiare existente. Fondul de Coeziune oferă o contribuție financiară pentru proiecte în domeniul mediului și al rețelelor transeuropene în domeniul infrastructurii de transport.

Inițial, „fondurile structuraleˮ, au inclus Fondul European de Dezvoltare Regională, Fondul Social European, Fondul European de Orientare și Garantare Agricolă – secțiunea Orientare și Instrumentul financiar pentru orientarea pescuitului.

Marea diversitate regională, extinderea spațiului și frontierelor maritime după extinderile din 2004 și 2007 au crescut importanța cooperării transnaționale și interregionale în cadrul Uniunii. Prin urmare, politica de coeziune a UE a fost complet revizuită în 2006.

Politica de coeziune ar trebui să contribuie la sporirea creșterii economice, a competitivității și a ocupării forței de muncă prin integrarea priorităților Uniunii pentru dezvoltarea durabilă.

Odată cu creșterea integrării europene, Uniunea împarte din ce în ce mai mult responsabilitatea cu statele membre, pentru menținerea modelului european de societate. Acest model reflectă valorile economiei sociale de piață, care încearcă să combine un sistem de organizare economică bazat pe forțele pieței, libertatea de oportunitate și de întreprindere, cu un angajament față de valorile solidarității și acces pentru toți membrii societății la protecție și servicii sociale de interes general. Prin urmare, politicile de coeziune economică și socială, care sunt legate de obiectivele modelului european de societate, sunt considerate a fi un factor în consolidarea productivității societății europene și în contribuția la bunăstarea economică și socială.

Ar trebui subliniat faptul că obiectivul de coeziune economică și socială înseamnă mult mai mult decât simpla redistribuire a fondurilor pentru cele mai sărace state membre și regiuni. Aceasta necesită o acțiune coerentă, printr-o coordonare a politicilor economice naționale și comune. Prin urmare, politica regională comună are două flancuri. În primul rând, aceasta urmărește să coordoneze politicile naționale, regionale prin formularea unor orientări și instituirea unor principii, cu scopul de a evita denaturarea concurenței între statele membre, prin intermediul schemelor de ajutor regional. În al doilea rând, ea coordonează diversele politici și instrumente financiare ale UE pentru a le oferi o „dimensiune regionalăˮ și, astfel, un impact mai mare asupra regiunilor slab dezvoltate.

1.6 Indicatorii politicii de coeziune:

Ponderea în PIB a cheltuielilor de cercetare-dezvoltare din sectorul public (R&D)

Indicatorul este definit ca raportul dintre cheltuielile totale de cercetare-dezvoltare din sectorul public si produsul intern brut. Acesta măsoară investițiile cheie de cercetare-dezvoltare care susțin viitoarea competitivitate care conduce la un produs intern brut mai mare. Cheltuiala de cercetare-dezvoltare reprezintă unul din motoarele creșterii economice în economia bazată pe cunoaștere și pe îmbunătățirea tehnologiilor de producție și stimularea creșterii.

PUBRD_PC_GDP=PUBRD/GDP= (GOVERD+HERD)/GDP

PUBRD= cheltuielile totale de cercetare-dezvoltare din sectorul public

GOVER = cheltuielile totale de cercetare-dezvoltare din sectorul guvernamental

HERD= cheltuielile totale de cercetare-dezvoltare din sectorul învătământ superior

GDP= produsul intern brut

1.6.1 (www.insse.ro)

Datorită recunoașterii beneficiilor aduse creșterii economice și în vederea reducerii decalajului țărilor din Europa față de principalii parteneri din întreaga lume, Consiliul Europei a propus ca acest indicator să fie unul dintre cei 5 indicatori principali incluși în Strategia Europa 2020, care urmărește atingerea țintei de „3% intensitate pentru cercetare-dezvoltare” în anul 2020. La nivel național, acest obiectiv este transpus în „2% intensitate pentru cercetare-dezvoltare” până în anul 2020.

2. Produsul intern brut (PIB) per locuitor, în standardul puterii de cumpărare (SPC)

Produsul Intern Brut este o măsură esențială a dezvoltării și creșterii economice a unei națiuni. Creșterea economică este exprimată în parități ale puterii de cumpărare (PPC) – care țin cont de nivelurile de prețuri între statele membre, permițând o comparație relevantă. Prin folosirea PPC-urilor ca factor de conversie, PIB-ul este convertit într-o monedă comună artificială, denumită standardul puterii de cumpărare (SPC), oferind posibilitatea de a compara puterea de cumpărare între țări care utilizează monede naționale diferite.

3. Rata de ocupare total, pe grupe de vârstă și sex

Rata de ocupare a populației în vârstă de muncă reprezintă raportul dintre populația ocupată în vârstă de muncă (15-64 ani) și totalul populației în vârstă de muncă (15-64 ani), exprimat procentual. Se obține împărțind numărul persoanelor ocupate în vârstă de muncă (15-64 ani) la populația totală în vârstă de muncă (15-64 ani) și se înmulțește cu 100.

ROC_15-64= POC_15-64 /PTOT_15-64*100

ROC_15-64 – rata ocupării persoanelor în vârstă de muncă (15-64 ani)

POC_15-64 – numărul persoanelor ocupate în vârstă de muncă (15-64 ani)

PTOT_15-64 – numărul total al persoanelor în vârstă de muncă (15-64 ani)

1.6.2 (www.insse.ro)

4. Numărul persoanelor cu studii superioare din grupa de vârstă 25-64 de ani în funcție de sex

Acest indicator reprezintă numărul persoanelor cu studii superioare din totalul populației și se calculează ca raport între populația de 25-64 ani din această categorie – stabilită corespunzător nivelului de educație superior – și populația totală din aceeași grupă de vârstă, în funcție de sex.

GRED_AD = PAD_i /PAD*100

GRED_AD – numărul persoanelor cu studii superioare în vârstă de 25-64 ani

PAD_i – numărul persoanelor adulte în vârstă de 25-64 ani cu nivel de educație i, unde i= nivelul superior

PAD – numărul total al persoanelor adulte în vârstă de 25-64 ani

1.6.3 (www.insse.ro)

5. Rata riscului de sărăcie sau excluziune socială

Persoanele expuse riscului de sărăcie sunt acele persoane care trăiesc într-o gospodărie cu un venit disponibil sub pragul riscului de sărăcie, care este stabilit la 60% din venitul mediu național echivalent disponibil (după transferurile sociale). Venitul echivalent este calculat prin împărțirea venitului total al gospodăriei al cărui dimensiunea s-a stabilit după aplicarea următoarelor ponderi: 1.0 la primul adult, 0,5 pentru fiecare alți membrii ai gospodăriei cu vârsta de peste 14 ani și 0,3 pentru fiecare membru al gospodăriei în vârstă de mai puțin de 14 ani. Persoanele afectate de excluziunea socială trăiesc în condiții constrânse de lipsa de resurse și experiență de cel puțin 4 din cele 9 următoare elemente cu privire la privarea de viață: nu își pot permite 1) să plătească chiria / facturile ipotecare sau de utilitate la timp, 2) sa păstreze casa la o temperatura adecvată, 3 ) să facă față unor cheltuieli neprevăzute, 4) să mănânce carne, pește sau proteine ​​echivalente la fiecare două zile, 5) o vacanță de o săptămână departe de casă, 6) o mașină, 7) o mașină de spălat, 8) un televizor color sau 9 ) un telefon (inclusiv telefon mobil). Persoanele care trăiesc în gospodării cu intensitate de lucru foarte scăzută sunt cei cu vârste între 0-59 care trăiesc în gospodării în care, în medie, adulții (în vârstă de 18-59 ani) au lucrat mai puțin de 20% din potențialul lor de muncă totală în cursul anului trecut. Studenții sunt excluși. Numărul total de persoane expuse riscului de sărăcie sau de excluziune socială este mai mic decât suma numărului de persoane din fiecare dintre cele trei forme de sărăcie sau excluziune socială, dar unele persoane pot fi afectate simultan de mai mult de una din aceste situații.

Rata riscului de sărăcie sau excluziune socială este compusă din trei indicatori:

5.1 locuirea într-o gospodărie cu o intensitate a muncii mică

5.2 sărăcie materială gravă

5.3 un venit inferior pragului național de sărăcie dupa plata transferurilor sociale

Rata riscului de sărăcie are o dimensiune regională puternică, care nu poate fi explicată prin caracteristici personale precum educația, statutul de angajat sau șomer, tipul de gospodărie și vârsta. Estimări ale sărăciei regionale bazate pe aceste dimensiuni subestimează în mod considerabil variația regională a sărăciei. Cu alte cuvinte, rata riscului de sărăcie depinde nu numai de educația sau de statutul de angajat sau șomer al persoanei, ci și de locul unde aceasta trăiește („efectul localizării”).

Primul indicator măsoară excluderea de pe piața muncii. Acest indicator nu este corelat nici cu PIB-ul pe cap de locuitor, nici chiar cu ratele de ocupare a forței de muncă.

Al doilea indicator este o măsură absolută a sărăciei, deoarece măsoară, în același mod în toate statele membre, accesul la nouă elemente esențiale. Acest indicator este strâns corelat cu nivelul de dezvoltare al unei țări.

Ultimul indicator este un indicator al sărăciei relative, deoarece el măsoară proporția persoanelor cu venituri sub 60% din venitul național mediu.

6. Speranța de viață la naștere

Speranța de viață la naștere, cunoscută și ca durata medie a vieții, reprezintă numărul mediu de ani pe care îi are de trăit un nou născut dacă ar trăi tot restul vieții în condițiile mortalității pe vârste din perioada de referință. Indicator sintetic al stării de sănătate a populației a fost elaborat pe baza datelor privind numărul populației, precum și a deceselor pe ani de naștere și vârste, din perioada de referință.

E(o) – speranța de viață la vârsta x=0 – se determină prin însumarea numărului mediu al supraviețuitorilor L(x) de la vârsta x până la vârsta maximă din tabela de mortalitate și împărțirea la numărul supraviețuitorilor vârstei x. Indicatorii tabelei de mortalitate au următoarea semnificație: L(x) – numărul supraviețuitorilor de vârsta x – câte persoane din generația ipotetică de 100000 născuți -vii mai sunt în viață la împlinirea vârstei exacte de x ani; D(x) – numărul decedaților între vârstele x și x+1 ani – arată câți din supraviețuitorii vârstei x ani mor înainte de a împlini vârsta x+1 ani; Q(x) – probabilitatea de deces între vârstele x și x+1 ani – arată riscul la care este expusă o persoană care a împlinit x ani și moare înainte de a împlini x+1 ani; P(x) – probabilitatea de supraviețuire între vârstele x și x+1 ani – arată șansele pe care le are o persoană care a împlinit vârsta x ani să fie în viață la împlinirea vârstei x+1 ani; LM(x) – numărul mediu al supraviețuitorilor în intervalul de vârstă x la x+1 ani; Acest indicator de calculează după formula:

= sau = +

1.6.4 (www.insse.ro)

unde w este vârsta la care moare ultimul reprezentant al generației inițiale de 100000 născuți-vii.

Capitolul II – Analiza componentelor principale

Analiza componentelor principale este o metodă de analiză multidimensională care are ca scop determinarea unor noi variabile, numite componente principale exprimate sub forma unor combinații liniare de variabile originale, astfel încât aceste variabile noi să fie caracterizate de o variabilitate maximă. Deoarece numărul combinațiilor liniare posibile este foarte mare, vor prezenta interes doar acele combinații semnificative din punct de vedere informațional, adică acele combinații liniare ce au o variabilitate mare. Se va efectua o triere a acestora cu scopul de a reține doar acele combinații ce prezintă interes datorită variabilității utilizându-se un criteriu bazat pe varianța fiecărei combinații liniare. Astfel, se vor elimina combinațiile liniare cu varianța mică, nesemnificativă și se vor reține doar acele combinații liniare semnificative, care au o varianță maximă.

Analiza componentelor principale este o tehnică multidimensională al cărei scop este reducerea dimensionalității spațiului cauzal inițial, în condițiile unei pierderi informaționale minime.

În urma transformărilor caracteristicilor inițiale, se formează noile caracteristici, mult mai reduse ca număr, ce poartă numele de componente principale.

2.1 Componentele principale

Componentele principale sunt variabile vectoriale abstracte prezentate ca și combinații liniare de variabile originale și au ca și proprietăți fundamentale:

Componentele principale sunt necorelate două câte două, iar suma pătratelor coeficienților ce definesc combinația liniară ce corespunde unei componente principale este egală cu unitatea;

Prima componentă principală este o combinație liniară normalizată a cărei varianță este maximă. Cea de-a doua componentă principală este o combinație liniară necorelată cu prima componentă principală, aceasta având o varianță cât mai mare posibilă, dar care este mai mică decât varianța primei componente.

Caracteristici ale componentelor principale:

Axele noului spațiu sunt ortogonale două câte două și definesc noile variabile, adică componentele principale;

Componentele principale sunt combinații liniare de varianță maximală ale variabilelor originale;

Conform teoriei, numărul componentelor principale este egal cu numărul de variabile originale. Însă, nu toate componentele principale au semnificație informațională importantă, așa că acestea sunt eliminate;

Suma varianțelor componentelor principale este egală cu suma varianțelor variabilelor originale, de aceea componentele principale preiau toată variabilitatea variabilelor originale;

Componentele principale sunt scalate în funcție de varianța acestora, adică prima componentă principală are varianța maximă, iar ultima are varianța minimă;

2.1.1 Proprietățile componentelor principale

În afara proprietăților enunțate anterior, componentele principale prezintă o serie de proprietăți interesante și foarte importante pentru a întelege conținutul și modul cum se formează.

2.1.1.1 Distribuirea dupa o lege normală

În cazul în care variabilele originale sunt repartizate normal, vectorul componentelor principale w este repartizat normal cu media μ și matricea de covarianță Λ, adică:

w~ N(μ, Λ), (2.1)

unde Λ este matricea diagonală ale cărei elemente sunt valorile proprii , ,…, ale matricii de covarianță Σ.

Deoarece componentele principale reprezintă combinații liniare ale celor n variabile originale, putem afirma că cele n variabile sunt normale. Pentru a arăta că matricea de covarianță a vectorului w este matricea Λ trebuie să arătăm că:

w= x, (2.2)

unde x este repartizat normal, cu matricea de covarianță Σ, putem arăta că matricea de covarianță a transformării liniare w este:

Cov(w)=ΣA (2.3)

2.1.1.2 Conservarea varianței totale

Proprietatea componentelor principale conform căreia acestea substituie variabilele originale din punct de vedere informațional se referă la faptul că prin intermediul componentelor principale se conservă variabilitatea din spațiul cauzal inițial.

Componentele principale , ,…, asigură conservarea varianței totale în întregime a variabilelor originale , ,…, , adică:

= deci: = (2.4)

2.1.1.3 Conservarea varianței generalizate

Această proprietate evidențiază calitatea informațională a componentelor principale de a retransmite ceea ce conțin variabilele originale.

Componentele principale , ,…, asigură conservarea integrală a varianței generalizate a variabilelor originale , ,…, . De aceea:

(x) = (w) (2.5)

2.1.1.4 Dependența de unitățile de măsură

Componentele principale , ,…, și varianțele acestora depind de unitățile de măsuăa ale variabilelor originale , ,…, . De aceea, odată cu schimbarea unității de măsură a variabilelor originale se schimbă componentele principale, dar și varianțele acestora.

2.1.2 Alegerea numărului de componente principale

Analiza componentelor principale poate fi folosită ca metodă de reducerea a dimensiunii spațiului de cauzalitate. În acest caz, apare necesitatea determinării numărului minim de componente principale, care trebuie să asigure preluarea unei cantități a variabilității spațiului cauzal inițial cât mai mare, astfel încât sacrificarea unor componente principale să nu determine o pierdere mare de informație.

Există mai multe criterii ce sunt folosite pentru a determina numărul de componente principale care trebuie reținute în analiză.

2.1.2.1 Criteriul pantei sau „granulozitățiiˮ

Acest criteriu presupune reprezentarea grafică a celor n valori proprii din analiză, fiind de fapt o metodă vizuală de stabilire a numărului de componente principale.

Criteriul pantei, propus de Cattell, presupune reținerea în analiză a unui număr de componente principale egal cu numărul de valori proprii, în condițiile în care panta graficului este suficient de abruptă.

Putem spune că numărul de componente principale este egal cu acea valoare proprie care reprezintă, pe grafic, punctul de cotitură, adică punctul de pe abscisă în jurul căruia panta curbei are parte de o trecere de la abrupt la lin.

2.1.2.2 Criteriul procentului de acoperire

Decizia de a adăuga noi componente principale la ce cele deja reținute în analiză, se ia în funcție de mărimea proporției în care estimațiile valorilor proprii ce corespund componentelor reținute, acoperă varianța variabilelor originale. Această proporție, în cazul matricii de covarianță, se poate calcula astfel:

= (2.6)

unde reprezintă elementele de pe diagonala principală a matricii de covarianță .

În cazul în care se folosește matricea de corelație , când se presupune că variabilele originale au fost standardizate, adică putem afirma că suma varianțelor acestora este egală cu numărul lor, raportul devine:

= (2.7)

unde reprezintă valorile proprii ale matricii de corelație .

2.1.2.3 Criterul valorii supraunitare sau criteriul lui Kaiser

Dacă analiza componentelor principale este realizată pe matricea de corelație, adică se utilizează date standardizate, cel mai utilizat criteriu este cel al magnitudinii fiecărei valori proprii în raport cu care se determină componentele principale.

Conform criteriului lui Kaiser, în analiză se vor reține doar componentele principale ce corespund unor valori proprii supraunitare, adică acele componente principale care au varianța mai are decât unitatea.

Deși, în analiză variabilele originale sunt sub formă standardizată și deci varianțele acestora sunt egale cu unitatea, ideea acestui criteriu este aceea că prezintă interes în analiză doar acele componente principale a căror varianță este mai mare decât varianța variabilelor originale, respectiv componentele principale care au varianță supraunitară.

Dezavantajul pe care îl poate avea acest criteriu este acela că pe lângă faptul că nu poate fi utilizat decât pe datele standardizate, poate duce la reținerea unui număr de componente fie prea mare, fie prea mic în comparație cu cel necesar.

2.1.3 Modelul matematic al componentelor principale

Pentru a defini modelul matematic al componentelor principale, vom considera că spațiul cauzal inițial supus analizei este determinat de un număr de n variabile explicative notate , ,.., . Aceste variabile reprezintă caracteristici ale obiectelor supuse analizei, adică fiecare obiect se presupune a fi caracterizat de n variabile.

Determinarea componentelor principale poate fi descrisă prin următoarea transformare:

ψ: ,

unde și reprezintă două spații vectoriale reale, iar dimensiunea celui de-al doilea spațiu este mult mai mică decât dimensiunea primului spațiu, respectiv k<n.

Prin intermediul transformării ψ, un anumit obiect x, ce aparține spațiului n-dimensional , este transformat într-un obiect w, ce aparține spațiului k-dimensional . Transformarea vizează atât modificarea coordonatelor subiectului, cât și reducerea numărului acestor coordonate.

În continuare, dacă x și w, atunci putem spune că transformarea ψ este o aplicație liniară de tipul următor:

w = x, (2.8)

unde A este o matrice de numere reale, de dimensiune nk.

Rezolvarea acestei probleme constă în determinarea matricii A, astfel încât un obiect w să constituie o reprezentare cât mai bună pentru obiectul x.

2.1.3.1 Formularea modelului matematic

Soluționarea problemei de analiză a componentelor principale din punct de vedere matematic este echivalentă cu rezolvarea următoarei probleme de extrem:

(2.9)

unde criteriul de optim poate fi maxim sau minim, în funcție de natura funcției Φ. Dacă Φ este o funcție de tip distanță, atunci criteriul de optim va fi reprezentat de minimizarea funcției Φ. Dacă Φ este o măsură a cantității de informație adusă de noua modalitate de reprezentare a obiectelor, criteriul optim va fi reprezentat de maximizarea funcției Φ.

Cu scopul definirii modelului matematic al analizei componentelor principale, vom considera că vectorii reprezintă coloanele unei matrici A de dimensiune nn de forma:

A = (2.10)

De asemenea, vom presupune că x este vectorul ale cărui coordonate sunt variabile originale , ,.., și că w este vectorul ale cărui coordonate sunt componentele principale , ,…, . În aceste condiții, combinațiile liniare care definesc componentele principale pot fi scrise sub forma:

(2.11)

sau, în scriere matriceală, sub forma:

= (2.12)

În urma acestor notații, putem defini modelul matematic al analizei ca fiind:

(2.13)

Cele n coloane ale matricii A reprezintă vectorii proprii normalizați ai matricii de covarianță Σ, iar varianța fiecărei componente principale , care reprezintă o varianță maximală în raport cu varianțele componentelor principale anterioare, este exprimată prin intermediul valorii ai aceleeași matrici de covarianță.

Am arătat anterior că cele n componente principale ale spațiului cauzal determinat de variabilele , ,.., sunt definite de combinații liniare:

= i=1,2,…, n (2.14)

ale căror ponderi se determină astfel încât să maximizeze varianța componentelor principale .

2.1.3.2 Formularea problemei de maximizare a varianței

Varianța unei componente principale w poate fi scrisă astfel:

Var(w) = Σα (2.15)

În analiza componentelor principale, principala problemă este aceea a determinării coordonatelor vectorului α astfel încât varianța componentei principale, Var(w) să fie maximă.

Problema determinării componentelor vectorului α ce definesc combinația liniară reprezentând componenta principală w se reduce la rezolvarea următoarei probleme de extreme cu legături. Trebuie menționat faptul că pentru a avea asigurarea că problema este bine determinată, trebuie impusă o restricție asupra vectorului necunoscut α: α = 1

(2.16)

unde necunoscutele problemei sunt componentele vectorului α. Vectorul α, care este soluție a acestei probleme, definește o componentă principală de varianță maximală.

2.2 Tehnici de clasificare/ clusterizare

Astăzi, tehnicile de clusterizare au o deosebită importanță și o largă utilizare, fiind prezente în numeroase domenii. Aplicarea și utilizarea lor se dezvoltă pe măsură ce cantitatea de date și puterea de procesare a calculatoarelor crește. Aplicațiile de clustering sunt utilizate pe scară largă în diverse domenii, cum ar fi inteligența artificială, recunoașterea formelor, economia, ecologia, psihiatria și marketingul. Putem spune că utilizarea cea mai frecventă este întâlnită în domeniul marketingului, în investigatiile de natură psihosocială sau în evaluările economico-sociale la nivel teritorial.

În domeniul marketingului, tehnicile de analiză cluster se aplică în studierea comportamentului consumatorilor, adică în evaluarea șanselor pe care le poate avea lansarea unui nou produs pe piață, identificarea unor noi piețe sau modalitățile de împărțire a pieței.

În domeniul economico-social analiza cluster poate fi folosită pentru rezolvarea unor probleme importante. De exemplu, în fundamentarea criteriilor de alegere a proiectelor de dezvoltare, stabilirea politicilor de creditare în domeniul financiar-bancar, identificarea celor mai profitabile domenii de afaceri sau clasificarea și ierarhizarea unor entități economico-sociale.

Metodele de clasificare sau de analiză „cluster” au ca scop gruparea indivizilor, identificați printr-o serie de atribute – variabile numerice – într-un număr cât mai restrâns de clase omogene. Ceea ce le caracterizează este faptul că realizează o analiză globală a indivizilor ce sunt studiați printr-un număr mare de variabile, iar ipotezele cerute sunt minime. Există un evident compromis între numărul de grupuri și omogenitatea intraclasă și interclasă a acestora. Dacă există câteva grupuri, coeziunea internă tinde să fie mică. În caz contrar, un număr mare de grupuri le face foarte apropiate, astfel că există puține diferențe între grupurile adiacente.

Analiza cluster are ca scop căutarea și identificarea de clase, grupe sau clustere în cadrul unor mulțimi de obiecte sau forme, astfel încât elementele care aparțin aceleiași clase să fie cât mai asemănătoare, iar elementele care aparțin unor clase diferite să fie cât mai diferite între ele. Putem spune că analiza cluster este o metodă de examinare a similarităților și disimilarităților dintre obiectele ce aparțin unei mulțimi cu scopul de a grupa aceste obiecte în clase distincte între ele și omogene în interior. Analiza cluster este o tehnică de clasificare caracterizată prin faptul că afectarea formelor sau obiectelor în clustere sau grupe se face pe etape, fără a cunoaște aprioric numărul de clase, în funcție de verificarea a două criterii fundamentale:

obiectele sau formele grupate în fiecare clasă să fie cât mai asemănătoare din anumite puncte de vedere;

obiectele sau formele grupate în fiecare clasă să fie cât mai diferite din anumite puncte de vedere;

Analiza cluster poate fi definită ca reprezentând o mulțime de principii, metode și algoritmi de clasificare, având ca scop organizarea datelor sub forma unor structuri informaționale semnificative.

Clusterul este o submulțime formată din obiecte care au proprietatea că gradul de disimilaritate dintre oricare două obiecte aparținând clusterului este mai mic decât gradul de disimilaritate dintre orice obiect care aparține clusterului și orice obiect care nu aparține clusterului respectiv.

Scopul analizei cluster:

definirea unor scheme de clasificare formală și a unor tipologii, pe baza cărora realitățile pot fi mai bine cunoscute și prezentate;

identificarea unor modele matematico-statistice cu ajutorul cărora mulțimile complexe și eterogene de fenomene și procese pot fi reprezentate sub formă simplificată;

definirea completă a caracteristicilor fundamentale ale unor populații de fenomene și procese;

identificarea unor entități individuale reprezentative pentru clasele și categoriile fenomenelor și proceselor.

Metodele de analiză cluster pot fi împărțite în două mari categorii: metode de tip ierarhic și metode de tip iterativ sau de partiționare în funcție de modul de operare și al soluțiilor pe care le furnizează.

2.2.1 Algoritmii de tip ierarhic

Analiza cluster de tip ierarhic sau arborescent este o metodă de clasificare bazată pe gruparea obiectelor pe bază de agregare succesivă din clase din ce în ce mai mari de obiecte sau de dezagregare succesivă în clase din ce în ce mai mici.

Rezultatul analizei cluster de tip ierarhic constă în obținerea unei mulțimi de structuri de clustere, numită arbore ierarhic.

Algoritmii sau metodele de tip ierarhic urmăresc producerea mai multor soluții cluster, de tip multinivel, numite ierarhii cluster, care se diferențiează între ele prin numărul de clustere pe care le include și prin gradul de agregare al clusterelor. Caracteristica principală a acestor algoritmi este faptul că numărul de clustere nu este cunoscut aprioric.

Algoritmii de clasificare de tip ierarhic pot fi împărțiți în două mari categorii:

algoritmi de clasificare prin agregare, amalgamare sau combinare;

algoritmi de clasificare prin dezagregare sau divizare.

Algoritmii de agregare construiesc clustere ascendent, pornind de la clustere ce conțin un singur obiect, continuând prin lipirea succesivă a clusterelor, până la obținerea unui cluster final care include toate obiectele.

Algoritmii de dezagregare construiesc clustere descendent, pornind de la un cluster ce conține toate obiectele și continuând, prin împărțire succesivă, până la obținerea unor clustere care conțin un singur obiect.

2.2.1.1 Metode de clasificare ierarhică prin agregare

2.2.1.1.1 Metoda agregării simple

Metoda agregării simple este o metodă de clasificare ierarhică de tip ascendent, care la fiecare etapă a algoritmului comasează acele clustere pentru care distanța dintre cei mai apropiați vecini este cea mai mică, în comparație cu alte perechi de clustere. Această metodă folosește metoda celor mai apropiați vecini pentru a vedea care distanța dintre clustere este mai mică. Clusterizarea de acest tip se mai numește și analiză cluster de tip MIN.

Metoda celor mai apropiați vecini evaluează distanța dintre două obiecte aflate în clustere diferite, obiecte care sunt cele mai apropiate în sensul distanței utilizate. Putem spune că distanța dintre două clustere este măsurată prin distanța dintre cele mai apropiate obiecte aparținând celor două clase.

2.2.1.1.2 Metoda agregării complexe

Metoda agregării complexe este o metodă de clasificare ierarhică de tip ascendent, care la fiecare etapă a algoritmului comasează acele clustere pentru care distanța dintre cei mai depărtați vecini este cea mai mică, în comparație cu alte perechi de clustere. Această metodă folosește metoda celor mai depărtați vecini vecini pentru a vedea care distanța dintre clustere este mai mică.

Metoda celor mai depărtați vecini evaluează distanța dintre două clustere ca distanța între două obiecte aflate în clustere diferite, care se află la cea mai mare depărtare în sensul distanței utilizate.

2.2.1.1.3 Metoda agregării medii

Metoda agregării medii este o metodă de clasificare ierarhică de tip ascendent, care la fiecare etapă a algoritmului comasează acele clustere pentru care distanța medie dintre toate perechile formate cu obiecte din cele două clustere este cea mai mică, în comparație cu alte perechi de clustere.

Diferența dintre această metoda și celelalte două menționate anterior este aceea că evaluarea distanței dintre două clustere este considerată a fi media distanțelor care separă obiectele aparținând celor două clustere.

2.2.1.1.4 Metoda centroidului

Metoda centroidului este o metodă de clasificare ierarhică de tip ascendent, care comasează la fiecare etapă a clasificării, două clustere pentru care distanța dintre centroizii celor doua clustere este cea mai mică, în comparație cu alte perechi de clustere. Distanțele dintre cele două clustere sunt calculate cu ajutorul metodei centroidului, care evaluează distanța dintre două clustere ca fiind distanța între centriozii celor două clustere.

2.2.1.1.5 Metoda lui Ward

Metoda lui Ward este o metodă de clasificare ierarhică de tip ascendent, care comasează la fiecare etapă a clasificării, două clustere pentru care suma patratelor abaterilor la nivelul clusterului obținut prin comasare este cea mai mică, în comparație cu alte perechi de clustere.

Această metodă este cunoscută și sub numele de metoda minimei varianțe intracluster și este considerată ca fiind una dintre cele mai eficiente metode de clasificare ierarhică prin agregare. Putem spune că această metodă de evaluare a distanței dintre două clustere se bazează pe maximizarea gradului de omogenitate a clusterelor.

2.2.1.2 Metode de divizare

Metodele de clasificare prin divizare sunt metode de tip descendent în care soluțiile obținute sunt ierarhii de clustere, ce pot fi reprezentate cu ajutorul arborilor cluster sau al dendrogramelor.

Algoritmii de clasificare ierarhică pe bază de divizare pornesc cu un singur cluster, ce contine toate obiectele care trebuie supuse clasificării. Pe parcurs, acest cluster inițial este divizat succesiv până când se obțin clustere ce conțin un singur obiect.

2.2.2 Algoritmul de partiționare K-medii

Clasificarea pe baza mediei este o tehnică de clasificare în clase disjuncte, centrul fiecărei clasei fiind obținut „dinamic” ca medie a indivizilor din clasa respectivă. Tehnica celor K-medii are ca obiectiv, la fiecare iterație, reducerea varianței intraclasă și maximizarea varianței interclasă.

Algoritmul celor K-medii este probabil cea mai populară tehnică de clustering reprezentativ. Acest algoritm are scopul de a partiționa mulțimea de forme Ω astfel încât partiția să verifice criteriul general al clasificării, care spune că obiectele se clasifică în clase în așa fel încât este asigurată o variabilitate intraclasă minimă și o variabilitate interclasă maximă.

În cadrul algoritmului trebuie rezolvate două probleme importante:

Modalitățile de stabilire a inițializatorilor de clase:

se aleg ca inițializatori primele k forme din eșantionul de T forme ( , ,…, );

sunt stabiliți de către utilizatori prin alegerea de către elemente din eșantionul de T forme;

prin generarea de numere aleatoare: se generează k numere aleatoare din distribuția uniformă cu capetele 1 și T și se consideră cele k numere alese ca inițializatori, formele care au indici egali cu numerele generate aleator;

se stabilesc într-o manieră bazată pe echiditanță;

sunt stabiliți astfel încât să asigure o variabilitate interclasă cât mai mare.

Modalitățile de arondare a formelor la clase:

cea mai utilizată modalitate este cea bazată pe distanța de la fiecare formă la cei k centroizi ai claselor.

Etapele algoritmului celor K-medii

Inițializarea: alegerea inițializatorilor de clase folosind una dintre metodele de mai sus;

Se arondează cele T – k forme în funcție de distanța de la fiecare formă la inițializatorul de clasă;

Se calculează centroizii , ,…, și se renunță la vechea arondare, reținându-se doar centroizii claselor;

Se arondează cele T forme la cele k clase în funcție de distanța minimă la centroizii celor k clase;

Procesul se reia de la etapa III;

Procesul se repetă până când modificările centrozilor de la o etapa la alta devin nesemnificative;

|| – || < ε; k k (2.17)

Există două variante de alegere a celor K-medii:

1. Metoda cu recalcularea finală a centroizilor, în care calculul centroizilor pe fiecare clasă se face după ce toate formele au fost arondate la clase.

2. Metoda cu actualizare imediată, în care recalcularea centroizilor se face de fiecare dată când o nouă formă a fost arondată la o nouă clasă.

Algoritmul celor K-medii este unul dintre cei mai simplii algoritmi de învățare nesupervizată care rezolvă bine cunoscuta problemă de grupare. Procedura urmează un mod simplu și ușor de a clasifica un anumit set de date printr-un anumit număr de grupuri (clustere) fixat apriori. Ideea principală este de a defini K-medii, una pentru fiecare grup. Cea mai bună alegere în a plasa mediile este pe cât posibil mai departe una de celălaltă. Următorul pas este de a lua fiecare punct aparținând unui set de date și de a-l asocia la cea mai apropiată medie. Când nu mai există niciun punct în așteptare, primul pas este finalizat. În acest moment avem nevoie de a re-calcula cei k noi, centrii de greutate ca barycenter al clusterelor rezultate din etapa anterioară. În momentul în care am obținut cei k noi centroizi, un nou obligatoriu trebuie să fie făcut între aceleași puncte de set de date și cel mai apropiat centru nou. Astfel a fost generată o buclă. Ca urmare a acestei bucle se poate observa că k-medii își schimbă pas cu pas locația până când nu se fac mai multe modificari sau cu alte cuvinte, mediile nu se mai mișcă. În cele din urmă, acest algoritm are ca scop minimizarea unei funcții obiectiv, știută ca funcția de eroare pătrat dată de:

= , (2.18)

unde ||- || reprezintă distanța Euclidiană xi and vj ci reprezintă numărul de puncte de date din al i-lea cluster c reprezintă numărul de centre din cluster

Capitolul III – Studiu de caz pe regiunile Uniunii Europene

3.1 Statistici descriptive

În continuare voi prezenta un tabel ce conține Statisticile descriptive:

Tabel 3.1 Statistici descriptive

Sintetizarea datelor poate fi văzuta pe trei planuri:

Planul nivelului/ tendinței/ locației/ poziției/ distribuției de probabilitate;

Planul variabilității;

Planul legăturilor.

3.1.1 Planul distribuției de probabilitate

Acest plan se referă la numere care sintetizează datele din punct de vedere local: media aritmetică, mediana, modul, Quartilele, minimul, maximul, coeficientul de aplatizare (Kurtosis) și coeficientul de asimetrie (Skewness).

Mean reprezintă media aritmetică. Media este indicatorul care se utilizează cel mai des pentru caracterizarea tendinței centrale conținută la nivelul observațiilor efectuate asupra unei variabile. Acest indicator este utilizat la centralizarea și standardizarea datelor, operații necesare în analiza datelor.

Media reprezintă valoarea care, înlocuind toți termenii unei serii, nu modifică nivelul lor totalizator, adică sintetizează nivelul pe care caracteristica măsurată îl înregistrează de-a lungul obiectelor analizate.

Se observă că variabila cu media cea mai mare este PIB-ul (pentru că datele au valori mari), iar variabila cu media cea mai mică este Locuirea într-o gospodărie cu o intensitate a muncii mică, indicator ce intră în componeța ratei riscului de sărăcie și excluziune sociala.

Analizând valorile pentru Minimum observăm că pentru primul indicator al politicii de coeziune, Ponderea în PIB a cheltuielilor de cercetare-dezvoltare din sectorul public (R&D) valoarea minimă este 0 pentru regiunea Ciudad Autónoma de Ceuta din Spania, Produsul intern brut (PIB) per locuitor, în standardul puterii de cumpărare (SPC) înregistrează cea mai mică valoare, respectiv 3100, în Emilia-Romagna din Italia și în Severen tsentralen din Bulgaria spre deosebire de regiunile din România, unde cea mai mică valoarea, de 3400 se înregistrează în regiunea Nord-Est. Rata de ocupare total, pe grupe de vârstă și sex înregistrează cea mai scăzută valoare în regiunea Basilicata din Italia, 7.10. Comparând această valoarea cu valoarea minimă ce se înregistrează în România, de 14.70 în regiunea Sud-Est observăm o mare diferență. Rata riscului de sărăcie sau excluziune socială înregistrează valoarea minimă în regiunea Severozápad din Cehia, valoare foarte apropiată și de cea minimă din România, de 11.90 din regiunea de Sud-Est.

Regiunea Severna i yugoiztochna Bulgaria din Bulgaria deține valoarea minimă în ceea ce privește Speranța de viață la naștere de 72.90.

Analizând valorile pentru Maximum, în ceea ce privește Ponderea în PIB a cheltuielilor de cercetare-dezvoltare din sectorul public (R&D) putem spune că cea mai mare valoare se înregistrează în Danemarca, în regiunea Hovedstaden, 1861.60, existând o foarte mare diferență în comparație cu România, unde cea mai mare valoarea se regăsește în regiunea Bucuresti – Ilfov, de 44.80. În ceea ce privește Produsul intern brut (PIB) per locuitor, în standardul puterii de cumpărare (SPC), maximul se regăsește în Région de Bruxelles-Capitale / Brussels Hoofdstedelijk Gewest, din Belgia, 59800.00. Despre România putem spune că maximul îl întâlnim în București-Ilfov, dar valoarea este mult mai mică decât maximul la nivelul Uniunii Europene. Speranța de viață la naștere are valoarea maximă în Comunidad Foral de Navarra din Spania, de 83.20 de ani. Comparativ cu România putem spune că diferența este semnificativă, întrucât 75.10 este valoarea cea mai mare din această țară, valoare întâlnită în regiunea București-Ilfov.

Din această analiza putem conchide că în România cea mai dezvoltată zonă este zona București-Ilfov, întrucât aici se înregistrează și cea mai ridicată valoarea a Produsului intern brut (PIB) per locuitor, în standardul puterii de cumpărare (SPC), dar și Speranța de viață la naștere este semnificativ mai mare, comparativ cu celelalte regiuni ale țării.

Tabel 3.2 Quartile

Alți doi indicatori reprezentativi care caracterizează distribuția variabilelor sunt coeficientul de aplatizare (Kurtosis) și coeficientul de asimetrie (Skewness).

Kurtosis este coeficientul de aplatizare. Acesta se compară cu valoarea 3 și putem obține următoarele situații:

Kurtosis=3, distribuție normală;

Kurtosis>3, distribuție leptocurtică, adică valorile sunt în jurul mediei: Ponderea în PIB a cheltuielilor cu cercetarea și dezvoltarea.

Kurtosis<3, distribuție platicurtică: restul variabilelor.

Skewness este coeficientul de asimetrie. Acesta se compară cu valoarea 0 și putem obține următoarele situații:

Skewness=0, distribuție normală;

Skewness<0, distribuție spre stânga, adică cele mai multe valori sunt concentrate în partea dreapta a mediei, deci predomină valorile mari: Speranța de viață la naștere;

Skewness>0, distribuție spre dreapta, adică cele mai multe valori sunt concentrate în partea stângă a mediei, deci predomină valorile mici: restul variabilelor.

Se observă că variabilele prezintă, în general, o asimetrie pozitivă, cu excepția ultimei variabile, Speranța de viață la naștere, ce prezintă asimetrie negativă.

Din figurile prezentate anterior putem observa că:

Distribuția variabilei Ponderea în PIB a cheltuielilor de cercetare și dezvoltare este o distribuție asimetrică datorită prezenței unor outlieri superiori, iar valorile depășesc cu mult distanța intercuartilică.

Distribuția variabilei Produsul intern brut per locuitor, în standardul puterii de cumpărare este o distribuție asimetrică, de asemenea observăm prezența unui outlier superior.

Variabila Rata de ocupare total prezintă o distribuție asimetrică, valori ce depășesc cu mult distanța intercuartilică și multe valori outlier superioare.

Distribuța variabilei Numărul persoanelor cu studii superioare din grupa de vârstă 25-64 de ani nu prezintă valori outlier, iar mediana este de aproximativ 25.

Variabila Rata riscului de sărăcie sau excluziune socială este distribuită asimetric, mediana are o valoare apropiată de 23 si prezintă un outlier superior.

Distribuția variabilei Locuirea într-o gospodărie cu o intensitatea a muncii mică este o distribuție asimetrică, în care valorile depășesc cu mult distanța intercuartilică.

Distribuția variabilei Sărăcia materială gravă este o distribuție asimetrică, ce prezinta mai multe valori outlieri superioare, iar valoarea medianei este mai mică decât 10.

Variabila Un venit inferior pragului național de sărăcie după plata transferurilor este distribuită asimetric, iar valoarea medianei este de aproximativ 15.

Speranța de viață la naștere este variabila ce prezintă o distribuție asimetrică, ce nu prezintă valori outlieri, iar mediana are o valoare de aproximativ 79.

3.1.2 Planul variabilității

Planul variabilității este cel care măsoară cantitatea de informație din date.

Standard Deviation reprezintă abaterea medie patratică și este calculată ca o medie patratică a abaterilor termenilor seriei de la media lor. Acest indicator a fost folosit și la standardizarea datelor. Pe baza acestuia a fost determinat și coeficientul de variație care arată omogenitatea datelor și se calculează ca raport între abaterea standard și media aritmetică.

Seriile pentru care coeficientul de variație ≤ 35% sunt omogene, cu medii reprezentative, care caracterizează corect tendința centrală din populație. Se observă că eșantionul este heterogen, adică regiunile sunt foarte diferite.

Ridicând abaterea standard la pătrat obținem varianța, unul dintre cei mai importanți indicatori deoarece reprezintă măsura cantității de informații.

Variabilitatea este importantă atât din punct de vedere informațional, cât și ca mărime în contextul căreia poate fi judecată relevanța mediei. Cu cât variabilitatea unei mulțimi de observații este mai mică, cu atât media constituie o sintetizare, o rezumare mai potrivită și mai relevantă pentru mulțimea de observații. Se observă că variabila cu varianța cea mai mare este Produsul Intern Brut, iar variabila cu varianța cea mai mică este Locuirea într-o gospodărie cu o intensitate a muncii mică.

3.1.3 Planul legăturilor

Planul legăturilor cuprinde doi indicatori reprezentativi: varianța totală și varianța generalizată. Acesta este caracterizat de o matrice esențială: matricea de corelație.

Tabel 3.11 Matricea de corelație

Matricea coeficienților de corelație prezintă intensitatea legăturilor între toate perechile de variabile.

Când se apropie de -1 modificarea unei variabile este puternic asociată cu inversul modificării liniare a celeilalte variabile.

Când coeficientul de corelație este egal cu 0, înseamnă că nu există asociație între modificările celor două variabile.

Când coeficientul de corelație se apropie de +1, înseamnă că modificarea unei variabile este foarte puternic asociată cu modificarea liniară directă a celeilalte variabile. În urma analizei matricei de corelație, se observă că cel mai mare coeficient de corelație este cel dintre variabilele Rata riscului de sărăcie sau excluziune socială și Venit inferior pragului național de sărăcie după plata transferurilor sociale, fapt ușor de explicat întrucat rata riscului de sărăcie sau excluziune socială este compusă din trei indicatori, iar unul dintre ei este chiar Venitul inferior pragului național de sărăcie după plata transferurilor sociale. Cea mai slabă corelație pozitivă există între variabilele Produsul intern brut per locuitor, în standardul puterii de cumpărare și Locuirea într-o gospodărie cu o intensitate a muncii mică. De asemenea, putem observa că variabilele Speranța de viață și Sărăcia materială gravă sunt cele cu cea mai puternică corelație negativă. Variabilele cu cea mai slabă corelație negativă sunt Numărul persoanelor cu studii superioare din grupa de vârstă 25-64 de ani în funcție de sex și Locuirea într-o gospodărie cu o intensitate a muncii mică.

3.2 Reducerea dimensionalității

Tabel 3.12 Comunalitatea variabilelor

Comunalitatea reprezintă proporția explicată de factorii din varianța unei variabile. Se observă că comunalitățile inițiale sunt 1, aceste fiind calculate înainte de reducerea dimensionalității. Valorile minime ale caracterului comun pentru anumite variabile, indică faptul că respectivele variabile nu sunt bine reprezentate de modelul factorial aplicat. În cazul de față, toate variabilelor sunt bine reprezentate de către modelul factorial folosit, așa cum putem observa în Tabelul 3.12.

Tabel 3.13 Varianța totală explicată

Varianța totală explicată reprezentată în Tabelul 3.13 furnizează primele informații specifice analizei factoriale. Folosind metoda Analizei Componentelor Principale (ACP), a fost generat un număr de nouă componente principale, așa numiții, factori. Așa cum putem observa doar primii trei factori îndeplinesc criteriile de selecție și anume Criteriul lui Kaiser (λ>1) și Criteriul procentului de acoperire (primii trei factori acoperă 81% din informație).

Coloanele Informație extrasă prezintă valorile pentru toți cei trei factori, dar după aplicarea procedurii de rotație. Se observă că cele 3 coloane existente asigură informații despre informația extrasă, atât individual, cât și cumulat.

Figura 3.14 Scree Plot

În Figura 3.14 sunt reprezentate grafic într-o secvență de factori principali, valorile proprii pentru toate componentele principale, ce au fost determinate cu ajutorul metodei Analizei Componentelor Principale. Din figura observăm existența unei soluții cu trei factori, întrucât graficul prezintă trei șabloane descrescătoare.

Tabel 3.15 Matricea componentelor după rotație

Matricea componentelor după rotație din Tabelul 3.15 conține datele obținute după aplicarea procedurii de rotație a factorilor, ce reprezintă o transformare a componentelor cu scopul de a aproxima structura dată. Observăm că variabilele analizate vor avea următoarea structură:

Prima componentă preia informație din următoarele variabile inițiale: Produsul Intern Brut per locuitor, în standardul puterii de cumpărare, Sărăcia materială gravă și Speranța de viața la naștere;

Cea de-a doua componentă preia informație din următoarele variabile inițiale: Rata riscului de sărăcie sau excluziune socială, Locuirea într-o gospodărie cu o intensitate a muncii mică și un Venit inferior pragului național de sărăcie dupa plata transferurilor sociale;

3. A treia componentă s-a construit pe baza următoarelor variabile: Ponderea în PIB a cheltuielilor de cercetare-dezvolatare din sectorul public, Rata de ocupare total și Numărul persoanelor cu studii superioare din grupa de vârstă 25-64 de ani.

3.3 Analiza Cluster

3.3.1 Analiza Cluster pe matricea observațiilor cu ajutorul metodei agregării Ward

Figura 3.16 Dendrograma

Clasele obținute în urma tăieturii sunt:

Tabel 3.17

În urma acestei analize Cluster, observăm că am obținut un număr de 4 clase:

Clasa 1 cuprinde 17 regiuni din țări ca Belgia, Spania și Italia

Clasa 2 cuprinde 66 de regiuni și este cea mai cuprinzătoare clasă. Regiunile se situează în țări ca: Belgia, Cehia, Danemarca, Spania, Italia, Olanda, Portugalia, Austria, Slovenia, Slovacia, Finlanda și Suedia.

Clasa 3 cuprinde 13 regiuni, situate în Belgia, Danemarca, Austria, Finlanda și Suedia.

Clasa 4 cuprinde 47 de regiuni din următoarele țări: Bulgaria, Cehia, Ungaria, Polonia, România, Slovenia și Slovacia.

Observăm că România face parte din aceeași clasă ca și Bulgaria, țară ce a intrat în Uniunea Europeană la aceeași dată ca și țara noastră. Celelalte țări din această clasă sunt așezate în aceeași parte a Europei ca și România.

3.3.2 Algoritmul celor K-medii

Tabel 3.18 Numărul de clase din fiecare cluster

Din Tabelul 3.18 putem observa că folosim algoritmul celor K-medii obținem 4 clustere.

Tabel 3.19

În urma algoritmului de partiționare au rezultat 4 clase, după cum urmează:

Clasa 1 cuprinde 22 de regiuni din țări ca: Belgia, Spania și Italia.

Clasa 2 cuprinde 60 de regiuni, fiind cea mai mare clasă. Aceste 60 de regiuni aparțin următoarelor țări: Belgia, Cehia, Spania, Italia, Portugalia, Olanda, Austria, Polonia, Slovacia, Finlanda și Suedia.

Clasa 3 este alcătuită din 17 regiuni localizate în Danemarca, Olanda, Austria, Finlanda și Suedia.

Clasa 4 cuprinde 44 de regiuni din țări ca: Bulgaria, Ungaria, Polonia, România și Slovacia.

Ca și în cazul celeilalte analize Cluster și în cazul algoritmului de partiționare, regiunile din România fac parte din clasa 3 alături regiuni ale unor țări aflate în vecinătate ca Bulgaria, Ungaria, Polonia și Slovacia.

Figura 3.20 Reprezentarea regiunilor după primele două componente principale

Din reprezentarea prezentată în Figura 3.14 se observă că există două regiuni ce pot fi considerate outlieri, și anume Région de Bruxelles-Capitale / Brussels Hoofdstedelijk Gewest și Sicilia.

Despre Région de Bruxelles-Capitale aflată în Belgia putem spune că Venitul disponibil pe cap de locuitor, în 2002 s-a ridicat la 14 730.2 euro, aproape de media națională de 14 645.7 euro. Cea mai mare remunerație totală a fost în sectorul activităților financiare (4 471900000 de euro în 2001, comparativ cu 3 660400000 în 1995). Urmată apoi de imobiliare, leasing și servicii de afaceri guvernamentale generale (4 290600000 de euro în 2001, comparativ cu 3 230300000 în 1995) și reale (4 074500000 de euro în 2001 și 2 681500000 în 1995), în timp ce în partea de jos a listei s-au regăsit sectoarele din agricultură, vânătoare, silvicultură, pescuit și piscicultură (8.9 milioane de euro în 2001, față de 7.7 milioane în 1995) și fabricarea lemnului și a produselor din lemn (10.6 milioane de euro în anul 2001, comparativ cu 13.7 milioane în 1995).

Figura 3.21 Reprezentarea regiunilor după prima și a treia componentă principală

Se observă că în urma acestei reprezentări valoarea outlier este regiunea Hovedstaden din Danemarca. Aceasta este formată în urma reformei ce a intrat în vigoare la 1 ianuarie 2007. Este compusă din fostele municipalități Copenhaga, Frederiksberg și Insula Bornholm și din fostele amter Københavns și Frederiksborg. În această regiune valoarea adăugată brută a fost de de 18.1% din totalul valorii adăugate în Danemarca (date din 2002, în prețuri curente). Sectorul serviciilor reprezintă 89%, industria reprezintă doar o cotă de 11%, în timp ce agricultura este aproape neglijabilă.

Productivitatea pe persoană ocupată, calculată în funcție de valoarea adăugată brută produsă, a fost egală cu 82000 de euro în anul 2000, fiind cea mai mare valoare înregistrată printre regiunile acestei țări.

Figura 3.22 Reprezentarea regiunilor după a doua și a treia componentă principală

În acest caz regiunile outlier sunt: Hovedstaden din Danemarca, Région de Bruxelles-Capitale aflată în Belgia, Viena din Austria si Pohjois-Suomi din Finlanda.

Economia vieneză afișează toate caracteristicile tipice ale economiei de suburbie: un sector de servicii puternic și un amestec de activități de producție axat pe bunuri de consum. Viena a avut o rată anuală medie de creștere de 3.2% între 1995 și 2000, cea mai mică în comparație cu alte regiuni ale Austriei, și sub media națională (3.7%). În 1998, Viena a avut cele mai mari cheltuieli cu cercetarea si dezvoltarea (48.5%) dintre toate landurile Austriei

PIB-ul pe cap de locuitor al regiunii Pohjois-Suomi este relativ scăzut în comparație cu țara ca un întreg. În 2001, acesta a fost al doilea cel mai mic din țară. Aceasta reprezintă 91% din media comunitară, în timp ce PIB-ul pentru Finlanda întregă reprezintă 105%.

În ceea ce privește valoarea adăugată brută, primară și cea secundară aceasta este mai mare în comparație cu cifrele naționale, cu cote de respectiv 5.2% și 37.4%. Ponderea serviciilor în valoarea adăugată brută, de doar 57.4%, reprezintă a doua cea mai mică valoare din țară. Productivitatea regiunii este ușor sub media națională: 4% sub nivelul de productivitate țară în anul 2001 (față de 7% în 1996).

3.5 Concluzii

Potrivit datelor Eurostat România și Bulgaria se află pe ultimele locuri în clasamentul Uniunii Europene în ceea ce privește principalii indicatori ca produsul intern brut, cheltuielile cu cercetarea și dezvoltarea, gradul de educație al locuitorilor sau speranța de viață la naștere.

În anul 2012, PIB-ul României s-a situat la 49% din media Uniunii Europene, similar cu nivelul înregistrat în anul 2011. Doar Bulgaria se situează sub România în acest clasament cu o medie de 47%, spre deosebire de Luxemburg, țară a Uniunii Europene, unde PIB-ul a fost de peste două ori și jumătate mai mare față de medie. În aceeași situație se mai regăsesc și Austria, Irlanda, Olanda și Suedia cu o medie mai mare de 30%. De asemenea, o mare diferență există între țara noastră și Danemarca și Germania, unde PIB-ul pe cap de locuitor a fost cu 15-25% peste media Uniunii Europene.

În urma analizei Cluster obținută în studiul de caz pe regiunile Uniunii Europene alături de România și Bulgaria, în aceeași clasă s-au mai regăsit și Polonia, Ungaria, Slovenia și Slovacia.

Aceste disparități dintre regiunile Uniunii Europene au dus la necesitatea apariției unor politici menite să atenueze diferențele economice, sociale și teritoriale apărute între diferite zone.

Uniunea Europeană nu poate tolera ca o parte importantă a patrimoniului lor să fie lăsată subdezvoltată din cauza integrării economice. Prosperitatea anumitor regiuni ale Uniunii nu poate fi suportată de către declinul sau stagnarea altor zone. Marile diferențe sunt intolerabile într-o comunitate, în cazul în care pe termen lung sunt lipsite de semnificație. În plus, diferențele nu implică doar o calitate săracă a vieții pentru regiunile defavorizate, dar indică incapacitatea de a profita de oportunitățile economice de care ar putea beneficia Uniunea în ansamblu.

Din aceste considerente, unul dintre obiectivele Uniunii este promovarea coeziunii economice, sociale și teritoriale, precum și solidaritatea între statele membre. În scopul promovării unei dezvoltări armonioase, Uniunea își dezvoltă și desfășoară activitatea care conduce la consolidarea coeziunii sale economice, sociale și teritoriale care vizează reducerea decalajelor dintre nivelurile de dezvoltare ale diferitelor regiuni și a rămânerii în urmă a regiunilor defavorizate. Formularea și punerea în aplicare a politicilor și acțiunilor și punerea în aplicare a pieței interne a Uniunii trebuie să ia în considerare aceste obiective și să participe la realizarea acestora. Uniunea susține realizarea acestor obiective prin acțiunea pe care o întreprinde prin intermediul fondurilor structurale, prin Banca Europeană de Investiții (BEI) și celelalte instrumente financiare existente.

Bibliografie

Aldea, A., Matei M. « Ranking National Innovation Systems According to their technical Efficiency », Procedia – Social and Behavioral Sciences, Volume 62, Pp 968–974, 24 October 2012, ISSN: 1877-0428

Forgy, E. W. – « Cluster analysis of multivariate data: efficiency vs interpretability of classifications » (1965). Editura Biometrics 21, 768–769.

Hartigan, J. A. and Wong, M. A. – « A K-means clustering algorithm » (1979). Editura Applied Statistics 28, 100–108.

Lloyd, S. P. – « Least squares quantization in PCM ». Technical Note, Bell Laboratories. Published in 1982 in IEEE Transactions on Information Theory 28, 128–137.

MacQueen, J. – « Some methods for classification and analysis of multivariate observations. In « Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability » (1967), eds L. M. Le Cam & J. Neyman, 1, pp. 281–297. Berkeley, CA: University of California Press.

Matei M. « Innovation Efficiency Analysis for Romania », Economic Computation and Economic Cybernetics Studies and Research, Vol. 44, Nr. 3, pp. 193- 204 , 2010, ISSN 0424-267X

Matei, M., « An analysis of innovation efficiency », Romanian Statistical Review, Nr. 11, 2008, pp. 1-10, ISSN 1018-046X

Ruxanda, Gh. – «  Analiza datelor » (2001), Editura ASE, București.

Spircu, L – « Analiza datelor, Aplicații economice », Ediția online, Biblioteca Digitală – CSIE.

Analele Universității „Constantin Brâncușiˮ din Târgu Jiu, Seria Economie, Nr. 1/2010

www.eurostat.ro

www.ec.europa.eu/regional_policy

http://stat.ethz.ch/R-manual/R-devel/library/stats/html/kmeans.html

http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/K-Means

www.insse.ro

https://sites.google.com/site/dataclusteringalgorithms/k-means-clustering-algorithm

Anexe

Anexa 1

Figura 1.1 Vectori proprii

Figura 2.2 Matricea componentelor în urma transformării

Bibliografie

Aldea, A., Matei M. « Ranking National Innovation Systems According to their technical Efficiency », Procedia – Social and Behavioral Sciences, Volume 62, Pp 968–974, 24 October 2012, ISSN: 1877-0428

Forgy, E. W. – « Cluster analysis of multivariate data: efficiency vs interpretability of classifications » (1965). Editura Biometrics 21, 768–769.

Hartigan, J. A. and Wong, M. A. – « A K-means clustering algorithm » (1979). Editura Applied Statistics 28, 100–108.

Lloyd, S. P. – « Least squares quantization in PCM ». Technical Note, Bell Laboratories. Published in 1982 in IEEE Transactions on Information Theory 28, 128–137.

MacQueen, J. – « Some methods for classification and analysis of multivariate observations. In « Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability » (1967), eds L. M. Le Cam & J. Neyman, 1, pp. 281–297. Berkeley, CA: University of California Press.

Matei M. « Innovation Efficiency Analysis for Romania », Economic Computation and Economic Cybernetics Studies and Research, Vol. 44, Nr. 3, pp. 193- 204 , 2010, ISSN 0424-267X

Matei, M., « An analysis of innovation efficiency », Romanian Statistical Review, Nr. 11, 2008, pp. 1-10, ISSN 1018-046X

Ruxanda, Gh. – «  Analiza datelor » (2001), Editura ASE, București.

Spircu, L – « Analiza datelor, Aplicații economice », Ediția online, Biblioteca Digitală – CSIE.

Analele Universității „Constantin Brâncușiˮ din Târgu Jiu, Seria Economie, Nr. 1/2010

www.eurostat.ro

www.ec.europa.eu/regional_policy

http://stat.ethz.ch/R-manual/R-devel/library/stats/html/kmeans.html

http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/K-Means

www.insse.ro

https://sites.google.com/site/dataclusteringalgorithms/k-means-clustering-algorithm

Anexe

Anexa 1

Figura 1.1 Vectori proprii

Figura 2.2 Matricea componentelor în urma transformării

Similar Posts