. Dezvoltarea Economiei In Profil Teritorial

Capitolul 1 : Dezvoltarea economică în profil teritorial

1.1 Regiunile economice și importanța lor

În teoria economică contemporană a existat de multe ori tendința unei separații nete între micro și macroeconomie, problemele consumatorilor individuali sau ale firmelor și interacțiunea lor pe piața fiind adeseori tratate izolat de comportamentul agregatelor macroeconomice, de funcționarea economiei ca întreg. Totuși o gama largă de probleme situate între aceste două extreme – problemele regiunilor, ale economiei locale și ale zonelor urbane – a solicitat o viziune integrata a celor două abordări.

Abordările din știința regională se caracterizează prin adoptarea unor metode și tehnici riguroase, sistematice în analiza fenomenelor și proceselor în care spațiul, distanța și localizarea joacă un rol important.

Studiul la scară regională al comportamentului agregatelor macroeconomice își propune să găsească răspunsuri la întrebări precum:

Ce factori determină rezultatele activității economice și gradul de ocupare al forței de muncă intr-o regiune?

De ce nivelul de trai este mai ridicat în unele regiuni decât in altele?

Din ce cauză unele regiuni înregistrează ritmuri mai accentuate de creștere economica decât altele?

Care sunt factorii ce influențează migrația interregională?

De ce persista în unele regiuni rate mai înalte ale șomajului decât în altele?

Modul de analiză și interpretare a acestor probleme derivă din teoriile și tehnicile elaborate inițial pentru înțelegerea comportamentului economiei naționale. O astfel de procedură poate fi considerată acceptabilă deoarece economiile regiunilor se aseamănă in multe privințe cu economiile naționale. Cu toate acestea există o serie de diferențe semnificative între regiuni și națiuni diferente ce nu pot fi ignorate:

– economiile regionale sunt mult mai deschise decât economiile naționale în cadrul cărora sunt localizate, comerțul interregional este scutit de taxe și alte bariere comerciale, toate regiunile unei țări utilizează aceeași moneda;

forța de munca și capitalul au un grad mai mare de mobilitate între regiuni decât între țări;

gradul ridicat de interdependență între regiunile din cadrul granițelor unui stat joacă un rol important în analiza regională.

Economia regională are ca principală rațiune a existenței sale, nevoia de a furniza o bază tehnico-metodologică rațională, științifică pentru strategiile și politicile regionale adică pentru stabilirea unui ansamblu coerent de obiective și căi de atenuare a dezechilibrelor regionale în condițiile dinamicii economico-sociale și instrumentelor adecvate de îndeplinire a obiectivelor stabilite. Din punct de vedere conceptual, terminologic, unii specialiști asociază politicii regionale, în planul acțiunii noțiunea de “amenajarea teritoriului”. În unele țări (de exemplu in Franța) acest termen (amenagement du territoire) a dobândit și un conținut economic, in timp ce în alte țari îi corespund termeni ca: “ramornung” – organizare spațială în Germania, “physical planning” – planificare naturală în Anglia, “ordinacion del territorio” – organizarea teritoriului în Spania, termeni ce au o conotație exclusiv spațială.

Regiunea reprezintă elementul fundamental în știința regională în general și în economia regională ca disciplină da bază în cadrul acesteia, în mod particular , în legătură cu care se emit teorii, se pun la punct metode și tehnici de investigare, se definesc obiective și măsuri, instrumente pentru îndeplinirea lor etc. Cei trei tei termeni fundamentali cu care operează analiza regională sunt:

aria: termenul generic pentru orice parte a spațiului bidimensional, fiind util în analiza economico-socială spațială (exemplu: spațiul geografic în care producția unui anumit producător este vândută);

zona: suprafață cu caracteristici diferite în raport cu spațiul înconjurător (zona administrativă și de afaceri dintr-un oraș);

regiune: este un termen mult mai precis, implicând o suprafață în spațiul economic național suficient de cuprinzătoare structural pentru a funcționa independent deși, în realitate, ea are strânse legături cu restul economiei.

Delimitarea regiunilor nu este deloc o sarcină ușoară, oricare ar fi criteriul utilizat: economic, administrativ, geografic, cultural, istoric etc., nu există metodologii întru-totul satisfăcătoare, compromisul fiind inevitabil. Metoda clasica de conceptualizare a regiunilor distinge trei tipuri:

Regiuni omogene prin prisma unor caracteristici unificatoare a unor criterii cheie, cum ar fi:

criteriul economic (ex.: venit/locuitor, sector industrial dominant comun, rate ale șomajului relativ uniforme etc.);

criteriul geografic (topologie sau climat similar, o resursă naturală comună);

criteriul social-politic (o anumită “identitate” regională, o dezvoltare istorică comună).

Regiuni nodale (polarizate) când interesul pentru uniformitate este minim iar coeziunea este rezultatul fluxurilor interne, al relațiilor, interdependențelor polarizate de obicei către un anumit domeniu (nod).

Regiuni pentru planificare (programare) unde unitatea derivă dintr-un anumit cadru instituțional-administrativ și din aplicarea unor politici și programe specifice de dezvoltare regională.

În cazul în care se urmărește stabilirea unui sistem clar de competențe pe plan administrativ-instituțional, când se are in vedere dezagregarea programelor economice naționale în programe la nivel regional, un criteriu foarte important este cel al vecinătății, care presupune ca regiunile sistemului național să acopere întreaga suprafață a tării, fără a exista suprapuneri.

Pe lângă grupările bazate pe structura administrativ-teritorială s-au cristalizat și anumite grupări tipologice menite să reducă, pe baza unor caracteristici de dezvoltare economico-socială, la câteva categorii mari mozaicul de regiuni ce compun teritoriul național. Utilitatea lor este evidențiată de rolul pe care îl au în fundamentarea politicilor regionale adecvate acestor categorii reprezentative ale regiunii.

Experiența internațională a dus la conturarea de grupări tipologice cu grade diferite de detaliere. Totuși în cadrul lor se poate distinge existența câtorva categorii de regiuni a căror probleme se situează in centrul atenției politicilor regionale din diferite țări:

Regiuni agricole aflate în dificultate au, in general, o poziție periferică in raport cu o regiune centrală, ocupă o suprafață relativ întinsă dar populația lor este mai puțin numeroasă sau este dispersată. Lor li se pot adăuga regiunile izolate (ex.: unele regiuni montane) ce nu dispun de o infrastructura corespunzătore. Rămânerea în urmă a acestor regiuni poate fi exemplificată prin lipsa de resurse, prin condiții mai puțin propice dezvoltării comparativ cu alte regiuni. Nivelul venitului pe locuitor este scăzut gradul de subocupare și rata șomajului ridicate, surse de venituri fiscale sărace, productivitatea muncii redusă. Adesea populația migrează mai întâi de la sate spre marile centre urbane, înainte de a părăsi regiunea însăși. Problemele de ajustare structurală ale acestor regiuni sunt, uneori, într-o puternică dependență de sectorul primar, ceea ce le diminuează suplețea in adaptare, in timp ce producția lor principală se caracterizează printr-o slabă elasticitate in raport cu veniturile.

Regiunile industriale aflate in declin sau “abandonate” sunt caracterizate prin scăderea ratei de activitate, creștere lentă a veniturilor pe locuitor, emigrație ridicată, simptome evidente ale dificultăților cu care se confruntă aceste regiuni. În cadrul lor se constată frecvent existența unor infrastructuri și a unei populații active îmbătrânite, cu un grad de poluare ce poate descuraja noile investiții, un climat social nesatisfăcător. Cauzele se pot regăsi in efectul de “situare” (unele sectoare tind să se degradeze mai mult în anumite regiuni decât in altele rezultând un deficit global), efectul “structural” (întreprinderile dintr-o regiune sunt specializate în sectoare “în pierdere de viteză” în raport cu rezultatele înregistrate pe plan național), efectul invers avantajului comparativ (principalele sectoare de activitate dintr-o regiune sunt acelea care obțin rezultate mediocre in raport cu celelalte regiuni, ceea ce conduce la înregistrarea unui maxim al dezavantajului comparativ).

Regiunile care suportă “presiunea” unei creșteri rapide sunt cele în care resursele cunosc o exploatare foarte intensă, în aceeași manieră ca și infrastructurile (rețele de transport, locuințe), in același timp cererea de forța de muncă este excesivă. Cu toate că situația ocupării, veniturilor sau impozitelor este favorabilă apare o disfuncționalitate socială, care se traduce prin lungimea excesivă a traseului locuința – loc de munca, poluare sonoră etc. În aceste regiuni creșterea economică antrenează randamente descrescătoare și, in final, costurile marginale devin superioare avantajelor marginale.

1.2 Regiuni economice în România

România are o bogata experiența în practica organizării administrativ-teritoriale. De-a lungul istoriei au fost adoptate forme dintre cele mai variate evident corespunzătoare cerințelor dezvoltării social-economice și politice din etapele respective. În organizarea teritoriului României s-a folosit experiența trecutului și s-a ținut cont de cerințele actuale și de perspectivă ale dezvoltării țarii. Un prim criteriu l-a constituit astfel analiza complexă a factorilor naturali, economici, demografici și tehnici, a intercondiționării acestora pe ansamblul teritoriului țarii și pentru fiecare zonă în parte.

Criteriul complexității a dat posibilitatea ca în organizarea județelor, municipiilor, orașelor sa se țină seama de condițiile economice, social-politice și geografice concrete, inclusiv aspectele privind componenta națională a populației, legături culturale tradiționale, perspectivele pe care le au diferitele zone și localități, potrivit dezvoltării țarii in ansamblu. În cadrul abordării complexe, un rol important l-a avut criteriul omogenității naturale și social-economice.

Criteriul centralității s-a folosit la amplasarea reședințelor de județ în teritoriu, urmărindu-se ca acestea să ocupe, pe cât posibil, o poziție geografică centrală, pentru a înlesni legaturile cu toate localitățile din cuprinsul județului. În concordanță cu acest criteriu o serie de orașe de mărime mijlocie mai puțin dezvoltate sub raport economico-social, au fost preferate pentru poziția lor centrala în cadrul teritoriului, ca reședință de județ, beneficiind astfel de o dezvoltare corespunzătoare.

Criteriul istoric s-a constituit, de asemenea, printre criteriile de baza ale delimitării județelor. El se regăsește în delimitarea unor vechi județe și în denumirea lor.

Adoptarea unor asemenea criterii încearcă asigurarea unui acord deplin în organizarea administrativ-teritorială și in schimbările calitative intervenite in dezvoltarea țării, asigurând condiții pentru ridicarea rolului și sporirea atribuțiilor localităților.

Pe lângă organizarea administrativ-teritorială în județe se identifică pe teritoriul României zone compuse din județe sau părți de județe cu caracteristici similare prezentându-se din punct de vedere economic ca având același grad de dezvoltare. Analiza trebuie concentrată în identificarea zonelor vulnerabile sau defavorizate, zone în care factorii ce condiționează dezvoltarea se situează sub anumite praguri critice. Pentru identificarea zonelor defavorizate s-au folosit următoarele categorii de criterii:

– criterii geografice, in raport cu zonele în cauza, prezintă condiții dificile de relief, condiții dificile de climă, resurse de apă subterană necorespunzătoare, sol slab productiv;

– criterii demografice, zonele vulnerabile fiind acelea în care se constată tendințe de depopulare, spor natural puternic negativ, îmbătrânire demografică, număr mic de persoane pe gospodărie;

– criterii economice, față de care zonele respective se caracterizează printr-un număr redus de locuri de muncă, dezvoltare slamic ca având același grad de dezvoltare. Analiza trebuie concentrată în identificarea zonelor vulnerabile sau defavorizate, zone în care factorii ce condiționează dezvoltarea se situează sub anumite praguri critice. Pentru identificarea zonelor defavorizate s-au folosit următoarele categorii de criterii:

– criterii geografice, in raport cu zonele în cauza, prezintă condiții dificile de relief, condiții dificile de climă, resurse de apă subterană necorespunzătoare, sol slab productiv;

– criterii demografice, zonele vulnerabile fiind acelea în care se constată tendințe de depopulare, spor natural puternic negativ, îmbătrânire demografică, număr mic de persoane pe gospodărie;

– criterii economice, față de care zonele respective se caracterizează printr-un număr redus de locuri de muncă, dezvoltare slabă a activităților neagricole;

– criterii sociale, zonele defavorizate prezentând disfuncții ale vieții comunitare, insatisfacții privind mediul construit etc.

Între zonele cu problemele cele mai dificile din punct de vedere al unuia sau mai multor criterii ce află: Moldova de nord-est, Podișul Bârladului, Munții Apuseni, Podișul Someșului, sud-vestul Olteniei, Teleormanul, Bărăganul, Delta Dunării etc.

În prezent în România pot fi puse in evidență câteva categorii de regiuni de maxim interes pentru strategiile și politicile regionale:

– regiuni cu excedent de forță de muncă și posibilități reduse sau dezavantajose de ocupare a acesteia (Moldova centrală și de nord);

– zone cu grad ridicat de poluare (Copșa Mică, Suceava, Baia Mare);

– regiuni cu nivel redus de dezvoltare economică (Vaslui, Sălaj, Giurgiu);

– zone ce vor fi supuse restructurării industriale prin măsuri de reconversie (Valea Jiului);

– zone a căror resurse necesită amenajări complexe pentru desfășurarea unor activități de producție și servicii (turism și agrement), protecția mediului (delta, litoral, zone montane);

– zone de granița a căror dezvoltare economică poate fi facilitată prin folosirea avantajelor complementarității resurselor și potențialului productiv din regiunile aparținând unor țari vecine;

– zone libere, privite ca un instrument complementar de dezvoltare economică prin impulsionarea atragerii de capital străin.

Problematica acestor zone, ca și a întregului spațiu național regional structurat, este abordată în cadrul “Strategiei de dezvoltare economico-socială a județelor și municipiului București în perspectiva 1995-2004” concepută ca o componentă a strategiei de pregătire a aderării României la Uniunea Europeană. Aceasta abordează problematica dezvoltării economico-sociale a României într-o viziune complexă în care strategiile proprii ale județelor sunt integrate într-o strategie unitară a dezvoltării regiunilor la nivelul întregii țări, luându-se in considerare fluxurile verticale ascendente și descendente intre Guvern și administrația publică locală și legăturile pe orizontală între unitățile administrativ-teritoriale. Strategia cuprinde două etape: 1995-1999 și 2000-2004 care reflectă nu numai opțiunile și prioritățile perioadei de relansare (restructurare, retehnologizare, îmbunătățirea infrastructurilor, crearea de zone libere) ci și posibilitatea viitoare de a accentua dezvoltarea județelor rămase in urmă.

1.3 Perspective ale dezvoltării regionale in România

Realizarea analizei regionale a dezvoltării economice poate reprezenta o rampă de lansare pentru întreaga economie românească aflată astăzi într-un important impas. Există foarte multe exemple in istorie în care sunt arătate căi de redresare a economiei unei țari plecând de la nivel regional. Marea Britanie realizează în anii 60 consilii de planificare economică regională capabile să aplice politici regionale coerente specifice problemelor fiecărui teritoriu: rata crescută a șomajului, dezvoltare economică cu ritmuri mai scăzute, rate scăzute ale natalității, migrație puternică a populației etc. Organizarea teritoriului Elveției în cantoane sau al Germaniei în landuri sunt expresia aplicării unor politici regionale puternice care au dat roade și care se îmbunătățesc permanent în funcție de realitățile economice existente.

Pentru România împărțirea administrativ-teritorială a fost realizată în anul 1958 și ea s-a păstrat, cu câteva mici modificări, până astăzi cuprinzând 41 de județe și municipiul București. Existența unui număr mare de teritorii mici, cu o populație relativ redusă (400000-700000 locuitori) nu se impune ca o ipoteză favorabilă unui demers regional cu atât mai mult cu cât țara noastră, aflată mult timp într-un regim economic supercentralizat, nu are nici experiența unei abordări regionale a problemelor existente. Există multe nivele de abordare din care se evidențiază trei: la nivelul județelor, la nivelul regiunilor istorice (Moldova, Muntenia, Oltenia, Transilvania, Banat-Crișana, Dobrogea) sau la nivelul unor grupuri compacte de județe cu probleme și oportunități similare.

După o alegere riguroasă a nivelului la care se va aborda analiza se poate trece , într-un pas următor, la identificarea problemelor cu care se confruntă fiecare regiune in parte, la calculul principalilor indicatori pentru fiecare regiune, la comparații intre regiuni și într-o ultimă fază la elaborarea unor concluzii clare astfel încât măsurile ce se vor adopta să aibă o țintă precisă și o eficiența sporită.

În mod cert nu există soluții tip pentru problemele regionale ale unei țări dar aplicarea unor planuri și politici adecvate specifice fiecărei regiuni poate duce la, nivel macroeconomic, la o creștere importantă a rezultatelor țării în cauză.

Motivația principală a politicii regionale constă în asigurarea echității sociale a populației situate în diverse zone ale țării. Instrumentele utilizate de guvern urmăresc să influențeze distribuția teritorială a activității economice astfel încât discrepanțele teritoriale în privința șomajului și standardului de viață să se atenueze. Din punct de vedere al interesului guvernului pentru dezvoltarea economică pe teritoriu, pot fi deosebite: regiuni de dezvoltare specială, regiuni dezvoltate (acestea fiind de regulă, bogate in resurse, dens populate sau având particularități de interes special), regiuni de dezvoltare medie, regiuni sărace, subdezvoltate (în aceste din urmă zone pot apărea doar sucursale ale firmelor, având puține locuri de muncă, și care, în perioade recesiune, se închid).

Există două aspecte de care trebuie să se ține seama în stabilirea politicii regionale a României:

– aspectul social caracterizat prin apariția sau persistența șomajului, migrația forței de muncă tinere sau a celei de calitate, diminuarea veniturilor reale ale populației și, implicit, a consumului, ceea ce descurajează investițiile, comerțul etc.;

– aspectul economic legat îndeosebi de eficiența economică a întreprinderilor aflate în zone sărace.

În acest sens putem da exemplul anilor 1993-1995 când în România șomajul are o răspândire relativ uniformă pe teritoriu (gradul de concentrare al numărului de șomeri pe județe este foarte redus). Totuși județele: Vaslui, Bistrița-Năsăud, Botoșani, Neamț, prezintă rate ale șomajului mai ridicate decât media pe țară spre deosebire de județele Gorj, Călărași, municipiul București unde șomajul prezintă cele mai reduse cote. Pentru județele din prima categorie (cu șomaj ridicat), guvernul și-a manifestat, in iunie 1995, intenția de a iniția măsuri de reducere a numărului de șomeri. Acesta constituie, după 1989, fie și ca intenție, o primă abordare a problemelor economice prin prisma politicii regionale.

Guvernul are de ales între a promova omogenizarea dezvoltării economice pe teritoriu, de cele mai multe ori, de natură socială (păstrarea specificului local, descurajarea tendinței de depopulare și a consecințelor acesteia) și criteriul economic de eficiență care să se încline balanța spre asigurarea libertății firmelor de a lua ființă și de a se dezvolta în zonele în care eficiența este maximă (datorită apropierii resurse sau de piețe de desfacere, existența forței de muncă etc.). Dacă există suficiente motive în favoarea sprijinirii dezvoltării economice a unor regiuni, motive care adesea au în vedere interese strategice, perspective pe termen lung, resurse de viitor etc., la care se adaugă motivații de natură socială, atunci următoarele instrumente pot fi aplicate în respectivele regiuni:

– alocarea de către guvern a fondurilor necesare înființării unor întreprinderi de stat sau pentru încurajarea sectorului privat;

– reduceri de impozite pentru noile întreprinderi;

– asistență legată de utilizarea forței de muncă (reconversie profesională, cursuri de perfecționare etc.);

– oferte avantajoase de terenuri sau de utilaje achiziționate în prealabil din fonduri guvernamentale și vândute apoi acelor firme care acceptă să-și desfășoare activitatea în regiunile defavorizate;

– asistență managerială acordată de instituțiile guvernului întreprinderilor din zonele sărace

Capitolul 2: Metode statistice pentru analiza în profil teritorial

2.1 Metode de analiza datelor

Statistica clasică este axată pe studiul unui număr restrâns de caracteristici măsurate pe o mulțime mică de indivizi. Ea a dezvoltat noțiunile de estimație și test fondate pe ipoteze probabiliste foarte restrictive. Totuși in practică indivizii observați sunt frecvent descriși printr-un număr mare de caracteristici. Metodele de analiza datelor permit un studiu global al indivizilor și al variabilelor, utilizând in general reprezentări grafice sugestive. Cercetarea asemănărilor sau diferențelor între indivizi poate fi unul dintre obiectivele analizei: se consideră că doi indivizi se aseamănă când pofilele lor conform diferitelor caracteristici sunt apropiate; este posibil cu ajutorul unor metode factoriale să prezentăm aceste asemănări între indivizi pe un grafic. Descrierea relațiilor între caracteristici poate fi un alt obiectiv al analizei: două caracteristici sunt considerate corelate dacă ele variază în același fel la indivizi diferiți.

Analiza indicatori la nivelul județelor poate scoate în evidență aspecte importante referitoare la diferențele existente între anumite zone ale țarii, putând astfel identifica zonele defavorizate, zonele cu dezvoltare medie precum și zonele cu dezvoltare mai ridicată. Vom urmări în acest capitol doar câțiva indicatori, o analiza completă urmând a fi făcuta în capitolul 4, încercând să scoatem în evidentă cele mai importante metode de analiză a datelor și aplicarea lor.

Obiectul analizei datelor îl reprezintă evidențierea structurii din ansamblul valorilor individuale ale tuturor variabilelor prevăzute în programul de observare, prin tranziția de la datele de observație la valori sintetice, fără să se formuleze aprioric ipoteze referitoare la structura variabilelor sau a observațiilor efectuate. Datorită volumului mare de date culese, datorită complexității acestora, structurile lor nu pot fi cunoscute fără să facă apel la metode specifice de generare, analiză si sinteză. Aceste analize de generare și sinteze sunt progresiv orientate în funcție de scopul demersului întreprins: îmbunătățirea cunoștințelor într-un domeniu; ca mijloc de reflectare, diagnosticare, previziune, planificare, ca mijloc de cristalizare a deciziilor, ca mijloc de selecție. Deci, obiectivul principal al analizei datelor îl reprezintă evidențierea caracteristicilor esențiale ale unui ansamblu de date observate.

Datele statistice culese și sistematizate într-o anumită modalitate au o destinație comună și anume evidențierea cât mai precisă a unei direcții (unui domeniu) în vederea declanșării unei acțiuni. De exemplu, din ansamblul datelor referitoare la economia națională structurate pe județe, dacă se dorește cunoașterea aspectelor referitoare la populație, atenția va fi concentrată asupra tuturor informațiilor privindu-le pe acestea. Ansamblul datelor observate, neprelucrate, pot fi simple (de exemplu cele referitoare la indicatorul populația ocupată în diferite județe sau localități) sau multiple (observarea simultană în timp a mai multor componente a populației). De asemenea, datele statistice pun în evidență elemente cantitative (măsuri, rații, nivele de încredere), sau calitative (clase, categorii), elemente omogene sau eterogene și se pot descompune în date explicate sau explicative (de exemplu explicarea datelor referitoare la populația ocupată prin date ce descriu populația totala, populația aptă de muncă, număr de șomeri). Datele concentrate în baze de date sau în alte forme de sistematizare conțin în mod logic toate elementele prezentate mai sus. Acestea pentru a fi analizabile prin metode de analiză a datelor, trebuie să satisfacă anumite cerințe cum ar fi: omogenitatea și exhaustivitatea, cerințe ce permit comparabilitatea observațiilor și a variabilelor.

Operațiile fundamentale de analiza a datelor constau în extragerea volumului de date necesare din baza de date sau di formele de sistematizare adoptate, in vederea analizării, sintetizării și recordării acestora (transformării lor în date inițiale). Obiectul concret al analizei datelor îl reprezintă descrierea continuă a unui sistem de informații cuprinse într-un sistem de tabele statistic; studiul separat sau global al tuturor informațiilor relative la un subiect dat pentru explicarea stării, pentru diagnosticare, pentru punerea în legătură a diferitelor date etc. în perspectiva declanșării unei acțiuni. De exemplu în cazul analizei forței de muncă, dacă diagnosticul se referă la rate înalte ale neocupării în anumite zone ale țării, obiectivul ce urmează a fi declanșat este remedierea diferențelor, analiza permițând în acest caz cuantificări specifice.

Prin urmare, analiza datelor constă în descompunerea formelor de sistematizare a datelor culese, în tabele de date analizabile prin metode matematice specifice, cu scopul declanșării unor decizii, selecții (clasamente), previziuni, planificări, reflecții sau simple dezvoltări a cunoștințelor.

Deoarece metodele de analiză operează cu masive de date foarte complexe, se face apel la metode matematice specifice, la sisteme de programe și utilitare informatice care permit descompunerea datelor și efectuarea sintezelor numerice și grafice.

În orice demers întreprins există o fază de analiză si una de sinteză. Sintetizarea datelor constă în adunarea (agregarea) elementelor esențiale, a trăsăturilor cele mai semnificative, sau a acelora mai puțin singulare care să poată fi comunicată fiind cel mai bun rezultat al analizei în vederea declanșării deciziei. Noțiunea analiza datelor sub aspect conceptual este respectată atât în faza de analiză cât și în aceea de sinteză. Distincția poate fi făcuta dacă ținem seama de complexitatea și volumul datelor prelucrate, dar acestea nu afectează principiile de bază.

Prin definiție analiza datelor face parte din categoria metodelor statistice și nu din categoria metodelor experimentale. Metodele statistice, care permit abordarea unei clase mult mai largi de probleme decât metodele experimentale se structurează în metode ale statisticii inductive și metode ale statisticii deductive. Ea operează numai asupra înregistrărilor și nu modelează aprioric o anumită situație dată

Majoritatea datelor sub forma următoare: n unități numite “indivizi” sunt descrise de p variabile numerice. Când n și p sunt mari, se caută sintetizarea acestei mulțimi de informații sub o formă exploatabilă și inteligibilă.

O primă etapă constă în descrierea separată a rezultatelor obținute pentru fiecare variabilă, descrierea unidimensională, fază necesară dar nu și suficientă în orice studiu statistic. Vom considera că ne interesează o singură o singură variabilă, numită si caracteristică care posedă un număr de valori obținute prin cercetare statistică. Sinteza acestor date se face sub formă de tabele, grafice și rezumate numerice. Este ceea ce se cheamă curent statistica descriptivă. Se utilizează tabele statistice, reprezentări grafice (diagrame în dreptunghiuri, histograme etc.).

După descrierile unidimensionale se studiază în general corelațiile între variabilele observate: ceea ce se numește curent studiul corelațiilor. Metodele și indicii de dependența diferă după natura (calitativă, ordinală, numerică) a variabilelor studiate. Această etapă a analizei trebuie să cuprindă: studiul grafic al corelației, calculul coeficientului de corelație liniară și testarea semnificației lui, analiza corelațiilor parțiale, corelații multiple dacă este cazul.

În majoritatea situațiilor nu se observă o singură variabilă asupra unui individ, ci un număr adesea ridicat. Studiul separat al fiecărei din aceste variabile după tehnicile expuse anterior este o fază indispensabilă in procesul de exploatare a datelor dar, totuși, insuficient; intr-adevăr, studiul separat al fiecărei variabile lasă deoparte corelațiile care pot exista între ele, și care adesea sunt aspectul cel mai important. Datele trebuie deci analizate ținând cont de caracterul lor multidimensional; analiza în componente principale este atunci o metodă specifică, puternică, pentru a explora structura unor astfel de date.

Demersul analizei datelor, până la utilizarea rezultatelor finale, în vederea declanșării unei acțiuni presupune parcurgerea următoarelor etape:

1. Elaborarea datelor: în această etapă sunt selectate variabilele cu care se caracterizează obiectul de studiu și care pot fi observate cu mare precizie; se identifică și se aleg cele mai adecvate procedee de observare (culegere automată, anchete, sondaje); se prevăd valorile posibile ale variabilelor pentru memorare (arhivare); în cazul marilor sisteme informatice sau a bazelor de date se simulează modelele de analiză în vederea utilizării lor ulterioare.

2. Memorarea (arhivarea) datelor: în cazul marilor sisteme de informații înregistrarea datelor se face în conformitate cu planurile elaborate pentru administrarea datelor. Datele pot fi astfel înregistrate încât să fie accesibile utilizatorilor prin sistemul de gestiune a bazelor de date.

3. Administrarea datelor statistice: această etapă se referă în principal la: actualizarea datelor, verificarea, codificarea, trierea, agregarea datelor, procedurile de extragere și codificare în vederea elaborării tuturor tabelelor necesare.

4. Analiza unidimensională (univariată): obiectul analizei unidimensionale îl reprezintă descrierea datelor fiecărei variabile, independent unele de altele. Metodele utilizate vor fi diferite în funcție de natura variabilelor (cantitativă, calitativă, calitativă cu variante multiple, temporale), în acest sens se utilizează reprezentări grafice specifice (histograme, diagrame, circulare) și se calculează indicatori specifici.

5. Analiza bidimensională (bivariată): obiectul acestei analize îl reprezintă studiul dependenței dintre două variabile; acest studiu permite aprofundarea relației de cauzalitate dintre variabile luate două câte două. Acest mod de analiză diferă după natura variabilelor (cantitativă, calitativă). În această etapă în mod frecvent se utilizează diagrama norului de puncte, stereograme, curbe de regresie etc.

6. Analiza n-dimensională (n-variată): obiectul acestei analize îl formează reprezentarea simultană a relațiilor dintre cele n variabile fără să se efectueze prelucrări prealabile. Metodele utilizate sunt în general grafice. Această analiză nu se aplică decât în cazul unui număr redus de variabile (de maximum 10).

7. Analiza factorială: obiectul acestei analize îl formează reprezentarea observațiilor într-un spațiu euclidian de dimensiuni reduse: analiza în componente principale, analiza corespondențelor, analiza corespondențelor multiple. Analiza factorială se utilizează în mod deosebit atunci când ansamblul de date prezintă mari dimensiuni.

8. Analiza tipologică sau clasificarea: obiectul analizei tipologice îl constituie construirea sau recunoașterea claselor (formelor sau grupelor) de observații ale variabilelor. În analiza tipologică sunt cuprinse: modele de formare a clasamentelor de observații, modele de recunoaștere a formelor. Analiza tipologică se aplică în cazul unui ansamblu mare de date de observație.

Utilizatorul metodelor de analiză a datelor explorează datele în mod secvențial, interactiv și iterativ. Sintezele obținute dintr-o etapă sunt utilizate (uneori sunt puncte de pornire) în etapele următoare. În literatura de specialitate se vorbește de tipuri de explorări de date existente la frontiera sistemelor expert. Etapele prezentate au implicații directe în cel puțin trei aspecte: al conținutului metodelor, al tehnologiei informatice, al practicii sociale și științifice (al preocupărilor pentru elaborarea programelor informatice standard).

2.2 Descrierea unidimensională a indicatorilor forței de muncă la nivelul județelor

Aplicarea metodelor da analiză a datelor prezentate mai sus poate scoate în evidență aspecte deosebit de importante ale dezvoltării regionale în România. Putem lua un exemplu pentru a scoate în evidență importanța acestor metode în elaborarea politicilor regionale la nivel de județe.

2.2.1 Indicatorii medii și de poziție

Trebuie făcute o serie de precizări metodologice cu privire la conținutul economic al indicatorilor forței de muncă:

Populația totală se împarte în 3 grupe de vârstă demoeconomice: 0-15 ani; 15-65 ani; peste 65 ani;

Resursele de muncă exprimă totalitatea persoanelor care dispun de ansamblul capacităților fizice și intelectuale care le permit să desfășoare o activitate utilă;

Resursele de muncă = populația cuprinsă în limitele vârstei de muncă – populația în limitele vârstei de muncă dar incapabilă de a desfășura o activitate utilă + populația înafara limitei vârstei de muncă dar care desfășoară o activitate utilă.

Populația activă cuprinde numărul populației care a depășit o anumită vârstă (15 ani) și care într-o anumită perioadă de referință îndeplinesc condițiile de a fi considerați în categoria ocupat sau neocupat;

În categoria ocupat sunt cuprinși cei care se încadrează în una din situațiile: angajat cu contract de muncă, angajat sau lucrător în propria unitate, indiferent dacă este absent sau prezent;

În categoria neocupat sunt cuprinși cei care îndeplinesc cumulativ condițiile: nu au un loc de muncă, sunt apți pentru muncă, disponibili pentru muncă și în căutarea unui loc de muncă;

Rata șomajului se calculează ca raport între numărul șomerilor și populația curent activă.

Deosebit de important pentru o analiză corectă este calculul indicatorilor ce caracterizează tendința centrală: media, indicatorii de poziție (mediana, cuartile, modul ); precum si indicatorii statistici ai împrăștierii: amplitudinea, abaterea medie liniară, dispersia, abaterea medie pătratică. Influența tuturor factorilor, indiferent de natura și direcția lor, la nivelul la care se face analiza, este reflectată sintetic de indicatorii cu care se caracterizează tendința centrală. Indicatorii ce caracterizează tendința centrală au rolul ca în comparație cu ei să putem clasifica nivelul unui anumit indicator dintr-un județ sau grup de județe. Astfel putem împărți cele 41 de județe in funcție de poziția lor față de media unui anumit indicator: sub media pe țara sau peste media pe tară.

Prezentarea sintetică a acestor indicatori este arătată în tabelul următor:

Media valorilor individuale ale caracteristicilor este expresia numerică a sintetizării într-un singur nivel reprezentativ a tot ceea ce este tipic, esențial și obiectiv în apariția, manifestarea și dezvoltarea fenomenului analizat.

Valoarea medie a unei caracteristici este semnificativă în cazul în care la nivelul fiecărei unități de observare acțiunea acelorași factori esențiali ar fi predominantă. În caz contrar, când acțiunea factorilor întâmplători este puternică, valoarea medie calculată prezintă un însemnat grad de incertitudine. Cu cât gradul de complexitate al unui fenomen este mai mare cu atât gama factorilor de influență este mai largă și implicit cu atât este mai mare variabilitatea unei serii de repartiție. Asta înseamnă că utilizarea corectă în analiză a indicatorilor tendinței centrale necesită operații de verificare a stabilității și reprezentativității lor în raport cu valorile individuale ale caracteristicilor înregistrate. Prin urmare, valoarea medie a unei caracteristici este reprezentativă pentru colectivitatea la care s-a înregistrat aceasta numai în măsura în care ea este calculată din date omogene. Se observă din aceste grafice județele în care valorile indicatorilor ating maximul, minimul sau valorile medii.

Putem trage chiar din această fază a analizei o serie de concluzii importante: județe cu rată a șomajului ridicată sunt Botoșani, Hunedoara, Neamț, Suceava; județe cu rate înalte ale ocupării forței de muncă: Arad, Bihor, Gorj, Maramureș, Timiș. Ținând cont de faptul că rata șomajului la sfârșitul anului 1996 a fost pe ansamblul țarii de 6,6% putem observa că valori apropiate de aceasta se înregistrează în județele: Ialomița, Teleorman și Dîmbovița. Valorile caracteristicilor cele mai apropiate de mediile corespunzătore sunt: pentru populația totală 535,124 (înregistrată la județul Maramureș), pentru populația ocupată 221,9 (înregistrată la județul Dîmbovița) iar pentru rata șomajului 6,7% (deasemenea înregistrată la județul Dîmbovița).

Făcând o apreciere la nivelul regiunilor istorice se observă că in Moldova rata șomajului înregistrează valori peste media pe țară aici înregistrându-se și maximul de 13,1% în județul Neamț. Cauzele acestui fapt sunt multiple și ele trebuie căutate atât la nivelul fiecărui județ (slaba rentabilitate a agenților economici fapt ce a condus la masive disponibilizări, slaba implicare a autorităților locale în dezvoltarea de programe antișomaj ,nivel scăzut al pregătirii profesionale, lipsa programelor de reconversie profesională, satisfacerea nevoilor materiale doar din ajutoarele sociale, munca fără forme legale ) cât și la nivel central (lipsa de interes a guvernului pentru orientarea investițiilor în aceste zone, neaplicarea unor programe regionale specifice acestor probleme).

În Muntenia rata șomajului înregistrează, în general, valori sub medie fapt datorat unei mai puternice ocupări, în special în agricultură, dar și a atitudinii guvernului de a menține în activitate agenți economici cu pierderi pentru a preîntâmpina mișcări sociale.

Pentru Transilvania situația ocupării forței de muncă se prezintă mai bine decât în celelalte regiuni, totuși, existând și aici zone cu probleme (Valea Jiului) unde se pot de asemenea aplica programe de reconversie profesională și orienta investiții pentru ocuparea forței de muncă disponibile.

Mediana reprezintă acea valoare a caracteristicii situată la mijlocul seriei, cu valorile individuale aranjate în ordine crescătoare sau descrescătoare. Cu alte cuvinte mediana împarte numărul unităților la care s-a făcut observarea în două părți egale. În cazul în care seria are un număr par de termeni mediana se calculează în mod convențional ca medie aritmetică a celor doi termeni din mijlocul seriei. Din acest punct de vedere, pentru indicatorul populația ocupată, valoarea mediană se calculează ca medie a valorilor înregistrate în județele Alba și Buzău, putând aprecia că aceste doua județe se află chiar la mijloc pe ansamblul țării. Pentru rata șomajului, județele ale căror valori sunt în centrul seriei sunt Dîmbovița și Sibiu.

Cuartilele sunt acele valori ale caracteristicii care împart seria ordonată în patru părți egale. Prima valoare este egala cu minimul seriei, a treia cu valoarea mediană iar ultima cu valoarea maximă. Cuartilele permit și o caracterizare calitativă a valorilor indicatorilor la nivelul județelor: județe cu rată a șomajului foarte mare a căror valori sunt cuprinse între Q3 și Q4: Neamț, Vâlcea, Botoșani etc.; județe cu rată a șomajului mare cu valori cuprinse între Q2 și Q3: Sălaj, Mureș, Dîmbovița; județe cu rată a șomajului redusă, cu valori cuprinse între Q1 și Q2: Vrancea, Teleorman, Covasna; județe cu rată a șomajului foarte redusă cu valori cuprinse între Q1 și minim: București, Timiș, Gorj, Arad.

Pentru o serie de frecvențe în diagrama diferențială cuartilele corespund absciselor în care dreptele paralele cu 0y împart diagrama în patru arii egale cu 25%.

2.2.2 Indicatorii statistici ai împrăștierii

Caracteristicile statistice care definesc aceeași colectivitate prezintă grade și forme de variație diferite în funcție de natura, direcția și intensitatea acțiunii factorilor esențiali și întâmplători. De asemenea ele pot fi analizate la niveluri diferite, după cum unitățile de observare sunt simple sau complexe pentru întreaga colectivitate sau numai pentru o parte a acesteia. În consecință calculul indicatorilor tendinței centrale trebuie să fie însoțit de verificat de omogenității valorilor individuale din care aceștia s-au calculat. Acest deziderat este realizat cu ajutorul indicatorilor statistici ai împrăștierii (ai dispersiei) valorilor individuale înregistrate. Totodată, indicatorii împrăștierii stau la baza calculului altor indicatori cu care se caracterizează asimetria, excesul, interdependența între factorii de influență.

Indicatorii împrăștierii permit soluționarea unor probleme de cunoaștere statistică cum ar fi: verificarea reprezentativității valorilor medii a caracteristicilor într-o serie statistică; analiza gradului de omogenitate a valorilor individuale ale seriei; analiza în timp și/sau în spațiu a mai multor serii de repartiție după caracteristici independente și/sau interdependente; selectarea factorilor semnificativi de influență după care se structurează unitățile unei colectivități; separarea acțiunii factorilor esențiali de acțiunea factorilor întâmplători și, în mod implicit, identificarea modalității de acțiune a factorilor esențiali în diferite grupe; caracterizarea statistică a formei de repartiție a unei caracteristici etc.

Prin urmare, măsurarea și analiza variabilității datelor statistice, cunoașterea legităților statistice necesită calculul și analiza indicatorilor variației. Acești indicatori sunt clasificați în teorie și în practică după mai multe criterii:

– după numărul variantelor cuprinse în metodologia lor de calcul (sau după gradul lor de generalitate) se identifică indicatori simpli și indicatori sintetici ai împrăștierii;

după metodologia de calcul și forma de exprimare deosebim indicatori ai împrăștierii calculați ca mărimi absolute (exprimați în unitatea de măsură a caracteristicii studiate) și indicatori ai împrăștierii calculați ca mărimi relative în raport cu valoarea unui indicator al tendinței centrale, de obicei în raport cu media. Aceștia din urmă sunt exprimați sub forma unor coeficienți sau în procente;

– după modul de sistematizare a datelor complexe deosebim indicatori ai împrăștierii calculați pentru serii de distribuție unidimensionale și indicatori ai împrăștierii calculați pentru serii de distribuție multidimensionale. Pentru măsurarea variabilității valorilor individuale dintr-o distribuție unidimensională se calculează indicatori simpli și sintetici ai împrăștierii, exprimați în mărimi absolute relative.

Indicatorii simpli

Acești indicatori se caracterizează, în principal, prin aceea că se calculează în cifre absolute sau relative, prin compararea valorilor individuale extreme sau prin compararea fiecărei valori individuale cu valoarea lor medie. Ei permit o caracterizare aproximativă și parțială a variației. De aceea este necesar să se completeze informațiile oferite de acești indicatori cu indicatorii sintetici ai împrăștierii. Principalii indicatori simpli ai împrăștierii sunt amplitudinea variației și abaterile individuale.

Amplitudinea variației este expresia cantitativă a domeniului de variație al unui fenomen și se calculează ca mărime absolută și/sau relativă.

Se observă că amplitudinea pentru populația totală este influențată de mărimea foarte mare a indicatorului pentru municipiul București. Eliminând această valoare rezultă o diferență între județul cel mai populat și cel mai puțin populat de 636.227 locuitori. Pentru rata șomajului amplitudinea variației este 10,8% valoare considerată mare, putând astfel concluziona că diferențele între județe privind rata șomajului sunt mari iar indicatorul este neomogen pe teritoriul țării. Se observă că amplitudinea variației se exprimă în unitatea de măsură a caracteristicii analizate. De asemenea, potrivit conținutului său, amplitudinea poate fi utilizată pentru analiza comparativă a variației sau a împrăștierii numai în cazul când seriile pentru care se calculează se referă la aceeași caracteristică înregistrată pentru aceeași perioadă de timp, în unități de spațiu diferite sau pentru aceeași unitate de spațiu, dar pentru perioade de timp diferite. De exemplu putem compara amplitudinea unui indicator în cele trei regiuni istorice: Moldova, Muntenia, Transilvania.

Datele pentru Muntenia sunt deformate datorită municipiului București, de aceea valorile lui pentru primii trei indicatori au fost excluse dar pentru ultimii doi au fost incluse în calculul amplitudinii. Din analiza tabelului se observă că populația totală are împrăștierea cea mai mare pentru județele din Muntenia, din acest punct de vedere Moldova fiind cea mai omogenă. Interesantă este situația pentru rata șomajului și salariul net în Muntenia: dacă rata șomajului prezintă diferențe mari între județele acestei regiuni salariul net are valoarea cea mai omogenă în comparație cu celelalte regiuni. Acest lucru se întâmplă datorită valorii ratei șomajului din județul Vâlcea, atipică pentru regiunea în care se află. Eliminând această valoare rezultă o amplitudine a ratei șomajului pentru Muntenia de doar 6,5%, valoare ce caracterizează mult mai bine împrăștierea valorilor individuale.

Amplitudinea relativă a variației se exprimă în coeficient sau, de regulă, în procente și se calculează ca raport între amplitudinea absolută a împrăștierii și nivelul unui indicator al tendinței centrale. De obicei, pentru calculul acestui indicator se ia ca bază de comparație valoarea medie a caracteristicii. Din metodologia de calcul se observă ca amplitudinea ca indicator al variației nu este suficient de semnificativă pentru analiza împrăștierii valorilor individuale, deoarece ea ține seama numai de valorile extreme ale caracteristicii, cu toate că variația fenomenului analizat presupune luarea în considerare a tuturor valorilor individuale și frecvențelor de apariție. Sunt frecvente cazurile în care valorile extreme sunt foarte îndepărtate de valorile intermediare, ceea ce ar conduce la concluzii aberante, lucru arătat și mai sus, dacă s-ar utiliza numai amplitudinea ca măsură a împrăștierii sau a variației. Se observă că, pe ansamblul țării, pentru numărul de salariați de obține valoarea ce mai mare a împrăștierii caracterizată prin acest indicator iar pentru salariul mediu net cea mai mică. Pentru regiunile istorice valorile indicatorului amplitudinea relativă a variației sunt prezentate în tabelul următor:

Abaterile individuale ca indicatori ai împrăștierii sau ai variației exprimă cu câte unități de măsură sau de câte ori (sau cât la sută) valoarea individuală a caracteristicii este mai mare sau mai mică decât mărimea unui indicator al tendinței centrale. Aceasta însemnă că abaterile individuale sunt exprimate în cifre absolute sau relative și se calculează în funcție de fiecare valoare individuală și nivelul mediu.

În funcție de scopul cercetării în locul mediei se poate lua mediana, modul etc. Abaterile individuale relative se calculează ca raport între abaterile individuale absolute și nivelul mediu al caracteristicii. Ele se exprimă sub formă de coeficienți sau în procente. La analiza variației prezintă interes, într-o distribuție unidimensională, abaterile maxime pozitive sau negative.

Din metodologia de calcul a abaterilor individuale se observă de asemenea, că acestea cu toate că oferă în comparație cu amplitudinea posibilități mai largi de informare, au totuși o încărcătură informațională limitată, deoarece gradul de variabilitate al unei caracteristici depinde nu numai de abaterile variantelor de la media lor, ci și de frecvența de apariție a acestora.

B. Indicatorii sintetici

Indicatorii sintetici ai împrăștierii caracterizează într-o singură expresie numerică întreaga variație a unei caracteristici, urmărită în colectivitatea analizată. Potrivit metodologiei lor de calcul indicatorii sintetici de împrăștiere țin seama de toate abaterile individuale și reflectă întreaga variație a caracteristicii înregistrate la nivelul colectivității. Putem cu ajutorul lor să analizăm împrăștierea valorilor indicatorilor forței de munca caracterizând astfel mărimea diferențelor între județe. În acest scop ei se calculează ca medii simple sau ponderate ale abaterilor variantelor caracteristicilor de la media lor. În funcție de metodologia lor de calcul, de încărcătura lor informațională, în teoria și practica statistică se calculează și se analizează frecvent următorii indicatori sintetici ai împrăștierii: abaterea medie, abaterea mediană, abaterea medie pătratică, dispersia și coeficientul de variație.

Abaterea medie (sau abaterea medie liniară sau abaterea medie absolută) se calculează ca o medie aritmetică simplă sau ponderată a abaterilor absolute ale termenilor seriei de la media sau mediana lor.

Conținutul și metodologia de calcul a abaterii medii impun următoarele observații: se exprimă în unitatea de măsură a caracteristicii, în cazul seriilor de distribuție de frecvențe pe intervale în locul variantelor vor fi considerate centrele intervalelor, pentru ușurarea calculului trebuie avut în vedere că într-o serie de distribuție suma algebrică a abaterilor absolute pozitive este egală cu suma algebrică a abaterilor absolute negative, în acest caz ne putem limita numai la valorile individuale ale caracteristicii superioare valorii medii. În calculul abaterii medii se utilizează frecvent media aritmetică, deoarece în mod curent tendința centrală se exprimă cu ajutorul mediei aritmetice și implicit trebuie să se definească și variația baza abaterilor valorilor individuale înregistrate față de media lor aritmetică. Știind că suma abaterilor valorilor individuale de la medie este nulă, pentru a evita acest lucru, în calculul abaterii medii se iau în considerare abaterile individuale în valori absolute. Procedura de calcul a abaterii medii este justificată în măsura în care pentru caracterizarea variabilității prezintă interes numai mărimea abaterii dar nu și sensul ei.

Abatere mediană (sau abatere echiprobabilă) reprezintă mediana valorilor absolute ale abaterilor calculate fie în raport cu media aritmetică fie în raport cu mediana valorilor individuale înregistrate. Abaterea mediană se mai numește și abaterea probabilă sau echiprobabilă, deoarece are o șansă din două de a fi depășită. Prin urmare 50% din observații sunt cuprinse în intervalul celor două abateri probabile centrate pe mediană. Ea este mai puțin utilizată în practică deoarece nu elimină dezavantajele abaterii medii.

Abaterea medie pătratică (sau abaterea standard, sau abaterea tip) se calculează ca o medie pătratică a abaterilor valorilor individuale de la media lor aritmetică. Abaterea medie pătratică, ca măsură a împrăștierii, este mai semnificativă decât ceilalți indicatori ai împrăștierii prezentați anterior. Acesta se datorează faptului că determinarea ei are ca punct de pornire pătratele abaterilor care sunt într-un fel valori mai semnificative decât abaterile simple luate în valoare absolută, deoarece accentuează efectul abaterilor mari.

Abaterea medie pătratică se exprimă în unitatea de măsură concretă a caracteristicii urmărite, iar valoarea acesteia este cu atât mai mare cu cât este mai mare împrăștierea valorilor individuale ale caracteristicii cercetate. Valoarea acestui indicator este influențată de ordinul de mărime al valorilor individuale ale caracteristicii.

Coeficientul de variație se calculează ca raport între abaterea medie pătratică și media aritmetică, reprezentând expresia relativă a abaterii tip.

Coeficientul de variație reprezintă o măsură sintetică a omogenității distribuțiilor statistice după o anumită caracteristică și ia valori în intervalul [0; 100%]. De asemenea, se observă că valorile mici ale coeficientului de variație semnifică faptul că valoarea medie a caracteristicii calculate are un grad ridicat de reprezentativitate, iar colectivitatea este omogenă. În cazul în care colectivitatea este eterogenă și, deci, media este mai puțin reprezentativă, valorile coeficientului se apropie de valoarea maximă 100%. Coeficientul de variație este considerat un util test de verificare a reprezentativității mediei aritmetice calculate. Acest test nu este operabil în cazul în care media se apropie de zero.

În funcție de informațiile de care se dispune, omogenitatea împrăștierii valorilor individuale într-o distribuție se poate caracteriza și cu alți coeficienți fără ca aceștia să aibă un alt conținut. Astfel se poate utiliza în locul abaterii medii pătratice, abaterea medie liniară calculată pe baza mediei aritmetice sau cea pe baza medianei. Acești indicatori nu aduc informații suplimentare ei putând fi totuși utilizați în funcție de scopul analizei.

Practica statistică a demonstrat că în cazul în care coeficienții de variație prezintă valori mai mari decât 30-35% asupra omogenității colectivității și reprezentativității mediei se pun semne de întrebare. În asemenea situații se impune regruparea unităților după o altă caracteristică.

Dispersia este un alt indicator sintetic de împrăștiere cu o largă utilizare în analiza statistică a fenomenelor de masă. Ea reprezintă momentul centrat de ordinul doi și se calculează ca o medie aritmetică simplă sau ponderată a pătratelor abaterilor valorilor individuale de la media lor aritmetică.

Dispersia prezintă o serie de trăsături importante:

– ca măsură a împrăștierii valorilor individuale față de medie, mărimea dispersiei are următoarea semnificație: cu cât acesta este mai mare, cu atât este mai mare variația valorilor individuale, și invers valorile reduse ale dispersiei arată omogenitatea ridicată a colectivității după caracteristica urmărită;

– dispersia, spre deosebire de ceilalți indicatori ai variației nu ale unitate de măsură cu conținut economic real;

– comparând relațiile de calcul ale dispersiei cu cele ale abaterii medii pătratice se observă ușor că aceasta din urmă se calculează prin intermediul primei.

Se poate aprecia că la nivelul întregii țări împrăștierea indicatorilor populația totală, populația ocupată, număr de salariați și rata șomajului este mare, coeficientul de variație depășind 35% (chiar 67% pentru numărul de salariați). Există deci diferențe semnificative din aceste puncte de vedere între județe fapt ce este evidențiat prin migrația forței de muncă din zonele cu rată a șomajului mare către zonele unde pot găsi locuri de muncă. Pentru salariul mediu net se poate aprecia că acesta prezintă valori omogene pe întreg teritoriul, coeficientul de variație al indicatorului fiind doar de 11%. Deci cu toate că distribuția în teritoriu a ocupării forței de muncă nu este omogenă, diferențele in ceea ce privește plata muncii nu sunt semnificative.

Se poate face o analiză și la nivelul provinciilor istorice, calculând aceeași indicatori sintetici ai împrăștierii (din calculul indicatorilor pentru Muntenia a fost exclus municipiul București considerat atipic).

Moldova

Muntenia

Transilvania

Observăm că există deosebiri semnificative între cele trei regiuni: în Moldova valorile indicatorilor observați sunt omogene, toți coeficienții de variație fiind sub 30-35% apreciind astfel că nu există deosebiri majore între județele din această zonă ( niveluri înalte ale ratei șomajului, populație totală, populație ocupată, număr de salariați peste media pe țară, nivel scăzut al salarizării); în Muntenia deosebiri importante existând la nivelul numărului de salariați și al populației ocupate, rata șomajului putând fi considerată omogenă pe ansamblul regiunii; în Transilvania există deosebiri importante atât la nivelul numărului de salariați dar și la nivelul ratei șomajului, fapt neîntâlnit în celelalte regiuni, Transilvania fiind cea mai neomogenă din punct de vedere al indicatorilor luați în calcul.

Analiza unidimensională a acestor indicatori scoate în evidență doar aspectul cantitativ scoțând în evidență nivele, scoruri nefăcându-se referire la eventualele corelații și cauzalități

2.3 Descrierea bidimensională a datelor și măsuri ale corelației între variabile

După descrierile unidimensionale se studiată în general corelațiile între variabilele observate, ceea ce se numește curent studiul corelațiilor. Metodele și indicii de dependență variază după natura (calitativă, ordinală, numerică) a variabilelor studiate. Măsurarea legăturilor sau calculul corelației este etapa analizei statistice care arată gradul de corespondență între două sau mai multe caracteristici, modul în care datele reale înregistrate se concentrează sau se împrăștie în jurul liniei de regresie.

Intensitatea legăturii se poate măsura cu ajutorul coeficientului de corelație și al raportului de corelație.

Domeniul de variație al coeficientului de corelație este intervalul [-1, 1]. Acest coeficient prezintă avantajul de a fi un indicator abstract, independent de forma de exprimare a datelor inițiale. Semnul indicatorului arată direcția legăturii, semnul minus indică o legătură inversă între variabile, iar semnul plus semnifică o legătură directă.

r nu măsoară decât caracterul liniar al unei legături, și folosirea lui trebuie rezervată norilor cu punctele repartizate de o parte și de alta cu o tendință liniară. Coeficientul de corelație este foarte sensibil la valorile extreme ale indivizilor și deci nu este “robust”

În situația în care legătura dintre cele două variabile nu este liniară ca indicator al intensității legăturii se utilizează raportul de corelație definit astfel:

unde ŷi reprezintă estimația variabilei rezultative pe baza modelului de regresie. Domeniul de variație al indicatorului este intervalul [0, 1], apropierea de valoarea 1 indicând existența unei legături intense.

Observând indicatorii mai sus prezentați este interesantă reprezentarea grafică a județelor în sistemul de axe reprezentate de doi indicatori:

Analizând aceste grafice putem observa poziția fiecărui județ față de cei doi indicatori luați ca bază de comparație.

Tabelul corelației între rata șomajului și salariul mediu net

+–––––––––-+––––––––––––+–––––-+–––––-+

| VARIABILE | CARACTERISTICI |COEFICIENȚI DE | CORELAȚIE |

| | | CORELATIE | PARȚIALĂ |

+–––––––––-+––––––––––––+–––––-+–––––-+

| NUM . (IDEN | EFF. P.ABS MEDIA ABATEREA | 4 5 | 4 5 |

+–––––––––-+––––––––––––+–––––-+–––––-+

| 4 . rata șomajului | 42 42.00 6.74 2.73 | 1.00 -0.13 | |

| 5 . salariul mediu net | 42 42.00 308851.31 36213.52 | -0.13 1.00 | |

| 1 . populația totala | 42 42.00 538.28 287.76 | -0.12 0.36 | -0.08 0.35 |

| 2 . populația ocupata | 42 42.00 223.31 115.03 | -0.14 0.39 | -0.10 0.38 |

| 3 . nr. de salariați | 42 42.00 97.45 65.48 | -0.17 0.51 | -0.12 0.50 |

+–––––––––-+––––––––––––+–––––-+–––––-+

Astfel în sistemul de axe salariul mediu net X rata șomajului se detașează județe cu situație favorabilă: Brașov, Gorj, Constanța, Argeș, municipiul București; județe cu situație nefavorabilă: Neamț, Botoșani; județe în care deși rata șomajului este mare și nivelul salarizării este peste medie: Galați, Hunedoara; situație inversă (nivele scăzute ale șomajului și salarizării) întâlnind în județele Arad, Satu Mare, Timiș. Valorile indicatorilor pentru celelalte județe se depărtează mai puțin, într-un sens sau altul, de la media pe țară. Această analiză bivariată scoate în evidență zone defavorizate, zone din care se așteaptă o deplasare a forței de muncă, cum ar fi Moldova, județele Brăila și Tulcea precum și zonele în care se va îndrepta această forță de muncă: centrul Munteniei (Argeș, Prahova, București), județe cu economie dezvoltată sau în expansiune Constanța, Brașov, Gorj. Teoretic între cele două variabile ar trebui să existe o corelație inversă puternică: cu cât rata șomajului este mai mare cu atât nivelul salariului mediu net ar trebui să fie mai mic. Această corelație nu se respectă datorită condițiilor speciale din România (zone monoindustriale în care aproape întreaga populație este ocupată într-un singur sector de activitate: minerit, siderurgie). Nivelul salariului în aceste zone trebuie să acopere cheltuielile unei gospodării în care doar capul familiei muncește, ceilalți membri ai familiei neputându-și găsi un loc de muncă datorită specificului zonei.

Tabelul corelației între rata șomajului populația totală

+––––––––––+––––––––––––+–––––-+–––––-+

| VARIABILE | CARACTERISTICI | COEFICIENȚI DE | CORELAȚIE |

| | | CORELAȚIE | PARȚIALĂ |

+––––––––––+––––––––––––+–––––-+–––––-+

| NUM . (IDEN) | EFF. P.ABS MEDIA ABATEREA | 1 4 | 1 4 |

––––––––––+––––––––––––+–––––-+–––––-+

| 1 . populația totala | 42 42.00 538.28 287.76 | 1.00 -0.12 | |

| 4 . rata șomajului | 42 42.00 6.74 2.73 | -0.12 1.00 | |

| 2 . populația ocupata | 42 42.00 223.31 115.03 | 0.99 -0.14 | 0.99 -0.16 |

| 3 . nr. de salariați | 42 42.00 97.45 65.48 | 0.95 -0.17 | 0.96 -0.19 |

| 5 . salariul mediu net | 42 42.00 308851.31 36213.52 | 0.36 -0.13 | 0.35 -0.09 |

+––––––––––+––––––––––––+–––––-+–––––-+

Din reprezentarea grafică se pot observa județele cu efectiv mare al populației grupate în două categorii: cu rate înalte ale neocupării (Neamț, Suceava, Galați Cluj, Bacău) și cu ocupare bună a forței de muncă (Constanța, Argeș, Prahova, București). Pe de altă parte județele în care, deși numărul populației este redus, rata șomajului este ridicată (Tulcea, Sălaj, Harghita). Acest fapt este datorat specificului zonei în care aceste județe se află: Delta Dunării, zone deluroase sau montane sărace în resurse. Deasemenea sunt prezentate și județele care nu au un număr mare al populației totale dar reușesc o bună ocupare a acesteia (Covasna, Giurgiu, Călărași, Mehedinți).

Tabelul corelației între salariul mediu net și populația ocupată

+––––––––––+––––––––––––+–––––-+–––––-+

| VARIABILE | CARACTERISTICI | COEFICIENȚI DE | CORELAȚIE |

| | | CORELAȚIE | PARȚIALĂ |

+––––––––––+––––––––––––+–––––-+–––––-+

| NUM . (IDEN) | EFF. P.ABS MEDIA ABATEREA | 2 5 | 2 5 |

+––––––––––+––––––––––––+–––––-+–––––-+

| 2 . populația ocupata | 42 42.00 223.31 115.03 | 1.00 0.39 | |

| 5 . salariul mediu net | 42 42.00 308851.31 36213.52 | 0.39 1.00 | |

| 1 . populația totala | 42 42.00 538.28 287.76 | 0.99 0.36 | 0.99 -0.26 |

| 3 . nr. de salariați | 42 42.00 97.45 65.48 | 0.97 0.51 | 0.97 0.54 |

| 4 . rata șomajului | 42 42.00 6.74 2.73 | -0.14 -0.13 | -0.10 -0.08 |

+––––––––––+––––––––––––+–––––-+–––––-+

Putem scoate în evidență din graficul prezentat faptul că în 11 județe salariul mediu net și populația ocupată depășesc mediile înregistrate pe ansamblul țării. Deasemenea în 16 județe se înregistrează pentru acești doi indicatori valori inferioare mediei. Se pot observa din această analiză puternice diferențe atât între județe cât și între zone geografice (zonă de câmpie, zonă de deal, zonă de munte).

Tabelul corelației între numărul de salariați și rata șomajului

+––––––––––+––––––––––––+–––––-+–––––-+

| VARIABILE | CARACTERISTICI | COEFICIENȚI | CORELAȚIE |

| | | DE CORELAȚIE | PARȚIALĂ |

+––––––––––+––––––––––––+–––––-+–––––-+

| NUM . (IDEN) | EFF. P.ABS MEDIA ABATEREA | 3 4 | 3 4 |

+––––––––––+––––––––––––+–––––-+–––––-+

| 3 . nr. de salariați | 42 42.00 97.45 65.48 | 1.00 -0.17 | |

| 4 . rata șomajului | 42 42.00 6.74 2.73 | -0.17 1.00 | |

| 1 . populația totala | 42 42.00 538.28 287.76 | 0.95 -0.12 | 0.96 0.15 |

| 2 . populația ocupata | 42 42.00 223.31 115.03 | 0.97 -0.14 | 0.97 0.10 |

| 5 . salariul mediu net | 42 42.00 308851.31 36213.52 | 0.51 -0.13 | 0.50 -0.05 |

+––––––––––+––––––––––––+–––––-+–––––-+

Această corelație respectă în general caracteristicile corelației populația totală-rata șomajului deoarece proporția salariaților în populația totală este aproximativ aceeași pe ansamblul țării. Trebuie remarcat ca județele în care acesta proporție este mai mică sunt, în general, în zone de câmpie unde forța de muncă se îndreaptă spre agricultură.

Tabelul corelației între populația totală și populația ocupată

+––––––––––––+––––––––––-+–––––-+–––––-+

| VARIABILE | CARACTERISTICI | COEFICIENȚI DE | CORELAȚIE |

| | | CORELAȚIE | PARȚIALĂ |

+––––––––––––+––––––––––-+–––––-+–––––-+

| NUM . (IDEN) LIBELLE COURT | EFF. MOYENNE EC.TYPE | 1 2 | 1 2 |

+––––––––––––+––––––––––-+–––––-+–––––-+

| 1 . (popt) populația totala | 42 538.28 287.76 | 1.00 0.99 | |

| 2 . (popo) populația ocupata | 42 223.31 115.03 | 0.99 1.00 | |

| 3 . (salr) nr. de salariați | 42 97.45 65.48 | 0.95 0.97 | -0.18 0.54 |

| 4 . (som ) rata șomajului | 42 6.74 2.73 | -0.12 -0.14 | 0.15 -0.16 |

| 5 . (sal ) salariul mediu net | 42 308851.31 36213.52 | 0.36 0.39 | -0.26 0.31 |

+––––––––––––+––––––––––-+–––––-+––––+

Fără îndoială că există o strânsă legătură între acești doi indicatori, reprezentarea grafică punând în evidență județe cu puternic potențial de forță de muncă (București, Cluj, Prahova, Constanța, Argeș, Hunedoara) în comparație cu județe mai mici în care potențialul de forță de muncă este redus (Giurgiu, Sălaj, Covasna, Tulcea, Ialomița, Călărași).

2.4 Analiza în componente principale

Studiem cu ajutorul acestei metode un tabel indivizi X variabile în cazul în care toate variabilele sunt numerice. Vom prezenta mai întâi o abordare explorativă ce permite descrierea indivizilor în multiplele lor dimensiuni și vizualizarea acestor relații între variabile. Vom studia apoi analiza în componente principale. Această metodă permite obținerea unei hărți a indivizilor în funcție de asemănările dintre ei și a unei hărți a variabilelor în funcție de corelațiile lor. Este deasemenea posibilă obținerea unei reprezentări simultane pe o hartă a indivizilor și variabilelor. Mai mult, este util să completăm reprezentare grafică a datelor cu ajutorul unei tipologii a indivizilor.

2.4.1 Analiza explorativă a datelor multidimensionale

Tabelul prezentat în capitolul anterior va servi drept fir conducător pentru această prezentare. Liniile tabelului reprezintă județele României iar coloanele indicatori cu privire la forța de muncă: 1.populația totală, 2.populația ocupată, 3.numărul de salariați, 4.rata șomajului, 5.salariul net.

Cei 42 de indivizi pot fi reprezentați împreună cu cele 5 caracteristici printr-un grafic de forma următoare:

2.4.2 Analiza descriptivă a variabilelor

Analizei explorative îi urmează o analiză descriptivă în care sunt prezentate câteva statistici elementare și matricea corelațiilor între variabile. Trebuie precizat că dispersiile sunt calculate împărțind prin numărul de indivizi, n, și nu prin n-1 deoarece este vorba despre o analiză geometrică a datelor și nu există inferență statistica (nu se studiază un eșantion pe baza căruia se trag concluzii pentru întreaga populație).

Tabelul statisticilor elementare

+––––––––––––-+–––––––-+–––––––-+

| NUM . VARIABILĂ EFECTIV | MEDIA ABATEREA | MINIM MAXIM |

+––––––––––––-+–––––––-+–––––––-+

| 1 .populația totala 42 | 538.28 287.76 | 231.87 2037.28 |

| 2 .populația ocupata 42 | 223.31 115.03 | 97.70 800.60 |

| 3 .nr. de salariați 42 | 97.45 65.48 | 33.00 434.00 |

| 4 .rata șomajului 42 | 6.74 2.73 | 2.30 13.10 |

| 5 .salariul mediu net 42 | 308851.31 36213.52 | 249355.00 400745.00 |

+––––––––––––-+–––––––-+–––––––-+

Tabelul corelațiilor între variabile

| popt popo salr som sal

––+––––––––––––

popt | 1.00

popo | 0.99 1.00

salr | 0.95 0.97 1.00

som | -0.12 -0.14 -0.17 1.00

sal | 0.36 0.39 0.51 -0.13 1.00

––+––––––––––––

Putem face următoarele remarci:

– variabila număr de șomeri este corelată negativ cu toate celelalte variabile;

– toate celelalte variabile sunt corelate pozitiv, aceasta însemnă că la o primă analiză județele pot fi ordonate de la cele mai mari la cele mai mici, acest lucru reieșind și din graficele prezentate;

– variabilele grupului: populație totală, populație ocupată și număr de salariați sunt bine corelate între ele;

Putem rezuma și vizualiza această primă analiză printr-o clasificare ierarhică ascendentă a variabilelor luând drept indice de similaritate între variabile, corelațiile lor. Corelațiile negative vor fi luate în valoare absolută. În prima etapă se grupează variabilele cele mai corelate populația totală și populația ocupată. În a doua etapă se caută cea mai puternică corelație care a mai rămas, este vorba despre corelația între populația ocupată și numărul de salariați, această ultimă variabilă unindu-se cu grupul format în prima etapă. Următoarea corelație se realizează între variabilele numărul de salariați și salariul mediu. Ultima variabilă rata șomajului este cel mai puțin corelată cu restul variabilelor ea grupându-se ultima. Acest procedeu de agregare iterativ se vizualizează printr-o dendogramă-arbore de clasificare:

Populația totală

Populația ocupată

Nr. de salariați

Salariul mediu net

Rata șomajului

2.4.3 Metoda analizei în componente principale (A.C.P.)

Analiza în componente principale constă în căutarea unui număr mic de variabile noi necorelate între ele care să rezume cât mai bine posibil datele de plecare inițiale. În acest scop se va proiecta norul de indivizi pe o serie de axe (drepte) ortogonale două câte două. Aceste vor avea proprietatea realizării unui maxim al inerției norului de proiecții corespunzător fiecărei axe. Căutăm astfel o axă, cu proprietatea că ajustează norul de puncte în sensul minimizării sumei pătratelor distanțelor la această axă.

Prima axă principală: căutăm să facem ca o dreaptă 1 să treacă cât mai bine prin mijlocul norului de puncte. Se măsoară împrăștierea norului în jurul unei drepte cu ajutorul inerției:

unde este proiecția ortogonală a punctului pe dreapta pe care notăm. Dreapta 1 caută să minimizeze inerția lui raportată la și se numește prima axă principală a norului .

Se poate arăta că dreapta 1 trece prin originea O, centrul de greutate al norului al datelor centrate reduse și este generată de vectorul unitar , vector propriu normat al matricei R a corelațiilor între variabilele asociat la cea mai mare valoare proprie .

Prima componentă principală: este o nouă variabilă definită pentru fiecare individ i prin lungimea algebrică a proiecției punctului pe axa 1. Valoarea lui este deci egală cu produsul scalar dintre vectorii și . Astfel avem:

Prima componentă principală este centrată fiind combinație liniară de variabile centrate. Se poate arăta că dispersia sa este egală cu .

Dispersia primei componente principale este egală cu inerția norului de puncte proiectate pe 1 în raport cu centrul de greutate O.

Corelațiile între variabilele și componenta principală pot fi calculate cu ajutorul formulei:

Se deduce că similaritatea lui față de mulțimea de variabile este egală cu

Pentru a măsura calitatea globală a primei componente principale considerată ca rezumat al datelor se folosește formula de descompunere a inerției totale pe care am construit-o. Vectorii fiind protecția ortogonală a vectorilorpe dreapta 1 avem:

Inerția totală a lui :

și se descompune deci în două părți:

și reprezintă inerția totală a norului de puncte {} a proiecțiilor punctelorpe axa . Această cantitate reprezintă inerția explicată de axa și este egală cu . Al doilea termen este inerția și reprezintă inerția reziduală a norului în jurul axei .

Calitatea globală a primei componente principale se măsoară prin partea de inerție explicată 1/p. Se regăsește asimilaritatea componentei principale cu mulțimea de variabile.

A doua axă principală se construiește căutând o axă ortogonală la și care minimizează inerția . Această a doua axă principală, , trece prin origine O și este generată de vectorul vectorul propriu normat al matricei de corelații R asociat la ce de a doua valoare proprie .

Notăm cu și proiecțiile punctelor pe axa și respectiv pe planul format de (,). Vectorii și sunt de asemenea proiecțiile lui pe axele și . Din descompunerea :

se deduce inerția norului:

unde inerția norului în raport cu planul format de dreptele și . Se poate spune că această inerție este minimă în raport cu toate planurile posibile. Planul format de dreptele și se numește primul plan principal. El este planul ce trece cel mai bine posibil prin mijlocul norului în sensul criteriului inerției.

A doua componentă principală este o nouă variabilă definită pentru fiecare individ i astfel: lungimea algebrică a segmentului . A doua componentă principală este centrată și de dispersie :

În plus corelația între și este nulă. Corelațiile între variabilele , se calculează astfel:

Ecuațiile inerției și dispersiei exprimă faptul că partea de inerție explicată prin a doua axă principală este egală cu și aceea explicată prin planul ( ) este .

Calitatea reprezentării indivizilor pe a doua axă principală și pe primul plan principal se măsoară cu ajutorul pătratelor cosinusurilor unghiurilor formate între vectorii, axa și planul (, ).

Pentru :

Pentru (,) :

Extinzând raționamentele făcute până acum obținem o mulțime de p axe principale generate de vectorii proprii ortonormați (aranjate în ordine descrescătoare). Componentele principale sunt definite prin:

Ele reprezintă coordonatele punctelor în noul reper. Se poate demonstra că ele sunt centrate, de dispersie și necorelate între ele. Punctele pot fi exprimate în acest nou reper astfel:

Formulele următoare sunt foarte utile și se deduc direct din procesul de construire a componentelor principale. Astfel avem formula de reconstituire a datelor :

formula de reconstituire a matricei corelațiilor dintre variabile:

Formula de descompunere a pătratelor distanțelor de la un punct la origine

Calculul corelațiilor între variabilele și componentele principale :

Deducem că asemănarea componentei principale față deeste egală cu:

și anume partea de inerție explicată de axa principală .

Revenind la exemplul numeric, în care variabilele sunt populația totală, populația ocupată, numărul de salariați rata șomajului și salariul net, iar indivizii sunt ce 42 de județe ale României putem analiza următoarele rezultate ale unei analize în două componente principale.

Coordonatele, contribuțiile și cosinusurile indivizilor față de cele două componente principale:

+–––––––––––+––––-+––––+––––+

| INDIVIZII | COORDONATE | CONTRIBUȚII| COSINUS |

|–––––––––––+––––-+––––+––––|

| JUDEȚ P.REL DISTO | 1 2 | 1 2 | 1 2 |

+–––––––––––+––––-+––––+––––+

| alba 2.38 1.01 | -0.28 0.90 | 0.1 2.1 | 0.08 0.85 |

| arad 2.38 3.50 | -0.40 1.30 | 0.1 4.1 | 0.05 0.48 |

| argeș 2.38 2.47 | 1.39 0.61 | 1.4 0.9 | 0.78 0.15 |

| bacău 2.38 1.55 | 1.11 -0.51 | 0.9 0.6 | 0.80 0.17 |

| bihor 2.38 2.44 | 0.72 1.35 | 0.4 4.4 | 0.21 0.75 |

| bistrița năsăud 2.38 2.82 | -1.61 -0.46 | 1.9 0.5 | 0.92 0.07 |

| botoșani 2.38 5.32 | -1.42 -1.48 | 1.5 5.3 | 0.38 0.41 |

| brașov 2.38 5.32 | 1.48 1.12 | 1.6 3.0 | 0.41 0.23 |

| brăila 2.38 1.10 | -0.92 -0.38 | 0.6 0.4 | 0.78 0.13 |

| buzău 2.38 0.81 | -0.60 -0.37 | 0.3 0.3 | 0.45 0.17 |

| caraș-severin 2.38 1.34 | -1.07 -0.18 | 0.8 0.1 | 0.85 0.02 |

| călărași 2.38 3.15 | -1.49 0.80 | 1.6 1.6 | 0.70 0.20 |

| cluj 2.38 2.35 | 1.28 -0.74 | 1.2 1.3 | 0.69 0.23 |

| constanta 2.38 4.86 | 1.86 0.40 | 2.6 0.4 | 0.71 0.03 |

| covasna 2.38 4.15 | -1.69 1.08 | 2.1 2.8 | 0.68 0.28 |

| dîmbovița 2.38 0.14 | -0.03 0.06 | 0.0 0.0 | 0.01 0.03 |

| dolj 2.38 1.15 | 0.86 -0.37 | 0.5 0.3 | 0.65 0.12 |

| galați 2.38 6.32 | 1.27 -0.80 | 1.2 1.5 | 0.25 0.10 |

| giurgiu 2.38 3.74 | -1.61 1.02 | 1.9 2.6 | 0.69 0.28 |

| gorj 2.38 6.85 | 0.42 1.99 | 0.1 9.7 | 0.03 0.58 |

| harghita 2.38 2.50 | -1.38 -0.40 | 1.4 0.4 | 0.76 0.06 |

| hunedoara 2.38 9.45 | 1.26 -1.12 | 1.2 3.1 | 0.17 0.13 |

| ialomița 2.38 2.19 | -1.41 0.43 | 1.5 0.5 | 0.91 0.08 |

| iași 2.38 3.26 | 0.97 -1.16 | 0.7 3.3 | 0.29 0.41 |

| ilfov 2.38 4.25 | -1.15 -0.22 | 1.0 0.1 | 0.31 0.01 |

| maramureș 2.38 2.15 | 0.06 1.37 | 0.0 4.6 | 0.00 0.87 |

| mehedinți 2.38 2.75 | -0.98 1.12 | 0.7 3.1 | 0.35 0.46 |

| mureș 2.38 0.87 | 0.22 -0.70 | 0.0 1.2 | 0.06 0.57 |

| neamț 2.38 5.73 | -0.36 -2.37 | 0.1 13.6 | 0.02 0.98 |

| olt 2.38 0.97 | -0.21 0.90 | 0.0 2.0 | 0.05 0.84 |

| prahova 2.38 4.87 | 2.16 0.11 | 3.5 0.0 | 0.96 0.00 |

| satu-mare 2.38 2.17 | -1.01 0.72 | 0.7 1.3 | 0.47 0.24 |

| sălaj 2.38 3.22 | -1.78 -0.16 | 2.3 0.1 | 0.98 0.01 |

| sibiu 2.38 0.33 | -0.42 -0.07 | 0.1 0.0 | 0.53 0.01 |

| suceava 2.38 3.55 | 0.26 -1.79 | 0.0 7.8 | 0.02 0.91 |

| teleorman 2.38 0.59 | -0.66 0.14 | 0.3 0.1 | 0.74 0.04 |

| timiș 2.38 3.55 | 1.06 1.27 | 0.8 3.9 | 0.31 0.45 |

| tulcea 2.38 4.98 | -1.98 -0.67 | 2.9 1.1 | 0.79 0.09 |

| vaslui 2.38 2.79 | -1.13 -1.10 | 0.9 3.0 | 0.46 0.43 |

| vâlcea 2.38 5.10 | -0.69 -1.86 | 0.4 8.4 | 0.09 0.68 |

| vrancea 2.38 1.84 | -1.07 0.36 | 0.8 0.3 | 0.62 0.07 |

| bucurești 2.38 82.51 | 8.97 -0.18 | 59.5 0.1 | 0.98 0.00 |

+–––––––––––+––––-+––––+––––+

Coordonatele variabilelor pe cele două componente principale:

–––––––-+––––––––––––+––––––––––-

VARIABILE | CORELAȚIA VARIABILĂ-FACTOR |COORDONATE ÎN COMP.PRINCIPALE

–––––––-+––––––––––––+––––––––––-

DENUMIRE | 1 2 0 0 0 | 1 2 0 0 0

–––––––-+––––––––––––+––––––––––-

populația totala | 0.96 -0.14 0.00 0.00 0.00 | 0.54 -0.14 0.00 0.00 0.00

populația ocupata | 0.97 -0.11 0.00 0.00 0.00 | 0.54 -0.12 0.00 0.00 0.00

nr. de salariați | 0.99 -0.06 0.00 0.00 0.00 | 0.55 -0.06 0.00 0.00 0.00

rata șomajului | -0.22 -0.96 0.00 0.00 0.00 | -0.12 -0.97 0.00 0.00 0.00

salariul mediu net | 0.57 0.16 0.00 0.00 0.00 | 0.32 0.16 0.00 0.00 0.00

–––––––-+––––––––––––+––––––––––-

Valorile proprii și procentul în care explică variația:

+–––+––––+–––-+–––-+

| VAR. | VALOARE | PROCENT | PROCENT |

| | PROPRIE | | CUMULAT |

+–––+––––+–––-+–––-+

| 1 | 3.2205 | 64.41 | 64.41 |

| 2 | 0.9770 | 19.54 | 83.95 |

| 3 | 0.7624 | 15.25 | 99.20 |

| 4 | 0.0343 | 0.69 | 99.88 |

| 5 | 0.0059 | 0.12 | 100.00 |

+–––+––––+–––-+–––-+

Valorilor proprii =3,2205 și =0,9770 au procentul cumulat 83,95% deci ele sunt valori proprii dominante deci putem aprecia că două componente principale sunt suficiente pentru explicarea variației celor cinci variabile analizate. Calitatea reprezentării prin proiecțiile pe planul Axa1Xaxa2 este de 0,8395. Celor două valori proprii le corespund doi vectori și ortogonali, ale căror valori se găsesc în tabel în coloana “Coordonate în componente principale”. Se poate verifica că suma pătratelor coordonatelor fiecărui vector este aproximativ 1 iar produsul scalar este aproximativ 0. Acești vectori proprii generează două axe și . Prin proiectarea variabilelor pe aceste axe se obțin cele două componente principale ale căror valori se găsesc în tabel în coloana ”Componente principale”.

Calitatea reprezentării indivizilor pe cele două componente principale se găsește în tabelul indivizilor în coloana “Cosinus”; cu cât această valoare este mai aproape de unu cu atât indivizii sunt mai bine explicați de cele două axe. De exemplu de unde rezultă o bună reprezentare pe prima axă.

Deosebit de sugestivă este reprezentarea grafică simultană a indivizilor și variabilelor, reprezentare ce se numește biplot.

Luând câteva precauții în ceea ce privește scara de reprezentare este posibil să suprapunem primul plan principal și cercul de corelații și să obținem astfel o interpretare îmbogățită.

Harta indivizilor se construiește pornind de la proiecțiile punctelor pe primul plan principal (,) ce au drept coordonate pe axele principale, valorile și . Graficul punctelor A(,) ne dă astfel cel mai bun rezumat al datelor într-un plan. Această hartă a indivizilor verifică interpretarea axelor dată anterior: județele se așează de-a lungul primei axe în funcție de rata neocupării forței de muncă: de la cele cu șomaj ridicat (Neamț, Botoșani, Suceava, Vaslui, Vâlcea) la cele cu ocupare mare a forței de muncă (Gorj, Arad, Maramureș, Bihor); iar în lungul celei de-a doua axe în funcție de numărul populației: cu număr ridicat (București, Prahova, Constanța, Brașov, Bacău) sau cu număr redus al populației (Tulcea, Harghita, Sălaj, Giurgiu).

Harta variabilelor pornește de la reprezentarea variabilelor într-un plan cu ajutorul punctelor . Se obține un grafic numit cercul de corelație. Se observă clar corelația pozitivă intre variabilele populația totală, populația ocupată, număr de salariați, salariul net și prima componentă principală. A doua componentă principală opune județe cu rată înaltă a șomajului, județelor cu rate scăzute.

2.5 Clasificarea indivizilor

Scopul metodelor de clasificare este construirea unei partiții sau a unui șir de partiții formate dintr-o mulțime de obiecte pentru care se cunosc distanțele dintre ele două câte două.

Există variate metode de clasificare: clasificarea ierarhică totală, clasificarea ierarhică ascendentă și descendentă, clasificarea mixtă. Dintre acestea vom prezenta clasificarea ierarhică ascendentă cu ajutorul criteriului lui Ward, metodă ce conduce la un alt procedeu de a rezuma datele: construirea unei tipologii/partiții de indivizi în clase, astfel că indivizii ce aparțin aceleiași clase sunt asemănători (similari), în timp ce indivizii ce aparțin aceleiași clase sunt deosebiți (disimilari).

Să considerăm o împărțire a mulțimii de indivizi în k clase de efective . Notăm cu tipologia corespunzătoare norului de puncte asociat N={} și centrele de greutate ale acestor clase.

Inerția totală a norului N se descompune astfel:

Primul termen din dreapta se numește inerția interclase și măsoară felul în care clasele se depărtează unele de altele. Acest termen îl notăm cu I() și reprezintă inerția explicată de tipologie. Al doilea termen se numește inerția interclase și măsoară omogenitatea claselor. Calitatea tipologiei se măsoară cu ajutorul raportului dintre inerția interclase și cea totală.

Criteriul lui Ward: când în tipologia se înlocuiesc două clase și prin reunirea lor există o diminuare a inerției interclase. Această micșorare poate fi calculată și este egală cu:

Acest criteriu este utilizat pentru a măsura distanța între două clase și și se numește criteriul de agregare a lui Ward.

Algoritmul de clasificare ascendentă ierarhică este iterativ. La etapa curentă se pleacă de la o partiție a mulțimii de indivizi în k clase și se regrupează câte două clase și minimizând criteriul lui Ward D(,). În timpul acestei iterații, inerția interclase scade cu o cantitate egală cu D(,). În etapa inițială fiecare individ formează o clasă și inerția totală este atunci egală cu inerția interclase. La etapa finală nu mai există decât o singură clasă și inerția interclase este nulă. Suma pierderilor inerției interclase a diferitelor etape este deci egală cu inerția totală.

Aplicând acest algoritm exemplului numeric ales putem observa clasificarea ierarhică a celor 42 de județe, prin gruparea lor două câte două și formarea de noi clase. Inițial fiecare județ formează o clasă, apoi, prin grupare se ajunge la a 83-a clasă ce cuprinde toate județele.

Clasificarea ierarhică directă (vecini reciproci)

Clasa Efectiv Indice de nivel

43 15 19 2 0.00138

44 11 9 2 0.00158

45 6 33 2 0.00164

46 32 41 2 0.00166

47 13 4 2 0.00201

48 43 12 3 0.00249

49 30 1 2 0.00280

50 10 36 2 0.00441

51 38 21 2 0.00552

52 7 39 2 0.00581

53 22 18 2 0.00609

54 50 34 3 0.00638

55 14 8 2 0.00848

56 5 26 2 0.00858

57 48 23 4 0.00882

58 51 45 4 0.00894

59 47 17 3 0.01055

60 35 29 2 0.01126

61 54 16 4 0.01246

62 24 28 2 0.01257

63 3 55 3 0.01332

64 37 56 3 0.01456

65 27 49 3 0.01532

66 46 2 3 0.01981

67 44 61 6 0.02056

68 62 59 5 0.02088

69 60 40 3 0.03427

70 52 58 6 0.03661

71 66 57 7 0.04090

72 68 31 6 0.04594

73 63 20 4 0.06148

74 25 67 7 0.06517

75 74 65 10 0.06708

76 73 64 7 0.12870

77 71 75 17 0.13918

78 69 70 9 0.18714

79 72 53 8 0.26597

80 76 79 15 0.29956

81 78 77 26 0.36962

82 80 81 41 1.01791

83 42 82 42 2.01255

Numerele de identificare ale claselor inițiale:

1 2 3 4 5 6 7 8 9 10 11 12 13

alba olt mehe damb sibi tele buza brai cara ilfo ialo cala giur

14 15 16 17 18 19 20 21 22 23 24 25 26

cova arad vran satu sala bist harg tulc vasl boto valc neam suce

27 28 29 30 31 32 33 34 35 36 37 38 39

gala hune prah dolj baca cluj mure iasi mara biho timi gorj bras

40 41 42

cons arge bucu

Reprezentarea grafică a clasificării ierarhice directe:

Din acest grafic se pot trage concluzii foarte importante privind repartiția teritorială a celor 5 indicatori, neuitând faptul că județele di aceeași grupă de bază prezintă caracteristici asemănătoare, deci, se confruntă cu aceleași probleme și se pot supune acelorași politici regionale specifice : Bucureștiul face notă aparte, valorile indicatorilor pentru capitală fiind foarte diferite de valorile pentru fiecare județ, se observă grupul județelor cu valori foarte bune ale indicatorilor (Argeș, Constanța, Brașov, Gorj). Acest grup se unește cu un alt grup în care deasemenea valorile indicatorilor aleși pentru analiză înregistrează valori ridicate (Timiș, Bihor, Maramureș). Urmează o grupă medie deasemenea formată din două subgrupe: prima are în componență județele Iași, Mureș, Cluj, Bacău, Dolj, Prahova, iar a doua Hunedoara și Galați. Urmează grupele județelor în care valorile indicatorilor sunt sub medie: grupa județelor din Moldova (Botoșani, Suceava, Vaslui, Neamț) la care se adaugă Vâlcea, Tulcea, Harghita, Sălaj, Bistrița-Năsăud, restul județelor împărțindu-se în două grupe a căror componență se observă în grafic.

Această clasificare nu scoate în evidență clar grupele de județe cu diferite valori ale indicatorilor aleși pentru analiză. În acest scop este mai adecvată gruparea în 5 grupe astfel încât, în planul celor două componente principale să apară, împreună cu cei cinci indicatori, cele 42 de județe grupate corespunzător. Este interesant de comparat indicatorii statistici pentru cele 5 grupe precum și analiza componenței fiecărei grupe.

Caracterizarea statistică a indicatorilor în cele cinci clase:

1 . populația totala

–––––-+––––+––––––––-+–––––––+

| CLASA | EFECTIV | MEDIA ABATEREA MEDIE| MINIM MAXIM |

+–––––+––––+––––––––-+–––––––+

| CLASSE 1 / 5 | 16 | 438.219 122.622 | 231.872 692.645 |

| CLASSE 2 / 5 | 12 | 390.387 98.415 | 261.040 584.780 |

| CLASSE 3 / 5 | 7 | 747.139 77.912 | 604.263 868.099 |

| CLASSE 4 / 5 | 6 | 607.372 111.641 | 396.990 747.122 |

| CLASSE 5 / 5 | 1 | 2037.280 0.000 | 2037.280 2037.280 |

+–––––––––-+––––––––-+–––––––+

| TOTAL | 42 | 538.277 287.756 | 231.872 2037.28 |

+–––––+––––+––––––––-+–––––––+

2 . populația ocupata

+–––––+––––-+––––––––-+–––––––+

| CLASA | EFECTIV | MEDIA ABATERA MEDIE | MINIM MAXIM |

+–––––+––––-+––––––––-+–––––––+

| CLASSE 1 / 5 | 16 | 184.113 55.544 | 97.700 300.700 |

| CLASSE 2 / 5 | 12 | 157.175 39.018 | 109.100 237.000 |

| CLASSE 3 / 5 | 7 | 309.971 31.531 | 263.500 364.400 |

| CLASSE 4 / 5 | 6 | 262.783 38.558 | 187.100 302.800 |

| CLASSE 5 / 5 | 1 | 800.600 0.000 | 800.600 800.600 |

+–––––+––––-+––––––––-+–––––––+

| TOTAL | 42 | 223.309 115.033 | 97.700 800.60O |

+–––––+––––-+––––––––-+–––––––+

3 . nr. de salariați

+–––––+––––+––––––––-+––––––-+

| CLASA | EFECTIV | MEDIA ABATEREA MEDIE | MINIM MAXIM |

+–––––+––––+––––––––-+––––––-+

| CLASSE 1 / 5 | 16 | 72.375 26.301 | 33.000 134.000 |

| CLASSE 2 / 5 | 12 | 60.833 14.017 | 43.000 89.000 |

| CLASSE 3 / 5 | 7 | 133.286 28.192 | 101.000 184.000 |

| CLASSE 4 / 5 | 6 | 139.667 18.154 | 102.000 159.000 |

| CLASSE 5 / 5 | 1 | 434.000 0.000 | 434.000 434.000 |

+–––––+––––+––––––––-+––––––-+

| TOTAL | 42 | 97.452 65.477 | 33.000 434.000 |

+–––––+––––+––––––––-+––––––-+

4 . rata șomajului

+–––––+––––+––––––––-+––––––-+

| CLASA | EFECTIV | MEDIA ABATEREA MEDIE | MINIM MAXIM |

+–––––+––––+––––––––-+––––––-+

| CLASSE 1 / 5 | 16 | 4.650 1.397 | 2.500 7.000 |

| CLASSE 2 / 5 | 12 | 9.242 1.792 | 7.600 13.100 |

| CLASSE 3 / 5 | 7 | 8.114 1.565 | 5.500 11.100 |

| CLASSE 4 / 5 | 6 | 6.233 3.008 | 2.300 10.800 |

| CLASSE 5 / 5 | 1 | 3.400 0.000 | 3.400 3.400 |

+–––––+––––+––––––––-+––––––-+

| TOTA | 42 | 6.736 2.726 | 2.300 13.100 |

+–––––+––––+––––––––-+––––––-+

5 . salariul mediu net

+–––––+––––+––––––––-+––––––-+

| CLASA | EFECTIV | MEDIA ABATEREA MEDIE | MINIM MAXIM |

+–––––+––––+––––––––-+––––––-+

| CLASSE 1 / 5 | 16 | 297410.156 18422.646 | 268479 328670 |

| CLASSE 2 / 5 | 12 | 289729.750 27792.865 | 249355 351250 |

| CLASSE 3 / 5 | 7 | 302347.594 14807.678 | 282194 319996 |

| CLASSE 4 / 5 | 6 | 376086.500 18068.264 | 341671 400745 |

| CLASSE 5 / 5 | 1 | 363485.000 0.000 | 363485 363485 |

+–––––+––––+––––––––-+––––––-+

| TOTAL | 42 | 308851.312 36213.520 | 249355 400745 |

+–––––+––––+––––––––-+––––––-+

Sugestivă este și reprezentarea grafică a claselor:

Se observă, din graficul anterior, componența celor cinci grupe de județe în funcție de cele două variabile artificiale construite în etapa analizei în conponente principale:

1.Grupa județelor cu rate ridicate ale șomajului și nivel scăzut al salarizării are următoarea componență: Neamț, Vâlcea, Botoșani, Vaslui, Tulcea, Bistrița-Năsăud, Buzău, Harghita, Ilfov, Sălaj, Brăila, Suceava. Putem aprecia pentru această grupă un nivel al dezvoltării scăzut, cu o corelație inversă privitoare la rata șomajului și nivelul salarizării. Rezultă patru zone geografice cu probleme: nordul Moldovei (Neamț, Botoșani, Suceava, Vaslui); estul României (Buzău, Brăila, Tulcea); Oltenia (Vâlcea); centrul Transilvaniei (Bistrița-Năsăud, Harghita, Sălaj). Pentru aceste zone este necesară aplicarea de politici specifice antișomaj.

2. Grupa județelor cu dezvoltare medie, în care rata șomajului și nivelul salarizării sunt apropiate de media pe țară este compusă din: Dîmbovița, Teleorman, Satu Mare, Ialomița, Alba, Sibiu, Olt, Giurgiu, Călărași, Covasna, Mehedinți, Caraș-Severin, Arad, Maramureș.

3. Grupa județelor cu nivele înalte ale salarizării și rate mici ale neocupării forței de muncă; în această grupă sunt cuprinse județele cu gradul cel mai înalt de dezvoltare: Argeș, Brașov, Timiș, Constanța, Prahova, Bihor, Maramureș, Gorj. Pentru aceste județe se poate aprecia o bună dezvoltare din punctul de vedere al forței de muncă, media ratei fiind de 6,23% iar media salariului net 376.086 lei, cea mai ridicata dintre cele cinci grupe.

4. Grupa județelor cu nivel înalt al salarizării dar și cu rate ridicate al șomajului are în componență: Prahova, Galați, Dolj, Bacău, Mureș, Hunedoara, Iași. Aceste județe au o bună dezvoltare industrială, unele dintre ele fiind puternice centre siderurgice (Galați, Hunedoara), județe cu urbanizare puternică (Bacău, Prahova) sau centre regionale de tradiție (Dolj, Iași, Mureș).

5. Ultima grupă este formată din municipiul București, care are valori ale populației totale, populației ocupate și numărului de salariați atipice celorlalte județe. Caracterul său special, capitala țării, face imposibilă realizarea de comparații cu alte zone. Totuși în ceea ce privește rata șomajului Bucureștiul se poate încadra între județele cu rate scăzute, iar din punct de vedere al salarizării nivelul pentru bucurești este chiar mai mic decât cel înregistrat în grupa județelor dezvoltate.

Această analiză conduce la următoarele concluzii: este neapărat necesară aplicarea unor politici regionale coerente pentru o cât mai bună uniformizare a valorilor indicatorilor forței de muncă în sensul ridicării nivelului în zonele mai puțin dezvoltate pentru evitarea unei puternice migrații a forței de muncă. Totodată este necesară o grupare a județelor în jurul unor centre puternic dezvoltate, formându-se astfel mai multe zone de dezvoltare, cu fonduri și administrare proprii. Se creează astfel premisele unei descentralizări și unei mai bune gestionări a problemelor locale.

Similar Posts