Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste [604530]

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

140
CAPITOLUL IV
CERCETAREA PEDAGOGICĂ

IV.1. ELEMENTE DE STATISTICĂ DESCRIPTIVĂ

Statistica este știința care se ocupă cu colectarea, analiza și interpretarea datelor cu privire
la un anumit fenomen, precum și cu formularea unor previziuni în ceea ce privește comporta mentul
viitor al acestuia. Ea este cea mai recomandată și exactă metodă de interpretare a fenomenelor de
masă, cu multiple posibile legături cauzale, unde legitatea se manifestă și se poate observa prin
consecințele unui număr mare de fapte luate în studiu.
Extragerea de informații statistice , din multitudinea de date , constă în prezentarea
descriptivă a acestora , atât prin calculul indicatorilor statistici , cât și prin realizarea distribu ției de
frecvență.

IV.1.1. Tipuri de variabile

Variabila este o caracteristică sau un atribut măsurabil, care diferă de la element la elemen t
printr -o variație intrinsecă, ea putându -și schimba valoarea în timp și/sau spațiu sub influența
diferitelor condiționări. Dacă nu ar exista această dispersie sau variație a datelor , rezultatul
experiențelor, fenomenelor sau proceselor ar fi exprimat înt r-o formă punctuală , iar aplicația
statistică nu ar mai avea sens.
Există două tipuri de variabile (date) ce definesc natura informației: calitative și
cantitative .
Datele de tip calitativ sunt cunoscute și sub numele de variabile categoriale sau
atributive . Valorile acestora variază ca sortiment, categorie sau clasă, și nu prin mărime, drept
urmare nu se poate realiza o ordonare între valorile acestor tipuri de date. De exemplu, putem
studia preferința fiecărei persoane asupra unei culori dintr -o paletă dată. Nu putem găsi o legătură
de tipul roșu este mai mic decât albastru .
Pentru a măsura o variabilă de tip categorial se folosesc scale nominale . Acestea vor defini
grupurile sau categoriile existente prin alocarea unor nume. Nefiind informație de tip cantitativ ,
este imposibil de realizat ordonarea acestora.
Datele sau variabilele de tip cantitativ se caracterizează prin variație în m ărime , de la
element la element. Astfel, acestea pot fi ordonate și relații de genul mai mic sau mai mare au se ns

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

141
în acest context. După tipul pasului de evaluare a relației mai mare sau mai mic , putem împărți
variabilele cantitative în discrete și continue .
O variabilă discretă poate lua valori numărabile sau izolate, cum ar fi: numărul de not e de
10 la examenul de admitere sau numărul de nou născuți într -o zi la o maternitate .
O variabilă de tip continuu poate lua orice valoare dintr -un interval definit. Spre exemplu
temperatura, valoarea presiunii arteriale, sau înălțimea unei persoane au valori de tip continu u.
Evident, precizia de măsurare depinde de utilitatea informației, astfel încât putem considera că
valoarea măsurată cu o exactitate de o zecimală este suficientă în exprimarea temperaturii, folosind
scara Celsius.
După legătura existentă între variabile , acestea se împart în dependente și independente .
Variabile independente (sau factori ) sunt de obicei în cadrul studiilor manipulate de
cercetător. Prin modificarea valorilor acestora, ca urmare a cauzalităților existente, se modifică și
variabilele dependente . Spre exemplu doza folosită pentru aplicarea unui anumit tratament este
variabila independentă , iar efectul severității maladiei este cea dependentă. Variabila independentă
este aceea ce se poate modifica de specialist, doctor, farmacist, iar va riabila dependentă este efectul
sau rezultatul urmărit.

IV.1.2. Reprezentarea datelor statistice

Datele obținute în urma efectuării experimentelor urmează a fi supuse analizei conform
metodelor statisticii. Aceste date se culeg , în general , dintr -o popu lație statistică sau colectivitate
statistică. Elementele populației sunt numite unități statistice sau indivizi. Dintr -o populație ne
interesează o trăsătură comună a indivizilor, numită variabilă sau caracteristică .
În general, informațiile care se culeg sunt numai de la o parte din indivizii care formează
entitatea statistică, și nu de la întreaga populație. Aceasta este o cercetare selectivă. Astfel de
indivizi formează eșantionul sau selecția de lucru .
O formă simplă de a obține informații re feritoare la populație din datele de pe eșantioane
este oferită de metodele statisticii descriptive . Aceasta implică culegerea datelor, prezentarea lor
sub formă de tabele sintetice sau analitice , întocmirea unor reprezentări grafice precum
histogramele și calculul indicatorilor statistici. Crearea tabelelor și a graficelor ajută la o
interpretare mai ușoară a datelor.
Prelucrarea statistică reprezintă sistematizarea preliminară a datelor statistice pe
colectivitatea generală, cât și pe unitățile statistice componente, inclusiv stabilirea mărimilor
indicatorilor absoluți și derivați, dar și reliefarea rezultatelor statistice obținute.

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

142
Așadar, etapele prelucrării statistice sunt: centralizarea, gruparea datelor, calculul
indicatorilor absoluți, cuantificarea indicatorilor derivați, prezentarea rezultatelor sub forma
tabelelor, graficelor și a seriilor statistice.

Gruparea reprezintă sistematizarea datelor după o variabilă (caracteristică) numerică. În
funcție de tipul variabilei de grupare (discretă sau cont inuă) și de plaja valorilor pe care le poate
lua caracteristica, gruparea se poate face:
– pe variante (atunci când grupăm datele după o variabilă discretă sau când plaja valorilor pe
care le poate lua caracteristica nu este foarte mare);
– pe intervale de v ariație (atunci când sistematizăm datele după o variabilă continuă, care are
o plajă largă de valori).
a) Gruparea datelor statistice pe variante
În acest caz, se va forma un număr de grupe egal cu numărul de variante. Prin numărarea
unităților incluse în fiecare grupă se obține frecvența grupei (numită și frecvență absolută).
b) Gruparea pe intervale de variație
Se poate efectua pe intervale de mărime egală sau diferită. În continuare vom trata numai
cazul grupării datelor statistice pe intervale egale de variație. Pentru realizarea grupării pe intervale
egale de variație se recomandă parcurgerea următorilor pași:
– se determină amplitudinea va riației caracteristic ii, ca diferență între valoarea
maximă și valoarea minimă a caracteristicii :
max min A X X=−

– se stabilește numărul de grupe :
În acest caz pot exista două situații:
• numărul de grupe (r) este prestabilit, pe baza experienței căpătate din studii anterioare
asupra domeniului de interes ;
• numărul de grupe (r) nu este prestabilit , caz în care, dacă unitățile se repartizează
aproximativ normal după caracteristica studiată, pentru determinarea numărul ui de
grupe se poate utiliza relația lui H. Sturges :
1 3,322 lnrn= + 
, unde n este numărul total de unități ale colectivității .
Este recomandat a se folosi un număr potrivit de grupe (de regulă între 4 și 10). Utilizarea
unui număr prea mare ar duce la fărâmi țarea excesivă a colectivității, iar un număr prea mic ar
putea să nu pună în evidență principalele tipuri calitative ale populației după variabila urmărită).
– se determină mărimea intervalului de grupare (h), ca raport între amplitudinea
caracteristicii și numărul de grupe:

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

143

Ahr=
Pentru ușurarea calculelor, se recomandă a se folosi mărimi rotunjite de interval, de aceea,
dacă valoarea reieșită din calcul este fracționară, cu mai multe zecimale, ea se poate rotunji prin
adaos la o va loare imediat super ioară, aleasă în mod convenabil .

– se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora :
()min min
min min
min min2
………………………………….
1X X h
X h X h
X r h X rh−+
+ − + 
+ − − +

Limitele intervalelor vor avea același grad de precizie ca și datele grupate (același număr
de zecimale), primul interval putând începe chiar de la valoarea minimă a caracteristicii sau de la
o valoare ușor inferioară acesteia, aleasă în mod convenabil. Este bine să nu existe suprapuneri de
limite, astfel încât la efectuarea grupării să poa tă fi respectată condiția de unicitate.
– Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului următor,
intervalele se numesc continue ;
– Dacă între limita superioară a unui interval și limita inferioară a intervalului urm ător
există o diferență de o unitate întreagă sau zecimală, intervalele se numesc discontinue sau
discrete.
Pentru a reprezenta datele sub o formă mai restrânsă se folosește gruparea acestora într -un
tabel cu două coloane pentru fiecare variabilă de inter es. În prima coloană se trece intervalul
variabilei de studiu, iar în a doua se trece numărul de apariții al acesteia în acel interval. Intervalele
trebuie să fie disjuncte și consecutive, astfel încât de la valoarea minimă până la valoarea maximă
să fie a coperită toată plaja de valori. Seria de distribuție de frecvențe unidimensională reprezintă
o serie în care primul șir cuprinde variantele/valorile sau intervalele de variație ale unei variabile,
iar al doilea șir – frecvențele de apariție ale variantelor sau volumul grupelor.
Centrul intervalului este determinat ca medie aritmetică simplă a limitelor intervalului și
este considerat reprezentativ pentru datele din acel interval. Se determină cu una din relațiile:

inf sup
2ii
iXXX+= sau
inf
2i
iihXX=+
unde:

ih este mărimea intervalului;

inf
iX și
sup
iX reprezintă limita inferioară, respectiv superioară a intervalului de variație ;

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

144

, 1,iX i r= sunt centrele intervalelor de variație.

Frecvența absolută a grupei este egală cu numărul de unități statistice care au valoarea
caracteristicii mai mare (sau egală) cu limita inferioară a intervalului și mai mică (sau egală) cu
limita superioară a acest uia. Suma frecvențelor absolute este notată cu n și reprezintă numărul total
de unități sau volumul eșantionului.

1r
i
inn
==
Frecvența relativă a unei grupe reprezintă ponderea unităților statistice în volu mul total
al colectivității care au valoarea caracteristicii cuprinsă între limita inferioară și cea superioară a
grupei respective. Se determină ca raport între frecvența absolută a grupei și volumul eșantionului
(eventual înmulțit cu 100).
1ii
i r
i
innnnn
===

, unde
()1,in i r= sunt frecvențele de apariție ale variantei
iX și se exprimă în
coeficienți, sau
%
1100 100ii
i r
i
innnnn
==  = 
 și se exprimă în procente.
Suma frecvențelor relative este 1 sau 100, după cum sunt exprimate , în coeficienți sau în procente :
11r
i
in
==
sau
%
1100r
i
in
==
Frecvențele absolute și relative oferă o imagine de ansamblu asupra tendinței de distribuție
a valorilor în colectivitate, asupra normalității, sime triei ori asimetriei repartiției de frecvențe.

IV.1.3. Indicatori i statistici

Extragerea și obținerea de informații dintr -un set de date se realizează în prima etapă prin
calculul indicatorilor statistici, realizând u-se o formă descriptivă a cunoștințel or. Tot în această
etapă de lucru, reprezentarea repartiției de frecvențe poate aduce informații suplimentare asupra
tipului de distribuție .
În studiul distribuției de frecvențe a caracteristicii unei populații se observă o tendință de
variație cu două as pecte:
1 – de localizare (de poziție );
2 – de împrăștiere (de variație ).

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

145
Analiza cantitativă care să permită evaluări și comparații din punct de vedere al localizării
sau al împrăștierii datelor se poate efectua numai cu ajutorul indicatorilor statistici . Aceștia
exprimă numeric pe baza valorilor de studiu, fie localizarea, fie variația datelor.
Media deține un rol important, și anume acela de a sintetiza într -o singură expresie
numerică valorile individuale înregistrate pentru variabilele statistice cercetate, astfel încât să fie
posibilă substituirea acestora.

Indicatori de localizare sau de poziție
• Media aritmetică (simplă)
Este indicatorul de bază al tendinței de localizare. Considerăm șirul de date x1, x2, …,x n.
Media aritmetică se notează cu 𝑋 sau M(x) .

• Media aritmetică ponderată
Dacă avem frecvențele absolute a1, a2, … , a m corespunzătoare valorilor x1, x2,…., xm,
atunci media se poate calcula conform formulei:

• Media aritmetică ajustată
În situația în care avem posibile valor i eronate apropiate de extrema minimă , respectiv
maximă, este indicat să se folosească media aritmetică ajustată. Aceasta se va calcula folosind din
datele inițiale doar un procent de 90% sau 80%. Practic valorile extreme vor fi eli minate în
proporția dorită. Spre exemplu, d acă alegem să lucrăm cu 90% din volumul de date, atunci 5% ,
reprezentând valorile cele mai mici , și 5%, reprezentând valorile cele mai mari , vor fi eliminate
din calcul.
• Media armonică
Se utilizează în calculul v alorii medii pentru mai multe mărimi relative . Valoarea reciprocă
(inversă) a mediei armonice este media reciprocelor valorilor din lot. Pentru șirul de valori x1, x2,
x3, … , x n se notează cu MH media armonică. Formula de calcul este:

Îndrumar Bacalaureat la Informatică – Structurare, sugestii metodologice și teste

146

cu condiția xi ≠ 0 .

• Media geometrică
Se utilizează în calculul coeficienților de creștere medie a valorilor unei serii cronologice
logaritmice, sau a seriilor cu creștere progresivă (cu rație crescătoare). De exemplu, se folosește
în calculul ritmului mediu de creș tere anuală sau în dinamica sporului natural al populației.
Media ge ometrică a unui șir de valori x1, x2, x3, … , x n se notează de obicei cu
GM și se
calculează cu formula:

• Media pătratică
Fie șirul de valori x1, x2, x3, … , x n. Media pătratică se notează MP și se calculează cu
formula (radical din media pătratelor valorilor):

• Mediana
Notăm valorile unui șir cu x1, x2, x3, … , x n. Suplimentar, acest șir trebuie să fie ordonat.
Valoarea c are ocupă locul central (este independentă de tipul de ordonare crescătoare sau
descrescătoare) se numește mediană și se notează cu Me.
Dacă șirul are un număr impar de valori, adică n = 2 ⋅k+1, avem :

Dacă șirul are un număr par de valori, deci n = 2⋅k, cal culăm mediana cu formula:

Mediana este un indicator puternic, ea fiind mai puțin influențată de valorile extreme
(asemănător mediei a ritmetice ajustate) și este mai stabilă la fluctuațiile de selecție.

Similar Posts