Program de Sintetizare a Vocii

CUPRINS

=== DIPLOM ===

CUPRINS

INTRODUCERE

În lucrare dată am reprezentat mai multe metode de sinteză a semnalului vocal, analizîndu-le concomitent, și am observat că predicția liniară reprezintă una din cele mai efective metode de analiză și sintetizare a semnalului vocal. Această metodă devine domonantă la determinarea parametrilor de bază a semnalului vocal, așa cum, de exemplu, este perioada tonului principal, formanții, spectrul, funcția ariei tractului vocal, și deasemenia la reperezentarea prescurtată a vorbirii cu scopul transmiterii ei cu viteză joasă și păstrării econome. Importanța metodei este determinată de precizia înaltă a rezultatelor obținute și simplității relative a calculelor.

Ideile de bază a metodei predicției liniare se combină bine cu modelul producerii vorbirii, deoarice semnalul vocal poate fi reprezentat sub forma unui semnal la ieșirea sistemului liniar cu parametri variabili în timp, excitat cu impulsuri cvaziperiodice sau zgomot. Metoda predicției liniare permite aprecierea precisă și sigură a parametrilor acestui sistem liniar cu coeficienți variabili.

Tehnologia de sintetizare a vocii va fi foarte utilă în domeniile în care se simte necesitatea unei atenții sporite de la personal, pentru studierea limbilor străine, pentru elaborarea unor interfețe între calculator și utilizator asemănător dialogului om-om, această implementare va fi foarte bine apreciată de utilizatorii cu vedere slabă sau orbi, mai ales dacă se ia în considerație faptul că programul nu necesită cerințe foarte mari pentru hard și soft.

Programul va funcționa foarte bine pe un calculator ce dispune de un procesor 486/33 (DX sau SX) sau mai performant; memoria operativă necesară este de un 1MB; o cartelă audio de tip Sound BlasterTM, ESS Tehnology, care sunt compatibile cu sistemul audio Microsoft Windows; sistemul de operare Windows 95, Windows NT 4.0 sau mai superioare.

Deci dincele expuse mai sus reese, că în prezent pentru a obține un rezultat cît mai bun în crearea unui sintetizor al semnalului vocal alegerea cea mai bună ar fi metoda de predicție liniară.

1. PRODUCEREA VORBIRII

1.1 Bazele fiziologice ale producerii vorbirii naturale

Vorbirea este un produs al aparamtului fonator uman, coordonat de aparatul cerebral. Trebuie remarcat faptul că aparatul fonator nu este un aparat special al omului destinat acestui scop, ci este vorba de adaptarea la aceasta funcție a unor organe care, de fapt, erau inițal și rămăn destinate altor scopuri, dar s-au transformat și specializat permanent, prin educație, în decursul evoluției speciei umane, preluănd astfel și funcția de producere al vorbirii. Aparatul fonator uman (figura 1) este compins din plămăni, laringe, faringe, cavitatea bucală și cavitatea nazală.

Fig.1 Reprezentarea simplificată a aparatului fonalor uman

În zona centrală a laringelui se găsesc, sub forma unor lamele elastice, corzile vocale, în număr de două perechi, una inferioară și una superioară. Între corzi se formează o cavitate numită glotă, a cărei dimensiune poate fi modificată prin intermediul mișcării corzilor vocale.

Dintre cele două perechi de corzi vocale, cele inferioare au o elasticitate mult mai mare și sunt esențiale în producerea vorbirii. Sistemul central comanda prin intermediul nervilor mișcarea corzilor vocale, punăndu-le în vibrație prin intermediul unor contracții, în acest mod se poate mări sau micșora dimensiunea glotei, realizăndu-se o modulare a debitului fluxului de aer care o străbate.

Vorbirea se produce în faza de expirație a aerului. Volumul de aer expulzat din plămăni trece prin glotă, a cărei dimensiune este reglabită prin intermediul corzilor vocale și apoi prin cavitățile supraglotice (faringe, cavitatea bucală și nazala), fiind expulzat în exterior prin gura și nări.

Cavitățile bucală și cea nazală mai sunt si cunosrute sub denumirea de tract vocal și tract nazal. Dintre cele două cavirăți: bucală și nazală, cea bucală este fundamentală pentru producerea vorbirii și, în cadrul acesteia, un rol esențial îl au pozițiile așa numitelor organe articulatorii, reprezentate prin limbă și maxilarul inferior, care, fiind mobile, pot da o ainumită conformație de volum cavității, corespunzătoare unui anumit sunet de vorbire.

Trebuie remarcată și importanța elementelor fixe din cadrul acestei cavități (dinții, maxilarul superior) a căror lipsă sau deformare pot influența producerea vorbirii. În acest sens, se cunoaște că lipsa unor dinti sau deformarea maxilarului superior (de exemplu: buză de iepure) provoacă deformarea vorbirii. Cavitatea nazală are o configurație fixă, din care motiv rolul ei este secundar, comparativ cu cel al cavității bucale și anume ea participînd doar la producerea unui număr redus de sunete (consoanele nazale: m; n). Acesul în areastă cavitate poate fi admis sau blocat prin intermediul unei terminații mobile a osului palatal, ce desparte cavitatea bucală de cea nazală, nuimit vălul palatului.

1.2 Caracteristici fonetice si semantice ale sunetelor vorbirii

Sunetele vorbirii pot fi clasificate după diverse criterii, rezultînd aslfel diverse clasificări. Fonetica interpretează și clasifică sunetele unei limbi din punct de vedere articulator, adică în funcție de poziția organelor fonatoare și în special a celor de articulație, corespunzătoare sunetului respectiv. O primă clasificare a acestor sunete, esentială și în vederea naturii vorbirii sintetice, este legată de participarea corzilor vocale la prodncerea lor. După arest criteriu senetele limbii se împart în două mari categorii:

-sunete sonore (de exemplu: vocalele) — la producerea cărora participarea corzilor vocale este esențială;

-sunete nesonore (exemplu: consoanele surde) — la producerea cărora corzile vocale nu participă.

Exemple tipice de sunete sonore sunt vocalele și unile din consoane (consoanele sonore). In general, consoanele se pot clasifica în:

-consoane sonore, la produccrea cărora participă și corzile vocale și

-consoane nesonore (surde), la producerea cărora corzile vocale nu participă.

Prin partiriciparea corzilor vocale la producerea unui sunet se înțelege faptul că acestea vibrează, cauzănd astfel modificări ale dimeusiunilor glotei.

Fiecare categorie din tipurile de sunete prezentate se mai poate clasifica în funcție de poziția organelor de articulatie sau a altor organe din sistemul fonator. Este de remarcat faptul ca este posibil ca un sunet cu aceeași semnificație să fie pronunțat în mod diferit, existănd asifel variante ale aceluiași tip de sunet ce corespund unor clasificari fonetice diferite (exemplu: g' și g; k' și k din tabelul 1 b). Clasificarea sunetelor unei limbi, din punct de vedere fonetic, în vocale și consoane este caracteristică marii majoritați a limbilor de pe glob, în timp ce subclasificările acestor doua mari categorii pot diferi de la o limbă la alta. Poziția organelor articulalării este cea care, de regulă, asigură marea varietate a sunetelor unei limbi, precum și a diferitelor limbi, în general.

Pentru cazul limbii române o clasificare propusă de specialiști în fonetică este reprezentată în următorea tabelă:

Tab. 1(a)

Clasificarea fonetică a sunetelor limbii române

a. Vocale

Tab. 1(b)

b. Consoane

Analizănd, conform clasificării prezentate, sunetele vorbirii, se constată că, din punct de vedere al contribuției diferitelor organe ale aparatului fonator la producerea lor, se pot distinge căteva zone esențiale pentru producerea vorbirii. O primă zonă se află în laringe și mai exact în glotă. Această zonă este activă numai prin vibrația corzilor vocale numai în cazul sunetelor sonore (vocale și consoane sonore). O altă zonă este localizată în cavitatea bucală, într-un loc în care secțiunea transversală a sa se micșorează mult, prinlr-o poziționare corespunzătoare a organelor de articulație ce se găsesc aici (limba, vălul palatului, dinții și bnzele). Se produc în acest mod așa numitele consoane constructive (fricative), ca de exempln: „f ", „s", ,,ș". Acestea sunt consoane nesonore, la producerea cărora corzile vocale nu participă, ci rămîn în repaos, iar glota este deschisă, astfel că fluxul de aer furnizat de plamîni ajunge nemodificat practic pînă în această zonă, unde se produce o turbulență, a cărui efect sonor este sunetul fricativ.

A treia zonă imporlantă este situată de asemenea în cavitatea bucala, în apropierea orificiului biucal și are o contribuție esențială la procducerea consoanelor ocluzive (explozive) (p; b; f; d; etc.).

În această zonă se produce o închidere (ocluziune) tolală a tractului vocal. Corzile vocale rămăn în repaos iar fluxul de aer trece liber prin glotă pănă la locul în care s-a produs ocluziunea, unde se compresează atăt timp căt aceasta durează (»100 ms); după care se produce deschidereă bruscă a acestuia, eliberăndu-se aerul reținut și producăndu-se astfel sunetul respectiv, printr-un efect exploziv. De exemplu, la producerea sunetului „p" ocluziunea se produce chiar la nivelul buzelor, iar pentru sunetul „t" între limbă și maxilarul superior, pe partea posterioară a dinților. La consoanele sonore sunt active atăt zona laringeană căt și una din cele două zone bucale. Astfel. consoanele “b”, “d”, “g” sunt consoane ocluzive dar produse și cu participarea corzilor vocale.

Unele cousoane se produc prin obturarea cavității vocale și prin forțarea aerului, spre exterior, prin cavitatea nazală (consoane nazale: ,,m” și „n”).

La consoana “l”, obturarea tractului vocal se face prin lipirea limbii de cerul gurii, aerul fiind expulzat prin părțile laterale ale zonei de ocluziune. În sfîrșit, 1a producerea consoanei „r" ocluziunea nu este continuă, ci se produce prin vibrarea limbii.

Vocalele se pot clasifica și ele după loail de articulare a limbii față de mijlocul osului ce formează maxilarul superi (palatul) în:

— anterioare (prepalatale) („e", „i" );

— posterioare (postpalatale) („u", „o");

După gradul de deschidere a maxilarului la produceiea lor, vocalele se pot clasifica în:

— închise („i", „î", „ă", „u");

— mijlocii („e", „ă", „o");

— deschise („a").

In concluzie, fiecărui sunet vorbit îi este caracteristică o anumită pozitie a organelor articnlatorii din cavitatea bucală, precum și activarea sau neactivarea corzilor vocale.

Cunoașterea zonelor de articulație importante pentru producerea unui anumit sunet de vorbire, precum și participarea sau nu a corzilor vocale, este esențială în realizarea vorbirii sintetice. Astfel, se va vedea că în funcție de contribuția sau lipsa activității corzilor vocale depinde tipul sursei de excitații a sintetizoruliu, iar în funcție de poziția zonelor de artculație depind parametrii filtrelor sintedzorului.

Din punct de vedere semantic, un sunet elementar al unei limbi este denumit fonem. Fonemul poate fi definit, în realitate, ca o clasă de sunete ce au areeași semnificație în cadrul unei limbi. Acest mod de definire semnifică faptul că sunetele cu raracteristici fizice diferite pot avea aceeași semnificație în cadrul unei limbi. În acest sens, elementele inei clase de sunete, considcrate ca reprezentînd același fonem, se definesc prin termenul de alofon. Unui fonem îi corespunde o dasă de alofoni.

Existența alofonilor se datorează atît posibilităii de a pronunța un anumit fonem cru o anumită variatie a poziției organelor articulatorii, în cazul pronuntării sale izolate, căt și faptului că, în cadrul vorbirii fluente, caracteristicile fizice ale unui fonem, precedat, urmat, sau intercalat de alte foneme. diferă de cele ale aceluiași fonem pronunțat izolat. astfel, de exemplu, în cadrul cuvintelor „casă" și „creion", fonemul „c" va fi reprezentat prin alofoni diferiti, datorită fonemelor diferite care îi succed. Acest aspect este imponant pentru sinteza vorbirii, indicîănd faptul că, pentru a obține o calitate mai bună a vorbirii sintetizate, în cadrul sintetizoarelor bazate pe înregistrarea fonemelor, este necesară înregistrarea mai multor alofoni corespunzători aceluiași fonem.

Prin cuplarea a doi alofoni, pronunțați fluent, se obține un sunet compus numit difon. Pentru a realiza o bună sinteză, în radrul sintetizoarelor bazate pe înregistrarea de alofoni, se utilizează frecvent și înregististrarea de difoni.

Continuînd în același mod, se poate defini morfemul ca o succesiune de alofoni pronunțati fluent și care reprezintă o parte constitutivă, dotată cu sens, din componența unui cnvînt (de exemplu: silaba).

Mai multe morfeme pronunțate fluent formează cnvăntul, care are o senmificație semantică bine definită în cadrul unei limbi. În cazul unor sintetizoare bazate pe elemente de vorbire înregistrate, morfemul poate fi, de asemenea, luat în considerare ca unitate de bază în vederea sintezei. De exemplu, cuvintele „șase" și „șapte" pot fi sintetizate pe baza înregistrării morfemelor: „șa", „se" și „pte".

1.3 Caracteristici fizice ale sunetelor vorbirii

Experimental se constată că toate sunetele vorbirii pot fi individualizate în spațiul amplitudine – frecventă – timp, ceea ce înseamuă că o analiză a sunetelor vorbirii în aceste trei domenii pioate pune în evidență parametrii care să permită identificarea unui sunet de vorbire dintre mai multe. Trebuie remarcat că, din acest punct de.vedere, vocalele se deosebesc net de consoane, cauza principala ronstituind-o apotul corzilor vocale la producerea acestor sunete.

S-a văzut că, la producerea vocalelor o primă zonă importantă o constituie glota, ale cărei dimensiuni variază, datorită vibrației corzilor vocale, între obturare totală și deschidere maximă, ceea ce realizează o variație a debitului fluxului de aer care o străbate. Experimental s-a constatat că, independent de sunetul vocalic produs, forma semnalului ce reprezintă variația debitului de aer care stăbate în timp glota este aceeași, putănd fi aproximată cu un tren de impulsuri de formă aproximativ triunghiulară (figura 1.3).

Fig. 2 Forma de undă aproximativă a impulsurilor laringiene

Rezultă astfel că, la producerea vocalelor, corzile vocale strangulează aproape periodic fluxul de aer expulzat din plămăni,. Deoarece frecvența cu care se produce vibrația corzilor vocale nu este constantă în dimp, ea putănd varia în jurul unei valori medii (f0), în timpul vorbirii, funcția corespunzătoare semnalului din figura 2 nu este periodică, ci pseudoperiodică, ea putînd fi însă aproximată cu o funcție periodică de frecvență f0, corespunzatoare unei vorbiri uniforme, cu ton și tărie constante.

Analizănd spectrul trenurilor de impulsuri laringiene, se constată experimental că au un spectru discret, bogat în armonici, asemănator celui al impulsurilor triunghiulare, iar amplitudinea armonicilor superioare scade cu aproximativ 12 dB/octavă, corespunzător celui din figura 3 (pentru vocea bărbătească).

Frecvența fundamentală (f0) a funcției periodice ce aproximează funcția pseudoperiodică a impulsurilor laringiene se numește „ton fundamental" și caracterizează tonul vorbitorului. Valoarea ei depinde de dimensiunea glotei, care este în jur de 20 – 24 mm la bărbați și 19 -20 mm la femei.

O valoare medie a frecvenței tonului fundamental este de 100-150 Hz pentru bărbad, 200-300 Hz pentru femei și 350-500 Hz pentru copii. Deși variabilă în cursul vorbirii fluente, totuși gama de variatie a frecvenței tonului fundamental nu depășește o octavă. Din punct de vedere al sintezei vorbirii, frecvența tonului fundamental are o importanță deosebită, din două motive:

– semnalul rezultat din glotă se constituie ca un scmnal primar, supus unor modificări ulterioare pe restul traiectului vocal, pentru a produce sunetele sonore;

– prin variația frecvenței acestui semnal se poate varia tonul semnalului vorbit, putăndu-se obține astfel o voce de bărbat, femeie sau copil.

Considerănd pentru semnalul din fig.3 o bandă de frecvență de dimensiunea celei telefonice ( B= 300-3400 Hz), rezultă că trebuie luate în considerare un număr

. În cazul producerii sunetelor nesonore, corzile vocale nu vibrează, astfel încăt fluxul de aer ce ajunge în zonele de articulație din cavitatea bucală nu va fi modulat la trecerea prin glotă. Pentru acest tip de semnal, spectrul de frecvență nu mai este discret, ci continuu, asemănător celui al unui semnal de zgomot.

Rezultă, de aici, că pentru producerea sunetelor vorbirii este necesară o sursa primară de semnal care, în cazul sunetelor sonore, poate fi aproximată cu un tren de impulsuri periodice, de formă aproximativ triunghiulară, iar în cazul sunetelor nesonore cu un semnal avănd spectrul asemănător unui semnal de zgomot. Aceste observații vor fi urilizate în cadrul sintetizoarelor parametrice de vorbire la realizarea surselor de excitație. Totodată se remarcă necesitatea comutării uneia din cele două surse de semnal de exciiație, în funcție de tipul fonemului ce urmează a fi sintetizat (sonor sau nesonor).

Semnalul generat în zona glotei nu poate fi perceput direct, deoarece nu este în legătură directă cu exteriorul decăt prin intermediul cavității supraglotice, care constituie un ansamblu rezonator complex, ce actionează asupra spectrului acestui semnal. În funcție de frecvențele proprii de rezonanță ale acestor cavități, diferitele componente spectrale ale semnalului rezultat din laringe pot fi amplificate sau atenuate, rezultănd astfel o modificare în frecvență, deci și în timp, a formei acestui semnal. Deoarece tipul semnalului laringean este diferit pentru cele două tipuri fundamentale de foneme (sonore și nesonore), această diferență se va regăsi și la semnalele obținute după parcurgerea cavităților supraglotice.

Astfel, semnalele corespunzatoare vocalelor își vor păstra o variație cuasiperiodică în timp, iar spectrul lor va rămăne discret, pe cănd .consoanele își vor păstra un spectru continuu, cu o formă de variație în timp asemănătoare semnalelor aleatoare.

În figurile 4 și 5 sunt prezentate formele de variație, în timp și în frecvență, pentru două sunete de vorbire tipice (vocală și consoană), rezultate la ieșirea cavității bucale.

Aproximînd forma semnalului din fig. 4.a cu un semnal periodic, de perioadă T, se constată experimental că frecvența fundamentală a acestuia (f=1/T=f0) este chiar frecvența tonului fundamental al vorbitorului. Analizănd spectrul aceluiași semnal, se constată că pot fi evidențiate căteva valori extreme, constănd din maxime și minime.

Experimental s-a constatat că poziția și valorile acestor extreme sunt reprezentadve pentru o anumită vocală. Valorile maxime au primit denumirea de formanți, iar cele minime de antiformanți.

Fiecare valoare extremă de acest fel este caracterizată prin frecvența de apariție, amplitudinea și banda corespunzătoare unei reduceri de amplitudine cu 3 dB față de valoarea maximă.

In cadrul vocalelor, se pot pune în evidentă 45 formanți. S-a constatat experimental, prin filtrări adecvate, că, dintre aceștia, o importanță esențală pentru perceperea corectă a vocalei respeclive o au doar primii doi formanți și, în cazuri mai reduse, cel de-al treilea, ceilalți îmbunătățind doar calitatea sunetului respectiv și contribuind, mai ales, la redarea timbrului vorbitorului.

Din punct de vedere al sintezei vorbirii, acest fenomen este deosebit de important, el semnificănd că, în principiu, sunt necesari doar doi, sau cel mult trei formanți, reproduși corect, pentru a genera, prin sinteză, o anumită vocală. inteligibilă pentru un ascultător normal.

Deoarece, în realitate, frecvența tonului fundamental variază și ea, de la un vorbitor la altul sau chiar la același vorbitor, în decursul vorbirii, o creștere a acestuia va conduce la micșorarea perioadei semnalului din figura 4.a și la o deplasare spre dreapta a înfașurătorii spectrului din figura 4.b, iar, în cazul unei scăderi, evoluția mărimilor specificate va fi inversă. Din aceste considerente, rezultă că pentru fiecare vocală vor exista, de fapt, niște benzi de frecvență, corelate între ele, în care pot apare formanții corespunzători.

În tabelul 2 sunt specificate zonele medii de apariție ale primilor trei formanti pentru vocalele limbii romăne , iar în fig. 5. sunt prezentate formele de variație în timp și frecvență corespunzătoare unei consoane (m).

Tab.2

Tabel cu denumirile specifice valorilor medii ale primilor trei formanți corespimzători unor vocale ale limbii romăne.

Fig.5. Formele de variație în timp (a) și în frecvență (b) corespunzătoare consoanei „m"

O comparație între figurile 4 și 5 indică două concluzii importanle pentru sinteza vorbirii. Prima indică faptul că amplitudinea formei de variație în timp a vocalelor este mult mai mare (de regulă cel puțin dublă) ca cea a consoanelor. A doua indică faptul că formanții consoanelor sunt mai puțin pronunțați și distincți, comparativ cu cei ai vocalelor.

1.4. Modele mecanice și electrice ale producerii vorbirii

Teoria acustică a producerii vorbirii a fost fundamentată de G. Fant în jurul anului 1960 și completată ulterior de J.L. Flanagan, care au și elaborat și perfectionat principalele modele mecano-acustice și electrice ale organului fonator uman.

Astfel, într-o primă aproximare, din punct de vedere mecano-acustic, tractul vocal poate fi considerat ca un tub acustic ce are la un capăt glota și la celălalt gura. Caracteristic acestui tub este secțiunea variabilă, putănd fi și nulă în locurile în care organele de articulație strangulează tractul pentru producerea consoanelor ocluzive. În timpul vorbirii, organele de articulație se mișcă destul de lent, modificănd secțiunea transversală, atăt ca dimensiune, căt și ca formă, funcție de sunetele dorite a se pronunța. Lungimea acestui tract, la bărbați, este în jur de 17 cm, iar secțiunea sa maximă, este în jur de 20 cm2.

Cavitatea nazală este cuprinsă între vălul palatului și nări, avănd o lungime de aproximativ 12 cm, iar secțiunea este constantă și nemodificabilă. În timpul producerii sunetelor nazale, tractul nazal se conectează la cel vocal prin intermediul valului palatului. Cu aceste considerente, modelul mecanico-acustic al sistemului fonator uman poate fi considerat similar cu cel reprezentat în figura 6.

Fig. 6. Modelul mecano-acustic al organului fonator uman

Datorită presiunii Ps a aerului pompat de plămîni, aerul iese din glotă cu viteza VG. Dacă sunetul produs este un sunet sonor, atunci coardele vocale încep să vibreze, întrerupănd periodic fluxul de aer. Ele sunt reprezentate, în acest model, sub forma unui tren de impulsuri, cu un spectru larg de frecvențe, care ajunge în cavitatea bucală și, eventual, în cea nazală (pentru sunete nazale sonore), dacă vălul palatului deschide calea spre această cavitate. Datorită proprietăților rezonante ale celor două cavități, anumite zone ale spectrului (mai apropiate de frecvențele de rezonanță proprii ale celor două cavitați), vor fi amplificate, iar altele, mai depărtate, vor fi atenuate. Sunetul va căpăta astfel o anumită coloratură spectrală, care va fi radiată prin cele două cavități de legătură cu exteriorul, cu vitezele VB, respectiv VN.

Tubul acustic, considerat echivalent tractului vocal, reprezintă, de fapt, o linie acustică cu parametrii distribuiți, ce poate fi înlocuită printr-un sistem acustic echivalent, cu parametri concentrați, dacă numărul de elemente care compun sistemul este suficient de mare. Un astfel de element este format dintr-un tub cilindric, avănd lungimea egală cu lungimea porțiunii de tract pe care o aproximează și secțiunea constantă, egală cu secțiunea aceleiași porțiuni, sau cu valoarea ei medie.

Pe baza analogiilor existente între mărimile acustice și cele electrice, se cunoaște că un astfel de element acustic poate fi înlocuit, din punct de vedere mecano-acustic, printr-un sistem echivalent, format dintr-o celulă cuadripol de impedanțe în „T", conform figurii 7.

Fig. 7. Celulă acustică elementară (a) și echivalentul ei mecanic (b) și electric (c).

Știind că impedanța caracteristică a unui element acustic, ca cel reprezentat în figura 7.b, este dată de relația:

în care:

– este densitatea aerului;

c – viteza sunetului în aer;

S – secțiunea transversală a cilindrului;

se remarcă faptul că valoarea impedanței caracteristice depinde numai de secțiunea tubului. Impedanțele cuadripolului echivalent din figura 7.b sunt date de relațiile:

în care marimea , care intervine alături de lungimea l a elementului acustic, în funcțiile hiperbolice, reprezintă constanta de propagare acustică.

La răndul său, cuadripolului mecano-acusdc reprezentat în figura 7.b, i se poate asocia un cuadripol electric echivalent, ca cel din figura 7.c, cu următoarele corespondențe între parametri:

R — rezistența de pierderi datorate văscozității pereților tubului acustic;

L — inductanța dependentă de masa de aer conținută în cilindrul elementar;

G — conductanța datorată termoconductibilității pereților tubului acustic;

2. CODIFICÂRI ALE SEMNALULUI DE VORBIRE

2.1. Codificări în decursul producerii vorbirii

Studierea producerii și perceperii vorbirii se află la confluența mai multor discipline științifice, din care se pot menționa: acustica, fonetica, lingvistica, anatomia, filologia, psihologia, cibernetica. teoria transmisiunii informației, etc.

Vorbirea fiind o caracteristică specific umană, cercetările legate de mecanismele producerii și perceperii ei au contribuit. și la o mai bună cunoaștere a structurii umane.

Astfel s-a remarcat legătura fundamentală existentă între gândire și vorbire, vorbirea reprezentând cel mai important mijloc de a gândi și de a comunica gândurile, comparativ cu alte forme de gândire, mai puțin uzitate (imagini, sunete, senzații etc.

Analizând producerea vorbirii, de la stadiul de gând și până la cel de semnal acustic, se constată că, în cadrul acestui proces există mai multe etape de codificare, adică de trecere a informației ce reprezintă vorbirea dintr-o formă de semnal în alta. Conform cercetărilor interdisciplinare întreprinse în acest domeniu. etapele procesului de generare a vorbirii, de la stadiul de gând și până la cel de semnal sonor, pot fi exemplificate cu schema bloc din figura 8.

Aceleași cercetări au indicat că forma de transmitere a semnalului de vorbire pe traseul ilustrat în fig.8 este atât discretă, cât și continuă. Deși nu se cunoaște cu precizie mecanismul producerii gândirii în creier, o serie de experiențe de psihologie indică faptul că generarea vorbirii pare să se bazeze pe elemente discrete, similare fonemelor, cu care se alcătuiesc cuvintele. Majoritatea limbilor vorbite folosesc 30 până la 60 de foneme, cu care se poate alcătui întregul vocabular corespunzător limbii respective.

Fig.8 Schema bloc de generare a semnalului vorbit

Tot experimental s-a mai putut estima că numărul mediu de foneme produse pe secundă, în cursul unei vorbiri fluente, este în jur de 10. Prima translatare a semnalului de vorbire, furnizat de creier, are loc la nivelul conexiunii creier – nervi, semnalul cerebral fiind transformat în impulsuri electrice, care acționează sistemul nervos. O nouă translatare are loc la nivelul conexiunii nervi – mușchi, în care semnalul de vorbire trece dintr-o formă discretă într-una continuă, mișcarea mușchilor fiind mai lentă și însoțită de inerție, deci continuă. O altă translatare se produce la interfața mușchi – organe articulatorii, în care semnalul de vorbire, aflat într-o formă de variație continuă, se transmite în aceeași formă. Ultima translatare a semnalului de vorbire are loc prin acțiunea organelor articulatorii asupra fluxului de aer expulzat de plămâni, rezultând semnalul de vorbire sub forma acustică, tot continuă, care este radiat în exterior. Recapitulând, rezultă că semnalul de vorbire, de la stadiul de intenție cerebrală și până la cel de undă acustică, suferă 4 codificări succesive, primele două generând un semnal discret, iar ultimele două un semnal continuu.

Se pune astfel problema de a găsi o metodă pentru a compara cantitatea de informație a semnalului vorbit aflat în diferite forme de reprezentare (discretă sau continuă). în acest scop, s-a adoptat și în analiza semnalului vorbit o mărime caracteristică semnalelor reprezentate în formă digitală și anume debitul de informație, exprimat în biți/secundă. Mărimile analogice sunt echivalate cu cele digitale, considerând că sunt mai întâi discretizate și cuantificate digital. Pentru un anumit semnal analogic, debitul binar va depinde astfel atât de frecvența maximă de variație a acestuia, care impune frecvența de eșantionare, conform criteriului lui Nyquist, cât și de modul de cuantizare utilizat în cadrul tehnicii respective.

Pentru estimarea debitului binar al semnalului de vorbire, în diferitele sale forme de codificare se utilizează, de regulă. drept termen de comparație, debitul corespunzător semnalului reprezentat sub forma acustică, limitat în frecvență la 4 kHz și discretizat conform metodei de conversie a modulației impulsurilor în cod standard, cu o cuantificare a amplitudinii eșantioanelor pe 8 biți, adică același tip de conversie ca și cel utilizat frecvent în telefonia digitală și căruia u corespunde un debit de 64 kbiri/secundă.

Experiențe de psihofiziologie au indicat faptul că debitul informațional al semnalului de vorbire produs la nivelul creierului, deci corespunzător unei codificări fonemice, nu depășește 60 biți/secundă. Comparând acest debit cu cel rezultat din discretizarea formei acustice a semnalului vorbit prin metoda MIC standard, rezultă că pe parcursul codificărilor succesive, care urmează până la forma acustică, se adaugă o mare cantitate de informație, care, în esență, este redundantă. Această suplimentare se produce datorită modului specific de producere a vorbirii umane și este motivată de donă avantaje principale:

– sporește gradul de protecție a semnalului de vorbire la parcurgerea canalului de comunicație extern spre receptor;

– înglobează și informații cu privire la personalitatea vorbitorului.

S-a putut astfel constata, cu surprindere, că, pe lângă informații legate de identificarea vorbitorului (timbru, sex, vârstă, dialect, cultură, inteligență, etc.), vorbirea mai conține și informații cu privire la starea psihică, sau de oboseală, a acestuia. Pe aceste considerente, în aviație și în astronautică se utilizează metode de evaluare a stresului prin intermediul analizei vorbirii .

Revenind la codificarea primară a vorbirii (fonemică), aceasta pare a fi cea mai eficientă, privită prin prisma debitului binar redus pe care-1 necesită, remarcând că această vorbire nu va reda decât inteligibilitatea, cu o voce mecanică, puțin plăcută și obositoare la o audiție pe un timp mai îndelungat.

Trebuie făcută o distincție însă între codificarea vorbirii la nivel de foneme, în creier, și cea corespunzătoare formei acustice a acelorași foneme. Numai prima se caracterizează printr-un debit ce nu depășește 60 biți/secundă, cea de-a doua formă necesitând un debit substanțial sporit. Din punct de vedere a1 sintezei vorbirii, celor două cazuri le vor corespunde situații diferite. în primul caz, sinteza se va face pe baza unor comenzi, înregistrate codificat, ce acționează asupra sintetizorului, în timp ce, în cazul al doilea, sinteza, se va face pe baza unor foneme reprezentate sub formă acustică și înregistrate sub formă analogică, sau, mai ales digitală, pe un suport cu funcție de memorie, împreună cu un set de reguli de alcătuire a unităților lingvistice, plecând de la formele înregistrate.

Privite din punct de vedere al sintezei vorbirii, teoretic, toate etapele parcurse în elaborarea semnalului vorbit ar putea constitui obiective pentru sinteză și probabil că cel mai eficient sintetizor de vorbire ar fi cel care ar produce direct vorbirea, prin simularea fenomenelor ce au loc. în creier. Din considerente legate însă de necunoașterea exactă a acestor fenomene, precum și a dificultăților de ordin tehnologic, nu s-a reușit însă sinteza vorbirii decât plecând de la simularea organelor ce produc vorbirea sub forma acustică, sau prin generarea directă a acestei forme.

2.2. Codificări ale semnalului vorbit reprezentat în formă acustică

Codificarea semnalului vorbit reprezentat în formă acustică s-a impus inițial mai ales datorită dezvoltării telecomunicațiilor digitale, iar ulterior și datorită necesitații de a putea înregistra semnalul vorbit sub formă digitală. Din punct de vedere al sintezei vorbirii, codificarea acestui tip de semnal interesează în vederea înregistrării, sub formă digitală, a cuvintelor, a segmentelor de cuvinte, sau a unor parametri funcție de care se poate reconstitui apoi vorbirea în forma ei originală, sau într-o formă modificată, dar care să păstreze o parte din caracteristicile formei originale din care provine (inteligibilitate, timbru, etc.). Având în vedere necesitatea de a înregistra vorbirea, sub formă acustică, pe suport de informație, în scopul unei redări, sau prelucrări ulterioare, se pune și problema unei codificări optime din punct de vedere al volumului de memorie necesar pentru stocare. Aceeași problemă s-a pus inițial și în telecomunicații, urmărindu-se reducerea volumului semnalului rezultat în urma conversiei analog – digitale, pentru a putea fi transmis pe canale de telecomunicații cu capacități cît mai reduse și a permite astfel creșterea gradului de multiplexare a liniilor de transmisiuni. De aceea tehnicile optime de conversie puse la punct în cadrul acestor cercetări au fost preluate și pentru înregistrarea digitală a vorbirii.

Dintre acestea, cele mai importante și utilizate sunt metoda de conversie bazată pe modulația impulsurilor în cod, în varianta standard, cât și cea bazată pe modulația impulsurilor în cod, diferențială.

2.2.1. Conversia analog – digitală (numerică) a vorbirii, prin metoda modulației impulsurilor în cod (MIC)

Fiind elaborată, în principal, pentru a permite realizarea telecomunicațiilor digitale, metoda de conversie MIC a fost utilizată ulterior, și ca metodă de înregistrare a semnalelor sub formă digitală, cu aplicații importante și la înregistrarea semnalului vorbit. Interesul legat de dezvoltarea telecomunicațiilor a făcut ca tehnologia de realizare a conversiei analog digitale prin metoda MIC să progreseze rapid, astăzi existând deja numeroase circuite integrate specializate în acest tip de conversie. Se extinde totodată conversia asistată de microsisteme de calcul destinată achiziției ș prelucrării prin metode digitale a semnalelor analogice, pentru care s-ai dezvoltat de asemenea o gamă foarte diversă de circuite integrate specializau.

Schema bloc ce indică etapele de prelucrare caracteristice unei conversii analog – numerice prin metoda MIC este prezentată în figura 9.

Fig. 9. Schema bloc a unui sistem de conversie de tip MIC (codorul)

Filtrul trece jos, sau filtrul de gardă, are rolul de a limita spectrul semnalului analogic x(t) supus conversiei la o valoare determinată de valoarea frecvenței de eșantionare:

(2.1)

conform condiției lui Nyquist și teoremei lui Shannon, pentru a permite definirea completă a funcției de densitate spectrală X () prin eșantioanele sale {x(nT)}, așa cum rezultă din modelul matematic asociat aceste prelucrări .

Eșantionarea apare ca o metodă de reprezentare a semnalelor analogice printr-o succesiune de valori (eșantioane), considerate la momente discrete de timp (nT).Considerând exemplul ilustrativ din figura 10.

Fig.10 Exemplu de ilustrare a eșantionării

se poate considera că eșantionarea se realizează aplicând semnalul x (t) la intrarea unui comutator ce se închide la momentele t = nT, n N, în restul timpului acesta rămânând deschis.

Considerând ipoteza ideală, în care comutatorul funcționează instantaneu și durata închiderii sale momentane este infinit de mică, se poate dezvolta un model matematic potrivit căruia semnalul eșantionat se obține ca un produs între semnalul analogic x(t) și funcția delta periodică:

(2.2)

conform relației:

(2.3)

rezultând

(2.4)

unde x(nT) trebuie considerat, conform cazului ideal, ca o situație limită, caracterizată de relația:

(2.5)

iar semnalul eșantionat va fi format din mulțimea acestor eșantioane ideale:

(2.6)

Pentru a analiza transformarea în domeniul frecvență, corespunzătoare produsului dintre cele două semnale, se consideră funcția de densitate spectrală a semnalului eșantionat, obținută prin transformata Fourier (TF):

(2.7.)

care va fi dată de produsul de convoluție:

(2.8.)

și deoarece:

(2.9)

rezultă:

(2.10)

Inversând în relația precedentă ordinea de integrare și sumare se obține:

(2.11)

de unde rezultă:

(2.12)

relație ce pune în evidență faptul că funcția de densitate spectrală a semnalului eșantionat este o repetare periodică a funcției de densitate spectrală a semnalului neeșantionat , conform figurii 11.

Deoarece, prin transformata Fourier, unui semnal x(t) cu suport finit îi corespunde o funcție de densitate spectrală cu suport infinit, funcția se va obține prin sumarea funcțiilor , corespunzător liniei punctate.

Se observă însă că deoarece funcțiile translatate se suprapun, nu poate fi reconstituită în mod corect din , prin filtrare, nici una din componentele translatate din nefiind echivalentă cu semnalul inițial .

Pentru ca această extragere să se facă în mod corect se impune ca și funcția să fie cu suport fizic finit, adică:

(2.13)

Alegând în acest caz pentru pulsația de eșantionare o valoare:

(2.14)

echivalentă cu:

(2.15)

Fig. 11. Reprezentarea funcțiilor de densitate spectrală a semnalului inițial și a celui eșantionat pentru un semnal analogic x(t)

Pentru perioada de eșantionare, conform condiției lui Nyquist, semnalul analogic inițial x(t) se poate reconstitui prin filtrare din semnalul Xe(t), conform figurii 12. Rezultă de aici și rolul filtrului de gardă de a realiza un suport mărginit pentru funcția de densitate spectrală a semnalului analogic ce urmează a fi eșantionat.

Fig.12. Funcțiile de densitate spectrală ale semnalului inițial (a) și a celui eșantionat în cazul în care semnalul inițial are spectrul limitat () (b)

Recuperarea funcției din poate fi astfel modelată prin înmulțirea funcției cu funcția de transfer a unui filtru trece jos ideal:

(2.16)

și anume:

Fig.13 Reprezentarea funcțiilor H() si h(t) corespunzătoare reconstituirii semnalului inițial din cel eșantionat

(2.17)

Pentru a obține funcția de timp corespunzătoare funcției se aplică transformata Fourier inversă (TF-1 ) relației precedente:

(2.18)

unde:

(2.19)

Se regăsește astfel funcția:

(2.20)

conform figurii 2.6.

Ținând cont de expresia mărimii xe(t) dată de relația (2.4) în relația (2.18) se obține:

(2.21)

Inversând ordinea integrare – sumare, relația precedentă devine:

(2.22)

unde

(2.23)

Din relația precedentă se remarcă faptul că se poate obține funcția h(t), dată de relația 2.19, făcând n = 0:

(2.24)

care se numește funcție de interpolare, sau funcție eșantion și care se anulează în orice moment t = nT, cu n0. Se asigură astfel dependența fiecărui eșantion nT de o singură funcție hn(t), conform figurii 2.7.

Fig.14 Reconstituirea semnalului inițial x(t) din funcții eșantion hn(t)

Cum filtrul de gardă nu poate fi realizat sub formă ideală, blocarea componentelor în zona de tăiere nu va fi totală, fiind astfel necesar să se aleagă o frecvență de eșantionare superioară celei impuse de condiția lui Nyquist și anume:

(2.25)

conform figurii 11, din care se observă că semnalul inițial poate fi extras printr-o filtrare trece bandă în jurul frecvențelor k, sau printr-o filtrare trece jos, în jurul originii, cu condiția că răspunsul filtrului la un semnal de tip impuls să fie o funcție de forma h(t).

În cazul unui model real, eșantioanele nu vor avea o lungime infinit de mică, ci una finită și vor urmări forma de undă a semnalului eșantionat pe durata lor. Se poate modela și acest caz , utilizând funcția treaptă impuls dreptunghiular periodic, a cărei expresie pentru o perioadă este:

(2.26)

și a cărei reprezentare e redată în figura 15. Această funcție apare ca un purtător în impulsuri ce va modula semnalul analogic x(t), rezultând un semnal sun forma unor impulsuri modulate în amplitudine (MIA), conform relației:

(2.27)

Formele de undă ale semnalelor implicate în acest tip de modulație sunt reprezentate în figura 15.

Funcția de densitate spectrală a semnalului eșantionat va fi:

(2.28)

iar seria Fourier exponențială corespunzătoare semnalului u(t) este:

(2.29)

în care:

(2.30)

Fig.15 Forme de undă ale semnalelor la modulația impulsurilor în amplitudine (MIA) normală (N) și uniformă (U)

reprezintă frecvența funcției purtătoare, deci frecvența de eșantionare.

Funcția de densitate spectrală corespunzătoare semnalului purtător u(t) este:

(2.31)

Introducând funcția U(), din relația (2.31), în relația (2.28), se obține:

(2.32)

Relația (2.32) indică faptul că spectrul semnalului eșantionat (Xe) va fi tot o repetare periodică a spectrului semnalului continuu (X) ca și în cazul eșantionării ideale, dar la eșantionarea reală spectrele repetate vor mai avea toate aceeași amplitudine, ca la eșantionarea ideală (fig.2 5), ci fiecare spectru va fi ponderat cu un alt coeficient (sinc).

Spectrele repetate vor descrește astfel în amplitudine, având înfășurătoarea (sinc), conform figurii 2.9, în care s-au reprezentat spectrele semnalelor ce intervin în relația 2.27 pentru. un semnal x(t) filtrat cu un filtru trcce jos, cu frecventa de tăiere și eșantionat cu frecvența de eșantionare > 2.

Să remarcăm faptul că din spectrul semnalului eșantionat, amplitudinea cea mai mare o are spectrul situat în jurul originii, reieșind astfel ideea că cea mai avantajoasă reconstituire din punct de vedere al amplitudinii semnalului obținut se obține prin separarea acestei componente cu un filtru trece jos. De asemenea, datorită descreșterii amplitudinii semnalului rezultă că semnalul va avea o valoare neglijabilă la frecvențele mai înalte.

Fig.16 Funcțiile de densitate spectrală ale semnalului inițial, a purtătorului și a semnalului eșantionat

Se mai remarcă faptul că banda semnalului depinde de lățimea t a impulsurilor de eșantionare, fiind cu atât mai mare cu cât acesta e mai mică, și cu atât mai mică, cu cât acesta este mai mare. Deoarece creșterea duratei impulsurilor semnalului purtător nu poate fi mărită prea mult fără a pierde din informația semnalului analogic, rezultă că se impune un compromis pentru a se obține un optim al performanțelor din ambele puncte de vedere.

În cazul acestui tip de eșantionare, fiecare impuls al semnalului eșantionat are amplitudinea variabilă.

Se poate utiliza și situația în care amplitudinea fiecărui impuls al semnalului eșantionat rămâne constantă și egală cu valoarea semnalului analogic în momentul eșantionării (eșantionare cu reținere) (fig.2.8.d). Se demonstrează /15/ că spectrul semnalului eșantionat va fi dat în acest caz de relația:

(2.33)

Analizând relațiile (2.32) și (2.33) se constată că spectrul semnalului dat de relația (2.33)va fi similar, ca formă, celui dat de relația (2.32), dar în acest caz atenuarea (înfășurătoarea) acestui spectru va fi dată de o funcție ce depinde de frecventa semnalului analogic și care va avea ca efect distorsionarea semnalului prin așa numitul efect de apertură ce va fi cu atât mai pronunțat cu cât durata impulsurilor semnalului purtător (t) va fi mai mare.

2.2.1.1. Cuantizarea și codarea semnalelor eșantionate.

Prelucrarea numerică a semnalelor eșantionate impune discretizarea lor nu numai în domeniul timp, dar și în cel al amplitudinii, operație cunoscută sub denumirea de cuantizare. Prin cuantizare. domeniul total al amplitudinilor este divizat într-un num[r de valori discrete, numite cuante. Distanța (q) dintre două cuante vecine se numește pas de cuantizare. In cazul în care cuantizarea se face cu pas constant, ea se numește uniformă, sau liniară, iar în cazul în care acest pas variază funcție de anumiți parametri ai semnalului eșantionat altfel decât liniar, ea se numește neuniformă, sau neliniară.

În cadrul cuantizării uniforme, ca limită de decizie se consideră jumătatea intervalului cuprins între două cuante. Astfel unui semnal eșantionat xe(nT) având amplitudinea cuprinsă în intervalul de valori:

(2.34)

i se va atribui, prin cuantizare, valoarea rotunjită: kq.

In acest fel, prin cuantizare, se realizează în mod inerent o operație de distorsionare a semnalului în domeniul amplitudine, caracterizată prin eroarea de cuantizare (e), ce va fi minimă (nulă) atunci când amplitudinea eșantionului coincide cu o cuantă a domeniului de cuantizare și maximă atunci când aceeași amplitudine este situată la jumătatea dintre două cuante consecutive.

Această eroare poate fi considerată ca un zgomot adăugat semnalului eșantionat și care se numește zgomot de cuantizare. În figura 17.a sunt reprezentate curbele caracteristice cuantizării și zgomotului de cuantizare pentru cazul cuantizării uniforme.

Cuantizarea uniformă are dezavantajul că în cazul semnalelor de nivel mic, comparabile cu mărimea pasului de cuantizare, eroarea de cuantizare devine importantă și înrăutățește raportul semnal/zgomot al semnalului cuantizat. Totodată ea devine cu atât mai avantajoasă, cu cât semnalul supus cuantizării este mai mare, comparativ cu pasul de cuantizare, raportul semnal/zgomot reducându-și valoarea. Spre deosebire de un zgomot obișnuit, zgomotul de cuantizare nu poate exista decât în prezența semnalului eșantionat supus cuantizării, în absența acestuia fiind nul. Pentru a îmbunătăți raportul semnal/zgomot și pentru semnale mici, cum creșterea numărului treptelor de cuantizare este limitată tehnologic, se procedează la o cuantizare cu pas variabil, în care mărimea pasului de cuantizare este corelată cu amplitudinea semnalului eșantionat supus cuantizării. In acest mod, mărimea pasului de cuantizare va fi direct proporțională cu amplitudinea eșantionului supus cuantizării, fiind mai mică pentru amplitudini mici și mai mare pentru cele mari.

Fig.17. Caracteristica de transfer și de eroare pentru cuantizarea uniformă (a) și pentru cea neuniformă (b)

Se caută în acest mod ca în cadrul aceluiași număr de trepte de cuantizare să se mențină constantă mărimea raportului semnal/zgomot în tot domeniul de amplitudini, comparativ cu cazul cuantitării uniforme, în care acesta descrește cu creșterea amplitudinii eșantioanelor. Caracteristicile corespunzătoare acestui tip de cuantizare sunt indicate în figura 2.10.b.

Modificarea intervalelor de cuantizare, conform cuantizării neuniforme, este echivalentă cu aplicarea semnalului eșantionat, înainte de cuantizare, unui circuit compresor de dinamică, a cărui caracteristică de transfer este indicată în figura 18.a. Pentru a nu se distorsiona însă semnalul, este necesar ca la conversia inversă,

Fig.18 Caracteristici de transfer pentru un compresor (a) și un expandor (b) de dinamică

numeric – analogică, semnalul să fie aplicat similar unui circuit cu o caracteristică de transfer inversă celui de compresie, circuit cunoscut sub denumirea de expandor de dinamică, a cărui caracteristică este reprezentată în figura 2.11.b.

În tehnica conversiei MIC procedeul comprimării și expandării de dinamică este cunoscut sub denumirea unitară de compandare.

Caracteristicile de compandare utilizate în telefonia numerică se realizează prin aproximări cu segmente de dreaptă, cele mai frecvent utilizate fiind cunoscute sub denumirea de legile de compandare „A" și „m".

Și în cazul procesului de compandare pot apărea distorsiuni datorate depășirii domeniului de amplitudini de câtre semnalul supus cuantizării, sau adaptării imperfecte între caracteristica compresorului și cea a expandorului.

Pentru transmisiuni telefonice numerice, recomandările CCITT prevăd efectuarea cuantizării cu 256 intervale, dintre care 128 pentru valori pozitive și 128 pentru valori negative.

Pentru fiecare eșantion, trebuie transmis atât semnul, cât și valoarea amplitudinii, reprezentată sub forma unui număr cuprins între 0 și 127. Codarea constă în stabilirea unui cuvânt de cod pentru fiecare eșantion cuantificat. Aceleași recomandări CCIIT prevăd pentru metoda MIC, aplicată în telefonia numerică, ca efectuarea codării semnului și amplitudinii fiecărui eșantion cuantificat să se realizeze pe 8 biți (octet), din care primul bit servește pentru transmiterea semnului, iar următoarele șapte pentru codarea, în cod binar, a amplitudinii cuantizate.

S-au elaborat mai multe tipuri de coduri binare, recomandate de CCITT în acest scop. Dintre acestea, cele mai cunoscute sunt:

– codul binar natural, în r-are cuvântul de cod este reprezentat de succesiunea simbolurilor binare ce înmulțesc puterile cifrei 2 la reprezentarea unui număr în sistemul de numerotație binar;

– codul binar simetric, identic cu codul binar natural, precedat însă de o cifră binară, care codifică semnul (1 pentru plus și 0 pentru minus);

– codul Gray, utilizat mai ales în cazul transmisiilor MIC de mare viteză, în care poziția biților nu semnifică o pondere numerică ca la codul binar natural, dar având avantajul că o tranziție între donă valori succesive necesită doar schimbarea unui singur bit;

– codul binar complimentat, care este similar celui binar natural, dar în care valoarea tuturor biților este inversată, în dorința de a înlocui simbolurile 0, care au o probabilitate mai mare de apariție în telefonie, cu simboluri 1, a căror prezență ușurează regenerarea semnalului în repetoare.

In același scop se mai poate practica și inversarea biților pari, la celelalte coduri, urmată de o transformare inversă la decodare.

In aplicațiile legate de înregistrarea digitală a vorbirii se utilizează frecvent codul binar simetric și cel binar complimentat.

Trebuie remarcat însă faptul că, deși au fost prezentate ca etape separate, în cadrul echipamentelor de telecomuncații numerice, compandarea, cuantizarea și codarea se realizează, de fapt, printr-un proces unitar, cu ajutorul unui sistem cunoscut sub denumirea de convertor analog -numeric, căruia i se aplică la intrare semnalul eșantionat, rezultând la ieșire cuvântul de cod binar corespunzător.

Domeniul convertoarelor analog – numerice a cunoscut o dezvoltare vertiginoasă în ultimii ani , marcată atât de apariția unei game diverse de convertoare, urmărind performanțe calitative superioare pentru unul sau mai mulți parametri (viteză, precizie, etc.), cât și de realizare sub formă de circuit integrat specializat cu funcții tot mai complexe (codecuri).

Pentru conversia de tip MIC s-au impus trei categorii de convertoare analog – numerice, a căror utilizare depinde mai ales de viteza de codare necesară :

– convertor A/D cu numărător;

– convertor A/D cu aproximații succesive;

– convertor A/D tandem.

Dacă convertorul A/D cu numărător se utilizează în aplicații ce nu necesită viteze mari de conversie, iar cel tandem, dimpotrivă, tocmai pentru viteze mari (sisteme secundare MIC), convertorul cu aproximații succesive este cel mai utilizat pentru viteze medii de conversie ( fiind inclus, de regulă, în sistemele primare telefonice de tip MIC) și foarte frecvent utilizat la înregistrarea digitală a vorbirii .

CAN cu aproximativi succesive funcționează pe principiul unei aproximări în buclă închisă utilizând ca subansamble principale un comparator, un registru de aproximații succesive (RAS) și un convertor numeric analog (CNA).

In momentul începerii conversiei, RAS se resetează, ceea ce are ca efect poziționarea tuturor biților săi pe „0”, cu excepția bitului cel mai semnificativ (BSMax) care ia valoarea „l”. Cu acest cuvânt format din n biți (n fiind lungimea cuvântului de cod utilizat pentru codare-rezoluția CAN) se comandă CNA, ceea ce are ca efect aplicarea la una din intrările comparatorului a unei tensiuni

(2.35)

UMax fiind tensiunea maximă pe care o poate converti CAN.

Astfel, la începutul conversiei, semnalul eșantionat este aplicat unui circuit de memorare, cu rolul de a-1 menține la intrarea CAN pe durata necesară efectuării conversiei. în prima aproximare, semnalul xe(nT) este deci comparat cu tensiunea maxima de intrare UMax/2

Dacă

(2.36)

bitul BSMax rămâne pe valoarea „l” și bitul de semnificație imediat următoare din RAS este poziționat, prin rezultatul comparării furnizat de comparator, tot pe „l”, CNA fiind astfel comandat de un nou cuvânt de cod, fumizat de RAS, în care primii doi cei mai semnificativi biți au valoarea „l”, iar toți ceilalți valoarea „0”.

Conform acestei comenzi CNA va furniza comparatorului pentru cea de-a doua aproximare o tensiune:

(2.37)

Dacă în urma comparării rezultă:

(2.38)

atunci ieșirea comparatorului comandă trecerea pe ,,1” și a celui de-al treilea bit, în ordinea semnificației, RAS aplicând CNA un nou cuvânt de comandă, ,cu primii trei biți cei mai semnificativi cu valoarea „l”, iar CNA va aplica comparatorului, pentru o nouă comparare, tensiunea:

(2.39)

Dacă, dimpotrivă, în urma primei comparări rezultatul ar fi fost:

(2.40)

atunci valoarea bitului BSMax din RAS ar fi fost forțată pe „0”, iar a bitului imediat următor pe „l”, ceilalți biți rămânând pe „0”. Cuvântul de comandă aplicat în acest caz CNA ar fi generat la ieșirea acestuia o tensiune:

(2.41)

Dacă

(2.42)

atunci conținutul primilor doi biți cei mai semnificativi ar fi rămas „0l”, următorul ar fi fost forțat pe „l”, iar CNA ar fi furnizat, pentru o nonă comparație, tensiunea:

(2.43)

Conversia decurge astfel similar, prin comparații succesive, până la stabilirea valorii binare a ultimului bit (cel mai puțin semnificativ: BSMin).

In figura 2.13 este prezentat pentru ilustrarea funcționării algoritmnl dc comparare în cazul unei conversii A/D cu o rezoluție de 3 biți.

In final, după cele n tacte furnizate de generatorul de tact sincronizează conversia, la ieșirea RAS este disponibil, în paralel, cuvântul de cod ce reprezintă rezultatul conversiei. Același cuvânt poate fi obținut și serial, de la ieșirea comparatorului, prin intermediul unui registru de deplasare.

După terminarea conversiei, un nou eșantion este adus în memoria de la intrarea comparatorului și ciclul decurge similar. Rezultă că potrivit principiului de funcționare al acestui tip de CAN, pentru a converti un eșantion de semnal analogic, aplicat la intrare, într-un cuvânt de cod cu n biți sunt necesare n aproximații succesive, de unde provine și numele convertorului.

La sfârșitul conversiei, tensiunea de reacție dată de CNA, care reprezintă cea mai bună aproximare a semnalului de intrare, realizată printr-un cuvânt de cod de n biți va fi:

(2.44)

în care: ak = 0 sau ak•= 1 în funcție de rezultatul comparației de ordinul k, iar cuvântul de cod rezultat în urma codării este: (a1, a2,…,an);,…, a„). CAN cu aproximații succesive realizează un compromis avantajos între viteză, precizie și complexitate, motiv pentru care este utilizat în majoritatea aplicațiilor legate de conversia A/D a semnalului vorbit. El se poate realiza la ora actuală fie cu trei circuite integrate de bază, ce implementează cele trei subansamble principale (comparator, RAS, CNA), fie chiar cu un singur circuit integrat complex, ce include toate cele trei funcții .

O problemă de actualitate o constituie realizarea sistemelor de achiziție și prelucrare a datelor cu ajutorul calculatoarelor, cu implicații importante și în sinteza vorbirii. Realizarea unor astfel de sisteme impune cuplarea unui CAN cu un calculator, sau, mai uzual, cu un microcalculator, sau chiar cu un microprocesor, ultima variantă fiind cea mai frecventă în realizarea sistemelor cu logică programată, destinate sintezei vorbirii. Pot apărea în acest caz probleme de adaptare între CAN și microprocesor datorate unor sincronizări, viteze, sau formate de cuvinte diferite. De aceea este necesară o interfațare între cele două sisteme, CAN urmând a fi privit de câtre microprocesor ca un periferic, cu care este legat prin intermediul unui circuit de interfață. Interfața se leagă la magistralele microsistemului prin intermediul unor memorii tampon, cu trei stări, care pe lângă cele două stări binare, caracteristice unei situații active, mai pol prezenta și o stare de înaltă impedanță, caracteristică situațiilor inactive, în care deși conectat la magistralele sistemului de calcul, interfața nu afectează cu nimic starea logică a acestora.

2.2.1.2. Decodarea semnalului codat prin MIC

In componența unui sistem de codare și decodare (codec) de tip MIC intră codorul, ce asigură conversia: semnal continuu-semnal digital de tip MIC, precum și decodorul, ce asigură conversia inversă: semnal digital tip MIC – semnal continuu. Decodarea semnalului MIC se realizează, teoretic, prin parcurgerea, în ordine inversă, a celor trei etape principale ce caracterizează conversia directă: eșantionarea, cuantizarea și codarea, dar practic, acestea se realizează prin intermediul aceluiași subansamblu, care este convertorul analog-digital, diferite variante, atât ca principiu de funcționare, cât și ca formă de integrare .

Semnalul rezultat din convertorul numeric – analogic (CNA) este apoi aplicat unui filtru trece jos, menit să elimine componente perturbatoare (xp) (în principal datorate frecvenței de eșantionare) ce rezultă, alături de semnalul util, la ieșirea CNA.

2.2.2. Conversia analog-digitală a vorbirii prin metode

difcrențiale

2.2.2.1. Modulația impulsurilor în cod diferențială (MICD)

Metodele de conversie analog-numerice diferențiale păstrează aceleași etape generale de conversie ca și la metoda MIC (eșantionare, cuantizare și codare), cu deosebirea că dacă la metoda MIC informația finală a cuvântului de cod reprezenta amplitudinea cuantizată a unui eșantion, în acest caz ea reprezintă o informație cu privire la modificarea acestei amplitudini față de cea a unuia sau mai multor eșantioane precedente.

Considerând cazul cel mai frecvent în care comparația se realizează numai între eșantionul curent și cel precedent, informația care interesează la acest tip de modulație se referă atât la semnul variației de amplitudine (creștere sau scădere), precum și la valoarea cuantizată a acestei variații. Avantajul acestei metode constă în faptul că datorită corelației importante pe care o posedă semnalul de vorbire, explicabilă în parte prin inerția organelor ce participă la articulația vorbirii, gama referitoare la variația d amplitudine între eșantioane este mai mică decât gama de variație a amplitudinii unui eșantion, ceea ce necesită un număr mai redus de trepte de cuantizare comparativ cu metoda MIC.

Deoarece preia etapele mari de conversie corespunzătoare metodei MIC, de care nu diferă în esență, această metodă este considerată și ca o variantă a metodei MIC, fiind cunoscută sub denumirea de metodă de conversie analog-digitală bazată pe modulația impulsurilor în cod diferențială (MICD; DPCM).

Semnalul eșantionat xe(nT) este aplicat unui circuit scăzător împreună cu un semnal ce reprezintă o aproximare (predicție) a eșantionului precedent xe[(n-l)T].

Din blocul de scădere rezultă semnalul diferență:

(2.45)

ce poate fi interpretat ca un semnal de eroare între amplitudinea eșantionului curent și aproximarea amplitudinii eșantionului precedent. Acest semnal de eroare este cuantizat, obținându-se semnalul eq(nT), ce reprezintă cuvântul de cod corespunzător eșantionului x(nT), rezultat în urma conversiei si care este înregistrat, sau transmis în linie, funcție de scopul conversiei respective.

Totodată acest semnal este aplicat și local unui circuit de însumare, împreună cu aproximarea eșantionului precedent, rezultând semnalul:

(2.46)

Fig.19 Schema bloc generală a unui codor de tip MIC diferențial

Blocul predictor furnizează, pe baza semnalului generat de blocul sumator, un semnal de aproximare conform unei anumite legi de predicție, specifică predictorului.

În cazul cel mai simplu semnalele și coincid:

= (2.47)

predictorul comportându-se practic doar ca o memorie ce reține semnalul , rezultat la ieșirea sumatorului până la apariția eșantionului următor .

În cazuri mai complexe, predictorul poate forma semnalul de aproximare prin luarea în considerare nu doar a eșantionului precedent. ci a mai multor eșantioane precedente, conform unor anumite legi de ponderare a amplitudinii fiecărui eșantion considerat. Un exemplu frecvent întâlnit este cel în care semnalul de predicție corespunzător unui eșantion se estimează ca o sumă ponderată a k eșantioane precedente , conform relației

(2.48)

și în care ponderea fiecărui eșantion precedent luat în considerare este specificată prin corespondentul ai corespunzător.

Decodorul corespunzător codorului MICD din figura 2.16 conține de asemenea un bloc predictor similar, precum și un circuit sumator pentru refacerea locală a semnalului xe(nT) sub forma unui semnal xr(nT):

(2.49)

Schema bloc a decodorului este reprezentată în fig.20, iar decodificarea și refacerea semnalului continuu se realizează simultan în cadrul blocului de conversie numeric-analogică, similar cu cel utilizat în metoda MIC.

Se mai pot introduce îmbunătățiri în cadrul metodei de conversie MICD, renunțându-se atât la cuantizarea liniară, cât și la predicția fixă, realizată prin intermediul predictorului, în favoarea unor variante în care atât predictorul, cât și cuantizorul, se adaptează permanent la modul de variație al semnalului vorbit. Se obține în acest caz așa numita metodă de conversie a modulației impulsurilor în cod diferențială adaptivă (MICDA; ADPCM) .

Fig.20 Schema bloc a decodorului MIC dtferențial

Deoarece atât MICD, cât și MICDA permit o reducere a debitului binar al semnalului rezultat în urma conversiei, comparativ cu debitul corespunzător metodei MIC standard (64 kbiți/secundă), aceste metode de conversie pot fi considerate că realizează și o compresie a debitului binar rezultat în urma conversiei, comparativ cu metoda MIC standard.

Experimentarea unor codecuri de tip MICD și MICDA au permis aprecierea că se poate reduce numărul de biți alocați pentru cuantizare astfel încât debitul binar rezultat să se reducă la mai puțin de jumătate din debitul corespunzător metodei MIC standard, fără o înrăutățire semnificativă a calității semnalului vorbit refăcut prin conversie inversă .

Această posibilitate este exploatată, curent în realizarea sintetizoarelor de vorbire bazate pe segmente de vorbire înregistrate digital, deoarece reduce semnificativ volumul de memorie necesar înregistrării, permițând astfel înregistrarea unui volum de informații de cel puțin două ori mai mare ca în cazul metodei MIC standard, ceea ce echivalează practic cu dublarea, sau chiar triplarea vocabularului ce poate fi sintetizat, în condițiile utilizării aceluiași volum de memorie. Se mai poate remarca faptul că gama de variație a diferenței de amplitudine dintre eșantioanele succesive, ce se cuantifică în cadrul metodelor de conversie diferențiale, se poate micșora, reducându-se astfel și numărul de biți necesari pentru codificare, prin creșterea frecvenței de eșantionare la o valoare mai mare decât cea corespunzătoare condiției lui Nyquist. Această măsură conduce însă la creșterea numărului de eșantioane pe secundă, deci la creșterea debitului binar rezultat în urma conversiei, care poate anula avantajul reducerii numărului treptelor de cuantizare și ca atare a numărului de biți alocați unui cuvânt de cod. Practic se urmărește un compromis optim, care să asigure atât un debit redus, cât și o calitate bună a vorbirii refăcute prin conversie inversă.

2.2.2.2. Modulația delta(MD)

Modulația delta poate fi privită ca un caz particular limită al MICD, și anume acela în care diferența dintre două eșantioane succesive se cuantifică cu numai donă trepte de cuantizare și se codifică pe un singur bit.

Un astfel de sistem de conversie va marca prin „0” sau „l” faptul că amplitudinea unui anumit eșantion este mai mică, respectiv mai mare, decât a celui precedent. într-o interpretare similară, se poate considera că ceea ce se cuantifică de fapt în acest caz și se transmite sub formă de cuvânt de cod cu dimensiunea de 1 bit este semnul diferenței dintre amplitudinile a donă eșantioane succesive.

Datorită reducerii la limita maximă a numărului de biți necesari cuantizării, este necesară și o micșorare a gamei de variație dintre amplitudinile eșantioanelor, cu tot gradul important de corelație a semnalului vorbit, pentru a nu înrăutăți calitatea transmisiei.

Reducerea gamei se poate realiza cel mai simplu prin creșterea frecvenței de eșantionare (conform figurii 2.18), procedeu frecvent utilizat în cadrul modulației delta, alegându-se de regulă multiplii ai frecvenței de eșantionare utilizată în metode de conversie MIC standard (8 kHz). Luând ca element de comparație debitul binar rezultat în urma conversiei prin MIC standard (64 Kbiți/secundă), în cazul MD se obțin, funcție de valoarea aleasă pentru frecvențe de eșantionare debitele specificate în tabelul din fig.21.

Fig. 21 Variația diferenței de amplitudine a două eșantioane succesive funcție de variația frecvenței de eșantionare

Din tabel se observă că până la valoarea de 64 kHz pentru frecvența de eșantionare, MD se prezintă și ca o metodă de compresie, comparativ cu debitul rezultat prin metoda de conversie MIC standard, dar pentru a obține o calitate acceptabilă a semnalului reconstituit se recomandă ca frecvența de eșantionare să fie de cel puțin 3 – 4 ori mai mare ca frecvența Nyquist .

Chiar că această condiție, compresia realizată prin MD rămâne importantă comparativ cu MIC și MICD, MD are și avantajul major de a necesita un echipament cu mult mai simplu. De asemenea, ca și la MIC și MICD, cuantizarea se poate face cu o treaptă de cuantizare constantă (MD liniară), sau cu una variabilă, dependentă de modul de variație a semnalului supus conversiei (MD adaptivă). Ca și la mic și MICD, un sistem de conversie prin MD va fi format dintr-un codor și un decodor, ce formează împreună un codec delta.

Tab. 3.

Variația debitului binar rezultat din conversia prin MD,

funcție de valoarea frecvenței de eșantionare

Modulația delta liniară (MDL)

MDL se caracterizează prin păstrarea treptei de cuantizare constantă. iar schema bloc a unui codec MDL este reprezentată în fig.22. Se remarcă, comparativ cu MICD, faptul că eșantionarea și codarea se realizează în cadrul aceluiași bloc, sincronizat de un generator de tact, iar blocul de scădere realizează și cuantizarea semnalului.

Fig.22 Schema bloc a unui codec delta liniar

Blocul de scădere este de regulă un circuit comparator, care realizează pe lângă compararea semnalelor x(t) și la momentul t=nT și o cuantificare a diferenței lor conform relației:

(2.50)

Blocul de eșantionare și codare este în majoritatea cazurilor format dintr-un circuit basculant bistabil (CBB), de regulă de tip D, care codifică în impulsuri TTL cele două nivele ce pot rezulta la ieșirea comparatorului, codarea fiind sincronizată de impulsurile fumizate de generatorul de tact. Se realizează astfel și o eșantionare a semnalului de ieșire al comparatorului, cu perioada de eșantionare T a generatorului de tact. Deci rezultatul i conversiei analog-numerice prin MDL este reprezentat de un cuvânt de cod pe 1 bit, ce poate avea valoarea logică „0” sau „l”, funcție de rezultatul comparării furnizat de comparatorul anterior. Ca bloc predictor se utilizează, în cazul MDL, un circuit de integrare, astfel că semnalul de aproximație este dat de relația:

(2.51)

Cu aceste precizări schema bloc a codorului MDL devine cea reprezentată în fig.23. Decodorul MDL este format din același bloc predictor, cu funcție de integrator, folosit și în cadrul codorului, urmat de un filtru trece jos. MDL are avantajul unei construcții deosebit de simple și dezavantajul faptului că introduce un zgomot important în cazul în care ; semnalul supus conversiei prezintă variații rapide (zgomot de neurmărire sau de depășire de pantă), precum și în cazul în care se menține constant. sau variațiile sale nu depășesc mărimea treptei de cuantizare (zgomot granular).

Fig.23 Schema bloc specifică codorului MDL

In cazul unei funcționări normale, MDL introduce zgomotul obișnuit de cuantizare. În fig.24 sunt reprezentate cele trei situații specifice prin intermediul semnalului inițial și a celui rezultat în urma conversiei prin MDL.

Din figură se poate remarca faptul că în cazul unei funcționări corecte semnalul rezultat în urma conversiei urmărește semnalul inițial și că printr-un proces de integrare, realizat cu un circuit identic cu cel existent în codor, urmat de o filtrare trece jos, se poate realiza conversia inversă, obținându-se semnalul x(t).

Fig.24 Cazuri specifice funcționării MDL

Deoarece semnalul de vorbire poate prezenta variații importante de dinamică, utilizarea MDL pentru compresie este neindicată datorită incapacității de a urmări aceste variații, precum și datorită zgomotului granular prezent în pauzele dintre cuvinte, care este deranjant precum și la conversia componentelor continue din semnalul supus conversiei.

Din acest motiv, în locul MDL, pentru conversia semnalului vorbit se utilizează variante de MD adaptive, în care pasul de cuantizare este dependent de mărimea semnalului supus conversiei conform unei anumite funcții.

O îmbunătățire a performanțelor MDL mai poate fi obținută și prin introducerea înaintea MDL a unui integrator, astfel încât semnalul supus conversiei în acest caz nu mai este x(t) ci . Se obține astfel așa numita modulație delta-sigma. Pentru a nu distorsiona semnalul refăcut prin conversie, în decodor este introdus un circuit de diferențiere. Se ameliorează în acest mod în anumită măsură fenomenul de neurmărire.

Modulația delta adaptivă (MDA)

Urmărind minimizarea celor două tipuri de zgomote deranjante, ce însoțesc MDL, în cadrul MDA se constată că apar tendințe contradictorii.

Astfel, pentru a reduce zgomotul de neurmărire, panta semnalului trebuie să poată urmări panta semnalului x(t), adică mărimea pasului de cuantizare q(nT) trebuie să verifice relația:

(2.52)

Analizând relația precedentă se constată că reducerea zgomotului de neurmărire este posibilă în cazul în care variația pantei semnalului x(t) crește fie prin creșterea pasului de cuantizare, fie prin reducerea perioadei de eșantionare (T).

Reducerea perioadei T are dezavantajul că implică creșterea frecvenței de eșantionare, deci și a debitului rezultat în urma conversiei, iar creșterea pasului de cuantizarea dezavantajul că deși reduce zgomotul de neurmărire, crește în schimb pe cel granular (conform figurii 2.23). Din aceste motive, determinarea pasului de cuantizare se face astfel încât să se realizeze un compromis optim, urmărind reducerea distorsiunilor introduse atât de zgomotul de neurmărire, cât și cel granular, iar debitul rezultat în urma conversiei să fie și el cât mai redus. In acest scop, mărimea pasului de cuantizare este determinată printr-o funcție liniară, sau neliniară, care depinde atât de mărimea pantei semnalului anterior, cât și de succesiunea simbolurilor precedente, rezultate în urma conversiei.

Fig.25 Urmărirea variației semnalului supus conversiei în cazul MDA

S-au dezvoltat astfel diverși algoritmi orientați ca performanțe pentru obținerea unor valori optime pentru unul sau mai mulți din parametrii ce caracterizează conversia prin MD. În scopul realizării funcției de variație a pantei de cuantizare se efectuează o cercetare statistică asupra semnalului analogic supus conversiei, care poate fi făcută la nivelul:

– valorii instantanee a semnalului analogic (sau a pantei sale);

– anvelopei semnalului analogic;

– anvelopei pantei semnalului analogic;

– variației mediate a semnalului analogic pe un număr predeterminat de perioade de eșantionare, etc.

Bineînțeles că realizarea convesiei în acest caz presupune complicarea codorului delta, pentru a permite analiza semnalului supus conversiei conform algoritmului stabilit, precum și a decodorului. Prin analogie cu operația de compandare utilizată în cadrul metodei de conversie MIC, aceste variante de MDA au primit. denumirea de modulație delta cu compandare.

Astfel MDA în care mărimea treptei de cuantizare urmărește, conform unui algoritm, valoarea instantanee a semnalului supus conversiei poartă denumirea de MD cu compandare instantanee, iar cea în care aceeași mărime urmărește înfășurătoarea aceluiași semnal a fost denumită MD cu compandare silabică. In conversia semnalului vorbit prin MDA, aceste două variante de MD cu compandare sunt cele mai cunoscute, putându-se menționa si o variantă hibridă, ce realizează de fapt atât compandarea instantanee, cât și pe cea silabică.

Fig.26 Schema bloc a unui MDA cu compandare

În fig.26 este reprezentată schema bloc a unui codec MDA cu compandare și se remarcă faptul că semnalul aplicat la intrarea blocului integrator este furnizat de ieșirea unui modulator de impulsuri în amplitudine (MIA). Amplitudinea impulsurilor este controlată pe doua căi:

– odată direct, prin intermediul semnalului rezultat prin conversie s care transmite informația referitoare la amplitudinea eșantionului precedent;

– a doua oară prin intermediul unui detector de secvențe. Se pot depista în acest fel secvențe corespunzătoare unor variații accentuate ale pantei semnalului supus conversiei, sau secvențe corespunzătoare unei invariații, sau chiar lipsă a semnalului de intrare, putându-se astfel lua măsuri de modificare adaptivă a amplitudinii semnalului de aproximare, pentru a micșora zgomotul de neurmărire sau de granularitate respectiv. Conform secvenței detectate, se aplică prin intermediul blocului de logică pentru adaptare un algoritm menit să adauge valorii minime a pasului de cuantizare (q0) valoarea necesară pentru a adapta prin impulsul fumizat de MIA pasul de cuantizare la valoarea ultimului eșantion, precum și la suma ponderată a amplitudinilor mai multor eșantioane anterioare, prelucrate prin intermediul logicii de adaptare.

Modulația delta adaptivă cu compandare instantanee (MDACI)

Este utilizată în cazul conversiei semnalelor cu variații rapide de amplitudine și cu un spectru larg. Pentru adaptare sunt utilizați algoritmi de adaptare a pasului de cuantizare la fiecare moment de eșantionare. Un codec simplu MDACI, dispune de cinci trepte, corespunzătoare pentru variația pasului de cuantizare, realizat prin schimbarea constantelor circuitului de integrare, precum și de un detector de secvențe realizat cu un numărător reversibil.

Adaptarea pasului de cuantizare se realizează prin comutarea în trepte a rezistenței circuitului de integrare în funcție de amplitudinea instantanee a semnalului de intrare.

Astfel valoarea momentană a semnalului aproximare va fi

(2.53)

Semnalul de aproximare rezultă deci prin integrarea semnalului de ieșire cu circuitul integrator RiC.

Conținutul numărătorului reversibil va crește dacă = 1 și va scădea dacă = 0, iar ieșirea sa este aplicată unui decodificator binar zecimal ce comandă circuitul de comandă al comutatorului. Logica acestui permite comutarea rezistenței la fiecare variație, sau după câteva variații di același sens.

Experimental se constată că pentru semnalul vorbit, la o intensitate normală, cinci trepte sunt suficiente pentru a asigura o compandare instantanee mulțumitoare. Decodorul acestui codec va conține decodorul local, urmat de un filtru trece jos și, eventual, de un amplificator de ieșire.

Modulația delta adaptivă cu compandare silabică (MDACS)

Schema bloc a unui codec MDACS este în principiu similară cu cea codecului MDAC (fig.26) cu deosebire că blocul logic de adaptare este urmat de un integrator cu constanta de 4-5 ms, semnalul rezultat dup integrare fiind aplicat apoi pentru comanda MIA.

Există mai multe variante de codecuri MDACS, care se pretează foarte bine la conversia semnalului vorbit, pronunțat normal de un vorbitor. Dintre aceste variante, trei /21/ sunt mai cunoscute și anume:

– cu adaptare continuă la panta semnalului;

– cu adaptare discretă la panta semnalului;

– codec delta robust,

ales prin faptul că au constituit obiectul unor implementări si formă de circuite integrate specializate, produse de diferite firme.

Modulația delta cu compandare silabică poate fi exemplificată cu codorul reprezentat în fig.27, ce reprezintă o variantă de MDACS ci compandare discretă.

Circuitul de reacție al codorului este compus dintr-un integrator (II) și un MIA. Compresia silabică în codor și expandarea în decodor realizează cu un circuit de formare a tensiunii de comandă a modulatorului.

Fig.27 Schema bloc a unei variante de codor delta cu comapandare silabice

Tensiunea de comandă se obține din succesiunea binară a semnalului rezultat în urma conversiei, care este integrată cu integratorul II, detectată și filtrată cu un detector de înfășurătoare și un filtru de netezire obținându-se astfel un semnal proporțional cu înfășurătoarea semnalului de ieșire. Această tensiune astfel obținută este aplicată unui sumator, în care se mai adună și tensiunea corespunzătoare treptei minime de cuantizare (q0) iar semnalul astfel rezultat este folosit pentru comanda MIA. În MIA are loc înmulțirea semnalului de ieșire cu un semnal proporțional cu înfășurătoarea sa, obținându-se astfel semnalul de aproximare. Măsurătorile efectuate asupra raportului semnal/zgomot de cuantizare (r.s.z.c.) pentru acest tip de codor delta au condus la curba reprezentată în fig.28.

Fig.28 Variația raportului semnal/zgomot de cuantizare pentru codorul MDACS

3. METODE DE SINTEZĂ A VORBIRII

Cunosc o largă răspîndire în ultima vreme așa numitele „sisteme cu vorbire artificială", capabile să genereze în mod antomat diferile mesaje vorbite. Dacă. într-un accept mai larg, în această categorie pot fi înglobate și acele sisteme ce doar redau un mesaj înregistrat într-o formă de înregistrare obișnuită, analogică (magnetofon, casetofon) sau digitală, în cazul în care conținutul semantic al informației înregistrate diferă de cel al mesajului generat, sistemul respectiv se consideră a fi un sintetizor de vorbire.

In general, deci, un sintetizor de vorbire poate fi definit ca un aparat capabil să genereze mesaje vorbite, pe baza unor informații înregistrate în prealabil, dar care diferă din punct de vedere semantic de mesajul vorbit.

Informația înregistrată se constituie astfel ca o mulțime de parametri asupra cărora trebuie efectuată o anumită prelucrare în vederea obținerii mesajului ce trebuie generat. Această prelucrare este definită ca fiind operația de sinteză a vorbirii artificiale, vorbire care, în acest sens, se mai numește și vorbire sintetică.

Caractcristic sintezei vorbirii mai este și faptul că trebuie să se realizeze în timp real, existănd în acest caz o asemănare între sinleza vorbirii și pronunția vorbirii umane, unde, de asemenea, trecerea de la stadiul de concept la cel de undă acustică trebuie să se realizeze în timp real, pentru a se asigura continuitatea vorbirii și perceperea mesajului.

O altă caracteristică importantă a sintezei vorbirii este aceea că pentru a selecta infomația de bază, ce urmează a fi înregistrată în sintetizor, este necesară o operație prealabilă, numită analiză, prin care se extrag din vorbirea naturală un set de parametri, ce constituie apoi informația de bază în vederea sintezei. Funcție de felul în care se face analiza, depinde și tipul acestor parametri, precum și modul în care se realizează sinteza, rezultănd astfel mai multe metode de sinteză a vorbirii.

Există două criterii generale de clasificare a sintetizoarelor de vorbire:

-după performanțele sintetizorului;

-după felul în care se realizează sinreza;

Principalii parametrii ce definesc performantele unui sintetizor de vorbire sunt: inleligibililatea, naturalețea, dimensiunea vocabularului precum și volumul de memorie necesar stocării informației de bază.

Ca și în alte cazuri, îmbunătațirea tuturor acesior parametri introduce condiții contradictorii, ceea ce implică necesitatea alegerii unor soluții de compromis pentru a se obține o situație optimă din punct de vedere al unuia sau mai mulți parametrii. Conform acestor parametri se pot face următoarele clasificări:

1. după inteligibilitate:

– cu inteligibilitate foarte bună,

– cu inteligibilitate bună,

– cu inteligibilitate satisfăcatoare;

cu mențiunea că măsurarea acestui parametru se face prin metode similare celor utilizate în telefonie

2. după naturalețe:

– cu voce care pasterează un specific uman;

– cu voce care nu păstercază un specific uman (mecanică);

3 după dimensiunea vocabularului:

– cu vocabular limitat:

– cu vocabular redus:

– cu vocabular extins;

– cu vocabular nelimitat;

4. după volumul de memorie necesar stocării informației de bază: ;

– cu memorie redusă;

– cu memorie extinsă.

După felul în care se realizează sinteza, o primă clasificare, de bază, deosebește metodele de sinteză în:

– metode de sinleză a sursei de generare a semnalului vorbit (sinteză cu codificarea sursei de semnal);

– metode de sinteză a formei acustice a semnalului vorbit (sinteză cu codificarea formei de semnal).

Mai este de remarcat și faptul că aceleași metode de sinteză pot fi implementate fie în tehică analogică, fie în tehică digitală, ultima impunîndu-se aproape în exdusivitate odată cu răspîndirea metodelor de preluicrare digitală a semnalelor cu ajutorul sistemelor cu logică programată.

3.1. Metode de sinteză a vorbirii cu codificarea sursei de semnal (Metode parametrice de sinteză)

Aceste metode sintetizează de fapt sursa generatoare de vorbire, adică simulează funcționarea tractului vocal și a semnalului de excitație a acesluia.

Ele au avantajul că necesită un volum mult mai redus de informații de bază și, ca atare, un volum mult mai redus de memorie pentru stocarea lor, dar prezintă și dezavantajul că impun prelucrări mai complexe asupra acestor informații, pentru a realiza sinteza. Totodată, etapa de analiză a vorbirii, efectuată în scopul selectării informației de bază pentru sinleză, este mai complexă și deoarece această informație diferă semnificativ de vorbirea propriuzisă, ea se constituie ca un set de parametri necesari sintezei, motiv pentru care aceste metode au mai fost numite și metode parametrice de sinleză a vorbirii.

Setul de parametri ce alcătuiesc informația de bază în vederea sintezei poate fi separat în două categorii și anume:

– paramelri aferenți tractului vocal (ti) și

– parametri aferenți surselor de excitație a tractului vocal (ei). Astfel, schema bloc generală a unui sintetizor parametric de vorbire este cea reprezentată în fig.29.

Fig.29 Schema bloc generală a unui sintetizator parametric de vorbire.

Această schemă bloc generală mai poate fi detaliată în funcție de tehnica, analogică sau digitală, în care se realizează sinteza. Astfel, dacă pentru un sintetizor parametric analogic subansamblele vor fi circuite analogice, iar parametrii vor fi cu precădere mărimi clectrice analogice, pentru un sintetizor digital, aceleași circuite vor fi digitale, iar parametrii vor fi, de asemenea, mărimi exprimate sub formă numerică.

Fig.30 Schema bloc a unui sintetizor paranietric analogic

În figurile 30 și 31 sunt reprezentate schemele bloc corespunzăloare, celor două cazuri, scheme ce simulează modelele mecanic și respectiv electric (figurile 1.8 și 1.10) ale aparatului fonator uman.

Prin intermediul celor două generaloare se furnizează semnalul de excitație echivalent fluxului de aer, modulat sau nu de corzile vocale.

Așa cum s-a precizat în capitolul 1.3, dedicat caracteristicilor fizice ale sunetelor vorbirii, semnalul de excitație a tractului vocal poate fi simulat, din punct de vedere electric cu un semnal periodic, de impulsuri aproximativ triunghiulare, în cazul producerii sunetelor sonore și cu un semnal de zgomot în cazul producerii sunetelor nesonore.

Blocul comutator are rolul de a comuta unul din cele doua generatoare de semnal de excilație, în funcție de tipul sunetului ce urmează a fi sintetizat (sonor sau nesonor), comanda comutării efectuindu-se prin intermediul unui parametru binar (ek).

Filtrul multiplu acordabil este un filtru cu rolul de a simula comportarea în frecvență a tractului vocal, el fiind realizat, de regulă, prin conectarea în serie sau paralel, a mai multor filtre simple acordabile, a căror acord se realizează prin intermediul aplicării parametrilor ti. Se modelează astfel comportarea tractului vocal, pentru producerea unui anumit sunet utilizînd un vector de comandă specific acelui sunet, a cărui componenți sunt tocmai valorile paramctrilor de sinteză corespunzători producerii sunetului respectiv:

V = V(ei; ej; ek; ti ) (3.1)

Prin intermediul parametrilor ej și ei se comandă amplitudinea semnalului furnizat de generatorul de zgomot și respectiv frecvența semnalului dat de generatorul de impulsuri, echivalentă frecvenței fundamentale de vibrație a corzilor vocale.

. Deci, prin intermediul parametrului ei se poate regla înălțimea „vocii" sintetizorului, putăndu-se astfel simula o voce masculină, feminină, sau mecanică. Parametrii de comandă a filtrului multiplu sunt specializați, de regulă, pentru:

– comanda frecvenței de rezonanță;

– comanda lățimii de bandă;

– comanda amplitudinii semnalului.

Filtrul multiplu ce simulează funcționarea tractului vocal trebuie să fie format dintr-un număr suficient de elemente componente, astfel încăt să permită realizarea unei bune aproximări a înfășurătorii spectrale corespunzătoare fiecărui sunet de vorbire, fără de care sinteza ar conduce la un sunet neinteligibil. De regulă, în sintetizoarele analogice se utilizează structuri simplificate ale filtrului multiplu, care au doar rolul de a reface înfățurătoarea spectrală corespunzătoare zonelor în care apar formanții specifici sunetului respectiv, conform proprietăților acestor formanți de a fi determinanți (în special primii trei) pentru recunoașterea sunetelor vorbirii, proprietăți prezentate în capitolul 1.3.

În cazul sintetizorului parametruc digital, locul generatorului de zgomot este luat de un generator de impulsuri aleatoare, iar în locul generatorului de impulsuri periodice triunghiulare, se utilizează un generator de impulsuri periodice dreptunghiulare. Filtrul analogic este de asemenea înlociut cu un filtru digital comandabil, urmat de un convertor numeric-analogic.

Fig.31 Schema bloc a unui sintetizor parametric digital

Deși, de-a lungul timpului, s-au dezvoltat mai multe melode de sinleză parametrică a vorbirii ca:

– sinteza fonemică;

– sinteza prin refacerea înfăsurătorii spectrale;

– sinteza homomorfică;

– sinteza prin predicție liniară, etc,

Totuși, doar două din aceste metode s-au impus în ultima vreme, ajungănd să fie implementate și sub forma unor circuile integrate specializate, de largă circulație, și anume: sinteza prin formanți și sinteza prin predicție liniară.

Mai trebuie remarcat că, în ordinea apariției, primele sintetizoare au fost cele parametrice, în timp ce sintetizoarele bazate pe codificarea formei semnalului au apărut abia mai tărziui, odată cu dezvoltarea metodelor de codificare și prelucrare numerică a semnalelor și cu apariția sistemelor cu logică programată pentru aplicarea acestor melode.

Sintetizoarele parametrice au fost denumite la început și „vocodere" fiind considerate ca niște sisteme de codificare a vocii și utilizate.atăt pentru sinteza vorbirii, căt și în telecomunicații, pentru reducerea redundanței semnalului vorbit, în scopul creșterii gradului de multiplexare a canalului de transmisie /2/. Trebiue specificat însă faptul că un vocoder includea, pe lăngă sintetizorul propriu-zis, și un analizor, cu rolul de a obține informația de bază necesară sintezei, conform figurii 32.

Fig.32 Schema bloc a unui vocoder

Odată cu dezvoltarea sistemelor cu logică programată, analiza a început să fie efectuată doar ca o etapă de obținere a parametrilor pentru sinteză, care au fost apoi memorați în memoria sisiemului, urmînd a fi extrași și folosiți pentru sinteză atunci cănd este nevoie.

În felul acesta, rolul vocoderului a fosl preluat doar de sintetizor, care s-a impus ca un sistem de sine stătător.

3.1.1 Sinteza fonemică

S-a constatat că vorbirea normală produce, în medie, aproximativ 10 foneme/secundă, care ar putea fi codificate și transmise cu un debit de numai 60 biți/secundă. Comparănd acest debit cu cel corespunzător codificării undei acustice prin metoda MIC standard (64 kbiți/secundă) rezultă că dacă s-ar reuși codificarea vorbirii direct la nivel fonemic, s-ar putea reduce debitul de peste 1000 ori, ceea ce ar conduce la o economie spectaculoasă de memorie de înregistrare, sau de volum de canal pentru transmisie.

Pentru a obține însă o compresie atăt de mare și a extrage numărul minim de parametri necesari sintezei fonemelor ce impun condiții foarte dificile operației de analiză, care devine foarte complexă, iar vorbirea sintetizată în acest mod nu va păstra decăt inteligibilitatea din totalitatea caracteristicilor vorbirii umane, fiind neplăcută si obositoare la ascultat și interpretat.

Deși s-au făcut multe încercări de realizare a unor sintetizoare fonemice, limita maximă de compresie nu a fost încă atinsă. Sinteza vorbirii pe baza fonemelor presupune stabilirea unui număr de reguli referitoare nu numai la modul de producere a unui fonem, dar și la alăturarea lui cu alte foneme, la accentuarea sau neaccentuarea lui funcție de cuvăntul în care intetvine, etc.

Pe de altă parte, se pune problema stabilirii unui număr minim de reguli care să permită sinteza fonemică.

Cercetările fonetice întreprinse în acest domeniu au evidendat că există nn număr de aproximativ 12 opduni binare de tip „da" sau „nu" de care dispune omiil pentru a produce vorbirea, fenomen valabil pentru toate limbile și care sunt expuse și comentate în tabelul 4.

Tab.4.

Tabel cu caracteristicile discriminatorii binare ale fonemelor

Modelarea electrică eficientă a acestor condiții rămăne însă deocamdată o problemă de viilor.

Caracterizarea sintezei fonemice printr-un mare număr de reguli a făcut ca această metodă să fie denumită și „sinteză prin reguli", apreciindu-se că reprezintă o cale pentru realizarea sintetizoarelor de vorbire cu vocabular nelimitat în condițiile cele mai avantajoase, dar, deocamdată, dificil de abordat.

In figura 33 este indicată schema bloc a unui sintetizor fonemic prin reguli.

Fig.33 Schema bloc a unui sintetizor fonemic prin reguli

Sinteza prin reguli poate fi considerată ca o metodă de transformare a unei reprezentări discrete a vorbirii intr-o formă acustică continuă echivalentă. Transformarea se realizează în două etape. În prima se transformă parametrii discretizați, ce caracterizează fonemele, în parametri continui pentru controlul funcționării unui sintetizor, iar în etapa a doua se transformă parametrii de control ai sintetizorului în vorbire sintetică, sintetizorul fiind de tipul celui reprezentat în figurile 30 sau 31.

Probabil că dezvoltarea unor sisteme de calcul puternice și rapide va avea ca efect reluarea în alt context a acestei metode de sinteză, rămasă deocamdată mult în urma celorlalte metode ce au la bază, de asemenea, codificarea sursei de semnal.

3.1.2 Sinteza prin refacerea înfăsurătorii spectrale

Această metodă utilizează ca parametri pentru sinteză o serie dc valori ale înfășurătorii spectrale a semnalului de vorbire, determinați printr-o analiză prealabilă. De regulă este utilizată pentru analiză banda vocală telefonică (300-3400 Hz), sau banda 200-4000 Hz avănd în vedere că frecvențele ce depășesc valoairea de 4000 Hz au o importanță mai redusă pentru inteligibilitate, contribuind mai ales la asigurarea calității vorbirii, atăt din punct de vedere a caracterului natural uman al vocii căt și a recunoașterii vorbitorului.

Calea cea mai simplă de analiză și sinteză prin această metodă constă în eșantionarea în frecvență a semnalului de vorbire, ce un set de filtre de trecere a banzii adiacente, conform fig.34.

Fig.34 Înfașurătoarea spectrală a unui semnal de vorbire

la un moment de timp dat

Ieșirile acestor filtre sunt prelucrate (de regulă prin redresare și integrare) obținăndu-se astfel un set de parametri de bază sub forma unor tensiuni lent variabile, cu care se comandă apoi realizarea sintezei.

Calitatea sintezei va depinde, pentru o bandă de frecvențe fixată pentru analiză, de intervalul ∆ dintre două eșantioane. Cu căt acesta va fi mai mic, cu atăt aproximarea va fi mai bună, dar cu atăt și numărul parametrilor va fi mai mare, iar sinteza va fi mai complicată.

Sintetizoarele care funcționează pe acest principiu se numesc sintetizoare de bandă, iar schema bloc de analiză a unui canal este indicată în fiura 35.

Fig.35 Schema bloc a analizatorului de canal corespunzător sintetizorului de banda

Pentru a modela matematic obținerea unui astfel de parametru se ține cont că semnalul de la ieșirea filtrului trece bandă se obține princonvolutia:

in care

este funcția de răspuns a filtrului considerat ideeal avănd caracteristica de fază liniară și caracteristica de frecvență dată de relatia:în banda de trecere și caracteristica de fregvență dată de relația:

fiind banda de trecere, iar k frecvența centrală a acestei benzi. Notănd cu h(t) înfașurătoarea funcției de răspuns a filtrului, relația (3.3) devine:

iar relația (3.2):]

sau:

Notînd

relația (3.8) devine:

și pune în evidență faptul că tensiunea de la ieșirea filtrului trece jos este proporțională cu spectrul semnalului x(t) și repreyintă un semnal modulat, semnificînd faptul că după trecere și filtrare se va obține o tensiune proporțională cu înfășurătoarea spectrală la fregvența de analiză k:

care va reprezenta chiar parametrul corespunzător canalului respectiv. Efectuînd astfel o analiză pe mai multe canale se obține de parametri utilizați la sinteză. Se constată că vaiatia acestor tensiuni este lentă, astfel că în cazul în care sinteza se face pe cale numerică, conversia analog-numerică a acestor parametri va conduce la un debit binar total mult mai scăzut cu cel rezultat în urma conversiei semnalului de vorbire propriu-zis.

La sintetizorul de bandă, lățimea canalelor spectrale de analiză nu este acceiași pe toate canalele, ci se stabilește în funcție de caracteristicile ci se stabilește în funcție de caracteristicile analizatorului auditiv uman. Astfel, deoarece s-a constatat că rolul cel mai important pentru percepția vorbirii, corespunzătoare primului formant este cuprins în zona de pînă la 1000 Hz, în timp ce peste această valoare, aportul la inteligibilitate al componenetelor spectrale acade aproximativ logoritmic cu creșterea fregvenței, eșantionarea înfășirătorii se va realiza conform așa numitei “scări de egală articulație” al lui Koenig. Canalele vor fi astfel mai dese și mai înguste pînă la 1000 Hz și mai rare și mai lartgi pupă acestă valoare.

În cadrul variantei digitale, la sintetizorul dre bandă se înlocuiesc filtrele de bandă cu filtre digitale iar parametrii de comandă se convertesc analog-numaric și comandă nivelul semnalului de ieșire fiecărui filtru.

O variantă digitală mai complexă se poate utiliza cu ajutroul unui sistem de achiziție și prelucrări digitale a semnalelor analogice, pe care să fie implementat un analizor Fourier și prin intermediul cănruia să se realizeze eșantionarea spectrului semnalului de vorbire, pentru a se obține setul de parametri cu care să se realizeze apoi, lot pe cale digitală, sinteza.

Viteza de calcul necesară unui astfel de sistem este însă mare, datorita necesității de a funcționa în timp real și nu poate fi realizată prin implementarea microprocesoarelor de uz general disponibile la ora actuala pe piața.

3.1.3 Sinteza pe bază de foirmanți

Această metodă de sinteză reprezintă de fapt un caz particular al meteodei precedente, fiind considerată ca o metodă distinctă doar datorită faptului că este una din cele mai frecvent utilizate, făcînd obiectul mai multor implementări sub forma unor circuite integrate specializate.

Spre deosebire de metoda precedentă, ce avea ca obiect refacerea înfășurătorii spectrale în toată banda de frecvență stabilită pentru sinteză, sinteza pe bază de formanți își propune să refacă înfășurătoarea spectrală doar în acele regiuni care prezintă o importanță deosebită pentru inteligibililatea vorbirii, adică în zona formanților, sa cum s-a demosntrat în paragraful 1.3. Experiențele efectuate în acest domeniu au pus în evidentă faptul că pentru a asigura o imteligibilitate foarte bună a vorbirii sintezate este suficientă refacerea înfașuratorii spectrale corespunzătoare celor trei formanți, importanța celorlalți doi fiind destul de redusă din acest punct de vedere.

Analiza va avea în acest caz rolul de a extrage din vorbirea năturală parametrii caracteristici pentru definirea formanților, precum și cei corespunzători sursei de excitație pentru a comanda un sintetizor. Parametrii formanților se referă la frecvența centrală, amplitudine și banda corespunzătoare, măsurată, de regulă, la 3 dB față de nivelul componentei cenirale.

Frecvențele formanților corespund unor frecvențe de rezonanță a tractului vocal, ce determină apariția unor maxime în spectrul semnalului de vorbire și ele se modifică permanent în decursul

vorbirii, funcție de poziția organelor de articulație. Variații similare suferă și amplitudinile, precum și benzile acestor formanți, ultimele însă în destul de mică măsură, deoarece lățimea formanților depinde mai ales de pierderile ce au loc la aceste frecvențe în tractul vocal, ele putînd fi considerate constante într-o primă aproximație .

Importantă, de aceea, pentru asigurarea inteligibilității vorbirii cursive este dinamica formanților, adică cunoașiterea modului de variație a frecvențelor centrale și a amplitudinilor lor.

Datorită inerției organelor de articulație, aceste variații sunt însă destul de lente, ceea ce face ca parametrii respectivi să ocupe un volum redus de semnal, iar conversia lor analog-numerică să conducă, în cazul utilizării tehnice digitale pentru realizarea sintetizorului, comparativ cu metoda precedentă, la un volum mai redus de memorie necesar stocării informației de bază.

Considerînd că se urmărește doar sinteza primilor trei formanți, se poate determina foarte exact numărul de parametrii corespunzători pentru comanda filtrului multiplu, ca fiind 6 (trei referitori la frecvența centrală și 3 la amplitudinea ei), la care se mai adaugă alți 3 corespunzători sursei de excitație (frecvența generatorului de armonici, amplitudinea generatorului de zgomot și tipul generatorului de excitație care va fi folosit pentru sinteza unui fonem). Calitatea vorbirii sintetizate prin metoda formanților depinde, în cea mai mare măsură de corectitudinea cu care se efectuează analiza, referitor mai ales la determinarea corectă a frecvențelor centrale și a amplitudinii formanților, precum și a variațiilor lor în timp. Dacă determinarea acestor parametri pentru sunete izolate este o problemă destul de simplă, determinarea lor în cursul vorbirii cursive este destul de complicată, datorită atăt variațiilor, căt și a interferențelor care apar în sunetele vecine. Domeniul de variație a primilor trei formanti pentru cele mai importante vocale ale limbii romăne este prezentat în fig.36 a, pe baza căruia s-a realizat și graficul din fig.36 b, în care se observă că apar suprapuneri între domeniile de apariție a formanților pentru vocale diferite, ceea ce explică complexitatea problemei.

De asemenea, problema sintezei prezintă complicații prin necesitatea fie a realiza filtre comandabile, atît ca bandă, căt mai ales ca frecvență și amplitudine, corespunzăloare formanților. Tehnica analogică a fost în acest caz depășită complet de cea digilală, unde filtrele digitale prezintă facilități mult mai impunonte pentru generarea formanților.

Sintetizoarele analogice formantice au filtrul multiplu format dintr-un ansamblu de filtre, egal cu numărul formanților propuși a fi sintetizați și care pot fi conectate în scrie sau în paralel.

Varianta digitală a unui sintetizor formantic va utiliza un singur filtru digital, datorită posibilităților oferite de acest gen de filtre de a realiza structuri de filtre multiple.

Determinarea parametrilor formanților se poate realiza și în tehnică analogică, în special prin numărarea trecerilor prin zero a semnalului rezultat printr-o filtrare în zona de apariție a fiecărui formant (fig.37) dar soluția cea mai avantajoasă o oferă touiși analiza spectrală, prin transformata Fourier, realizată pe cale digitală, cu un sistem de achiziție și prelucrări de date analogice prin metode digitale.

Problema determinării formanților se complică în cazul consoanelor, comparativ cu vocalele, deoarece în acest caz formanții nu sunt la fel de conturati ca la vocale, iar variația lor în timp este mai rapidă. Din aceste motive, la consoane, se recomandă ca fiind mai indicat să se măsoare momentele spectrale în care apar maxime de energie: Mk (fk; Ak) utilizîndu-se în acest scop nișle valori medii, respecdv medii pătrarice de frecvență definite astfel:

definindu-se și o lățime (dispersie) a spectrului prin relația,

Un sintetizor formandc mai performant va conține astfel încă două filtre, unul special pentru consoane, comandat prin intermediul parametrilor ce definesc momentele spectrale ale acestora și un altul specific consoanelor nazale, conform schemei bloc din fignra 38.

Fig.38 Schema bloc a unui sintetizor formantic adaptat și pentru consoane

Un sintelizor formanlic digital performant, implementat într-un circuit integrat specializat și destul de răspăndit este circuitul MEA 8000, realizat de firma Philips.

3.1.4. Sinteza prin predictie liniară

Metoda predicției liniare este o metodă de analiză și sinteză a semnalelor reprezentate numeric, care au proprietatea că între eșantioanele succesive există o dependență specifică autocorelației.

Diferența dintre eșantioanele adiacente va avea în acest caz o gamă de variație mai redusă decăl- a semnahilui însii^r, proprietatJe utilizată și în cadrul metodelor diferențiale de codare și care favorizea/ă codarea acestei diferențe cu un număr mai redus de bili comparativ cu variația semnalului propriuzis.

Existcnța corelației între eșanrioanele nnui semnal permite însă și o reprezentare a acestuia printr-o altă metodă, ce cxploalează existența nnei dependențe nu numai întrc două eșantioane adiacentc, ci și în cadrul unei secvențe formate din mai multe eșandoane consecntive.

Predicția liniară constă în aceea că un eșantion al unei secvențe numerice corelate poate fi aproximat printr-o combinație liniară a mai multor eșantioane precedente confomn relatici:

în care ak sunt coeficienți de ponderare, G un factor de căștig, iar s(n) un semnal numit semnal de excitație.

Semnalul de vorbire fiind un semnal corelat, se pretează bine acestui mod de tratare. Similar metodelor de codare diferențială, se poate defini un semnal de aproximare (predicție):

numit predicție liniară, cu coeficienții Șakș numiți coficienți de predicție și cu sistemul care-1 generează numit predictor liniar. Între relațiile (2.15) și (2.16) se poate defini eroarea de predicție e(n) ca. fiind diferența dintre cele două semnale:

pentru care se poate obține o reperezentare echivalentă, cu ajutorul transformatei Z:

în care:

poate fi considerată ca funcție de transfer a unui sistem liniar, numit filtru al erorii de predicție, conform fig.39:

Fig.39 Simbolul filtrului erorii de predicție

Relația precedentă indică posibilitatea de a realiza aproximarea funcției X(z) cu o funcție de transfer de forma:

Ce corespunde funcției de transfer a unui filtru numeric de tip “numai poli” și ăn care G reprezintă un factor de cîștig ce urmeză a fi determinat din condiția:

în care E(z) este o aproximare a funcției E(z). În domeniul timp relația precedentă este echivalentă, cu:

Valoarea factorului G se determină aplicănd de conservare a energiei între funcția e(n) și eroarea de predicție medie a sercvenței {e(n)}:

în care en este eroarea medie pătratică totală, definită și ca energie a erorii de predicție. Dacă se consideră:

și se ține cont de relația (3.24), relația (3.25) devine:

e(n)=G*s(n) (3.26)

ceea ce pune în evidență un aspect foarte important și anume că semnalul de eroare de predicție este proporțional cu semnalul de excitație, prin intermediul factorului G, cee ce însemnă că semnalul de erore poate fi utilizat și ca semnalul de excitație:

Avînd în vedere considerentele precedente, rezultă că tractul vocal poate fi modelat din punct de vedere al predicției liniare cu modelul din fig.40:

Datorită naturii nestaționare a semnaluli vocal, estimarea coeficienților de predicție liniară trebuie făcută pe segmente scurte de timp (1020ms) pe care se constată o comporatre a tractului vocal ce poate fi considerată constantă și corespunzătoare generării unui anumit sunet de vorbire. Pentru a determina coeficienții de predicție se utilizeză tot metoda minimizării energiei erorii de predicție medie pătratice totale:

în care xn(m) reprezintă un segment vocal din vecinătatea eșantionului n, pe care se consideră că s-a realizat analiza.

Pentru minimizare, din derivarea relației precedente rezultă un sistem de ecuații diferențiale liniare:

care conduce la sistemul de ecuații:

Introducînd notația:

sistemul (3.30) se mai poate scrie:

Rezolvarea prin metode adecvate a acestui sistem de ecuații pune în evidență faptul că eroarea minimă totală eT conține o componentă fixă și una variabilă, care depinde de coeficienții de predicție conform relației:

Pentru rezolvarea sistemului de ecuații (3.32) s-au dezvoltat mai multe metode, care depind de modul de alegere a limitelor de sumare, precum și a segmentului vocal m. dintre aceste metode, cele mai utilizate sunt metoda autocorelației si metoda rețelelor cu celule în X.

Metoda autocorelației consideră semnalul de vorbire, supus analizei, definit în cadrul unui segment:

și nu în afara acestui interval.

Pentru a obține un astfel de efct, semnalul de vorbire este înmulțit cu un semnal de tip “fereastră” w(m) conform relației:

ceea ce corespunde în calcululerorii medii pătratice de predicție en (relația 3.28) la o sumare pînă la n-1+p, conform relației:

Eroarea de predicție va fi în acest caz mai mare la capetele intervalului considerat deoarice, la început , semnalul va fi prezis din eșantioane cărora li s-a atribuit forțat valoarea zero, iar la sfîrșit deoaricesemnalul va fi forțat să ia valori nule din eșantioane nenule.

Pentru a atenua acest efct funcția fereastră cu care se face ponderea se alege astfel încît să acționeze ponderat la extrimitățile segmentului xn(m). Considerînd noile limite de sumare precum și faptul că xn(m) este considerat nul în afara intervalului [0,N-1] relația (3.31) devine:

și pune în evidență funcția de autocorelație pe timp scurt, adică pe intervalul i-k:

unde:

Relațiile (3.38) și (3.39) se utilizeză pentru calculul coeficienților k din relația (3.32), care se ami pot scrie sub formă matricială:

în care membrul stîng reprezintă o matrice cu porprietăți speciale, fiind simetrică și cu elementele pe diagonale egale (matrice Toeplitz):

Aceste proprietăți au permis elaborarea unor algoritmuri eficiente de rezolvare a sistemului (3.32). Cel ami utilizat și eficient algoritm este algoritmul Durbin care se bazează pe esxistența următoarelor relații de recurență:

în care e(i) este eroarea de predicție pentru un predictor de ordinul i, cu i=1…p.

Rezolvînd sucesiv ecuațiile (3.43)…(3.46) se se obține în final soluția:

Această metodă de rezolvare permite atît determinarea succesivă a coeficienților de predicție pentru ordine mai mici decît p, cît și erorile de predicție de diferite ordine e(i).

Acest avantaj este important, deoarice atunici cind nu se cunoaște dinainte ordinul modelului de predicție liniară necesar pentru o bună aproximare, se poate continua algoritmul cu valori crescătoare pentru i pînă ce eroarea eroarea de predicție e(i) scade sub o anumită valoare. Se mai poate arăta că utilizarea metodei autocorelației pentru determinarea coeficienților de predicție are avantajul că asigură și condiția de stabilitate a filtrului ce repreyintă modelul liniar predictiv dacă este verificată relația: (3.48) și care impune ca rădăcinile polinomului ce reprezintă de transfer A(z) a acestui model să se găsească, în planul z, în interiorul cercului unitate.

Considerînd conform formulei (3.19) și figurii 3.15, funcția de transfer a unui filtru al erorii de predicție de ordinul (i) ca fiind:

dacă acestui filtru i se aplică semnalul xn(m) la intrare, la ieșire se va obține eroarea de predicție de ordinul (i):

în care, conform relației (3.17):

și ținînd cont de relatia precedentă se mai poate scire și cu ajutorul transformatei z:

Ținînd cont de modul de definire a funcției A(i)(z) conform relației (3.49), precum și relației de recurență (3.45), ce exprimă pe ak(i) în funcție de ak(i-1) , relația (3.49) devine:

care introdusă în (3.52) conduce la relatia:

în care primul termen din partea dreaptă repreyintă chiar tranzacția z a erorii de predicție de ordinul i-1, adică:

Pentru interpretarea celui de-al doilea termen dinpartea dreaptă a relației precedente, se face notația:

Similar vom avea pentru ordinul (i-1):

Aplicarea tramnsformatei z inversă relației (3.56) se obține:

Analizînd relatiile (3.51) și (3.58) se poate remarca faptul că e(i)(m) din relația (3.51) reprezintă o eroare de predicție de tip înainte (progresivă) a eșantionului xn(m) exprimată în funcție de precedentele i eșantione {xn(m-k), k=1,2,…i}, iar b(i)(m) poate fi considerat că repreyintă o eroare de predicție de tip înapoi (regresivă) a eșantionului xn(m-i) în funcție de următoarele de i eșantioane care vor urma {xn(m-i+k), k=1,2,…i}.

Aplicînd transformata z inversă relației (3.55) se obține:

Înlocuind pe A(i) în relația (3.56) conform relației (3.53) se obține:

și ținînd cont de relația (3.57) se obține:

Aplicînd transformata z inversă relației precedente se obține:

Relațiile (3.59) și (3.62) exprimă erorile de predicție progresive și regresive de ordinul (i) în funcție de aceleași erori de ordinul (i-1).

Dacă se consideră și secvența originală xn(m) ca eroare de predicție de ordinul zero, astfel încît să se poată scrie:

atunci cu ajutorul relațiilor (3.63), (3.59) și (3.62) se poate reprezenta o rețea ca cea din fig. 3.17, formată din p etaje identice conectate în cascadă, care reprezintă de fapt chiar implementarea numerică a filtrului de eroare de predicție ce are funcția de transfer A(z).

Deoarice coeficienții de predicție liniară nu apar în mod explicit în structura rețelei fig.41, înseamnă că minimizarea energiei erorii de predicție se poate efectua în funcție de parametrii {ki, i=1,2,…p} de numiți coeficienți de reflexie. Parametrii {ki} pot fi determinați pe baza erorilor de predicție progresive și regresive fără a mai fi nevoie de calculul coeficienților de autocorelație, cu ajutorul reției:

Datorită faptului că relația (3.64) este de forma unei funcții de corelație, coeficientul ki, apare aca un coeficient de corelație între secvențele erorilor de predicție {e(i-1)(m)} și {b(i-1)(m)} de al intrarea etjului i din structura rețelei din fig.41.

Fig.41 Rețeua filtrului numeric al erorii de predicție (latice).

Din acest motiv parametrii ki au mai fost determinați și coeficienții de corelație parțială, sau coeficienții PARCOR și s-au elaborat programe de calcul pe calculator care permit determinarea rapidă a acestor coeficienți.

Metoda celulelor în X, ca și cea a corelației, este stabilă și, în plus, în cazul rețelelor utiliozarea funcției fereastră nu este necesară.

O problemă importantă în cadrul sintezeoi prin predicție liniară constă în stabilirea numărului optim de coeficienți de predicție ce trebuie determinați pentru a se asigura o bună aproximare a semnalului vorbit. Alegerea acestui număr depinde de mărimea frecvenșei de eșandtionare fc.

Măsurătorile experimentale au pus în evidență faptul că pentru modelarea corectă a comportării tractului vocal sunt necesari aproximativ fc poli pentru o fregvență de eșantionare de fc kHz. La acest număr mai trbuiesc o adăugați aproximativ 34 poli pentru a reprezenta spectrul sursei de excitație și interfața tractului vocal cu exteriorul (radiația), ajungîndu-se astfel , pentru o fregvență de eșantionare de 8 khz, la numărul de 1112 poli, iar pentru fregvența de eșationare de 10 kHz, la 1314 poli, adică tot atîțea coeficienți de predicție.

Această determinare este exemplificată cu reprezentatrea în figura 3.18.a a erorii de predicție normalizateîn funcție de numărul de coeficienții de predicție (p), putîndu-se ramarca faptul că scădera erorii de predicție, pentru p>14, devine tot mai lentă, astfel că creșterea în continuare a numărului de predicșie nu mai este justificată de rezultatele care se obțin.

Din aceiași figură se mai poate remarca și faptul că eroarea de predicție este mai mare pntru sunetele sonore decît pentru cele nesonore, deoarice și energia acestor sunete este, în general, cu aproximativ un ordin de mărime mai mare ca cea a sunetelor nesonore.

De o mare importanță în realizarea unei bune sinteze prin predicție liniară este și alegerea segmentului de analiză (N). Deoarice numărul total de calcule depinde de N, este de dorit este de dorit ca acesta să fie cît mai mic, dar, pe de altă parte, datorită periodicității semnalului sonor, pentru a se reflecta, acest aspect în sinteză, este necesar ca N să conțină cîteva periode ale frecvenței fundamentale.

Utilizarea unei ferestre de ponderare impune, de asemenia, lungimea secvenței de analiză, astfel încît erorile de început și sfîrșit, mai mari, ce se obțin în acest caz, pot fi neglijate.

Practic, pentru o frecvență de eșantionare cuprinsă între 810 kHz se recomandă o durată de analiză corespunzătoare la 100400 eșantioane. Acest număr mai poate fi redus dacă se pot folosisegmente de analiză ce conțin numai două perioade ale fundamentalei.

Realizarea unui sintetizor de vorbire prin predicție liniară presupune simularea modelului reprezentat în fig.42 și comanda sa cu un sunet de vectori de forma:

V=V(s1,s2,G,a1,a2,…ai) (3.65)

în care ei –reprezintă parametrul ce comandă frecvența tonului fundamental pentru ganaratorul de armonici;

ek- reprezintă parametrul de comandă al comutatorului sonor/nesonor ;

G- factorul de cîștig al semnalului de excitație;

ai- parametrii de predicție.

Fig.42 Factorul de cîștig al semnalului de excitație

3.2 Metode de sinteză a vorbirii cu codificarea formei de semnal

În cadrul acestor metode, informația de bază este formată din segmente ale formei acustice a vorbirii, putîndu-se opera la unu7l din următoarele nivele:

la nivel de cuvint;

la nivel de morfem;

la nivel de difonem;

la nivel de fonem (alofon).

Structura sintetizorului este asemănătoare celei a unui sistem de achiziție și prelucrări de date analogiceprin meotde numerice, asistat de un microcalculator, sau unsistem similardedicat, realizat pe baza implementării unui microprocesor.

În cazul variantei în care segmentele ce constituie informa ția de bază sunt chear cuvintele, aceastea se înregistrează sub formă numerică în memoria calculatorului, la adrese precise, fărăr pause, de unde se extrag în ordinea alcătuirii textului ce urmează a fi generat. Pentru a genera pauzile, se înregistrează o nouă yonă de memorie cu zgomot de fond, carea se cicleazăapoi de un număr de ori necesar pentru a obține o pauză de o nanumită durată. Prin tehnici de programare se realizează apoi un tabel de adresecorespunzătoare începutului și sfirșitului fiecărui cuvint, în care sunt intercalate și adrese ale zonei de zgomot de fond, pentru a se remarca pauzele dintre cuvinte.

Conform acestui tabel, datele sunt extrase din momorie cu o viteză corespunzătoatre realizării unei vorbiri cursive (vitezpă ce poate fi programată) și aplicate la intrarea convertorului numeric analog, la a cărui ieșire, după filtrare, se obține mesajul ce trebuie generat.

Pauzele se introduc sub forma unor zone cu zgomot de fond, fapt ce corespunde și vorbirii reale. Absența oricărui între cuvinte dă impresia unei vorbiri ne naturale, ceea ce deranjează la audiție.

Refacerea formei semnalului, plecănd de la înregistrarea unor cuvinte, asigură calitatea cea mai bună a vorbirii sintetice, permițind recunoașterea vocii celui care a pronunțat cuvintele, deci asigurînd o naturalețe și o claritate foarte bune. Este neceasr însă în acest caz un volum mare de memorie pentru înregistrare, motiv pentru care sintetizorul respectiv poate dipunede un vocabuar destul de limitat. Înregistrarea cuvintelor în memorie se face prin una dintehnicile obișnuite de conversie analog-numerică (MIC, delta, sau variante ale acestora).

În cazul în care informația de bază este înregistrată la nivel de morfeme, acestea se aleg, de regulă, ca fiind silabilecuvintelor care trebuie să alcătuiască vocabularul sintetizorului.

Se procedeză deci, mai întîi, la o analiză a semnalului de vorbire, care se realizeză cu acelașisistem de achizitie și prelucrări de date, analiza și segmenatrea efectuîndu-se cu ajutorul unui dispozitiv de tip dieplăi grafic.

Dacă informația de bază este selsctată sub forma difonilor, se obține o sinteză prin difoneme, sau alofoni, se obține o sinteză fonemică. Acest sintetizor fonemic, deși poartă același nume cu cel specific codificării sursei de vorbire, se deosibește fundamental de acela, deoarice nu-și propune să modeleze tractul vocal, corespunzător unui fonem, ci intercazează doardoar funcția de timp corespunzătoare semnalului de vorbire, pe care o are memorată.

Pentru a reda fidel și tranzițiile de al un fone la altul, practc, același fonem se inregistreză în mai multe variate, adăugîndu-i-se și un rest din fonemul cu care se leagă în cadrul cuvîntului respectiv, iar sintetizorul este cunoscutfrecvent sub denumirea de sitetizor cu alofoni.

Trebuie făcută o distincție însă între acest tip de sintetizor și sintetizorul cu difoneme, deoarice primul înregistrează doar un rest din fonemul de legătură, pe cînd cel de-al doilea înregistreză ambele foneme, inclusiv tranziția dintre ele.

În cazul sintetizorului cu alofoni s-a calculat că pentru fiecare limbăexistă un număr de cîteva mii de astfel de combinații între foneme diferite, ce se pot cupla și care ar trebui memoratepentru a pemite o sinteză cu o bună inteligibilitate.

Pentru a se asigura și o calitate corespurnzătoare este necesar să se mai prevadă și înregistrarea fonemelor în formă accentuată. Astfel alofonul ”o” din cuvîntul ”doi“ este diferit de cel din cuvîntul “două”, ultimul fiind accentuat.

Cuplarea adoi alofoni în cadrul sintezei trebuie să se realizeze printr-o tehnică de interpolare, care, în cel mai simplu caz, constă în a delimitafiecare astfel de fonem cu un început și sfîrșit, de nivel aproximativ consatant. Această masură de prevedere înlătură tranzițiilebruște dintre două foneme de nivele mult diferite, caz în care diferența de nivel ar fi percepută ca o pocnitură, care ar deranja audiția.

Volumul de memorie este necesar pentru memorarea tuturor alofonilor specifici sintezei unui vocabularnelimitat este destulde mare, dar se constată că, pentru un vocabular uzual, acesta este în jur de 2.000, putînd fi asfel implementat și pe un microcalcualtor, cu o emorie disponibilă de ordinul megaocteților. Pentru ca acestă memorie să fie să fie cît mai ușor de realizat se combină avantajele memoriilor RAM dinamice, de a putea reliza capacitați mari de memorie, cu capsule puține, cu memoriile externe de tip disc flexibil, pentru care au fost elaborate programe de utilizare foarte eficiente și care permitschimbarea rapidă a suportului de memorare.

4. PROTECȚIA MUNCII LA ÎNTREPRINDERE

4.1. Aprecierea pericolului la monitor

Odată cu dezvoltarea tehnicii de calcul tot mai mult se atrage atenția asupra problemelor protecției utilizatorilor, în special acelor care lucrează la calculator, adică lângă monitor. Principalii factori dăunători, care influențează asupra sănătății omului, când acesta lucrează lângă monitor sunt:

radiația sau iradieri ionizate;

câmpul electrostatic;

câmpul electromagnetic, etc.

Iradieri Ionizate reprezintă iradierea electro-magnetică cu o capacitate de ionizare a moleculelor. Dacă se provoacă ionizarea moleculelor organismului uman, atunci legăturile între molecule se distruge și ca rezultat apar diferite boli. Capacitatea de ionizare o au următoarele particule: X- iradieri, fluxul de electroni, substanțele radioactive.

În cazul monitoarelor cel mai semnificativ tip de iradiere ionizată este – iradiere, care însă este foarte mică, de obicei nu depășește normele biologice. Celelalte tipuri de iradieri pot fi neglijate deoarece greu pot fi depistate.

– iradierea apare în urma ciocnirii electronilor cu atomii substanței luminofore sau cu atomii ecranului din sticlă.

Pentru a micșora iradierea ionizată a monitoarelor moderne, pe suprafața lor se aplică o foaie metalică străvezie, care atenuează fluxul de iradiere. O altă cale de apărare împotriva iradierii ionizate este procurarea unui ecran protector, care se instalează pe monitor și are același efect ca și foaia metalică străvezie.

În genere iradierea ionizată asupra omului poate provoca următoarele acțiuni:

locale – acțiuni de scurtă durată cu doze mari, care aduce la traume locale: îmbolnăvirea pieii, pierderea pieii, pierderea unghiilor, defectarea oaselor, cancer;

totale – reprezintă iradieri îndelungate cu doze mici, aduce la îmbolnăvirea sângelui (leucemie).

Câmpul electrostatic, care apare pe ecranul monitorului este rezultatul bombardării permanente a monitorului cu fascicolul de electroni emis de catod. Astfel sarcina electrică, case se acumulează pe suprafață monitorului, formează câmpul electrostatic. Fenomenul electrizării statice este legat și de starea aerului din mediu. În condiții normale aerul se caracterizează cu proprietăți izolatorii înalte, însă sub acțiunea razelor solare și celor cosmice, radiației materialelor radioactive a scoarței pământului și a altor factor ionizatori, moleculele neutrale a aerului se ionizează, formând ioni pozitivi și negativi – purtători ai sarcinii electrice. Dacă intensitatea câmpului electric, format de materialele, de dispozitivele de curent continuu și de obiectele, care ușor se electrizează, este mare, atunci ionii liberi obțin energie cinetică suficientă pentru a forma ioni noi la ciocnirea lor cu moleculele neutre. În urma ionizării aerul își pierde proprietatea sa de izolator (devine conductibil) și descărcarea electrică latentă se transformă într-o descărcare sferică, adică are loc o străpungere electrică a aerului.

Descărcarea electricității statice poate provoca o explozie, incendiu și alte accidente. La unele întreprinderi, care produc substanțe sintetice, polimeri și produse din aceste substanță, și care posedă proprietăți dielectrice înalte, electrizarea micșorează productivitatea muncii și este unul din motive care duc la scăderea calității producției.

Influența sistematică a câmpului electrostatic de intensitate înaltă asupra corpului omului poate duce la unele dereglări funcționale a sistemului central nervos, a sistemului cardio-vascular și a altor organe. Din aceste motive, intensitatea maxim-admisibilă a câmpului electric la locurile de muncă este normată:

Tab. 5

Intensitatea maxim-admisibilă a câmpului electric la locurile de muncă

Intensitățile admisibile a câmpului electrostatic sînt indicate fără a lua în considerație influența asupra omului a descărcărilor electrice. Normele indicate pentru intensitatea câmpului electrostatic mai mare de 20 kW/m se utilizează numai cu condiția, restul timpului a zilei de lucru intensitatea nu întrece 20 kW/m. Dacă intensitatea câmpului electrostatic întrece valorile indicate, atunci se aplică unele măsuri de micșorare a ei.

Măsurile principale de micșorare a intensității câmpului electric în zona de lucru sânt:

îndepărtarea surselor a câmpurilor electrostatice din zona personalului care deservește aparatura;

ecranarea sursei câmpului sau a locului de muncă;

utilizarea neutralizatorilor de sarcini electrice statice;

umezirea materialului care se electrizează;

schimbarea materialelor, care ușor se electrizează cu materiale ce nu se electrizează;

alegerea suprafețelor care contactează conform condițiilor de electrizare minimă;

modificarea procesului tehnologic în așa mod ca să se micșoreze nivelul de electrizare;

alegerea materialelor și suprafețelor care greu electrizează alte corpuri sau le electrizează cu sarcini de polaritate diferită;

instalarea în toate încăperile, unde se află oameni, a podelelor care conduc curentul electric.

În calitate de măsură de protecție individuală a omului de la electricitatea electrostatică poate servi încălțămintea ce conduce curentul electric, albituri, halat, etc. adică tot ce asigură legătura electrică a corpului omului cu pământul.

În majoritatea monitoarelor moderne problema câmpului electrostatic este parțial rezolvată prin introducerea tehnologiei antistatice. Datorită acestei tehnologii câmpul electrostatic se micșorează până la 10% din intensitatea inițială a acestuia. În afară de această majoritatea ecranelor protectoare, care micșorează iradierea ionizată, mai sigură și atenuarea considerabilă a câmpului electrostatic.

Câmpul electromagnetic creat de monitor este de asemenea un factor dăunător sănătății omului.

Influența câmpurilor electromagnetice de mare intensitate asupra omului constă în absorbția de către țesuturile corpului uman a energiei, însă influența principală îi revine câmpului electric. Nivelul de influență a câmpurilor electromagnetice asupra omului depinde de frecvență, de puterea emisiei, de durata acțiunii, de regimul de emisie (prin impulsuri sau continuu), și de asemenea de proprietățile individuale ale organismului. Influența câmpului electric de frecvență joasă provoacă dereglări în activitatea funcțională a sistemului cardio-vascular, și chiar la schimbări privind componența sângelui.

Influența câmpului electromagnetic de frecvență înaltă se reflectă sub forma efectului termic, care duce la ridicarea temperaturii corpului, la supraîncălzirea locală a țesuturilor corpului și a organelor cu o termoreglare slabă. Ca rezultat unii lucrători suferă din cauză insomniei, simt dureri în regiunea inimii, dureri de cap, ușor obosesc.

Pentru a micșora puterea de emisie a sursei câmpului electromagnetic pot fi utilizate următoarele mijloace tehnice:

utilizarea unui astfel de regim de lucrul, în care dispozitivul lucrează cu o putere mai mică decât cea proiectată;

lichidarea locurilor de emisie suplimentară;

micșorarea undelor reflectate prin ajustarea sarcinilor, etc.

Alegerea corectă a regimului de lucru a personalului și a utilajului permite micșorarea prezenței omului în zona de acțiune a câmpurilor electromagnetice.

Utilizarea sistemelor de dirijare la distanță cu utilajul permite personalului să-și îndeplinească funcțiile în afara zonei de acțiune a câmpurilor electromagnetice.

Procesul de ecranare, des utilizat cu scopul de micșora influența câmpurilor electromagnetice, utilizează fenomenul de absorbție și reflectare a energiei câmpului electromagnetic. Pentru confecționarea ecranului se utilizează materiale cu o conductibilitate electrică înaltă (aluminiu, cupru, oțel), și cu proprietăți de absorbție și reflectare sub formă de foi și plasă. Ecranele obligatoriu se unesc la pământ.

Eficacitatea acțiunii de ecranare a materialului se caracterizează prin adâncimea infiltrării câmpului electromagnetic în ecran, care depinde de materialul de confecționare.

Adâncimea infiltrării câmpului electromagnetic, la care acest câmp scade de 2,718 ori:

unde – permeabilitatea magnetică relativă a materialului ecranului, Hn/m;

– conductibilitatea relativă a materialului ecranului, cm/m;

f frecvența câmpului electromagnetic Hz.

Adâncimea infiltrării a frecvențelor înalte și supraînalte în ecran de obicei nu întrece un milimetru, astfel grosimea ecranului se alege din considerente constructive.

4.2. Calcularea protecției “legare la nul”

Legarea la nul este o măsură de protejare a omului de electrocutare prin deconectarea strictă și în viteză a rețelei în caz de apariție a tensiunii pe carcasă (străpungerea izolării). Deconectarea strictă se efectuează, dacă curentul de scurt circuit format prin fază și firul nul este destul de mare pentru ca declanșatorul să funcționeze corect.

Scopul calculării instalației “legarea la nul” – determinarea secțiunii firului nul, care satisface condiția funcționării protecției maximale de curent. Valoarea protecției se determină după puterea instalației electrice proiectate (exploatate).

Curentul de scurtcircuit trebuie să depășească valoarea protecției conform cerințelor (pentru siguranțe Is.c. ≥ 3 In, unde In – curentul nominal al siguranței). Modul de calculare este următorul:

Se calculă rezistența circuitului “faza – nul”:

;

unde: Rf – rezistența activă a firului fazic, Ohm;

Rn – rezistența activă a firului nul, Ohm;

Xc – rezistența inductivă a rețelei “faza – nul” și pentru rețelele cu tensiune joasă (până la 1000 V) și firele din cupru și aluminiu, deci Xc este foarte mică (Xc = 0).

Rezistențele active se calculă după formula:

; ;

unde Lf, Sf, Ln, Sn – lungimea și secțiunea firului fazic și nul corespunzător;

–rezistența electrică specifică: pentru cupru, Cu0.018 Ohm * (mm / m);

pentru aluminiu Al = 0.028 Ohm * (mm / m);

Deoarece materialul din care s-a confecționat cablul (firul) este cupru, lungimea firului de fază = 400 m, iar secțiunea firului = 16 mm vom obține următoarele calcule:

;

Pentru lungimea firului nul Ln = 400 m și secțiunea firului = 10 mm vom obține:

;

curentul de scurt-circuit calculat în A:

;

unde Zt – rezistența transformatorului.

Pentru tensiunea U = 380 V și Zt / 3 = 0.0354 Ohm (din tabel) obținem următoarele calcule:

Se compară Is.c. cu In: dacă Is.c. ≤ 3 In pentru siguranță atunci se aleg conductoare de o secțiune mai mare și calculul se repetă.

Deoarece In este egal cu 63 A obținem:

Rezultă că, curentul de scurtcircuit depășește valoarea cerințelor obiectului protecția muncii (pentru siguranțe) sînt respectate.

4.3. Securitatea antiincendiară

Incendiu se numește procesul necontrolat de ardere în afara unui loc de ardere special amenajat, ce aduce daune materiale.

În cadrul oricărei organizații, sau întreprinderi trebuie să existe mijloace de anunțare, de apel rapid la serviciile orășenești antiincendiare în cazul apariției incendiului. Pentru obiectele de o importanță majoră sau periculoase, este recomandată posibilitatea legăturii telefonice directe cu secția antiincendiară orășenească. Semnalizarea antiincendiară se execută cu ajutorul diferitor sisteme. Pentru a anunța despre incendiu se utilizează legătura telefonică, legătura radio, sirena, semnalizarea cu ajutorul clopotelor etc. Mijloacele de anunțare despre incendiu trebuie să fie disponibile toate 24 ore.

Semnalizarea incendiului se execută de diferite sisteme. Cel mai simplu și mai des utilizat este semnalizatorul manual, care se activează prin apăsarea butonului. Așa semnalizatoare se instalează pe scări, în paliere și sînt vopsite în culoarea roșie.

În timpul de față larg se utilizează semnalizatoarele automate, care conform principiului de lucru se împart în cele termice, de fum, combinate și optice.

Semnalizatoarele termice de acțiune maximă acționează la deformarea unei plăci bimetalice, la încălzirea ei până la 60, 80, 100 °C în dependență de reglaj.

În semnalizatoarele termice semiconductoare, în calitate de elemente sensibile sânt termorezistențele, din cauza cărora se schimbă curentul în rețea la încălzirea lor.

Termo-semnalizatoarele diferențiale reacționează la ridicarea rapidă a temperaturii (la 30°C timp de 7 secunde), iar în calitate de element sensibil se folosește elementul la încălzirea căruia apare termo-FEM.

În semnalizatoarele de fum în calitate de element sensibil se utilizează camera de ionizare, în care sub acțiunea izotopului radioactiv (plutoniu-239) apare un curent de ionizare. Apariția fumului în cameră mărește consumul de raze ceea ce cauzează micșorarea curentului de ionizare.

În semnalizatoarele combinate se folosește interconectarea semnalizatorului de fum cu cel termic. La camera de ionizare se mai conectează în plus încă o termorezistență.

Semnalizatoarele combinate reacționează atât la apariția fumului, cât și la schimbarea temperaturii. Semnalizatoarele optice reacționează la razele ultraviolete ale spectrului flăcării, deoarece elementul sensibil reprezintă contoarele de fotoni. Semnalizatoarele de diferite tipuri pot controla suprafețe de la 15 până la 100 m2.

Semnalizatoarele de fum și cele combinate nu se instalează în încăperi umede și prăfuite, sau în încăperi în care se conțin vapori de acizi, baze, sau unde temperatura este mai mare decât 80 °C, deoarece în așa locuri poate avea loc acționarea falsă ale semnalizatoarelor.

4.3.1. Cauzele apariției incendiilor

Procesul de ardere este posibil în cazul când este prezentă substanța arzătoare, sursa de aprindere și oxidantul, care în cele mai dese cazuri este oxigenul, ce se conține în aer. La reducerea concentrației oxigenului din aer până la 12-14% arderea majorității substanțelor se oprește. Procesul de ardere este posibil și în lipsa oxigenului – deoarece hidrogenul, stibiul și unele metale ard în clor. Unele substanțe ( turba, cărbunele, funinginea, cârpele uleioase), numite piriforme pot să se autoinflameze la contactul cu aerul. Auto-aprinderea acestor substanțe are loc în urma proceselor chimice, termice sau microbiologice. Substanțele se încălzesc sub acțiunea căldurii ce vine din afară, ce se elimină în timpul reacțiilor chimice, și de asemenea în rezultatul acțiunii micro-organismelor.

În procesul de producție, incendiul poate apare în urma unor cauze de ordin electric sau ne electric. La cauzele de ordin ne electric se referă:

funcționarea proastă a instalațiilor de producție și dereglarea procesului tehnologic; comportarea iresponsabilă sau ne atentă cu focul (fumatul, lăsarea fără supraveghere a dispozitivelor de încălzire);

construcția incorectă sau dereglarea sistemului de ventilare;

autoinflamarea materialelor.

La cauzele de ordin electric se referă:

scurtcircuitul;

supraîncărcarea conductoarelor;

rezistența mare de trecere;

scânteierea;

electricitatea statică și descărcarea fulgerului;

arcul electric ce apare în timpul sudării electrice și în timpul operațiilor greșite cu aparatajul de comutare;

instabilitatea tensiunii electrice din rețea – ca rezultat se aprind unele circuite integrate din calculator, sau monitor, etc.

4.3.2. Mijloacele de stingere a incendiilor

Cel mai răspândit mijloc de stingere a incendiilor este apa, ce posedă o capacitate termică enormă și o temperatură mare de vaporizare, ceea ce permite de a lua căldura din focarul incendiului. În același timp apa nu poate fi folosită pentru stingerea soluțiilor ușor inflamabile (benzina, gaz lampant, ulei mineral), deoarece din cauza greutății relative mari, ea se adună sub aceste soluții și împrăștiindu-se ușor și rapid măresc considerabil suprafața de ardere. De asemenea, se interzice stingerea cu apa a substanțelor ce elimină reagenți inflamabili (carbid de calciu, silitra) la contactarea lor cu apa.

Pentru stingerea instalațiilor electrice sub tensiune, apa nu poate fi folosită fără măsuri speciale de protecție a oamenilor de la atingerea curentului electric prin getul de apa. În clădiri, în locuri special rezervate, se instalează scuturi antiincendiare, ce conțin unele rechizite necesare pentru stingerea focului: robinet de presiune, țeava elastică, în unele locuri nisip, găleți, topoare și alte instrumente de distrugere a pereților.

O mare răspândire au căpătat mijloacele automate de detectare și stingere a incendiului. Principiul de funcționare a acestora, în majoritatea cazurilor, se bazează pe prezența unor țevi în interiorul cărora se află apă sub presiune, și niște dopuri din materiale ce se topesc ușor, introduse în aceste țevi. La ridicarea temperaturii în încăpere, dopurile se topesc și apa din țevi sub acțiunea presiunii stropește focul.

O modalitate efectivă în prevenirea incendiilor, minimizarea daunelor și reducerea jertfelor omenești este familiarizarea muncitorilor, copiilor și a populației în întregime cu regulile de comportare în situații de incendiu, modalitățile de stingere a focului, normele elementare de prevenire a incendiului.

4.3.3. Securitatea antiincendiară în sălile de calcul

Pentru a analiza nivelul securității incendiare a locurilor de muncă, a zonelor de producție, a sălilor de calcul se folosește următoarea clasificare :

1.Clasificarea materialelor de construcție și construcțiilor după nivelul de inflamabilitate:

ne inflamabile;

greu inflamabile;

inflamabile;

2. Clasificarea construcțiilor după nivelul rezistență la incendiu (limita nivelului de rezistența la incendiu – timpul în ore din momentul începerii incendiului până la momentul apariției crăpăturilor).

3. Clasificarea încăperilor după RCIE ("Regulile de Construcție a Instalațiilor Electrice"):

cu pericol de explozie;

cu pericol de inflamare.

Criteriile de apreciere:

Conținutul de substanțe inflamabile;

Regimul termic de prelucrare.

4. Clasificarea proceselor de producție după pericolul incendiar:

cu pericol de explozie;

cu pericol de explozie și inflamare;

cu pericol de inflamare;

fără pericol de inflamare;

Conform primei clasificări (clasificarea materialelor de construcție și construcțiilor după nivelul de inflamabilitate) sala de calcul este ne inflamabilă deoarece sînt prevăzute multe măsuri de prevenire a incendiului cum ar fi: sisteme de semnalizare, podele din metal, mese metalice, pereții în sala de calcul se acoperă cu substanțe ne arzătoare.

După clasificarea a doua (clasificarea construcțiilor după nivelul rezistență la incendiu), de obicei sălile de calcul se află în clădiri construite sau din beton armat sau coteleț (pentru instituțiile de învățământ). Ambele materiale de construcție au o rezistență la incendiu mare – pereții în sala de calcul se acoperă cu substanțe ne arzătoare.

După clasificarea a treia (după Regulile de Construcție a Instalațiilor Electrice), luând în considerație conținutul mic de substanțe inflamabile și regimul termic de prelucrare, sălile de calcul pot fi caracterizate – cu pericol mic de inflamare.

Sălile de calcul după pericolul incendiar a proceselor de producție se referă la categoria celor cu pericol de inflamare ceea ce se explică prin faptul, că în încăpere se găsesc substanțe inflamabile: de obicei, aceste săli sînt echipate cu utilaj care conține masă plastică, care totuși arde. Trebuie însă de menționat, în ultimul timp masa plastică utilizată la fabricarea tehnicii de calcul are o astfel de componență chimică, care nu arde sau care se autostinge după primele secunde de ardere. În sala de calcul de obicei lipsesc așa atribute cum ar fi : covoare, obiecte din lemn, dulapuri cu cărți, etc. Reiese că, cu toate că pericolul de inflamare există, el este foarte mic.

Securitatea antiincendiară poate fi asigurată prin măsuri de profilaxie antiincendiară și prin respectarea regulilor de prevenire a incendiului. Noțiunea de profilaxie antiincendiară include un complex întreg de măsuri, necesare pentru preîntâmpinarea apariției incendiului sau reducerea urmărilor lui.

4.3.4. Măsurile profilactice de luptă cu cauzele incendiului în sălile de calcul

Măsurile de eliminare a cauzelor incendiilor și exploziilor se divizează în:

măsuri tehnice;

măsuri de exploatare;

măsuri organizatorice;

măsuri de regim.

La măsurile tehnice se referă – respectarea normelor antiincendiare la construcția clădirilor, sistemului de încălzire, sistemului de ventilare, la alegerea și montarea echipamentului electric, sistemele paratrăsnet.

La măsurile de exploatare se referă – exploatarea corectă a utilajului de producere, instalațiilor de compresie, cuptoarelor și a altor dispozitive de forță și a utilajului electric; menținerea corectă a încăperilor, a clădirilor și a teritoriului întreprinderii.

La măsurile organizatorice se referă – studierea regulilor antiincendiare de către personalul întreprinderii, sau organizației, editarea instrucțiunilor și placatelor necesare.

La măsurile de regim se referă – interzicerea sau impunerea unor restricții de utilizare a focului deschis, fumatului, a lucrărilor de sudare în anumite locuri.

La proiectarea și construcția clădirilor și încăperilor, (în particular a sălii de calcul), de asemenea trebuie să se respecte măsurile antiincendiare:

protecția construcțiilor de lemn (dacă sînt) se realizează prin îmbibarea cu substanțe

chimice ne inflamabile (antipirene), acoperirea cu vopsele refractare;

pentru limitarea extinderii incendiului se fac obstacole antiincendiare: pereți, bariere, uși, porți, ferestre. Toate acestea trebuie îndeplinite din materiale ne arzătoare.

Măsurile active de luptă cu incendiile în sălile de calcul:

izolarea locului de ardere de aer cu ajutorul substanțelor solide (nisip, pături, etc.);

răcirea focarului până la unele temperaturi stabilite, care se face cu ajutorul apei, însă apa are restricții la stingerea substanțelor inflamabile, instalațiilor electrice, etc., de aceea mai des se folosește bioxidul de carbon, care în reacție cu aerul micșorează temperatura până la -78 C;

reducerea vitezei petrecerii reacției chimice în flacără – în acest scop se folosesc prafurile;

distrugerea mecanică a flăcării în rezultatul acționării asupra ei a unui get puternic de gaz sau apa.

Pentru stingerea focului în sălile de calcul se utilizează extinctoarele cu CO2 și praf, care posedă o viteză mare de stingere, timp îndelungat de acțiune, posibilitate de stingere a instalațiilor electrice, eficacitate înaltă de luptă cu focul.

Reieșind din normele securității antiincendiare, pentru o sală de calcul cu suprafața de 100 m˛ sînt necesare următoarele mijloace primare de stingere a incendiului:

un extinctor de CO2 de tip OU-5 sau OU-8, cu ajutorul căruia se poate stinge flacăra de pe diferite materiale și instalații electrice (până la 1000 V);

un extinctor de spumă chimică (OHP-10) sau un extinctor de spumă (OVP-5 sau OVP-10) pentru stingerea materialelor solide și lichidele inflamabile (în afara de instalațiile sub tensiune);

pâslă sau asbest (1X1; 2X1,5; 2X2 m).

Sălile de calcul trebuie să fie echipate cu semnalizatoare incendiare – pentru semnalizarea apariției incendiului. În calitate de semnalizatoare incendiare pentru sălile de calcul se utilizează semnalizatoarele de fum fotoelectrice de tip IDF-1 sau DIP-1.

În dependență de înălțimea podului (3 m) și aria podelei (40 m.), după norme este suficientă prezența a trei semnalizatoare pentru toată încăperea. Aceste dispozitive se caracterizează printr-o viteză mare, sensibilitate înaltă și care funcționează după principiul difuziunii căldurii de către particulele de fum.

Avantajul acestor semnalizatoare constă în lipsa inerției, controlul unei suprafețe mari. Neajunsul lor este posibilitatea acționării false și costul ridicat.

Toate sistemele, care utilizează curent electric – dispozitivele de repartizare, aparatele de măsură, sistemele de siguranță și alte aparate electrice trebuie să fie montate pe suporturi care nu ard (marmor, textolit, asbest, etc.).

Măsurarea rezistenței izolației circuitului electric trebuie să se execute în fiecare an în încăperile cu mediul normal, iar în încăperile cu umiditate înaltă, cu exces de gaze și aburi – nu mai rar de 2 ori pe an.

Suportul metalic, carcasele echipamentelor electrice și electronice, de asemenea țevile metalice, prin care trece sârmele electrice, trebuie să fie conectate la pământ.

În gospodăria obiectelor electrice deseori se utilizează acumulatoarele, încărcarea cărora se însoțește de emisia gazelor și aburilor explozive și periculoase pentru sănătatea omului. Din aceste motive acumulatoarele trebuie instalate în încăperi aparte, bine izolate de celelalte, cu o ventilare corespunzătoare.

Aceste măsuri sînt mai mult valabile pentru acumulatoarele produse până în anul 1990.

Astăzi acumulatoarele, care se utilizează la alimentarea calculatoarelor, sînt proiectate și fabricate după alte tehnologii mai avansate, și încărcarea lor nu se mai însoțește de emisia gazelor și aburilor explozive și periculoase.

În caz de incendiu trebuie să fie prevăzută posibilitatea evacuării rapide a oamenilor. Căile de evacuare trebuie să asigure evacuarea tuturor oamenilor, care se află în încăperile întreprinderii într-un timp foarte scurt.Numărul ieșirilor de evacuare din încăperi și de la fiecare etaj trebuie să se stabilească în corespundere cu ГОСТ 2.09.02-85, și să fie nu mai puțin de două ieșiri.

5. PARTEA ECONOMICĂ

5.1. Piața software-ului

Este foarte important de înțeles faptul că, o piață cum este cea a software-ului, cea mai puternică piață la ora actuală, funcționează după niște reguli foarte simple. Nu se produce de dragul producției sau a produsului în sine, indiferent cât de frumos și perfect este, se produce numai și numai dacă există o necesitate ce impune produsul respectiv. Acest fapt se reflectă atât în industrie cât și în cercetare. Energia investită într-un produs software, implicând atât faza de proiectare, implementarea în sine cât și caracteristicile principale ale acestuia, este direct proporțională cu miza finală a proiectului. Acest lucru este deseori neglijat de designerul entuziast, puternic impulsionat de frumusețea potențială a produsului, «uitând» pe parcurs finalitatea reală a proiectului respectiv.

O altă caracteristică determinantă a unor importante segmente ale pieței software este în prezent procentul majoritar de consumatori neprofesioniști, fapt ce implică mai multe lucruri. În primul rând este vorba de creșterea importanței imaginii produsului, atât la nivel de prezentare în reclame și spoturi publicitare cât și la nivel de interfață cu utilizatorul. Înțelegerea rapidă a acestei reguli poate duce la un design orientat către utilizatorul final (end-user). Astfel s-au putut promova sisteme uriașe, mediocru proiectate, dar cu o interfață. Această abordare, la rândul ei, a impus noi linii de design tehnologic nu neapărat mai bune sau mai eficiente, ci mai degrabă punând accentul pe compatibilitate cu produse mai vechi. Un al doilea aspect al procentajului majoritar de consumatori neprofesioniști este apariția fenomenului de concurență neloială practicată de către unele companii extrem de mari.

5.2. Marketing

Una dintre ideile care trebuie să călăuzească în permanență designerul (proiectantul) modern de software este aceea că: «etichetele» asignate de-a lungul timpului unor concepte se modifică extrem de des însă ideile bune aflate în spatele acestora sunt puține și foarte simple în esență. Separarea elementelor de marketing de ceea ce aduce cu adevărat un produs nou poate duce la descoperiri deseori frustrante.

Vechea zicală «reclama este sufletul comerțului» își găsește locul mai mult ca oriunde într-o piață orientată pe IT {Information Technology) unde chiar obiectul major de tranzacționare îl reprezintă informația și uneltele de prelucrare ale acesteia. Advertising, în sensul modem al cuvântului nu este un corespondent simplu și direct al reclamei așa cum ne-o imaginăm cu toții

privind spoturile publicitare mai mult sau mai puțin puerile din mediile audio și TV. Procesul de advertising modem pornește cu, și se bazează pe, elemente definite încă înaintea conturării unui eventual produs final vandabil. Deseori piețele modeme vehiculează entități virtuale cu o valoare de potențial imens. Corespondentul real este deseori doar o idee sau o imagine bine pusă la punct a unui produs viitor sau prezent, dar mediocru.

Un exemplu ar fi firme ca Netscape Communications care au pornit prin a oferi un produs gratuit (deci doar imagine) și în foarte scurt timp au penetrat piața IT, segmentul browserelor Web, deținând și în prezent un important procent al acestuia.

Fără a intra în detalii, trebuie reținut faptul că, deseori, în piețele modeme imaginea creată a produsului este cea care-1 propulsează înainte incluzând chiar și designul acestuia. Acest fapt, aparent îngrijorător, creează un paradox greu de înțeles de mulți în prezent. Astfel inginerul software va asculta sfaturile oamenilor care se vor ocupa de imaginea produsului; iar aceștia vor asculta afirmațiile lui în ceea ce privește funcționalitățile produsului.

Concluzionând: nu scrieți linii de cod ci creați o imagine! Este un alt mod de a spune că perspectiva de ansamblu asupra unui produs în general este mult mai importantă decât implementarea produsului la un moment dat.

5.3. Designul la nivel de implementare

Vom intra aici în detalii ce condiționează designul la nivel de implementare pentru un sistem software.

Am menționa de la început faptul că traficul informațional între designer (developer/arhitect) și clienții/acționarii sistemului considerat se va efectua în majoritate utilizând tehnici electronice cum ar fi email, fax sau online chat. Acest fapt impune dintru început aplicarea unui șablon de proiectare (design pattem) de tip skeleton (top-down) prin construirea unui sistem ce își propune o funcționalitate implementată modular, susținută de un schelet inițial, dezvoltat foarte rapid.

Marea majoritate a proiectelor modeme sunt condiționate din mai multe puncte de vedere ce duc în final la constrângerea, aparent neimportantă, de a atinge un stadiu funcțional cât mai rapid. Condiționările sunt în primul rând mobilitatea extrem de crescută a pieței atât în ceea ce privește balanța cerere-ofertă cât și în ceea ce privește tehnologia în sine. Un designer modem nu își va permite luni de zile de studiu în ideea obținerii unei arhitecturi optime deoarece riscul ca sistemul său extrem de fiabil și optim să devină învechit chiar în acele luni de studiu, este foarte mare. O a doua condiționare provine de la potențialul concurenței care desigur cunoaște de asemenea nevoile curente ale pieței și va dezvolta produse similare ca-n în același timp. Ne vom rezuma la aceste două exemple de condiționări, care impun rapiditatea dezvoltării unui sistem funcțional chiar și în varianta skeleton.

Modularitatea este impusă și din multe alte puncte de vedere. Unul dintre ele ar fi posibilitatea reutilizării unor module dezvoltate anterior sau de către terți în cadrul sistemului, lucru ce ar optimiza

în ansamblu investiția umană în proiect. Un alt factor ar fi posibilitatea specificării unor interfețe inter-module ce vor putea fi apoi puse în corespondență cu diferite echipe (vezi mai jos) asigurând astfel și o coerență a procesului de dezvoltare propriu-zis.

Desigur sistemul nostru software își propune să ofere o cotă de portabilitate maximă și asta nu înseamnă nici pe departe numai posibilitatea rulării codului executabil pe mai multe plaftorme/arhitecturi hardware/software într-un mod identic. Sensul modem al noțiunii de portabilitate este dat de o serie de calități și restricții impuse produsului respectiv. Începând cu sistemul de documentare și help online, posibilitatea auto configurării în funcție de platforma curentă și optimizarea aplicației pentru a rula cât mai eficient în acel mediu și terminând cu banala afirmație că aplicația va trebui să ofere o comportare și o funcționalitate pseudo-identică pe toate platformele hardware/software în cauză, toate aceste elemente participă la definirea noțiunii de portabilitate.

O altă calitate a sistemului nostru, aparent în contradicție cu cea evocată anterior (portabilitatea) este capacitatea de automodelare și integrare într-un mediu format din aplicații ne portabile, vechi, monolitice, greoaie însă folosite de o mare majoritate de acționari ce își doresc utilizarea acestora în continuare chiar și după apariția sistemului nostru superb, modular, portabil și funcțional. Integrarea este poate una dintre cele mai controversate și greu de implementat calități însă și cea mai apreciată de către end-useri (utilizatorii finali sunt și ei acționari în cadrul sistemului). În acest sens tot mai multe din tehnologiile modeme utilizate în prezent se orientează către facilități portabile de integrare cu mediul gazdă al aplicației/sistemului dezvoltat.

Poate una dintre cele mai importante calități ce ne-o propunem în cadrul sistemului nostru este aceea care determină diferența dintre un simplu program scris în grabă pentru satisfacerea unui client și un sistem software dezvoltat cu o anume maturitate. Modularitatea și posibilitatea reutilizării modulelor în cadrul altor sisteme fac necesară o dezvoltare bazată pe o documentare completă a fiecărui pas de dezvoltare, a funcționalității fiecărui modul precum și a detaliilor și funcționalității fiecărei interfețe oferite de modulele din cadrul sistemului în ansamblu.

Etapa finală a dezvoltării sistemului nostru este desigur cea de implementare propriu-zisă. Aceasta este compusă din mai multe sub etape ce asigură în ansamblu și continuitatea produsului. Ne vom ocupa aici de elemente cum ar fi definirea specificațiilor, termene limită (deadlines) și stabilirea lor, sistemul de versiuni și subversiuni, construirea echipelor și interfațarea, uneltele utilizate, sistemul de documentație și în fine facilitatea de mentenanță (incluzând aici testarea, depanarea precum și întreținerea pe termen mediu și lung), o calitate necesară și extrem de vitală în cadrul oricărui sistem software.

Definirea inițială a specificațiilor se poate deseori suprapune cu etapa de design arhitectural în cazul în care arhitectul va fi și cel ce va coordona dezvoltarea implementării în sine. Aici se stabilesc în principal elementele de detaliu mediu la nivelul modulelor precum și specificarea și înghețarea parțială a interfețelor funcționale din cadrul sistemului. În definirea specificațiilor vom trece de la modelul adoptat în analiza arhitecturii sistemului în sine, la un model intuitiv mai apropiat, considerând aici doar acei acționari ce pot fi cu adevărat caracterizați prin termenul de beneficiari ai sistemului. Aceștia vor stabili principalele funcționalități oferite de aplicație prezentând apoi arhitectului setul inițial al specificațiilor globale. Jobul arhitectului este de a integra aceste cerințe într-un model coerent având și opțiunea unor eventuale retușuri și eliminări a elementelor redundante sau imposibil de realizat.

Esențial este ca în această fază să fie definite, de comun acord între arhitect și beneficiari, cât mai multe aspecte legate de structură, dar mai ales de funcționalitatea aplicației. Specificațiile inițiale sunt un pas foarte important deoarece determină durata estimativă a proiectului precum și manopera necesară, deci în final costurile de dezvoltare. De aceea, este extrem de important ca această etapă să se desfășoare extrem de atent și păstrând un echilibru constant între posibilitățile reale și cererile beneficiarului.

Experiența arată că, în timp, pe măsură ce implementarea avansează, specificațiile inițiale și mai ales cerințele beneficiarului pot varia foarte mult și acest lucru nu este în beneficiul proiectului în ansamblu deoarece implică mai multă muncă, mai mult timp și în mod clar posibilitatea apariției incoerențelor în proiectul rezultat final. Recomandarea este de a definitiva specificațiile funcționale inițiale printr-un document ce va fi păstrat pentru referința ulterioară. Orice modificare va interveni la aceste specificații se va face, similar, printr-un document.

Imediat după definitivarea specificațiilor, arhitectul va construi rapid un draft al arhitecturii inițiale a sistemului, pe baza căruia, împreună cu șeful de proiect (șef al echipei de programatori), va estima niște cote de deviz pentru proiect incluzând aici termenele limită (deadlines), durata (duration) precum și factorul număr de ore / programator necesare, factor determinant în costurile de dezvoltare. Trebuie pus accentul pe atributul estimativ ce va trebui explicat în această faza și beneficiarilor, nefiind posibilă determinarea în avans a tuturor elementelor surpriză de care vom avea parte pe parcursul dezvoltării în sine.

Există o «glumă» ce recomandă unui dezvoltator de soft să comunice beneficiarului întotdeauna un timp estimativ dublu față de cât ar considera în realitate că durează dezvoltarea proiectului respectiv, prevăzând astfel un timp auxiliar pentru orice surprize neașteptate ar putea să apară. Din nefericire concurența acerbă face acest lucru aproape imposibil însă experiența arată că

este de preferat pierderea unui contract datorită unei estimări de timp mari (dar cu păstrarea unui renume bun) decât întârzierea la termen ce va aduce sigur o pierdere a renumelui și să nu uitam că principalul atu în această lume a IT este o imagine cât mai bună și atrăgătoare.

Odată stabilite niște termene de predare estimative, un alt element de considerat este cel al surprizelor ce ne vor aștepta cu siguranță pe parcursul dezvoltării proiectului. Nu există proiect software ce ar putea scăpa de aceste surprize. Ele pot lovi din direcții diferite și chiar simultan, începând cu probleme la nivelul unor dificultăți de programare, sănătatea unui programator important, hackerul ce pătrunde și șterge fișiere, expirarea licenței uneltelor de dezvoltare utilizate. Iată numai câteva dintre cele mai neașteptate întâmplări ce pot apare. Dar surprize vor apare și vor apare așa de regulat și sigur încât termenul de surpriză deseori nu își are rostul. Și cum una dintre regulile lui Murphy spune că dacă poți avea o surpriză plăcută și una neplăcută atunci în majoritatea cazurilor o vei avea pe cea neplăcută.

În cazul apariției unor elemente neprevăzute în dezvoltarea proiectului, elemente ce ar putea influența într-un mod sau altul bunul mers al proiectului și mai ales vor aveam impact și asupra beneficiarului într-un fel sau altul, de exemplu prin necesitatea prelungirii termenului contractului, sfatul nostru este de a comunica cât mai rapid cu beneficiarul împărtășindu-i problemele rapid și fără ocolișuri. Acest lucru va fi sigur apreciat. Nu lăsați lucrurile să dreneze sperând că veți găsi o soluție miraculoasă în ultimul sfert de oră înainte de termen. Asemenea soluții nu există și dacă apar sunt doar excepții de la regulă. Beneficiarul va aprecia mult mai mult faptul că își poate defini mai bine pașii următori cunoscând eventualele întârzieri. Comunicarea cu acesta este esențială și acest lucru nu trebuie uitat pe parcursul întregului proiect.

5.4. Sistemul de revizii

Un element esențial, mai ales în cazul lucrului în echipă asupra unor sisteme modulare, îl reprezintă definirea și impunerea unui sistem de revizii incluzând versiuni, revizii și modificări. Acest sistem va trebui gândit, odată cu arhitectura sistemului, în așa fel încât să se asigure un set minimal de calități: excluderea mutuală, paralelism, distribuire maximă posibilă. Sistemul fiind modular și distribuirea joburilor fiind deja făcută unor echipe specializate astfel încât fiecare dintre ele va modifica la un anumit moment unul sau mai multe module dar niciodată două echipe nu vor încerca modificarea aceluiași modul funcțional, sistemul de revizii utilizat va fi unul ierarhizat, pornind de la asigurarea unei versiuni incrementale fiecărui modul în parte, fiecărui subsistem format din mai multe module și în ansamblu sistemului global. De preferat este ca modificările necesare în cadrul unui anumit modul din cadrul sistemului să fie efectuate de echipa ce se ocupă în mod curent de

respectivul modul. De asemenea va trebui gândită o schemă prin care comunicația inter-echipe să fie cât mai eficientă făcând astfel posibil un timp de răspuns maximal din partea unei echipe solicitate pentru a modifica un anumit modul.

A nu se uita că, cel puțin în faza de dezvoltare, sistemul de revizii are un rol foarte important, mai ales în evitarea erorilor și a deadlock-ului precum și în menținerea coerenței sistemului în ansamblu. De aceea, impunerea sa nu trebuie să fie neconcordantă cu acest scop. Pe de altă parte sistemul fluxului informațional intern, incluzând și versiunile, va trebui gândit în așa fel încât să poată fi adoptat de toate echipele participante la procesul de dezvoltare. În acest sens recomandarea noastră este ca notațiile și numerotarea utilizată să fie uniformizată cel puțin la nivelul modular, fiind în prealabil stabilită de comun acord cu toate echipele participante.

Jurnalul modificărilor. Un element important este, de asemenea, menținerea a ceea ce se numește change-log. Acesta este un jurnal corespunzător fiecărui modul distinct în cadrul sistemului, care definește modificările aduse în timp modulului respectiv, corelate cu versiunea și data/ora curentă a fiecărei modificări. Acest jurnal se dovedește extrem de util în situația apariției unor noi erori datorate eventualei adăugări de facilități unor module. Se vor putea astfel determina rapid ce modificări au fost aduse modulelor în cauză în perioada considerată, și se va putea astfel localiza sursa erorilor.

Sistemul de versiuni. Voi spune aici puțin despre sistemul de versiuni la nivelul sistemului global, așa numita versiune a aplicației. În acest caz elementele deterministe nu mai sunt doar cele legate de menținerea coerenței interne etc. Din ce în ce mai mult, versiunile externe tind să constituie elemente legate de marketing și să eticheteze într-un anumit fel produsul respectiv. Un exemplu bun ar fi Microsoft care, din pură strategie de marketing, și-a botezat Windows versiunea internă 4.0.xxxx în Windows95 aplicând astfel o ștampilă de timp produsului impunând achiziționarea unui produs nou cât mai des (vezi Windows 98).

De aceea sistemul de versiuni externe rămâne mai mult la latitudinea departamentului de marketing decât a arhitectului. Singurul fapt evident este că versiunea asigurată acestuia va trebui în timp să evidențieze evoluția produsului (în bine!). Software-ul ca și alte domenii științifice, suferă de aceeași boală ce afectează orice om de știință încă din copilărie: de ce să spui ceva simplu când poți s-o spui mult mai complicat. Ei bine nici noi nu am scăpat de acest stigmat și în acest sens am inventat notațiile prealpha, alpha, beta testing, beta, stable etc. Toate aceste notații sunt referiri la stadiul de avansare al unui produs din punctul de vedere mai ales al fiabilității și stabilității în utilizare și mai puțin din punctul de vedere al funcționalității sale directe.

Astfel o aplicație versiunea 2.0 prealpha este un sistem care în principiu oferă o funcționalitate crescută față de versiunea 1.0, însă stabilitatea sa lasă foarte mult de dorit implicând chiar și implementarea unor facilități ce sunt prevăzute însă în mod sigur. Practic sistemul se mai află încă în faza de design-implementare. Ajungerea la stadiul 2.0 alpha arată ca sistemul respectiv a evoluat, implementează totalitatea facilităților expuse în specificații însă nu a fost testat. Beta testing se consideră a fi faza ce urmează unei testări interne, preliminare, a produsului implicând testări ulterioare mult mai complexe, implicând eventual și developeri externi ce se vor numi în acest caz beta testers. Fazei de beta testing îi urmează faza de reîntoarcere la testări interne (beta), utilizând informațiile colectate în urma beta testing-ului. Urmează apoi lansarea produsului în stadiul stable, din acest moment produsul fiind considerat apt pentru a fi lăudat pe piață. Noțiunea de final este deseori un sinonim pentru stable iar alteori marchează trecerea de la o versiune majoră la alta prin etichetarea produsului ca fiind ultimul produs aparținând clasei definite de versiunea majoră respectivă. Dar să nu uităm niciodată că toate acestea sunt simple denumiri și etichete.

Documentare. Etapa de dezvoltare fiind în curs de încheiere, specificațiile fiind într-o fază avansată de definitivare, produsul într-o stare funcțională (eventual prealpha) se impune demararea procesului de documentare a aplicației în sine. Nici un proiect modem nu va supraviețui fără un sistem de documentație și de help online, bine pus la punct și intuitiv. Cu cât piața țintă este mai largă cu atât rolul și importanța documentației sunt mai evidente. Făcând parte de asemenea din imaginea de ansamblu a produsului (nu uitați că imaginea se vinde în IT) acest task nu trebuie neglijat și nici lăsat pe mâna unor neprofesioniști.

De asemenea, un alt aspect este cel al integrării documentației on-line prin intermediul unui sit web împreună cu eventualul mecanism de distribuire a unor versiuni demonstrative ale produsului. Este o metodă deosebit de apreciată atât de potențialii beneficiari, de utilizatorii curenți dar și de hackerii dornici de software gratis sau ușor de spart. Compromisul trebuie făcut! Un lucru este sigur: fără sit web o firmă de software nu prea mai poate supraviețui.

Am discutat anterior despre importanța suportului și mentenanței oferite pentru un anumit produs atât pe termen scurt cât și pe termen mediu și lung. Un beneficiar își dorește o asigurare că produsul pe care îl comandă/cumpără astăzi îl va putea folosi și peste doi ani și în plus va putea avea acces și la noi tehnologii integrate în cadrul sistemului respectiv pe măsura trecerii timpului. În acest sens se poate face o analogie cu industria auto unde se observă existența unor ateliere specializate pentru anumite tipuri de mașini mult timp chiar și după ce tipurile respective au ieșit din liniile de producție.

Marile firme de software abordează această problemă, elegant, prin asignarea unei echipe specializate pentru un anumit produs, ce va avea ca sarcină principală mentenanța produsului respectiv, în perioada de până la dezvoltarea unor noi versiuni sau chiar și după oprirea dezvoltării produsului respectiv. Echipa ce se ocupă de această întreținere, în principiu, va corecta erori minore în software, documentație etc. și în plus va raporta erori importante și modificări necesare arhitectului principal sau șefului de proiect în cazul în care proiectul este încă în faze de dezvoltare.

În cazul unor proiecte mai mici, sau realizate cu buget mic, problema se poate de asemenea rezolva prin includerea în costurile inițiale și a specificării duratei și tipului de suport oferit pentru produsul respectiv.

5.5. Importanța sintetizării vocii după text pe piața softului

La momentul actual se fac foarte multe cercetări în domeniul sintetizării vocii. În domeniul dat investesc foarte mari fonduri practic toate companiile mari producătoare de Soft ( de exemplu Microsoft). Acest lucru este datorat faptului că acesta este pasul următor în dezvoltarea calculatoarelor și deci cel care va reuși să rezolve problema dată mai reușit și mai repede va obține monopolul în domeniul dat.

Sintetizarea vocii după text este un proces prin intermediul căruia textul este redat (prezentat) în mod audio-digital. Majoritatea proiectelor de sintetizare a vocii după text pot fi împărțite sau structurate după metoda pe care ele o folosesc pentru transformarea fenomenelor în sunete audibile (acustice, fonice).

Cuvintele înlănțuite. Deși sistemele de cuvinte înlănțuite nu sunt realmente sintetizatoare, ele folosesc modul cel mai obișnuit – sistemele de sintetizare a vocii după text peste tot. În sistemul cuvântului înlănțuit aplicarea desenatorului (proiectantului) prevede înregistrarea (imprimarea) frazelor și cuvintelor izolate. Sistemul unește împreună înregistrările pentru a produce o propoziție sau o frază. Dacă folosești Voice-Mail atunci auzi unul din aceste mecanisme vorbind, „[Tu ai] [trei] [mesaje noi]”. Mecanismul are înregistrări pentru [Tu ai] toate cifrele și [mesaje noi].

Sinteza. Mecanismul sintetizarea vocii după text care folosește sinteza produce sunete similare celor create de coardele vocale umane și aplică diferite filtre pentru a imita lungimea gâtului, cavitatea bucală, forma buzelor și poziția limbii. Vocea produsă de tehnologia sintezei sună mai puțin umană decât vocea produsă de înlănțuirea diphone, dacă este posibil de obținut diferite calități a vocii prin schimbarea câtorva indici.

Înlănțuirea indicilor. Mecanismul sintetizarea vocii după text care folosește înlănțuirea indicelui unind mici segmente audio-digitale și folosește nivelul intersegmentar pentru a produce sunete neîntrerupte (continue), de exemplu, înlănțuirea diphone, unde fiecare segment este alcătuit din două foneme, unul care începe sunetul și celălalt care îl sfârșește. Prin urmare cuvântul „Hello” constă din următoarele foneme, h eh l oe, indicele corespunzător segmentelor h surd h-eh eh-l l-oe oe-surd. Segmentele indice sunt produse de înregistrarea de ori întregi a vocii umane și identificând minuțios începutul și sfârșitul fenomenului. Deci această tehnică poate produce o voce mai reală, avem nevoie de mai mult timp pentru a crea o voce nouă care nu este localizată din cauza că fenomenele sunt specifice limbajului vorbitorului.

5.5.1. De ce să folosim sintetizarea vocii după text (Text-to-Speech)?

Sintetizarea vocii după text trebuie utilizat la comunicarea informației acustice utilizatorului atunci când înregistrările audio numerice sunt nepotrivite. În general, sintetizarea vocii după text este mai bun decât înregistrările audio atunci când:

înregistrările audio sunt prea mari pentru a fi stocate pe disc sau costisitoare, scumpe de înregistrat;

atunci când înregistrarea audio este imposibilă, deoarece aplicarea cunoaște din timp că va vorbi;

sintetizarea vocii după text de asemenea ne oferă niște avantaje. În general sintetizarea vocii după text este foarte folositor pentru producerea frazelor sau situațiilor când imprimarea anticipată nu este eficientă, sintetizarea vocii după text are următoarele amplificări în practică:

Citirea textelor dinamice. Text în vorbire este folositor pentru frazele care sunt prea variate pentru a fi stocate sau înregistrate folosind toate schimbările posibile, de exemplu, vorbirea timpului este folositoare pentru sintetizarea vocii după text deoarece efortul și stocarea implicată în înlănțuirea tuturor timpurilor posibile este realizabil.

Corectura. Corectura audibilă a textului și a numerelor îl ajută pe utilizator să descopere erorile tipice scăpate de corectură vizuală.

Păstrarea spațiului stocat în sintetizarea vocii după text este folosit pentru frazele care vor ocupa mai mult spațiu de stocare dacă ele ar fi înregistrate anticipat în format audio-digital.

Anunțarea utilizatorului despre evenimente. Sintetizarea vocii după text este utilizat pentru mesajele, informațiile, de exemplu, pentru a informa utilizatorul că tipărirea este completă, aplicantul poate spune „printing complete” decât să creeze o cutie de mesaje cerând utilizatorului să facă clichet pe OK. Aceasta ar trebui folosită pentru informația necritică în cazul când utilizatorul închide sunetul computatorului sau nu ascultă.

Producerea feedback acustic. Sintetizarea vocii după text poate produce un feedback vizual este nepotrivit sau imposibil, de exemplu, ochii utilizatorului pot fi ocupați la efectuarea altei sarcini așa ca: transcrierea datelor de pe un document. Utilizatorii care au o vedere slabă se pot baza pe text în vorbire, ca un unicul lor mijloc de feedback de la computer.

5.5.2.Folosiri potențiale de categoria aplicabilă

Folosirea specifică a textului în vorbire va depinde de aplicări. Iată câteva metode de idei și aplicarea lor:

Educație, telefonie și jocuri

Sintetizarea vocii după text este folosit în Jocuri și educație să permită persoanelor în practică să vorbească cu utilizatorul în locul formării baloanelor. Desigur, este de asemenea să reînregistreze vocea. În practică se va folosi sintetizarea vocii după text în loc de înregistrări în următoarele cazuri:

Este întotdeauna posibil de a folosi cuvinte înlănțuite, fraze, sintetizarea vocii după text, pentru a înlocui propoziții imprimante. Proiectorul practic poate ușor trece de la un șir de propoziții dorite la mecanismul de sintetizare a vocii după text.

Sintetizarea sintetizarea vocii după text inevitabil sună fals și sinistru. Oricum este foarte bine pentru vocea personajului care sunt roboți, străini sau necunoscuți.

Desigur, în practică nu ne putem permite să avem înregistrarea tuturor dialogurilor posibile sau dacă textul nu a fost înregistrat din timp, este unica alegere.

5.6. Planificarea elaborării programului de sintetizare a vocii după text

Tehnologia proiectării unui sistem nou contemporan se bazează pe următoarele particularități:

• tehnica utilizată este construită utilizând ultimele elaborări științifice;

• accelerarea vitezei de elaborare a proiectelor;

• tehnica de calcul și softului sunt supuse uzurii morale foarte rapide;

Toate acestea au dus la necesitatea de creare a noi metode de planificare. Una din aceste metode prezintă modelarea procesului de elaborare, adică prezentarea lucrărilor în procesul elaborării proiectului. Metodele tradiționale de planificare presupun utilizarea celor mai simple modele de tipul construirea diagramelor de tip consecutive și ciclice. Dar în asemenea diagrame nu este posibil de a prezenta legăturile dintre niște lucrări, de unde rezultă imposibilitatea de a afla cât de importantă este lucrarea dată pentru executarea scopului final. Pot apărea diferite întârzieri în timp, ce apar pe porțiuni de interconectare a lucrărilor, care sunt complicat de prezentat în diagrame. De obicei, în procesul dirijării se culege informația despre lucrările efectuate și aproape nu se culege și nu se prezintă informația referitor la prognoza finisării lucrărilor viitoare, de aceia este imposibil de a prognoza rezultatele diferitor variante de soluționare la modificările planului inițial de lucru. Este de asemenea complicat de a reflecta și dinamica lucrărilor, de a corecta toată diagrama în legătură cu

schimbarea termenilor de efectuare a unei lucrări, este necesar să nu schimbăm termenul de efectuare a întregului complex de lucrări.

La elaborarea sistemului informatic de evidență a activității științifice, se ține seama de asigurarea condiției de optim pentru careva indicatori. Așa indicatori, în dependență de condițiile concrete, pot fi:

timpul minim pentru elaborarea întregului complex de lucrări;

costul minim al elaborării proiectului;

economia maximă a resurselor.

Particularitățile sistemului informatic de evidență a activității științifice, în general, sunt următoarele:

se realizează metoda proiectării de sistem la rezolvarea problemelor de organizare a gestiunii proceselor.

se utilizează modelul pentru descrierea proceselor și calculul parametrilor acestor procese (durata, costul, forțele de muncă, etc.)

se utilizează sisteme de calcul pentru prelucrarea datelor operative pentru calculul indicatorilor și primirea rapoartelor analitice și statistice necesare.

Documentul de bază în sistemul de evidență a activității științifice este modelul informațional în care sunt prezentate lucrările necesare pentru atingerea scopului final și durate de timp necesară (în zile).

Tab.6

Durata efectuării lucrărilor

5.7. Evaluarea economică a programului de sintetizare a vocii după text

Din tabelul 8 vedem că proiectul durează 79 de zile. Adăugăm o zi de rezervă și obținem 80 de zile, 16 săptămâni cu 5 zile lucrătoare cu câte 8 ore lucrătoare. Salariul lunar al lucrătorilor este prezentat în tabelul 9.

Tab.7

Componența grupului de lucru

Salariul săptămânal alcătuiește, deci, 100 lei.

Pe durata proiectului salariul de bază alcătuiește: 16 x 100 = 1600 lei;

Salariul auxiliar (10% din salariul de bază); 1600 x 10% = 1600 x 0,1 = 160 lei

Defalcări în Fondul Social (31%) (1600 + 160) x 31% = 1760 x 0,31 = 545,6 lei

Necesitățile în materiale, soft și hard sunt prezentate în tabelele 8 și 9.

Tab.8

Costul softului și hardului procurat

Tab.9

Costul materialelor utilizate

Să calculăm cheltuielile de energie electrică. Un calculator personal obișnuit are o putere de 200 W. Pe parcursul proiectului, timp de 80 de zile vor fi consumate:

200 x 80 x 8 x 0.75= 96000 W = 96 kW

La momentul actual un kW costă 0,65 lei, deci cheltuielile vor fi: 96 x 0,65 =62,4 lei

Deoarece procurarea softului și hardului în domeniul Tehnologiilor Informaționale este considerată investiție capitală, v-om amortiza aceste cheltuieli în timp de 1 an, fiindcă aceste produse sunt supuse uzurii morale rapide:

[S / (A x 365)] x Z unde: S – suma ce trebuie de amortizat;

A – perioada de amortizare în ani;

Z – perioada proiectului în zile.

[8150 / (1 x 365)] x 80 = 1786,30 lei

Pentru studierea domeniilor necesare la proiectarea sistemului a fost procurată literatură în sumă de 300 lei.

Tab.10

Calculul prețului de livrare a Programului

Concluzii

În această lucrare am reprezentat mai multe metode de sinteză a semnalului vocal, analizînd concomitent aceste motode, și am observat că predicția liniară reprezintă una din cele mai efective metode de analiză și sintetizare a semnalului vocal. Această metodă devine domonantă la determinarea parametrilor de bazp a semnalului vocal, așa cum, de exemplu, este perioada tonului principal, formanții, spectrul, funcția ariei tractului vocal, și deasemenia la reperezentarea prescurtată a vorbiri cu scopul transmiterii eicu viteză joasă și păstrării econome.importanța metodei este determinată de precizia înalpă a rezultatetlor obținute și simplității relative a calculelor.

Ideile de bază a metodei predicției liniare se combină bine cu modelul producerii vorbirii, deoparice semnalul vocal poate fi reprezentat sub forma unui semnal la ieșirea sistemului liniar cu parametri variabili în timp, excitat cu impulsuri cvaziperiodice sau zgomot. Metoda predicției liniare permite aprecierea precisă și sigură a parametrilor acestui sistem liniar cu coeficienți variabili.

Tehnologia de sintetizare a vocii va fi foarte utilă în domeniile în care se simte necesitatea unei atenții sporite de la lucrători, pentru studierea limbilor străine, pentru elaborarea unor interfețe între calculator și utilizator asemănător dialogului om-om, această implementare va fi foarte apreciată de utilizatorii cu vedere slabă sau orbi, mai ales dacă se ia în considerație faptul că programul nu necesită cerințe foarte mari pentru hard și soft.

Programul va funcționa foarte bine pe un calculator ce dispune de un procesor 486/33 (DX sau SX) sau mai performant; memoria operativă necesară este de un 1MB; o cartelă audio de tip Sound BlasterTM, ESS Tehnology, care sunt compatibile cu sistemul audio Microsoft Windows; sistemul de operare Windows 95, Windows NT 4.0 sau mai superioare.

Deci dincele expuse mai sus reese, că în prezent pentru pentru a obține un rezultat cît mai bun în crearea unui sintetizor al semnalului vocal alegerea cea mai bună ar fi metoda de predicție liniară.

Bibliografie:

1. E. Oancea , Analiza și sinteza vorbirii, Editura militară, 1978

2. H. N. Teodorescu, L. Bulchholtzer, C. Poșa, Comunicarea orală om-mașină, Editura tehnică, 1986

3. Л. Р. Рабинер, Р. В. Шафер, “ифравая щбработка речевых сигнадов, Москва «Радио и связь», 1981

4. Л. В. Златоустова, Р. К. Потапова, Общая и прикладная фонетика, Издательство Московского университета, 1986

5. Владимир Гофман, Анатолий Хомоненко, DELPHI 5, БХВ – Петербург, Санкт-Петербург, 2001;

6. А.М.Епанешников, В.А. Епанешников, DELPHI 5 базы данных, Москва, Диалог-Мифи, 2000;

7.Protecția muncii și a mediului ambiant/Elaborat Marian O., Bajureanu A., Chișinău, UTM, 1993;

Site-uri Web

8. www.borland.com;

9. www.delphi.com;

10. www.torry.ru;

11. www.citforum.ru.

ANEXE

Anexa nr.1

Rezultatul sintetizării semnalului vocal

Anexa nr.2

Schema bloc a unui sintetizor a semnalului vocal după text

Anexa nr.3

Interfața grafică a programului de sintetizare a vocii după text

Anexa nr.4

Listingul programului

Similar Posts