Introducere ………………………….. ………………………….. ………………………….. …………………………….. [616332]

2

Cuprins
Introducere ………………………….. ………………………….. ………………………….. ………………………….. ……………………. 4
Capitolul I. Scurt istoric al metodelor de recunoaștere a vorbirii ………………………….. ………………………….. …… 5
1.1 Introducere în domeniu ………………………….. ………………………….. ………………………….. ……………………… 5
1.2. Descoperiri în domeniul sintezei vorbirii de -a lungul timpului ………………………….. …………………………. 7
Capitol II.Fundamente teoretice ………………………….. ………………………….. ………………………….. …………………. 10
2.1 Domeniile tehnologiei vorbirii ………………………….. ………………………….. ………………………….. ……………. 10
2.1.1 Recunoașterea automată a vorbirii ………………………….. ………………………….. ………………………….. . 10
2.1.2 Sinteza automată a vorbirii ………………………….. ………………………….. ………………………….. …………. 11
2.1.3 Codarea vorbirii ………………………….. ………………………….. ………………………….. ………………………… 13
2.1.4 Înțelegerea automată a vorbirii ………………………….. ………………………….. ………………………….. ……. 13
2.1.5 Recunoașterea automată a vorbitorului ………………………….. ………………………….. ……………………. 15
2.3 Micro controller -e ………………………….. ………………………….. ………………………….. ………………………….. … 17
2.3.1 Scurtă introducere ………………………….. ………………………….. ………………………….. ……………………… 17
2.3.2 Aspecte generale ale unui microcontroller ………………………….. ………………………….. ………………… 17
2.3.3 Arhitectura unui microcontroller ………………………….. ………………………….. ………………………….. …. 19
2.3.4 Aplicații ale microcontroller -elor ………………………….. ………………………….. ………………………….. …. 19
2.3.5 Familii de microcontrollere ………………………….. ………………………….. ………………………….. …………. 20
2.3.6 Module PWM ………………………….. ………………………….. ………………………….. ………………………….. .. 22
2.4 Standardul Bluetooth ………………………….. ………………………….. ………………………….. ……………………….. 23
2.5 Dioda Schottky ………………………….. ………………………….. ………………………….. ………………………….. …….. 24
Capitolul 3 . Etapele realizării unui vehicul comandat vocal ………………………….. ………………………….. …………. 29
3.1 Puncte de interes în proiectarea vehiculului ………………………….. ………………………….. …………………….. 29
3.2 Stabilirea caracteristicilor vehiculului ………………………….. ………………………….. ………………………….. …. 29
3.3 Selectarea componentelor ………………………….. ………………………….. ………………………….. ………………… 30
3.2.1 Microcontroller -ul ………………………….. ………………………….. ………………………….. ……………………… 30
3.2.2 Selectarea driver -ului de motoare ………………………….. ………………………….. ………………………….. .. 36
3.2.3 Proiectarea și realizarea driver -ului de motoare ………………………….. ………………………….. ………… 38
3.2.4 Modulul Bluetooth ………………………….. ………………………….. ………………………….. …………………….. 43
3.2.5 Motoare ………………………….. ………………………….. ………………………….. ………………………….. ……….. 45
3.2.6 Diode Schottky ………………………….. ………………………….. ………………………….. ………………………….. 45
Capitolul 4 Realizarea aplicației software ………………………….. ………………………….. ………………………….. …….. 46
4.1 Diagramă de execuție ………………………….. ………………………….. ………………………….. ……………………….. 46
4.2 Aplicația Software ………………………….. ………………………….. ………………………….. ………………………….. .. 47

3
Capitolul 5 . Concluzii și îmbunătățiri ulterioare ………………………….. ………………………….. ………………………… 50
5.1 Concluzii ………………………….. ………………………….. ………………………….. ………………………….. …………….. 50
5.2 Îmbunătățiri ulterioare ………………………….. ………………………….. ………………………….. ……………………… 50
Rezumat ………………………….. ………………………….. ………………………….. ………………………….. ………………………. 51
Summary ………………………….. ………………………….. ………………………….. ………………………….. …………………….. 52
Bibliografie ………………………….. ………………………….. ………………………….. ………………………….. ………………….. 53
ANEXE ………………………….. ………………………….. ………………………….. ………………………….. …………………………. 54

4
Introducere

Evol uția tehnologică cât și dorința omului de a -și ușura activitatea zilnică a dus la apariția
dispozitivelor controlate prin voce. Un dispozitiv controla t prin comenzi vocal e(VCD -voice
command device ) este controlat prin intermediul vocii umane . Renunțând la butoane, comutatoare
și întrerupătoare, utilizatorii pot acționa ușor aparatele cu mâinile ocupate sau în timp ce execută
alte sarcini. Primele modele de VCD -uri se regăsesc în aparatele electrocasnice, precum mașinile de
spălat care permit consumatorilor să modifice funcțiile de spălare ale mașinii prin comenzi vocale
sau telefoane mobile cu funcție de apelare prin comandă vocală.
VCD -urile moderne sunt independente de utilizator, astfel încât pot executa comenzi de la
mai multe tipuri de voci, indiferent de accentul sau dialectul folosit . Sunt de asemenea capabile să
reacționeze la comenzi multiple, să selecteze mesajele vocale , să furnizeze un răspuns adecvat,
imitând cu precizie o conversație naturală. Acestea pot recunoaște aproximativ 50 de comenzi și pot
înregistra mesaje audio cu o durată maximă de 2 minute. VCD -urile pot fi găsite în sistemele de
operare ale calculatoarelor , aplicații comerciale pentru calculatoare, telefoane mobile, autovehicule,
call centere și motoare de căutare precum Google.
În 2007, un articol de afaceri al CNN preciza că industria comenzilor vocale valora peste un
miliard de dolari, iar Google și Apple încercau să dezvolte caracteristici de recunoaștere a vorbirii.
Au trecut ani de la publicarea articolului, iar de atunci lumea a întâlnit o varietate de dispozitive cu
comenzi vocale. Adițional, Google a creat un motor de recunoaștere a vorbirii numit Pico TTS, iar
Apple a lansat Siri . Dispozitivele comandate prin voce devin accesibile într -o gamă largă și de
asemenea sunt create modalități inovatoare de utilizare a vocii umane .

5
Capitolul I. Scurt istoric al metodelor de recunoaștere a vorbirii

1.1 Introducere în domeniu
Încă din cele mai vechi timpuri comunicarea prin voce a reprezentat modalitatea dominantă
prin care oamenii au creat legături sociale și au schimbat informație. În zilele noastre, limbajul
vorbit este răspândit cu ajutorul mass -media și reprezintă încă principalul mijloc de informare a
oamenilor.
Dacă până nu demult limbajul vorbit reprezenta o mod alitate de interacțiune subiect uman –
subiect uman, odată cu dezvoltarea microelectronicii și cu creșterea accesibilității tehnicii de calcul,
comunicarea prin voce devine un mijloc de comunicare între subiectul uman și mașina de calcul.
Din păcate, din c auza limitărilor tehnologice în ceea ce privește implementarea comunicării
prin voce la nivelul calculatoarelor electronice, nu se poate încă spune că limbajul vorbit poate
înlocui total modalitățile tradiționale de interacțiune om – mașină, precum interfe țele grafice
acționate cu ajutorul claviaturilor sau altor dispozitive specifice. Dacă astăzi încă interfețele grafice
reprezintă modalitatea predilectă de interacțiune om – calculator, este de așteptat ca acestea să poată
fi in totalitate inlocuite prin i nterfețe vocale.
Înlocuirea interfețelor grafice prin interfețe comandate prin voce este de dorit din mai multe
motive, printre care și acela că interfețele grafice actuale, oricât de expresive, nu sunt atât de
intuitive precum cele vocale. În plus, pentru subiecții umani cu diverse handicapuri sau afecțiuni ale
analizatorului vizual, interfețele grafice sunt inutilizabile. Mai mult, mijloacele de interacțiune cu
interfețele grafice se remarcă printr -o relativă lipsă de fiabilitate: de plidă, claviaturile
calculatoarelor personale au o durată de viață relativ scurtă, comparativ cu microfoanele și
difuzoarele.
Totuși, deși o prea mare generalitate a interfețelor comandate prin voce nu a fost atinsă,
pentru domenii bine precizate de activitate, într -un context de mediu bine cunoscut și urmărit cu
strictețe, aplicațiile ce cuprind intefețe vocale sunt deja realizate, existând și produse comerciale în
acest sens.
O interfață vocală om – mașină trebuie să includă mai multe componente, printre care cel
puțin un sis tem de recunoaștere a vorbiri și unul de sinteză a vorbirii. Totuși, aceste două
componente nu sunt suficiente în sine pentru a asigura o fiabilitate suficientă unei interfețe audio
om – mașină. O componentă vizând înțelegerea și dialogul propriu -zis este esențială pentru a
asigura gestiunea interacțiunilor cu subiectul uman; o bază de cunoștințe este de asemenea necesară

6
pentru a ghida sistemul în interpretarea enunțurilor rostite de subiectul uman și prentru a -i putea
permite alegerea acțiunii potrivite, în acord cu dorințele utilizatorului.
Pentru toate aceste componente există destul de multe provocări, de pildă robustețea la
condițiile de mediu, flexibilitatea cu privire la domeniul de utilizare ales, ușurința integrării în
sistemele de calcul existente .
Prelucrarea limbajului vorbit se referă la tehnologiile legate de recunoașterea vorbirii,
sinteza vorbirii pornind de la text, precum și înțelegerea limbajului vorbit. De asemenea,
recunoașterea vorbitorului se poate include în acest domeniu. După cum a m afirmat mai sus, orice
sistem de recunoaștere a limbajului vorbit trebuie să cuprindă cel puțin trei componente: un sistem
de recunoaștere a vorbirii, care să realizeze conversia semnalului vocal in enunțuri, un sistem de
sinteză a vorbirii, care să tran sforme un enunț scris in semnal vocal inteligibil pentru subiectul
uman, precum și un sistem de înțelegere a limbajului vorbit, care să asigure asocierea enunțurilor
unor acțiuni precizate.
Pentru toate aceste trei componente există puncte comune, dar și d iferențe specifice, în ceea
ce privește tehnologiile de implementare utilizate. Reguli create manual au fost dezvoltate pentru
sisteme de prelucrare a limbajului vorbit, dar succesul obținut a fost relativ modest. De aceea,
abordările statistice, plecând d e la date în sine, au fost încercate, iar rezultatele au început să devină
interesante.
Abordările statistice actuale constau în esență în modelarea semnalului vocal prin utilizarea
unor algoritmi statistici bine definiți, care pot să extragă in mod automa t conoștințe din date.
Abordarea aceasta plecând de la date poate fi privită ca o problemă de recunoaștere a formelor.
Pe de altă parte, abordările bazate pe reguli nu trebuie excluse. Teoretic , dacă există un set
de reguli suficient de bun, pentru o sarc ină dată, abordările statistice nu sunt necesare. Problema
este deci aceea a stabilirii unui set consistent de reguli pentru o problemă precizată, iar la
momentul actual nu există, din câte știm, suficiente cunoștinte pentru a putea produce un set
comple t de reguli consistente. Deocamdată, credem, aceste seturi de reguli pot fi construite iterativ,
plecând de la abordările statistice existente. Prin urmare, abordările statistice și cele bazate pe reguli
pot fi privite drept modalități complementare de a î nzestra un sistem informatic cu capacitatea
gestionării cunoștințelo r.

7
1.2. Descoperiri în domeniul sintezei vorbirii de -a lungul timpului
Cercetările din domeniul recunoașterii automate a vorbirii au început imediat după a doua
jumătate a secolului XX .
Cele mai timpurii încercări de a construi un sistem de recunoaștere automată a vorbirii
datează din deceniul șase al secolului XX, când comunitatea științifică a încercat să realizeze
sisteme de recunoaștere plecând de la ideile fundamentale ale acustici i și foneticii. Astfel, în 1952,
la Bell Laboratories a fost construit un sistem de recunoaștere a cifrelor rostite izolat de către un
singur vorbitor. Sistemul se baza pe măsurarea rezonanțelor spectrale din timpul zonelor sonore ale
fiecărei cifre. În 19 56, la RCA Laboratories, s -a încercat recunoașterea a zece cuvinte monosilabice,
rostite de către un singur vorbitor. Și acest sistem utiliza măsurători spectrale (realizate cu ajutorul
unui banc de filtre analogice) pe porțiunile sonore. În 1959, la Unive rsity College din Marea
Britanie, s -a încercat construirea unui sistem de recunoaștere a fonemelor ce avea ca scop
identificarea a patru vocale și nouă consoane. Decizia de recunoaștere se lua comparând spectrul
acestor foneme cu un set de referințe spectr ale păstrate într -o bază de date. Tot în anul 1959, la MIT
Lincoln Laboratories s -a construit un alt sistem de recunoaștere a cuvintelor de forma “b -<vocală> –
t”, independent de vorbitor . Și în acest caz a fost utilizat un analizor spectral bazat pe un banc de
filtre analogice.

Figură 1 Analizor spectral
Deceniul șapte a fost martorul apariției și publicării multor idei fundamentale în domeniul
recunoașterii vorbirii. Începutul este reprezentat de afirmarea unor laboratoare japonez e care iși
propuneau proiectarea și implementarea unui hardware dedicat acestui domeniu. Primul sistem
japonez cunoscut în lume a fost realizat la Radio Research Laboratory din Tokyo și a constat în
esență într -un circuit digital dedicat pentru recunoașter ea vocalelor. Și acest sistem, ca și cele de
peste ocean, conținea un analizor de spectru realizat cu ajutorul unui banc de filtre. În 1962, la
Universitatea din Kyoto, a fost construit un sistem hardware de recunoaștere a fonemelor. Ca
noutate, sistemul a fost printre primele ce au folosit o segmentare a semnalului vocal, precum și o

8
statistică a trecerilor prin zero pe segmentele de semnal obținute. În 1963, la NEC Laboratories a
fost implementat un sistem hardware de recunoaștere a cifrelor. Acesta din u rmă a condus la un
program de cercetare îndelungat, concretizat în deceniul opt prin multe realizări remarcabile în
domeniu.
Tot în deceniul șapte au fost inițiate două proiecte de anvergură care au avut implicații
importante pe termen lung în cercetările din domeniul recunoașterii vorbirii. Primul dintre acestea a
fost inițiat de RCA Laboratories și își propunea soluții concrete pentru problemele legate de
variabilitățile temporale ale semnalului vocal (debite binare diferite pentru vorbitori diferiți la
rostirea acelorași enunțuri). Astfel a fost dezvoltat un set de metode de normalizare în timp bazate
pe posibilitatea de detecție a începutului și sfârșitului enunțurilor, ceea ce a avut drept efect
reducerea drestică a erorilor de recunoaștere. În aceeași perioadă, în Uniunea Sovietică, a fost
propusă folosirea unei metode de programare dinamică în vederea alinierii temporale a două rostiri
ale aceluiași enunț; astfel a apărut algoritmul DTW. Totuși, aceste idei au rămas cu desăvârșire
necunoscute în Occide nt, până prin deceniul nouă după ce metodele respective fuseseră deja
propuse și implementate.
În deceniul opt cercetările în domeniul recunoașterii vorbirii s -au axat în principal pe
recunoașterea cuvintelor izolate, pionii marcanți în acest sens fiind Un iunea Sovietică, Japonia și
Statele Unite ale Americii. Cercetările savanților ruși au determinat progrese importante ale
metodelor bazate pe potrivirea modelelor (“template matching”), în timp ce japonezii au demonstrat
eficiența metodelor de programare l iniară. În același timp, americanii au arătat cum analiza prin
predicție liniară, folosită deja cu succes la codarea semnalului vocal, poate fi utilizată cu succes și în
domeniul recunoașterii vorbirii. De asemenea, la AT&T Bell Laboratories au fost începu te cercetări
în domeniul recunoașterii independent de vorbitor, dar rafinarea algoritmilor a durat mai mult de un
deceniu.
Deceniul nouă a fost extrem de prolific în privința algoritmilor și chiar metodologiilor
folosite. Multe dintre ideile apărute atunci sunt utilizate cu succes și astăzi. În acest deceniu atenția
s-a mutat asupra recunoașterii cuvintelor legate; au fost concepuți un număr mare de algoritmi
complecși în vederea recunoașterii cuvintelor legate, independent de vorbitor. Acești algoritmi sun t
astăzi bine puși la punct și utilizați pe scară largă. Scopul urmărit a fost crearea unui sistem capabil
să recunoască șiruri de cuvinte foarte des folosite (de pildă, cifre). Realizări remarcabile s -au
înregistrat la NEC Laboratories, Bell Laboratories, sau Joint Speech Research Group.
În paralel, tot in deceniul nouă, s -a observat o tendință spre utilizarea metodelor de modelare
statistică a categoriilor clasificate (de exemplu, enunțuri scurte, cuvinte, foneme, vorbitori), prin
aplicarea modelelor Mark ov ascunse (HMM – “Hidden Markov Models”), ale căror baze

9
matematice fuseseră puse cu circa două decenii in urmă, la IBM, Dragon Systems etc. Cele mai
notabile eforturi în domeniu s -au concretizat în implementarea, spre sfârșitul deceniului, la Carnegie
Mellon University, a sistemului Sphinx. Acesta a fost, după știința noastră, primul sistem din lume
care a încercat o abordare practică a problemei recunoașterii vorbirii continue, independent de
vorbitor .
Deceniul zece se remarcă prin răspândirea metodelor statistice de recunoaștere a vorbirii
bazate pe modele Markov ascunse și în Europa, precum și prin situarea recunoașterii vorbirii
continue în centrul cercetărilor în domeniu. Astfel, în perioada 1993 -2002 a fost dezvoltat în Marea
Britanie, la Cambridge U niversity sistemul de recunoaștere a vorbirii continue, vocabular mare,
independent de vorbitor, numit HTK (“Hidden Markov Modelling Toolkit”). Acest sistem
constituie astăzi unul dintre cele mai utilizate instrumente software în cercetările și aplicațiile în
domeniul recunoașterii vorbirii continue. Totuși, sistemul Sphinx s -a dezvoltat spectaculos,
atingând un nivel de maturitate care să -i permită intrarea în domeniul comercial. Aceasta s -a
petrecut în 1995, când Microsoft a cumpărat sistemul produs de ec hipa de la Carnegie Mellon,
pentru a -l comercializa sub numele de Microsoft Whisper (“Windows Highly Intelligent Speech
Recognition”), integrându -l apoi în mediul de dezvoltare de aplicații în domeniu, disponibil odată
cu sistemul de operare Windows XP.
Deceniul unsprezece (în care ne aflăm la momentul redactării acestei lucrări) se remarcă, pe
de-o parte, prin continuarea preocupărilor legate de utilizarea metodelor statistice pentru
recunoașterea vorbirii continue, iar, pe de altă parte, prin includerea ș i a altor componente
perceptuale (de exemplu,imagini), în vederea realizării unor aplicații având ca țintă conversația
multimodală om -calculator.
Aceasta deoarece s -a constatat că limitând complexitatea sistemelor strict la recunoașterea
vorbirii, performa nțele nu se pot, teoretic , ameliora peste o rată de recunoaștere de circa 97%. Prin
urmare, se încearcă includerea și a altor tipuri de informații, pentru a “ajuta” sistemul în sarcina de
recunoaștere. În acest sens, se pot remarca eforturile laboratorului CLIPS, de la Universitatea
Joseph Fourier, Grenoble, Franța, concretizate în implementarea ideii de “smart room”, în 2004,
adică o încăpere dotată cu senzori acustici, vizuali, termici etc, care să asiste îngrijirea medicală a
oamenilor bolnavi sau a bătr ânilor.

10
Capitol II.Fundamente teoretice

2.1 Domeniile tehnologiei vorbirii
2.1.1 Recunoașterea automată a vorbirii
De foarte multe ori problema recunoașterii vorbirii este formulată în termenii unui model
matematic sursă -canal, inspirat din teoria cl asică a informației, insă noi nu vom insista asupra
acestei abordări bine cunoscute, preferând să accentuăm aspectele practice legate de implementarea
unui asemenea sistem.
Un sistem tipic de recunoaștere a vorbirii este constituit din câteva blocuri esenț iale, după
cum se arată in figura 2 . Aplicațiile se interfațează cu decodorul pentru a obține rezultatele
recunoașterii, rezultate care ar putea fi folosite pentru adaptarea altor componente ale sistemului.
Modelele acustice cuprind reprezentarea cunoștinț elor cu privire la aspectele acustice și fonetice ale
semnalului vocal, la variabilitatea condițiilor de achiziție (microfon) și de mediu (zgomot), la
diferențele legate de genul și dialectul vorbitorilor etc. Modelele lingvistice se referă la cunoștințele
pe care sistemul le are cu privire la probabilitatea de apariție și la secvențierea posibilă a cuvintelor
identificate. Multe semne de întrebare există în privința aspectelor legate de caracteristicile
vorbitorilor, stilul și “cadența” vorbirii, recunoașt erea segmentelor de semnal vocal, cuvintele
posibile, cuvintele probabile, cuvintele necunoscute, variațiile gramaticale, interferențe, zgomote,
accent aparte pentru vorbitorii non -nativi relativ la o anumită limbă etc. Un sistem de recunoaștere a
vorbirii care să se poată impune trebuie să trateze de o manieră satisfăcătoare cel puțin toa te
aspectele precizate mai sus. [1]

Figură 2 Arhitectura unui sistem de recunoaștere a vorbirii

11
Semnalul vocal este prelucrat în modulul “Prelu crare de semnal”, care realizează extragerea
unor vectori acustici care vor fi furnizați blocului “Decodare”. Acesta folosește atât modelele
acustice cât și pe cele lingvistice pentru a genera secvența cea mai probabilă de cuvinte, în sensul
maximizării pr obabilității posterioare pentru un set de vectori de parametri precizați. Decodorul
poate de asemenea să ofere informații blocului de “Adaptare”, care să realizeze “calarea”
modelelor acustice pe anumiți vorbitori, sau a celor lingvistice pe anumite domen ii de expresie sau
de activitate. Aceasta, pentru a permite creșterea performanțelor sistemului, în contexte cu totul
particulare: un anumit subiect uman, o sarcină de recunoaștere bine precizată. [1]

2.1.2 Sinteza automată a vorbirii
Prin sinteză automată a vorbirii se înțelege îndeobește generare de semnal vocal pornind de
la un text dat, de exemplu de la o claviatură. Sarcina unui sistem de sinteză a vorbirii poate fi
considerată ca recunoaștere a vorbirii, dar privită în oglindă: generarea vorbirii, de o calitate cât mai
apropiată de cea a vorbirii umane, plecând de la orice text de intrare dat.
Ca observație importantă, se poate afirma că, spre deosebire de recunoașterea vorbirii,
sinteza nu este atât de dependentă de domeniul de cunoștințe vizat. Totuș i, conversia enunțurilor
scrise în semnal vocal nu este trivială. Chiar dacă se pot păstra pe suport electronic dicționare
imense, sistemul de sinteză tot s -ar afla în fața problemei ridicate de existența milioanelor de
acronime sau de nume proprii. Mai mu lt, pentru ca vorbirea sintetizată să aibă o calitate apropiată
de a celei umane, componentele de bază ale unui sistem de sinteză a vorbirii sunt prezentate in
figura 3.

12

Figură 3 Arhitectura unui sistem de sinteză a vorbirii
Com ponenta “Analiză de text” aduce textul într -o formă în care acesta să poată fi rostit,
adică, printre altele, îl normalizează în timp, în sensul dilatării sau comprimării anumitor segmente,
pentru a produce o vorbire cât mai naturală. Textul de intrare poa te fi etichetat sau nu. Etichetarea
este utilă pentru a asista analiza textului, analiza fonetică și analiza prozodică. Componenta
“Analiză fonetică” realizează conversia textului prelucrat anterior în secvența de foneme
corespunzătoare acestuia. Blocul “A naliză prozodică” adaugă informații legate de frecvența
fundamentală (în engleză, “pitch”) și de duratele de pronunție ale fonemelor. În fine, componenta
“Sinteză a vorbirii” utilizează secvența de foneme etichetată de către blocul anterior, pentru a
gener a forma de undă corespunzătoare.
Diferite aplicații cunosc într -o măsură mai mare sau mai mică structura și conținutul textului
ce se dorește sintetizat, prin urmare unele dintre componentele indicate în figura 1.2 pot lipsi. De
pildă, unele aplicații pot avea unele cerințe (relativ laxe) legate de frecvența fundamentală. Acestea
pot fi indicate prin etichete introduse corespunzător în textul scris. Unele aplicații pot să cunoască
deja structura și conținutul textului de sintetizat, prin urmare blocul “Anal iză de text” poate lipsi.
Dacă aplicația dispune de un dicționar care să cuprindă transcrierile fonetice ale tuturor
cuvintelor din textul de sintetizat, blocul “Analiză fonetică” poate de asemenea să lipsească. De

13
asemenea, blocul “analiză prozodică” poat e lipsi dacă informația legată de frecvența fundamentală
este disponibilă din alte surse. [1]
2.1.3 Codarea vorbirii
Codarea semnalului vocal nu reprezintă în sine o ramură a tehnologiei vorbirii, fiind mai
curând o aplicație în domeniul prelucrării numeri ce a semnalelor. Din acest motiv, nu vom insista
asupra codării vorbirii, deși unii autori consideră altminteri .
Totuși, codarea vorbirii este o etapă necesară în aplicațiile ce vizează recunoașterea sau
sinteza vorbirii. Ea se referă la tehnici de compre sie a informației conținute în semnalul vocal, în
vederea transmiterii ca atare a acestuia, sau a unor prelucrări ulterioare, specifice aplicațiilor de
recunoaștere sau sinteză a vorbirii.
Ideea fundamentală din “spatele” codării semnalului vocal este înce rcarea de a elimina
redundanța acestuia, în vederea compactării informației cuprinse in el. Scopul codării este
reprezentat, pe de o parte, de transmiterea semnalului vocal în condițiile utilizării unei benzi de
transmisiune cat mai mici (implementare: cod ec-urile), iar, pe de altă parte, de ușurarea sarcinilor
mașinii de calcul în aplicațiile ce vizează utilizarea informației cuprinse în vorbire (implementări:
scoaterea semnalului de sub zgomot, eliminarea variabilităților intra -enunț sau intra -vorbitor, i n
funcție de aplicația vizată).
Spre deosebire de alte domenii ale tehnologiei vorbirii, codarea vorbirii se bucură, în lume,
de o îndelungată tradiție, înregistrând progrese menite să asigure o fiabilitate sporită metodelor
utilizate pentru aceasta. Matur itatea atinsă de domeniul codării vorbirii s -a concretizat într -o serie
de standarde, emise de organisme internaționale importante. [1]

2.1.4 Înțelegerea automată a vorbirii
Indiferent de sarcina concretă a interfețelor om – calculator comandate prin voce , o
componentă care să realizeze înțelegerea limbajului vorbit poate crește de o manieră netă
performanțele. Acesta deoarece un sistem de înțelegere a vorbirii poate interpreta în context
enunțurile rostite, determinand în acest fel executarea unor acțiuni corespunzătoare textului “de
intrare”.
Cunoștințe lexicale, sintactice și semantice trebuie să concure la ameliorarea interacțiunii
dintre nivelele de analiză acustică, fonetică și lingvistică, în vederea reducerii incertitudinii legate
de natura și conți nutul enunțurilor prin care subiectul uman “abordează” mașina de calcul.

14
Cunoașterea vocabularului caracteristic, a tiparelor sintactice probabile și a relației între
acestea și un set precizat de acțiuni, pentru o aplicație dată, stau la baza oricărui sis tem de înțelegere
a limbajului vorbit.
O schemă a unui sistem tipic de înțelegere a limbajului v orbit este arătată in figura 4 . Un
astfel de sistem cuprinde, de regulă, un sistem de recunoaștere a vorbirii și unul de sinteză, o
componentă de interpretare a enunțurilor , pentru a confrunta rezultatele recunoașterii vorbirii cu un
set de tipare semantice . Setul de tipare semantice poate fi construit (și actualizat incremental) cu
ajutorul unei componente de analiză a discursului , care să determine contextul un ui anumit enunț și
să dezambiguizeze sensul său. Componenta de dialog reprezintă “inima” sistemului; ea asigură
comunicarea între aplicație și celelalte module.

Figură 4 Arhitectura unui sistem de î nțelegere a vorbirii
Dacă major itatea componentelor sistemului pot fi generice în totalitate sau parțial,
componenta “Dialog” controlează “conversația” acestor blocuri, dar în relație cu acțiunea concretă
de îndeplinit. Această componentă este răspunzătoare pentru menținerea ideii pe ca re sistemul o are
asupra enunțurilor “vehiculate” între el și interlocutorul uman.
Informația legată de conținutul discursului este esențială pentru interpretarea semantică a
enunțurilor în context.

15
Acest domeniu nu se mai află strict sub umbrela tehnologi ei vorbirii; prelucrarea limbajului
natural concură cu semiotica, psihologia socială și retorica, într -o abordare tehnologică pentru care
stricta pregătire tehnică a specialiștior este departe de a fi suficientă. [1]

2.1.5 Recunoașterea automată a vorbitor ului
Recunoașterea vorbitorului este întrucâtva complementară recunoașterii vorbirii, deoarece ea
are ca scop discriminarea subiecților umani pe baza informației extrase din vocile acestora. Prin
urmare, în sarcina recunoașterii vorbitorului nu interesează ce se spune, ci cine spune.
Direct derivată din domeniul strict al recunoașterii vorbitorilor este abordarea ce încearcă
segmentarea documentelor audio în raport cu un set de vorbitori, încercând un răspuns la întrebarea:
cine spune și când spune; ceea ce se spune fiind irelevant.
Există două subclase de aplicații de recunoaștere a vorbitorului: verificarea vorbitorului ,
care își propune să determine dacă un enunț aparține sau nu unui anumit subiect uman, și
identificarea vorbitorului , care încearcă să rea lizeze o corespondență între o voce necunoscută și
identitatea unui subiect uman dintr -un set dat. Întrucat în cazul verificării vorbitorului decizia este
de tip binar, iar în cazul identificării este de tip N-ar (unde N este numărul de potențiali candidaț i,
deci numărul de vorbitori ale căror identități sunt cunoscute), este de așteptat ca performanțele
obținute în procesul de verificare să fie superioare celor obținute în procesul de identificare.
Din punctul de vedere al gradului de control asupra materi alului vocal utilizat, sistemele de
recunoaștere a vorbitorului pot fi dependente de text , sau independente de text . În primele, semnalul
vocal disponibil în etapa de antrenare și în cea de testare provine din același text. În această situație,
metodele de programare dinamică (algoritmi precum DTW – “Dynamic Time Warping”, sau
distanța Levenshtein) pot fi aplicate pentru a realiza alinierea în timp a fragmentelor de semnal
vocal. In cazul sistemelor independente de text, alinierea dinamică nu mai este utili zabilă, însă
metodele statistice pot fi folsite cu succes.
În figura 5 este sugerată arhitectura generică a unui sistem de recunoaștere a vorbitorului.

16

Figură 5 Arhitectura unui sistem de recunoaștere a vorbitorului
Dată fiind co mplexitatea vocii umane și dependența acesteia, pe de o parte, de starea
emoțională a subiecților și, pe de altă parte, de condițiile de mediu (raport semnal – zgomot etc.), s –
a constatat că există diferențe importante între fragmentele de material vocal p rovenite de la același
vorbitor, dar achiziționate la momente de timp diferite. Prin urmare, alegerea atentă a
caracteristicilor acustice care vor fi utilizate în procesul de recunoaștere este crucială. Aceste
caracteristici trebuie să accentueze diferențe le inter -subiect și să le atenueze pe cele intra -subiect,
dar stabilitatea lor în timp este o condiție esențială.
Deși in trecut algoritmii de tip DTW sau construirea unor modele aglomerative pentru
subiecți (de exemplu, cuantizarea vectorială) au fost opț iunile preferate in proiectarea aplicațiilor de
recunoaștere a vorbitorului, în prezent, ca și în domeniul recunoașterii vorbirii, metodele statistice
prin care se modelează subiecții umani câștigă tot mai mult teren. [1]

17
2.3 Microcontroller -e
2.3.1 Scurtă introducere
Având în vedere evoluția din punct de vedere istoric a operației de comandă a unui proces
putem contura imaginea unui microcontroller. Se poate afirma că un microcontroller este un sistem
utilizat în speță pentru a comanda și a prelucra stări de la un proces sau de la diferite aspecte din
mediul înconjurător. Dimensiunile controller -elor erau foarte mari la început, dar odată cu
dezvoltarea microprocesoarelor dimensiunile acestor echipamente s -au redus. Procesul de reducere
a dimensiuni lor s-a extins, astfel c ă toate componentele unui controller au fost integrate pe același
chip. În acest mod a luat naștere calculatorul pe un singur chip, microcontroller -ul care este
specializat pentru implementarea operațiilor de control. [3]
În sens la rg, un controller se referă la o structură electronică realizată pentru a putea controla
un proces sau, o interacțiune cu mediul exterior, nefiind necesar ca operatorul uman să intervină. La
inceput pentru realizarea controler -elor se foloseau tehnologii p ur analogice, utilizandu -se
componente electromecanice și /sau componente electronice.
Microcontrolle r-ele care fac referire la tehnica numerică modernă au fost realizate inițial pe
baza logicii cablate (cu circuite integrate numerice standard SSI (Small Sc ale Integration – care au
aproximativ 10 porți ) și MSI (Medium Scale Integration -între 10 și 100 porți)) și a unei electronici
analogice uneori complexe, dezavantajele fiind dimensiunile mari, consumul energetic pe măsură și,
din păcate, o fiabilitate care lăsa de dorit. [4]
Avantajele folosirii unui controller într -o aplicație fac referire la reducerea semnificativă a
numărului de componente electronice precum și reducerea costului proiectării și dezvoltării unui
produs .

2.3.2 Aspecte generale ale unui mi crocontroller
Microcontroller -ul este un calculator ce include un microprocesor fiind destinat aplica țiilor
de control și nu calcului de uz general. Numele dispozitivului este sugestiv astfel, cuvântul „micro”
se referă la dimensiunea redusă a chip -ului, i ar controller indică faptul că acest dispozitiv este
proiectat pentru aplicații de control a unor evenimente, obiecte. Scopul proiectării microcontroller –
elor este de a obține o dimensiune redusă a chip -ului, reducerea costurilor și includerea de spațiu de
memorie și I /O pe chip.

18
Un microcontroller conține în același circuit integrat cel puțin:
 UCP
 Memorie
 I/O
Orice aparat pe care îl utilizăm astăzi are integrat în el un microcontroller. Se poate deduce
faptul că aparatele pe care le utilizăm și care r ealizează cel puțin una din operațiile de comandă,
afișare informații sau stocare conțin un microcontroller. Un exemplu la îndemână este un automobil
care are integrat cel puțin un microcontroller pentru comanda motorului mașinii sau pentru a
comanda alte sisteme din interiorul autovehiculului. Printre exemple se numară și calculatoarele în
care microcontroller -ele se găsesc în tastatură, imprimante și alte periferice.
Schema generală simplificată a unui microcontroller este redată în figura 6 . După cum s e
poate observa din figură, pentru funcționarea unui microcontroller sunt necesare programe care se
stochează în memoria sa proprie. Acest sistem de calcul include o unitate centrală, oscilator pentru
tact, memorie și dispozitive de intrare -ieșire. Intrări le pot fi analogice sau digitale, de regulă
semnalele provenind de la diferiți senzori sau de la comutatoare. Ieșirile sunt de obicei diode cu
LED, motoare, relee, etc.

Microprocesoarele sunt utilizate în PC -uri, laptop -uri, servere, unde flexib ilitatea,
compatibilitatea software și performanța sunt criterii care trebuie îndeplinite. Spre deosebire de
microprocesoare, microcontroller -ele sunt specializate pe aplicații în dauna flexibilității. Minimul
de resurse necesare pe care ar trebui să le in cludă un microcontroler sunt următoarele:
 unitate centrală (CPU), cu un oscilator intern pentru ceasul de sistem
 memorie locală tip ROM/PROM/EPROM/FLASH (eventual și una de tip RAM)
 un sistem de întreruperi
 I/O – intrări/ieșiri numerice (de tip port parale l)

Figură 6 Schema unui microcontroller

19
 un port serial de tip asincron și/sau sincron, programabil
 un sistem de timere -temporizatoare/numărătoare programabile
Este posibil ca la acestea să fie adăugate, la un preț de cost avantajos, caracteristici specifice
sarcinii de control care trebuie în deplinite:
 un sistem de conversie analog -digitală (una sau mai multe intrări analogice)
 un sistem de conversie digital analogic și/sau ieșiri PWM (cu modulare în durată)
 un comparator analogic
 memorie de date nevolatilă de tip EEPROM
 un ceas de gardă (time r de tip watchdog)
 facilități pentru optimizarea consumului propriu

2.3.3 Arhitectura unui microcontroller
Microcontroller -ul fiind un caz particular de calculator (specializat pentru operații I/O,
realizat pe un singur chip) conține cele cinci component ele de bază : unitate de control, unitate
aritmetic ă și logică, unitate de memorie, unitate de intrare și unitate de ieșire (system I/O) .
Unitatea centrală de prelucrare (UCP) este compus ă din unitatea de control și unitatea
aritmetică și logică. Magistrala internă (bus) leagă între ele componentele microcontroller -ului. Pe
magistral ă se vehiculează semnale de adresă, semnale de date și semnale de control. Performanța
unui microcontroller este determinată și de mărimea magistralelor. Cu ajutorul magistralei de adrese
unitatea centrală de prelucrare (UCP) selecteaz ă o locație de memorie sau un dispozitiv I /O, iar
magistrala de date întreține schimbul de date între UCP și memorie sau dispozitivele I/O. Între UCP
și memorie se transferă atât date cât și instrucț iuni (se pot transfera pe o singur ă magistrală de date
sau pe magistrale de date distincte ). În acest sens sunt definite două arhitecturi: arhitectura von
Neumann în care se utilizează un bus unic pentru circulația datelor și a instrucțiunilor și arhitectu ra
Harvard în care există un bus separat pentru circulația datelor și a instrucțiunilor. La primul tip de
arhitectură accesul este mai lent, pe când la arhitectura Harvard performanțele de viteză sunt mai
mari, dar și structura acestei a rhitecturi este mai complexă. [3 ]

2.3.4 Aplicații ale microcontroller -elor
Microcontrollerele au un spectru larg de utilizări, aplicațiile în care acestea sunt integrate fac
parte din categoria așa numitelor “embedded systems” (sisteme încapuslate). În acest caz existența
unui sistem integrat /încorporat este aproape transparentă pentru utilizator.

20
Aplicațiile în care aceste microcontrollere sunt utilizate sunt multiple, printre domenii
enumerându -se:
 “industria de automobile (controlul aprinderii/motorului, climatizare, diag noză, sisteme de
alarmă, etc.)
 electronică de consum (sisteme audio, televizoare, camere video și videocasetofoane,
telefonie mobilă, GPS -uri, jocuri electronice, etc.)
 aparatura electrocasnică (mașini de spălat, frigidere, cuptoare cu microunde, aspiratoa re)
 controlul mediului și climatizare (sere, locuințe, hale industriale)
 industria aerospațială
 mijloacele moderne de măsurare – instrumentație (aparate de măsură, senzori și traductoare
inteligente)”

2.3.5 Familii de microcontrollere
Microcontroller -ele sunt produse într -o mare diversitate în care există totuși elemente comune.
Prin utilizarea unui nucleu comun au fost definite de -a lungul anilor mai multe familii de
microcontroller -e. To ți membrii unei anumite familii de microcontroller -e folosesc acela și nucleu
care este constituit dintr -o unitate centrală și o serie de periferice și interfețe. Din punct de vedere al
programatorului, toți membrii unei familii folosesc același set de instrucțiuni, permit aceleași
moduri de adresare și folosesc aceleași re gistre. Diferențele care apar între membrii unei familii se
referă în primul rând la echiparea chip -ului cu memorie (tipul de memorie utilizat și la capacitatea
memoriei ), la frecvența de clock folosită pentru UCP sau în interfețele on -chip și perifericele on-
chip suplimentare față de cel mai simplu reprezentant al familiei. Modul de conectare a semnalelor
la pin, tipul capsulei circuitului integrat subliniază o altă diferență între membrii unei familii. Cele
mai importante familii de microcontroll er-e sunt prezentate în continuare fiind luate în considerare
însușirile lor caracteristice :
 INTEL 4048 cu o structur ă Harvard modificată, a fost primul microcontroller apărut pe
piața, astăzi fiind utilizat în multe aplicații datorită prețului său redus.
 INTEL 805 1 (MCS -51) reprezintă a doua generație de microcontroller -e pe 8 bi ți a
firmei Intel și, la ora actuală pe piață, este familia care se vinde cel mai bine. I8051 are o
structură Harvard modificată cu spațiu de adresare diferit pentru program și date. Acest
tip de microcontroller folosește un procesor boolean prin care se pot realiza operații
complexe la nivel de bit, iar în funcție de rezultate se pot face salturi.

21
 INTEL 80C196 (MCS -96) este un microcontroller pe 16 biți care admite un tact până la
50MHz și reprezintă a treia generație de microcontroller -e produs ă de compania Intel.
Are o arhitectură von Neumann, conține blocuri aritmetice pentru înmulțire și împărțire,
lucrează cu șase moduri de adresare, convertor analog numeric, generator PWM și timer
watc hdog.
 INTEL 80186 și 80188 sunt microcontroller -e propuse de Intel ca versiuni ale
popularelor microprocesoare 8086 și 8088 care au fost integrate în primele calculatoare
IBM PC XT. Provenind din clasele 8086/8088 ele conțin pe același chip două canale
DMA , două număratoare (timere), un sistem de întreruperi și un bloc de refresh pentru
memoria RAM. Un avantaj al utilizării acestor microcontroller -e este c ă se pot folosi
unelte de dezvoltare, precum compilatoare, asambloare de la PC -uri. Spa țiul mare de
adresare specific PC -urilor reprezint ă un alt mare avantaj.
 MC14500 a fost primul microcontroller reali zat de Motorola. Caracteristicile acestuia
erau: capsulă de 16 pini(mic ă), 16 instruc țiuni, arhitectură RISC cu calea de date de un
bit.
 Motorola 6805 se bazează pe procesorul 6800 și are o arhitectura von Neumann, așadar
are un singur bus pentru circulația datelor și a instrucțiunilor. O parte din
microcontroller -ele din aceast ă familie conțin convertoare A /D, canale seriale și
sintetizatoare de frecve nță cu buclă PLL.
 Motorola 68HC11 este un microcontroller cu o arhitectură von Neumann, având 8 biți
de date și 16 biți de adresă. Conține memorie EEPROM sau OTP, linii digitale I /O,
numărătoare /temporizatoare, convertoare A/D, canale seriale de comunica ții sincrone și
asincrone.
 PIC(MicroChip) fac parte din categoria microcontroller -erelor cu arhitectură RISC fiind
primele aparute. Numărul de instrucțiuni este redus semnificativ în comparație cu
microcontroler -ele 8048(33 instruc țiuni față de 90 ). Consumul redus, viteza mare, prețul
mic și dimensiunea redusă a chip -ului au impus MC PIC pe piață. Există trei linii de
astfel de microcontrolle r-e: low range, middle range și high range (acestea se diferen țiază
prin lungimea cuvântului de programare și prin alte beneficii legate de structură ).
 COP400 (NationalSemiconductor) este un microcontroller pe 4 biți integrat în capsule
de 20 -28 pini unde tensiunile de alimentare sunt cuprinse în intervalul 2,3V -6,0V.
 COP800 (NationalSemiconductor) este un microcontroller pe 8 biți care este înzestrat
cu MICROWIRE, UART, RAM, ROM, sistem de întreruperi, comparator, ceas de
gardă, generator PWM, convertor analog /numeric cu 8 canale de prescalare, mod de

22
așteptare și HALT, un trigger Schmitt și oferă protecție la scăderea ten siunii de
alimentare.
 HPC (NationalSemiconductor) sunt microcontroller -e de mare performanță pe 16 biți și
cu o arhitectură von Neumann. Se diferențiază prin canale seriale HDL (High Level Data
Link Control) și elemente DSP (Digital Signal Processor ), la o tensiune de alimentare de
3,3V. Aceste tipuri de microcontroller -e își găsesc utilizarea în domeniul
telecomunicațiilor, imprimate laser, hard discuri și aplicații militare.
 AVR sunt microcontroller -e care au la baz ă un procesor RISC cu o arhitectură Harv ard.
Pe baza acestui nucleu compania Atmel a dezvoltat mai multe familii de
microcontroller -e cu diferite structuri de memorie și de interfețe I/O destinate diferitelor
clase de aplica ții.

2.3.6 Module PWM
Un semnal PWM (Puls Width Modulation) este folos it în multe aplicații; comanda
motoarelor de curent continuu sau comanda surselor de alimentare pot fi amintite ca prin cipale
aplicații. În figura 7 este reprezentat un semnal PWM.

Figură 7 Semnalul PWM
Semnalul PWM este un semna l periodic la care se poate modifica în mod controlat factorul
de umplere. Modulele timer au resursele necesare generării unui semnal cu factor de umplere
variabil. Deoarece, după cum am mai amintit, semnalul PWM este utilizat în aplicații există module
timer dedicate acestei funcții; modulele PWM. Un modul PWM poate genera mai multe semnale
modulate. Structura unui canal PWM e ste reprezentată în figura 8.

23

Figură 8 Structura unui canal PWM
Registrul de prescalare generează clock -ul pentru un numărător. Clock -ul de numărare este
programabil. Conținutul numărătorului este comparat cu cel al registrului PWM. Cât timp rezultatul
comparației este mai mic sau egal, se va genera un unu logic la ieșirea PWM. Dacă rezultatul
comparației est e mai mare, se va genera la ieșirea PWM un zero logic. Dacă registrele comparate
sunt de opt biți factorul de umplere poate fi între 1/256 și 1. Un canal PWM odată programat va
genera la ieșire semnalul periodic continuu, fără intervenția unității centrale . Ca și la celelalte
componente funcționale, în ceea ce privește global modulele timer (includem și modulele watchdog
și PWM) vor fi prezentate în încheiere câteva criterii de apreciere:
 numărul de canale timer și dimensiunea registrului de numărare;
 flexibilitaea timere -lor, mecanisme implementate;
 existența unui ceas de gardă (watchdog);
 numărul de canale PWM și dimensiunea registrului PWM. [3]

2.4 Standardul Bluetooth
Bluetooth (BT) definește un set de protocoale de comunicație, bazate pe standardul I EEE
802.15.1, pentru comunicații la mică distanță, în banda nelicențiată de 2.4 GHz (2.402,…, 2.483,5
GHz).
Pentru securitatea transmisiei și îmbunătățirea calității comunicației se adoptă saltul de
frecvență FHSS (1600 salturi pe secundă), pe 79 purtătoar e cu banda fiecare de 1 MHz.
Pot fi formate rețele ad -hoc mici (piconet) pe principiul master – slave, în care un master poate
comunica cu maximum 7 echipamente slave. Toate elementele din rețea folosesc aceeași frecvență,

24
dar se definesc sloturi de timp (de câte 625 µs ) masterul transmițând în sloturile impare iar
elementele slave transmit în sloturile pare. Legătura între echipamente poate fi PTP (Point To Point)
sau de difuzare PTM (Point To Multipoint). Un cadru BT, cu lungimea de maximum 2871 biți, are
în componență un cod de acces și sincronizare de 72 biți, un heder de 54 biți și datele propriu -zise
cu dimensiunea maximă de 2745 biți.
În funcție de versiunea protocolului de comunicație se obțin diverse debite maxime de transfer.
Astfel versiunea 1 .2 permite un debit de 1 Mbps (practic 723 kbps) , versiunea 2 permite 3 Mbps
(practic 2.1 Mbps) iar versiunea 3 și 4 permi t un debit de până la 24 Mbps.
Distanțele pe care operează echipamentele Bluetooth depind de puterea de emisie, care putere se
încad rează î n una din cl asele din tabelul din figura 9.

Figură 9 Caracteristicile Claselor Bluetooth
Se constată că puterea maximă a dispozitivelor Bluetooth este mică în comparație cu alte
echipamente (250 mW în cazul UTMS -CMDA, 1W pentru GSM1800/1900 și 2 W pentru
GSM850/900).
Domeniul de aplicații al tehnologiei BT se referă în principal la comunicația pe distanțe scurte,
acolo unde nu se justifică utilizarea echipamentelor (cu fir) spre exemplu de tipul USB.
Prin comparație tehno logia WiFi (în competiție cu BT) se folosește pentru transmisia de date,
voce și video pe distanțe scurte, de până la 300 m. [5]

2.5 Dioda Schottky
Dioda Schottky (numită după fizicianul german Walter H. Schottky), este o diodă
semiconductoare formată din joncționarea semiconductor -metal. Are o tensiune de deschidere
foarte mica și o viteză de comutație foarte mare. Detectoarele de tip cat `s whisker(primele diode
construite, descoperite în 1874 de către Karl Ferdinand Braun) folosite în redresoarele de pute re
timpurii sunt diodele cu contact punctiform ce pot fi considerate precursoarele diodei Schottky. În
România acestea erau cunoscute sub numele de galene(plumb în formă cristalină naturală folosit în
construcția acestor diode).

25

Figură 10 Simbolul diodei Schottky
Valoarea tipică a tensiunii de deschidere a unei diode de siliciu este de 600 -700 mV, în timp
ce valorile tensiunii de prag ale unei diode Schottky sunt situate între 150 și 450 mV. Această
propietate permite viteze mari de comutație și o eficiență energetică sporită.

Figură 11 Diferite tipuri de diode
Joncțiunea diodei Schottky este formată între un metal și un semiconductor, creând o barieră
de tip Schottky(în loc de o joncțiune p -n semicondu ctoare ca în diodele convenționale). Metalele
folosite de obicei la construcția diodei Schottky sunt molibdenul, platina, cromul sau tungstenul și
anumite siliciuri(de exemplu siliciura de paladiu sau cea de platină), în timp ce semiconductorul
utilizat în mod uzual este cel de siliciu de tip n. Metalul are funcția de anod, iar semiconductorul de
tip n acționează drept catod al diodei. Această barieră Schottky are ca rezultat atât comutarea foarte
rapidă, cât și scăderea tensiunii de deschidere.

26

Figură 12 Imagine detaliată a joncțiunii metal -semiconductor
Alegerea structurii de tip metal -semiconductor determină tensiunea de prag a diodei.
Ambele cristale semiconductoare de tip n și p pot dezvolta bariere Schottky. Cu toate aceste a,
semiconductorul de tip p are de obicei o tensiune de deschidere mai mică. Deoarece curentul de
polarizare inversă crește dramatic cu coborârea tensiunii de deschidere, limitând reducerea oricât de
mult a acesteia, semiconductorii de tip p sunt rar folos iți.

Figură 13 Construcția unei diode Schottky
Dacă dopajul semiconductorului crește, lățimea regiunii de epuizare scade. Sub o anumită
lățime, purtătorii de sarcină pot migra prin regiunea de epuizare. La nivele mari de dopaj, j oncțiunea
nu se mai comportă ca un redresor și devine un material ohmic(cu comportament rezistiv).
Semiconductorul poate fi astfel utilizat pentru formarea simultană a contactelor ohmice și a diodei.
Diferența cea mai semnificativă dintre diodele cu joncți une P -N și cele Schottky este lipsa
timpului de recuperare inversă, când diode trece din stare de conducție în stare de blocare. În dioda
P-N, timpul de recuperare variază de la ordinul microsecundelor la mai puțin de 100ns pentru

27
diodele rapide. Diodele S chottky nu au un timp de recuperare, deoarece nu există o regiune de
epuizare a purtătorilor de sarcină liberi la nivelul joncțiunii metal -semiconductor. Timpul de
comutare este de aproximativ 100ps în cazul diodelor de semnal mic și până la zeci de nanose cunde
pentru diode speciale de putere de mare capacitate. Cu ajutorul diodelor Schottky, comutarea este în
esență ”instantanee”, cu o încărcare ușoară capacitivă, ce are efect asupra semnalelor de frecvență
foarte ridicată.

Figură 14 Caracteristica statică a diodei Schottky în comparație cu dioda cu joncțiune P -N și dioda cu contact punctiform
Valorile cele mai evidente ale diodelor Schottky sunt valorile relativ scăzute ale tensiunii de
străpungere și curenții relativ mari în re gim de polarizare inversă. Pentru diodele Schottky cu o
joncțiune metal – siliciu, tensiunea de străpungere este de obicei mai mică de 50 V.
Unele modele speciale de tensiune mai mare sunt disponibile(200 V este considerată tensiune
inversă ridicată).
În timp ce tensiunile de străpungere mai mari sunt realizabile, diodele Schottky astfel
realizate ar prezenta o tensiune de deschidere comparabilă cu diodele standard. Astfel de diode
Schottky nu ar avea nici un avantaj cu excepția vitezei mari de comutație.
Diodele Schottky construite din carbură de siliciu au un curent invers mult mai scăzut decât
diodele Schottky din siliciu, precum și o tensiune de străpungere mai mare. Carbura de siliciu are o
conductivitate termică ridicată, iar temperatura are o influenț ă redusă asupra caracteristicilor sale de
comutație. Cu un ambalaj special, diodele Schottky realizate din carbură de siliciu pot funcționa la

28
temperaturi de joncțiuni de peste 500 Kelvin ceea ce permite răcirea pasivă în dispozitivele în
aplicațiile aeros pațiale. [6]

29
Capitolul 3 . Etapele realizării unui vehicul comandat vocal

3.1 Puncte de i nteres în proiectarea vehiculului
 Selectarea unui mi crocontroller capabil să execute comenzi PWM
 Selectarea unui driver de motoare care să respecte comenzile primit e de la Arduino
 Proiectarea și realizarea driver -ului de motoare
 Selectarea unui modul bluetooth suficient de performant pentru transmisia telefon –
vehicul
 Selectarea unor motoare destul de puternice pentru a pune vehiculul în mișcare
 Selectarea unei metode de comandare și anume comandă vocală

3.2 Stabilirea caracteristicilor vehiculului
Scopul ve hiculului comandat vocal este acela de a fi capabil să execute comenzi primite de
la telefon prin intermediul Bluetooth. Astfel, vehiculul trebuie să meargă înaint e, înapoi, să vireze la
dreapta și la stânga, și să se oprească. Microcontroller -ul, prin comenzile PWM transmise cu
ajutorul shield -ului la motoare, face posibilă execuția operațiilor respective. Puntea H dublă,
integrată în driver , are un rol esențial în modul de funcționare. Schimbarea sensului curentului prin
puntea H va facilita schimbarea direcției de mișcare a vehiculului. Atunci când ambii curenți vor
trece în același sens, vehiculul se va mișca înainte sau înapoi, în funcție de comanda primită. Pen tru
a executa virajele, vom folosi conceptul utilizat de obicei la mijloacele de transport șenilate. Pentru
a vira la dreapta, curentul va trece prin puntea H corespunzătoare motoarelor din partea stângă în
sensul de mers pentru comanda înainte, iar prin p untea H corespunzătoare motoarelor di n partea
dreaptă în sens de mers pentru comanda înapoi . Pen tru virajul la stânga se inversează sensul
curenților prin punțile H din cazul virajului la dreapta. De asemenea, microcontroller -ul, după ce va
executa comanda de viraj, va avea memorată comanda anterioară, astfel continuându -și mișcarea
înainte sau înapoi, sau în caz de staționare, se va opri.

30
3.3 Selectarea componentelor
3.2.1 Microcontroller -ul
Pentru controlul motoarelor am ales placa de control Arduino Uno V3, care are ca
microcontroller integratul AT mega328p produs de Arduino. Placa este echipată cu o serie de pini de
intrare și ieșire atât analogici cât și digitali care pot fi conectați la di ferite plăci de dezvoltare și alte
circuite. Placa conține 6 pini analogici și 14 pini digitali. Este programabilă cu ajutorul aplicației
Arduino IDE prin intermediul unui cablu USB de tip B. Poate fi alimentată de un cablu USB sau de
o baterie de 9 volți, deși suportă tensiuni între 7 și 20 de volți. Este asemănăt oare cu Arduino Nano
și Leonardo.

Figură 15 Modulul Arduino V3
Specificații tehnice:
Microcontroller: ATmega328P
Tensiunea de operare: 5V
Tensiunea de intrare recomandată: 7-12 V
Limitele tensiunii de intrare: 6-20 V
Pini d igitali de intrare/ieșire: 14(din care 6 furnizează ieșire tip PWM)
Pini de intrare analogici: 6
Curent continuu pe pinii de intrare/ieșire: 20mA
Curent continuu pentru pinul de 3.3V: 50mA

31
Memorie Flash: 32 KB dintre care 0.5KB sunt utilizați de
bootlo ader
SRAM: 2KB
EEPROM: 1KB
Viteza de procesare: 16 MHz
LED_BUILTIN: 13

Microcontroller -ul care a fost ales pentru realizarea proiectului se numește ATMega328P și
e produs de către firma Atmel. Acest tip de microcontroller oferă o gamă largă de funcț ii și există
multe unelte de dezvoltare pentru soft -ul intern al chip -ului.

Figură 16 Microcontroller -ul ATMega328P

ATmega328P este un microcontroller pe 8 biți și este bazat pe arhitectura AVR RISC
(Reduced Instruction Set C omputing) . Folosind acest tip de arhitectură, microcontroller -ul are un
set redus de instrucțiuni (131), iar reducerea instrucțiunilor are avantajul că salvează și spațiu în
microprocesor. Procesorul AVR combină un bogat set de instrucțiuni cu 32 de regist re de uz
general. Cele 32 de registre de uz general sunt direct conectate la unitatea aritmetică și logică
(ALU -Arithmetic Logic Unit), fapt ce permite ca două registre independente să fie accesate printr -o
singură instrucțiune într -un singur moment de tac t. Prin această arhitectură se ating performanțe de
aproape 10 ori mai mari decât la microcontroler -ele CISC obișnuite. Pentru a maximiza
performanța, AVR utilizează o arhitectură Harvard care presupune existența memoriilor separate
pentre date și instrucț iuni.

32
Caracteristici ale microcontroller -ului ATMega328P conform foii de catalog :
 Producător :ATMEL
 Tip circuit integrat: AVR microcontroller
 Tip capsulă : PDIP
 Număr pini: 28 pini
 Capaciate memorie EEPROM: 1 Kbytes
 Capaciate memorie Flash: 32 Kbytes
 Capa ciate memorie Flash: 2 Kbytes
 Număr de intrări /ieșiri: 23
 Dimensiunea regiștrilor : 8 bi ți
 Număr timere: 2 timere/countere de 8 biți și unul de 16 biți
 Număr de converoare analog digitale:1 CAD (6 canale)
 Canale PWM : 6
 Sistem de întreruperi interne și exte rne
 Watchdog
 Modul USART pentru comunicație serială
 Interfață serială SPI
 Comparator analogic pe chip
 Moduri de funcționare economice
 Temperatura de operare: -40 ° C la +85 ° C
 Tensiune de alimentare : 1.8-5.5V [10]

ATMega328P dispune de 28 de pini , dintr e care doar 23 de pini pot fi utilizați pentru
programarea microcontroller -ului. Pinii VCC și GND sunt utilizați pentru alimentarea chip -ului cu
tensiune de la rețeaua de alimentare. Ceilalți 3 pini: AVCC, AREF și GND sunt folosiți pentru
alimentarea conve rtorului analog -digital. În figura 17 se prezintă configurația pinilor
microcontroller -ului conform cu specifica țiile din foaia de catalog.

33

În figura 18 se prezintă diagrama bloc a microcontroller -ului pe 8 bi ți ATMega 328P.

Figură 18 Schema bloc a microcontroller -ului
13 16
1 28
2 27
3 26
4 25
5 24
6 23
7 22
8 21
9 20
10 19
11 18
12 17
14 15
PC5 (ADC5/SCL/PCINT13)
(PCINT14/RESET) PC6
(PCINT16/RXD) PD0
(PCINT17/TXD) PD1
(PCINT18/INT0) PD2
(PCINT19/OC2B/INT1) PD3
(PCINT20/XCK/TO) PD4
VCC
GND
(PCINT6/XTAL1/TOSC1) PB6
(PCINT7/XTAL2/TOSC2) PB7
(PCINT21/OC0B/T1) PD5
(PCINT22/OC0A/AIN0) PD6
(PCINT23/AIN1) PD7
(PCINT0/CLKO/ICP1) PB 0
PC4 (ADC4/SDA/PCINT12)
PC3 (ADC3/PCINT11)
PC2 (ADC2/PCINT10)
PC1 (ADC1/PCINT9)
PC0 (ADC0/PCINT8)
GND
AREF
AVCC
PB5 (SCK/PCINT5)
PB4 (MISO/PCINT4)
PB3 (MOSI/OC2A/PCINT3)
PB2 (SS/OC1B/PCINT2)
PB1 (OC1A/PCINT1)

Figură 17 Configurația pinilor microcontroller -ului

34

Convertorul analog –digital de pe acest microcontroller are rezoluție de 10 biți ceea ce
înseamnă că ia valori între 0 -1023. Dac ă tensiunea de referință este de 5V, acest lucru se traduce în
faptul că cea mai mică schimbare de tensiune la intrare este de 5V /1023=0.00488V sau 4,88 mV.
Există mai multe posibilități de alegere a referinței de tensiune pentru convertorul analog –
digital: referință externă prin pinul AVcc, internă egal ă cu 1.1V sau internă egală cu Vcc. Acest
lucru se realizează din software prin setarea biților REFS1 și REFS0 din registrul ADMUX (ADC
Multiplexer Selection Register).
Acest convertor dispune de un număr de 6 canale de intrare și se poate citi doar un sin gur
canal la un moment dat. Rezultatele obținute în urma citirii sunt stocate în regiștrii ADCH și
ADCL, regiștrii de câte 8 biți. Întrucât, rezultatul obținut de la ADC este pe 10 biți, se vor folosi
ambii regiștrii pentru memorarea rezultatului. Pentru r ealizarea acestui lucru se folosește bitul 5
ADLAR din registrul ADMUX al cărui rol este de a selecta varianta de stocarea a valorii citite în
cei doi regiștrii. Se folosesc 4 biți (MUX3…0) pentru a selecta canalul de unde va fi citit semnalul.
Microcontro ller-ul dispune de o interfață serială USART (Universal
Synchronous/Asynchronous Receiver/Transmitter) care este un standard de comunicare serială
sincronă sau asincronă între diverse dispozitive. Comunicația poate fi unidirecțională sau
bidirecțională și se poate lucra în modul master/slave. În cazul comunicației unidirecționale, există
un singur transmițător și un receptor (sau invers), iar în cazul bidirecțional, pe o legătură se
realizează transmisia și pe altă legatură recepția. Dacă este vorba de o co municație sincronă se
utilizează o legatură prin care se stabilește același semnal de tact între emițător și receptor.
Masterul reprezintă dispozitivul care transmite date, iar slave -ul este cel care recepționează
datele. Funcțiile masterului sunt de a sta bili formatul cuvântului și frecvența ceasului. Slave -ul
trebuie să recepționeze date care au același format cu datele transmise de master și trebuie să
lucreze la aceeși frecvență ca și masterul.
În cazul microcontroller -ului ATMega328P, USART este împăr țită în 3 blocuri: generatorul
de clock și părțile de transmisie și recepție. Receptorul este partea cea mai complexă a modulului
USART datorită ceasului său și unității de recuperare a datelor. Pe lângă unitatea de recuperare,
receptorul mai cuprinde un v erificator de paritate, o logică de control, un registru de șiftare și două
buffere de primire. Generatorul de ceas generează ceasul de bază atât pentru emițător cât și pentru
receptor.
Un cadru serial este definit ca fiind un caracter de biți de date cu biți de sincronizare (biți
de start și stop), și opțional un bit de paritate pentru verificarea erorii. Modul USART acceptă toate
cele 30 de combinații pentru un cadru:

35
 Un bit de start
 5, 6, 7, 8 sau 9 biți de date
 Un bit de paritate pară /impară sau fără bit de paritate
 1 sau 2 biți de stop
Un cadru începe cu bitul de start urmat de bitul cel mai puțin semnificativ. Când un cadru
întreg este transmis, el poate fi urmat de un cadru nou sau comunicația poate fi trecută într -o stare
de inactivitate. În figur a 19 sunt exemplificate combinațiile posib ile pentru formatul cadrului.[13 ]

Figură 19 Structura cadrului la USART

Semnificația biților:
 St- bit de start, întotdeauna cu nivel jos
 P- bit de paritate(impar/par)
 Sp- bit de stop,î n totdeauna cu nivel sus
 Idle- nu există comunicare pe linie

Figură 20 Semnificația pinilor
St
Cadru
(Idle)
(St/Idle)
0
2
3
1
4
5
6
7
8
P
Sp1
Sp2

36
3.2.2 Selectarea driver -ului de motoare
Pentru a controla un motor de curent continuu este necesară o punte H ce permite controlul
atât al vitezei de rotație, cât și sensul acesteia. O punte H este constituită din patru elemente de
comutație, în special tranzistoare, cu terminalele motorului situate în centru, având o formă similară
cu cea a literei H. Puntea H funcționează prin activarea a două elemente de comutație astfel încât să
permită trecerea curentului de la alimentare către masă prin consumator. [8]

Figură 21 Principiul de funcționare al punții H
Pentru driver -ul de motoare am ales integratul L298N. L298N este un circuit integrat
monolitic cu 15 pini fabricat sub formă Multiwatt sau PowerS020. Este un driver în punte H dublă
ce suportă tensiuni și curenți de valoare mare, proiectat să accepte standardele nivelelor logice TTL
și să conducă sarcini inductive cum ar fi releele, solenoidele, motoare de curent continuu și
motoare pas cu pas. Furnizează două intrări de activare pentru a porni sau opri dispozitivul
indiferent de semnalul de intrare. Emitorii tranzistorilor inferiori ai fiecărei punți sunt interco nectați,
iar terminalele externe corespunzătoare pot fi utilizate pentru conectarea unui rezistor de detecție
externă. O intrare adițională de alimentare este furnizată pentru un nivel logic de tensiune mai
scăzut.

37

Figură 22 Diagrama bloc a L298N
Avantaje:
 Tensiune de alimentare : până la 46 V
 Curent continuu maxim: 4A
 Tensiune de saturație scăzută
 Tensiunea de intrare logică ”0” de maxim 1.5 V (imunitate mare la zgomot)

Figură 23 Specificații tehnic e L298N

Figură 24 Configurația pinilor pentru L298N

38
3.2.3 Proiectarea și realizarea driver -ului de motoare
Pentru proiectarea driverului de motoare am folosit programul Target 3001!. Acesta este un
program de tip ECAD1 pentru sche me PCB2. Primul pas pentru realizarea driver -ului este
proiectarea cablajului imprimat. Cu ajutorul Target 3001! am realizat schem a electrică a cablajului,
care este reprezentată în figura 25 :

Figură 25 Schema electrică a driver -ului

Următorul pas a fost convertirea acestuia în PCB, aranjarea convențională a componentelor
pe placă astfel încât să fie compatibilă cu Arduino și trasarea circuitelor. După realizarea acestor
operații am obținut schemele din figura 26 . Prima este cea p entru partea superioară a cablajului , iar
cea de -a doua este pentru partea inferioară a cablajului.

1 ECAD- Electronic Computer Assisted Design
2 PCB – Printed Circuit Board

39

Figură 26 Previzualizare a traseelor cablajului imprimat
De asemenea am putut previzualiza structura circuitului cu ajutorul funcției de vizualizare
3D a programului Target 3001!.

Figură 27 Previzualizare 3D a cablajului
Cel de -al treilea pas a fost imprimarea cablajului pe hârtie. Am folosit hârtie lucioasă ce
permite transferul mai ușor al ton erului de pe imprimeu pe plăcuța de cablaj imprimat (figura 28).

40

Figură 28 Hârtia lucioasă imprimată
Pasul următor constă în pregătirea cabla jului pentru transferul de toner . Este necesară
îndepărtarea tuturor impurităților și degresare a plăcii astfel încât să se transfere o cantitate cât mai
mare de toner pe plăcuța de cablaj imprimat (Figura 29).

Figură 29 Plăcuța de cupru degresată și curățată
Dupa ce a fost pregătită pentru transfer, placa este acoperită cu hârtia impr imată și supusă
unui agent termic puternic, în cazul de față fierul de călcat, pentru o durată de aproximativ 4 minute
pe fiecare parte (Figura 30) .

41

Figură 30 Tratament termic
În urma tratamentului termic , am obținut următoarele rezulta te. Cu ajutorul unui marker
special am completat zo nele în c are transferul de toner nu s-a efectuat complet (Figura 31).

Figură 31 Cablajul imprimat dupa transferul de toner și retușare
După finalizarea retușurilor, s -a introdus placa în c lorură ferică pentru aproximativ 8 -10
minute, pentru a îndepărta cuprul de pe suprafața neacoperită de toner (Figura 32).

42

Figură 32 Cablajul imprimat după tratamentul cu clorură ferică
Cablajul imprimat final a fost obținut după ce a fos t supus unui tratament de curățire și
șmirgheluit foarte fin (Figura 33).

Figură 33 Cablajul imprimat final, curățat și șlefuit
Asamblarea componentelor pe cablaj s -a realizat cu ajutor ul unui letc on de 50W , fludor și
colofoniu (Figura 34).

43

Figură 34 Aspectul final al shield -ului de motoare

3.2.4 Modulul Bluetooth
Pentru transmiterea comenzii către Arduino am ales ca modalitate de transmisie conexiunea
Bluetooth. Ca modul de recepție, conectorul Bl uetooth Mate Silver este mai mult decât suficient ,
având o arie de acoperire de 10 metri . Modelul RN -42 folosește numai 26 µA în modul de repaus
în timp ce poate fi detectat și disponibil pentru conectare.

Figură 35 Modulul Bl uetooth
Caracteristici:
 Putere consumată mică : 25mA
 Funcționează în medii afectate de Radio Frecvență cum ar fi : Wi -Fi, 802.11g,
Zigbee etc

44
 Conexiune sigură , cu criptare pe 128 de biți
 Frecvență: 2.402 – 2.480 GHz
 Tensiune de funcționare: 3.3V – 6V
 Comun icații seriale: 1200 – 921K bps, permițând și rate de biți non -standard
 Temperatură de funcționare: -40o C ~ +70o C
 Antenă integrată
 Modulație pe 79 de canale la frecvențe de 1MHz, de tip FHSS/GFSK
 Corectare a erorilor pentru livrarea garantată a pachetelor de date
 Receptor radio de clasă 2, cu o rază a ariei de acoperire de până la 20 de metri,
transmițător de 4dBm, și o sensibilitate de recepție de -80 dBm
 configurare UART locală sau configurare over-the-air prin radio -frecvență [11]

Figură 36 Specificațiile tehnice ale modulului Bluetooth

45

3.2.5 Motoare
Dispozitivele de propulsie alese sunt motoarele MG-6-120. Acestea au arbore dublu, o
tensiune nominală de 6V curent continuu, curent nominal <300mA, o viteză de rotație de până la
100 rpm și un cuplu de 1.0 kgf/cm.

Figură 37 Motorul MG -16-120

3.2.6 Diode Schottky
Pentru protecția driverului, am inclus în PCB și diode Sh ottky , model SK16 . Acestea au
mai multe avantaje față de o diodă normală. În pri mul rând, tensiunea de prag este foarte mică,
permițând transferul unei tensiuni mai mari decât în cazul diodelor normale. În al doilea rând, viteza
de comutație foarte mare, trecerea din regim de conducție în regim de blocare fiind instantanee. De
asemene a, tensiunea de străpungere î i oferă un avantaj semnificativ, iar pierderile de putere sunt
minime.

Figură 38 Specificațiile tehnice ale diodelor SK16

46
Capitolul 4 Realizarea aplicației software
4.1 Diagramă de execuție

47
4.2 Aplicația Software
#include "SoftwareSerial.h"
SoftwareSerial mySerial(4,2);
int MOTOR2_PIN1 = 3;
int MOTOR2_PIN2 = 5;
int MOTOR1_PIN1 = 6; //definire pini utilizați
int MOTOR1_PIN2 = 9;
void setup() {
pinMode(MOTOR1_PIN1, OUTPUT);
pinMode(MOTOR1_PI N2, OUTPUT);
pinMode(MOTOR2_PIN1, OUTPUT); //inițializare pini de control motoare
pinMode(MOTOR2_PIN2, OUTPUT);
initBluetooth(); //inițializare modul Bluetooth
}
void initBluetooth(){
Serial.begin(9600);
mySerial.beg in(115200);
mySerial.print( "$");
mySerial.print( "$");
mySerial.print( "$");
delay(100);
mySerial.println( "U,9600,N" ); //comandă setare BaudRate de funcționare a Bluetooth -ului la
9600(standard)
mySerial.begin(9600);
while (mySerial .available()) mySerial.read(); //comandă de curățare Buffer Bluetooth
}
int last=0;
String readvoice;
void loop()
{
while (mySerial.available()){ //Verifică dacă există date de citit
delay(10); //Delay de stabilitate
char c = mySerial.read(); //Citește următorul caracter de la Bluetooth
readvoice += c; //construire mesaj – "înainte", "înapoi", ”stânga", ”dreapta" și ”stop”
}

48

if(readvoice.length() >0) //verifică dacă s -a citit o comandă
{
Serial.println(readvoice);
if(readvoi ce == "înainte" ) //verifică tipul comenzii
inainte();
if(readvoice== "înapoi" )
inapoi();
if(readvoice== "stânga" )
stanga();
if(readvoice== "dreapta" )
dreapta();
if(readvoice== "stop" )
opreste();
}
readvoice= "";
switch (last){ //după execuția comenzii, în caz de viraj, se revine la ultima comandă(înainte,
înapoi sau stop)
case 0:
opreste();
break ;
case 1:
inainte();
break ;
case 2:
inapoi();
break ;
}
}
void oprest e() //funcția de oprire a motoarelor ce setează voltajul la 0
{
analogWrite(MOTOR1_PIN1,0);
analogWrite(MOTOR1_PIN2,0);
analogWrite(MOTOR2_PIN1,0);
analogWrite(MOTOR2_PIN2,0);

49
last=0;
}
void inainte() //funcția de înainte ce alimentează motoarele pentru a se deplasa înainte
{
analogWrite(MOTOR1_PIN1,0);
analogWrite(MOTOR1_PIN2,127);
analogWrite(MOTOR2_PIN1,127);
analogWrite(MOTOR2_PIN2,0);
last=1;
}
void inapoi() //funcția de înapoi ce alimentează motoarele pentru a se deplasa înapoi
{
analogWrite(MOTOR1_PIN1,127);
analogWrite(MOTOR1_PIN2,0);
analogWrite(MOTOR2_PIN1,0);
analogWrite(MOTOR2_PIN2,127);
last=2;
}
void stanga() //funcția de viraj la stânga ce alimentează motoarele pentru a exe cuta un viraj la
stânga
{
analogWrite(MOTOR1_PIN1,0);
analogWrite(MOTOR1_PIN2,127);
analogWrite(MOTOR2_PIN1,0);
analogWrite(MOTOR2_PIN2,127);
delay(4200);
}
void dreapta() //funcția de viraj la dreapta ce alimentează motoarele pentru a e xecuta un viraj la
dreapta
{
analogWrite(MOTOR2_PIN1,127);
analogWrite(MOTOR2_PIN2,0);
analogWrite(MOTOR1_PIN1,127);
analogWrite(MOTOR1_PIN2,0);
delay(4200); }

50
Capitolul 5 . Concluzii și îmbunătățiri ulterioare
5.1 Concluzii
Vehiculul a fost conc eput cu scopul de a facilita controlul acestuia prin intermediul
comenzilor vocale. Acest lucru permite utilizatorului să îndeplinească alte operațiuni și de
asemenea să îi comande robotului să execute alte comenzi, astfel încât utilizatorul să poată execu ta
mai multe operații în timp ce comandă vehiculul, ușurându -i modul de execuție al operațiilor de tip
preluare, prelucrare, analiză și transmitere de date.
Principalul avantaj al sistemului realizat este puterea mare de propulsie datorată celor 4
motoare , fiind posibilă comandarea individuală a motoarelor în mod paralel, două câte două. De
asemenea comanda prin bluetooth îi permite mișcarea independentă, fără a necesita un cablu de
transmitere a comenzilor, dar pe de altă parte este și un dezavantaj din c auza faptului că alimentarea
se face de la șase baterii a câte 1.5 V, ceea ce necesită schimbarea sau încărcarea periodică a
surselor de alimentare.
5.2 Îmbunătățiri ulterioare
 Se pot înlocui cele două motoare frontale cu un servomotor și un angrenaj de
direcție, ce va permite vehiculului să -și modifice direcția de deplasare într -un mod
mai precis la unghiuri diferite de 90o , cum se întâmplă în configurația actuală.
 Se poate adăuga un senzor de distanță/proximitate ce va permite vehiculului să
detecteze ev entuale obstacole și de asemenea poate fi programat să le evite.
 Se poate pune alimentare de generație recentă bazată pe Litiu -ion, pentru a prelungi
durata de funcționare a vehiculului.
 Se poate înlocui comunicarea bluetooth cu o comunicare Wi -Fi pentru a permite
distanțe mai mari de comandă, dar și posibilitatea stocării datelor pe un server.
 Se poate adăuga o cameră, iar semnalul video să fie transmis către un server ce poate
monitoriza locația în care se află vehiculul.

51
Rezumat

Scopul acestui p roiect a fost de a demonstra că există și o altă cale de comandă a vehiculelor
sau a altor dispozitive. În capitolul I am detaliat faptul că domeniul recunoașterii vorbirii a fost în
atenția oamenilor de știință încă de la începuturile secolului 20, dorind u-se un progres semnificativ
din partea diferitelor țări dezvoltate masiv tehnologic în ziua de azi. În capitolul II, am început prin
a explica domeniile vorbirii: recunoașterea automată, sinteza automată, codarea, înțelegerea și
recunoașterea automată a v orbirii. În continuare, am prezentat microcontroller -ele și caracteristicile
acestora: aspecte generale legate despre microcontroller -e, arhitectură, aplicații, familii, dar și
modulul PWM și ce înseamnă acesta, fiind o componentă a microcontroller -elor.
Standardul Bluetooth și dioda Schottky au fost incluse în fundamentele teoretice, deoarece
aceste componente au avut un rol major în funcționarea vehiculului controlat prin comenzi vocale.
În capitolul III am enumerat toate etapele parcurse pentru a real iza practic un vehicul
controlat prin comenzi vocale. În primul rând, a fost nevoie de un plan pentru a alege
componentele potrivite pentru buna funcționare a vehicului, de comenzile ce va trebui să le execute
și în ce mod le va executa.
În afară de sele ctarea componentelor, am realizat practic shield -ul(interfaț a): de la proiectare
la formă finală, cu componente montate pe aceasta. Pasul final în realizarea proiectului a constat în
realizarea aplicației software și diagrama de execuție a acesteia, pas pr ezentat în capitolul IV.
În concluzie, vehiculul a fost conceput cu scopul de a facilita controlul acestuia prin
intermediul comenzilor vocale. Acest lucru permite utilizatorului să îndeplinească alte operațiuni și
de asemenea să îi comande robotului să ex ecute alte comenzi, astfel încât utilizatorul să poată
executa mai multe operații în timp ce comandă vehiculul, ușurându -i modul de execuție al
operațiilor de tip preluare, prelucrare, analiză și transmitere de date.
Principalul avantaj al sistemului real izat este puterea mare de propulsie datorată celor 4
motoare, fiind posibilă comandarea individuală a motoarelor în mod paralel, două câte două. De
asemenea comanda prin bluetooth îi permite mișcarea independentă, fără a necesita un cablu de
transmitere a comenzilor, dar pe de altă parte este și un dezavantaj din cauza faptului că alimentarea
se face de la șase baterii a câte 1.5 V, ceea ce necesită schimbarea sau încărcarea periodică a
surselor de alimentare. Eventual, se pot aduce îmbunătățirile care le -am precizat în capitolul V,
precum și altele.

52
Summary

The purpose of this project was to demonstrate that there is another way to command
vehicles or other devices. In Chapter I, I have detailed that the field of speech recognition has been
in the atten tion of scientists since the early 20th century, and that significant progress has been
made by the various massively technologically advanced countries today. In Chapter II, we began
by explaining the areas of speech: automatic recognition, automatic synt hesis, coding,
understanding, and automatic speech recognition. Next we presented microcontrollers and their
features: general issues related to microcontrollers, architecture, applications, families, but also the
PWM module and what it means, being a comp onent of microcontrollers.
The Bluetooth standard and the Schottky diode have been included in the theoretical
foundations, as these components have played a major role in the operation of the voice controlled
vehicle.
In Chapter III we listed all the step s taken to achieve a virtually controlled voice -controlled
vehicle. First, there was a need for a plan to choose the right components for the proper operation of
the vehicle, the controls it will have to execute, and how it will execute.
In addition to sel ecting components, we have basically created the shield (interface): from
design to final shape with components mounted on it. The final step in the implementation of the
project consisted in the realization of the software application and its execution di agram, step
presented in chapter IV.
In conclusion, the vehicle was designed to facilitate its control via voice commands. This
allows the user to perform other operations and also command the robot to execute other commands
so that the user can perform mu ltiple operations while commanding the vehicle, facilitating the
execution of the pickup, processing, analysis and data transmission.
The main advantage of the system is the high propulsion power due to the four engines, it is
possible to individually cont rol the motors in parallel, two by two. Also, the bluetooth command
allows independent movement without the need for a command line, but on the other hand it is also
a disadvantage because the power is made from six 1.5 V batteries, requiring change or per iodic
loading of power supplies. Eventually, the improvements we have made in Chapter V, as well as
others, can be made.

53
Bibliografie

1. https://en.wikipedia.org/wiki/Speech_recognition
2. https://en.wikipedia.org/wiki/Voice_user_interface
3. Borza, P., Gerigan, C., Ogruțan, P. ș i Toacș e, Gh. – Microcontrollere. Aplicații, Editura Tehnică,
Bucureș ti, 2000. (http://vega.unitbv.ro/~ogrutan/Microcontrollere/curs.pdf )
4. http://web.ulbsibiu.ro/laurean.bogdan/html/Microcontrol ere%20introducere.pdf
5. Bala Ștefan – Sisteme de comunicații, curs
6. Bala Ștefan – Dispozitive Electronice și Electronică Analogică, Volumul 1, Editura
Universității Petrol -Gaze din Ploiești, 2017
7. https://www.autodesk.com/products/eagle/blog/schottky -diodes/
8. https://howtomechatronics.com/tutorials/arduino/arduino -dc-motor-control -tutorial –
l298n -pwm -h-bridge/
9. Minescu Mihail – Tehnologii Electronice, curs
10. Bala Ștefan – Tehnici CAD în realizarea modulelor electronice – Indrumar de laborator,
Editura UPG Ploiești, 2016.
11. https://www.sparkfun.com/products/12576
12. https://store.comet.bg/download -file.php?id=6844
13. Datasheet ATmega328P ( http://www.atmel.com/images/atmel -8271 -8-bit-avr-
microcontroller -atmega48a -48pa -88a-88pa -168a -168pa -328-
328p_datasheet_complete.pdf
14. https://en.wikipedia.org/wiki/TARGET_(CAD_software)

54

ANEXE

Similar Posts