Analiza Si Sinteza Semnalelor Audio
Abstract
„Pure mathematics is, in its way, the poetry of logical ideas.” ~ Albert Einstein
Îmi place să cred că muzica este o aluzie divină a faptului că există și altceva în acest univers, o conexiune armonică între toate ființele. Muzica este peste tot în jurul nostru; singura noastră datorie este să ne deschidem… și să ascultăm.
Această lucrare caută să acopere la un nivel de bază fizica undelor, a sunetelor, a muzicii și a instrumentelor muzicale, precum și impresionanta legătură dintre uman și real, dintre artă și știință, dintre muzică și matematică.
Obiectivele avute în vedere pentru realizarea acestei lucrări de licență sunt: introducerea cititorului în lumea muzicii și abordarea acesteia din punct de vedere științific, prezentarea modului de producere a sunetelor din perspectiva instrumentelor muzicale, analiza și sinteza acestor semnale audio în mediul de dezvoltare produs de MathWorks, MATLAB®, precum și crearea unei aplicații care să poată analiza sau sintetiza un semnal audio, sau să redea polifonic o partitură introdusă la intrare.
3.2.2. Funcții delta și eșantionare
3.2.3. Teorema lui Nyquist
3.2.4. Transformata Z
3.2.5. Filtre digitale
3.2.6. Timpul de scădere
3.2.7. Transformata Fourier Discretă
3.2.8. Transformata Fourier Rapidă
3.3. Sinteza sunetelor muzicale
3.3.1. Anvelope și oscilatoare de frecvență joasă
3.3.2. Sinteza aditivă
3.3.3. Modelarea fizică
3.3.4. Algoritmi de sintetizare
3.3.5. Alte metode de sinteză
3.3.6. Reprezentarea în frecvență a formelor de undă
3.3.7. Coarda ciupită
3.4. Signal Processing Toolbox
3.4.1. Caracteristici cheie
3.4.2. Unelte interactive
3.5. Analiza armonică
3.6. Sinteza armonică
3.7. Normalizare, filtrare și restaurare sunet cu Adobe® Audition® 3
4. Rezultate în simulare – Aplicația grafică MATLAB
Concluzii
Bibliografie
Introducere
Istoria instrumentelor muzicale datează de zeci de mii ani. Fragmente de flaute osoase și fluiere au fost găsite la situri neanderthaliene. Chiar recent, un flaut vechi 9.000 de ani descoperit în China, s-a dovedit a fi, în simplitatea lui, cel mai vechi instrument muzical din lume. Aceste instrumente timpurii arată că oamenii au fost mult timp preocupați de producerea sunetelor pe înălțimi, și anume sunete ce conțin predominant o singură frecvență. Într-adevăr, găurile de mărimea degetului pe aceste flaute indică faptul că acești muzicieni preistorici au avut unele concepte de scalare muzicală.
Muzica și matematica sunt strâns legate între ele. De asemenea, ele joacă roluri foarte diferite în societate. Cu toate acestea, între ele există o legătură mult mai strânsă decât se percepe în mod uzual. Coardele vibrează la anumite frecvențe. Undele sonore pot fi descrise prin ecuații matematice. Violoncelul are o anumită formă, în scopul de a rezona cu corzile într-un mod, de asemenea, matematic. Chiar și tehnologia necesară pentru a face o înregistrare digitală pe un CD se bazează pe matematică. Această lucrare caută să identifice astfel de legături în trei zone diferite, și se încheie cu perspectiva conform căreia muzica are de multe ori unele caracteristici matematice si, mai important, că aspectele artistice pot fi găsite de asemenea în matematică. La urma urmei, matematica este limba pe care fizicienii o folosesc pentru a descrie lumea naturală. Mai mult decât atât, fizicienii, chimiștii sau inginerii nu folosesc matematica doar pentru a descrie lumea fizică, dar și, totodată, pentru a prezice rezultatul unor procese fizice.
În mod similar, s-ar putea încerca găsirea unei „ecuații” pentru a descrie o porțiune muzicală sau, chiar mai bine, pentru a-i prezice rezultatul. Am putea modela sunetul prin ecuații, sau modela lucrări muzicale prin intermediul ecuațiilor. Muzica s-ar crede că este, până la urmă, o mare sumă de sunete individuale și o idee ar fi să investim timp și bani în găsirea acestor ecuații, astfel încât întreaga omenire să se mulțumească cu o muzică previzibilă și ușor de descris.
Adevărul însă este altul: nu există o ecuație anume care să poată modela o lucrare muzicală și nici nu ar trebui să petrecem timp în căutarea sa. Cu toate acestea, există anumite structuri matematice inerente în toate lucrările de muzică și acestea nu sunt date de ecuații. Limbajul matematic este un instrument convenabil pentru a înțelege și comunica această structură de bază.
Teoreticienii de muzică se folosesc de multe ori de puterea formidabilă a matematicii în procesul lor de creare de categorii conceptuale. Numerele întregi discrete sunt deosebit de bine adaptate pentru etichetarea înălțimii sunetului, sau a clapelor de pian. Aria matematicii numită combinatorică permite posibilitatea de numărare a multiplelor moduri de combinare a înălțimilor, deci a numerelor. Acest lucru oferă taxonomii și clasificări ale diferitelor mulțimi care apar. Teoria Grupurilor, un alt domeniu al matematicii pure, descrie modul în care se leagă mulțimile și înălțimile și modul în care acestea pot fi transformate de la unul la altul. În acest sens, matematica pură oferă un cadru convenabil pentru teoreticianul de muzică de a comunica moduri utile în a percepe o lucrare muzicală.
Teoria muzicală nu există doar pentru cei care o ascultă. Teoria muzicală este, de asemenea, utilă compozitorului. Bach, Beethoven și Mozart au fost extrem de bine pregătiți în teoria muzicală a epocilor respective și au aplicat-o zi de zi. Această discuție abstractă are la fel de bine relevanță pentru artist. Un pianist clasic poate cânta mii de note într-un singur concert, fără a avea nevoie neapărată de o partitură și fără ca măcar să îi fie necesară memorarea fiecărei note individuale. Teoria muzicii furnizează artiștilor un sistem de recunoaștere a tiparelor, iar acest lucru întărește memoria muzicală. O melodie nu constă din mai multe sunete individuale izolate, ci mai degrabă din mai multe idei țesute împreună. Pe de altă parte, aceeași memorie muzicală permite ascultătorului de a concepe o piesă de muzică ca un întreg, mai degrabă decât evenimente individuale izolate. Teoria muzicii nu se limitează la muzica clasică. Muzicienii de jazz folosesc, de asemenea, teoria muzicii la improvizații și compoziții proprii. Muzica non-occidentală, de asemenea, se pretează la analize în cadrul teoriei muzicii.
Noțiuni de bază în teoria muzicală
Muzica poate fi reprezentată grafic în diferite sisteme de notare, cel mai des folosit fiind portativul, un set grafic de 5 linii paralele și echidistante ce se numără începând de jos în sus. Pe portativ se pot reprezenta unsprezece note, pe fiecare linie sau spațiu, axa verticală fiind dedicată înălțimii notelor iar cea orizontală duratei.
Notele muzicale se notează în mod uzual prin două variante corespondente:
Silabe – solfegiu
Litere (sistemul internațional)
Tabel 1.1. Corespondența notelor muzicale.
Numele, durata si simbolul notelor muzicale corespondente sunt:
Tabel 1.2. Simbol note, denumire si durată.
Pentru o bună înțelegere a sistemului muzical, se va folosi ca exemplu instrumentul muzical cunoscut sub numele de pian. Clapele pianului sunt dispuse în două seturi folosite în redarea celor 12 note ale scării muzicale occidentale, într-o combinație de clape mai lungi (albe) și mai scurte (negre – semitonurile), care repetă intervalul unei octave.
Figura 1.1. Dispunerea tastelor pe claviatura de pian. Cheile principale sunt hașurate. Notația C4 indică faptul că nota C se află în octava a 4-a.
În figura de mai sus, se poate vedea cum notele muzicale pot fi identificate după numărul octavei si literele desemnate notelor (A, B, C,…, G). Tastatura este divizată în octave, unde notele fiecărei octave reprezintă dublul frecventei notelor din octava imediat precedenta. Luând ca exemplu nota A4, recunoscuta ca „A-440”, întrucât reprezintă nota A cu frecvența de 440 Hz. De notat este faptul ca fiecare octavă conține 12 note, cu ultimul A la frecventa 2×440 Hz = 880 Hz. Asta presupune ca rația notelor adiacente diferă in frecventa cu un factor de . Pentru a rezuma, pentru octava celor 12 note de la A4 la A5, avem:
Tabel 1.3. Cele 12 note ale octavei a 4-a și frecvențele corespondente.
Notele sunt așezate pe o partitură muzicală și denotă frecvența si durata notelor. Fiecare rând muzical este constituit din 5 linii orizontale paralele. Poziția fiecărei note in cadrul acestor linii paralele va determina frecvența notei, iar forma sa va determina durata acesteia în comparație cu celelalte note. Cu cat este mai sus pe rândul muzical, cu atât va avea nota o frecvență mai înaltă atunci când este redată. Notele pot fi de asemenea plasate deasupra rândului (frecvențe mai înalte) sau sub acesta (note de frecvențe mai joase)
Figura 1.2. Notația muzicală este o diagramă în timp și frecvență unde poziția verticală indică frecvența notei.
Orchestra
Orchestra este un ansamblu instrumental de dimensiuni mari constituit din instrumente precum cele cu coarde (cu arcuș, ciupite sau lovite), de suflat (din lemn, alamă sau hibride) sau de percuție, precum și instrumente complexe – orga mare.
Termenul de orchestră derivă din limba greacă, orkhestra, un spațiu semicircular folosit de grupuri de dansatori, unde sufixul -tra denotă „spațiu” iar „orkheisthai” – a dansa..
De mii de ani, oamenii au încercat să combine sonoritatea instrumentelor muzicale, dar adevăratele progrese ce s-au transformat în cele din urmă în orchestra modernă au apărut abia cu 4 secole în urmă. Inițial, muzicienii obișnuiau să se întâlnească pentru a cânta și se foloseau de orice instrument disponibil, indiferent de compatibilitatea cu celelalte. În jurul anilor 1500, în perioada Renașterii, compozitorii obișnuiau să scrie fragmente muzicale menite să fie cântate la orice instrument. Acest lucru s-a schimbat un secol mai târziu, odată cu opera „Orfeo” a lui Claudio Monteverdi, cel care a stabilit precis instrumentele necesare organizate pe secțiuni, dând orchestrei o extraordinară varietate.
Începând cu secolul al nouăsprezecelea, și-au făcut loc instrumente tot mai avansate, permițând compozitorilor să poată scrie părți mult mai dificile, pentru instrumente tot mai specifice, pentru care o erudiție deosebită a capacităților fiecărui instrument în parte era esențială.
Pe măsură ce orchestrele au devenit tot mai complexe și au crescut proporțiile grupului, muzicienii (cu precădere cei din spate) s-au confruntat cu situația de-a nu mai putea urmări concert maistrul datorită distanței, ceea ce a dus la introducerea baghetei pe care dirijorii o folosesc astăzi, alături de urcarea acestora pe un podium amplasat în partea frontal-centrală.
Secolul al douăzecilea a fost un secol de libertate si experimentare, pe măsură ce dirijorii au avut tot mai multă vizibilitate si responsabilitate, dar în cea mai mare parte, partitura de bază a orchestrei clasice s-a păstrat până în zilele noastre.
Întrebarea care s-ar putea pune ar fi dacă poate sau nu o astfel de organizație aparent anacronică supraviețui mult timp. Poate conta o simfonie în cultura contemporană? Bineînțeles. Orchestra a fost și rămâne în continuare o forță politică și socială puternică, un diplomat cultural prin excelență. Aceasta s-a adaptat cu bine la revoluția digitală și continuă să fie văzută ca un element esențial de mândrie civică. Într-o perioadă de transformări dramatice în modul în care muzica clasică este creată, ascultată, distribuită și evaluată, orchestra a reușit să-și păstreze rolul său istoric ca loc de întâlnire al curentelor intelectuale, un adevărat forum pentru iluminarea publică.
Instrumente muzicale principale
Sursele de sunet ale instrumentelor muzicale sunt vibrațiile mecanice, acustice sau electrice. În acest sens, câteva exemple familiare sunt vibrațiile de:
coarde (vioară, chitară, pian, etc.)
bare sau tije (xilofon, Glockenspiel, celesta, clopoței, clarinet, etc.)
membrane (tobe, banjo etc.)
plăci sau scoici (cinel, gong, Bell, etc.)
aer într-un tub (orgă, instrumenteral prin excelență. Aceasta s-a adaptat cu bine la revoluția digitală și continuă să fie văzută ca un element esențial de mândrie civică. Într-o perioadă de transformări dramatice în modul în care muzica clasică este creată, ascultată, distribuită și evaluată, orchestra a reușit să-și păstreze rolul său istoric ca loc de întâlnire al curentelor intelectuale, un adevărat forum pentru iluminarea publică.
Instrumente muzicale principale
Sursele de sunet ale instrumentelor muzicale sunt vibrațiile mecanice, acustice sau electrice. În acest sens, câteva exemple familiare sunt vibrațiile de:
coarde (vioară, chitară, pian, etc.)
bare sau tije (xilofon, Glockenspiel, celesta, clopoței, clarinet, etc.)
membrane (tobe, banjo etc.)
plăci sau scoici (cinel, gong, Bell, etc.)
aer într-un tub (orgă, instrumente de suflat din lemn sau alamă, balafon etc.)
aer într-un recipient închis (toba, vioara, sau corp chitara etc.)
În majoritatea instrumentelor, producerea sunetului depinde de comportamentul colectiv al mai multor componente vibratoare, care pot fi slab sau puternic cuplate împreună. Această cuplare, împreună cu un feedback neliniar, poate provoca instrumentului ca întreg să se comporte ca un sistem vibrant complex, chiar dacă elementele individuale sunt vibratoare relativ simple.
Pianul
Pianul este un instrument muzical extrem de răspândit, în care sunetul este produs de lovirea unor corzi metalice tensionate ce sunt fixate pe o placă de rezonanță din lemn, de către niște ciocănele acoperite cu pâslă, mecanismul făcându-se prin intermediul unei claviaturi.
Pianul, inventat de Bartolomeo Cristofori (1655-1731) în jurul anului 1709, este unul dintre cele mai versatile dintre toate instrumentele muzicale. Cel mai vechi pian existent, construit de către Cristofori în 1721, este expus la Muzeul Metropolitan de Artă din New York. Mecanismul cheie al lui Cristofori a fost adoptat și de alți fabricanți de pian, printre care și Gottfried Silbermann, care i-a arătat unul dintre pianele sale lui Bach. Industria de construire a pianelor, practicată de Andreas și Nannette Stein, a înflorit în Viena în secolul al XVIII-lea. Pianele vieneze, ca acelea utilizate de Mozart, au avut, în general, rame din lemn și două corzi pentru fiecare notă.
Pianul a continuat să se dezvolte în prima parte a secolului al XIX-lea. Intervalul tonal a crescut de la 5 la octave. John Broadwood în Anglia și Sébastien Érard în Franța, au devenit cei mai importanți constructori de piane. Au fost de asemenea adoptate acțiunea de dublă declanșare (inventată de Erard), utilizarea a trei corzi (pentru toate notele, mai puțin cele mai joase), și cadrul de fier al pianului.
Chitara
Chitara (ori ghitara) este un instrument muzical cu coarde ciupite. Are în componență un gât lung, delimitat cu ajutorul tastelor (mici bare de metal amplasate perpendicular pe partea anterioară a gâtului, pe direcția acestuia), și o cutie de rezonanță cu fețe plane. În lateral, caracteristicile chitării dau corpului forma consacrată de clepsidră. Acordajul standard în cvarte perfecte (cu o singură excepție) aduce cu cel al instrumentelor din familia violei (viola da gamba, violine ș.a.).
Există două tipuri de chitare moderne: acustice și electrice.
Familia chitarelor acustice include chitara clasică, chitara flamenco, chitara portugheză, chitare flat-top, chitare arcuite, chitare rezonator (Dobro), chitare cu 12 corzi și chitara acustică bass (inclusiv guitarron sau chitarrone, utilizate în muzica Mariachi) .
Chitara modernă cu șase corzi este un descendent al instrumentului spaniol din secolul al șaisprezecelea „vihuela”, care își are rădăcinile în antichitate. Cuvântul modern, chitară, a fost adoptat din spaniolul „guitarra”, derivat din mult mai vechiul cuvânt grecesc „kithara”. Chitara din perioada Renașterii, care n-a fost luată prea în serios, avea patru perechi de corzi duble. În timpul Barocului, o a cincea pereche a fost adăugată. La sfârșitul Barocului, corzile duble au fost înlocuite de corzi singulare, și o a șasea coardă a fost adăugată. Deși Boccherini si alți compozitori ai secolului al optsprezecelea au inclus chitara în anumite arii muzicale personale, stabilirea chitării ca instrument de concert a avut loc în mare parte în secolul al nouăsprezecelea.
Cercetătorii au acordat o atenție considerabilă felului in care rezonează corpul chitării și la modul în care rezonanțele de joasă frecvență pot fi considerate ca fiind o cauză a vibrațiilor cuplate ale plăcii de sus, a plăcii din spate și a aerului închis. S-a experimentat de-a lungul timpului cu diferite modele de consolidare, în special în placa superioară. Spre deosebire de vioară, care s-a schimbat foarte puțin de-a lungul mai multor decenii, chitara este încă în evoluție.
Vioara
Vioara este un instrument muzical cu coarde și arcuș. Coardele sunt acordate în cvinte perfecte și sunt desfășurate peste partea anterioară a cutiei de rezonanță, vibrând atunci când arcușul este tras peste ele sau când sunt ciupite. Acesta este cel mai mic, și totodată membrul ce poate atinge cele mai înalte note muzicale din familia instrumentelor cu coarde și arcuș, ce include, de asemenea, viola, violoncelul și contrabasul. Aceasta este folosită de muzicieni dintr-o mare varietate de genuri muzicale, printre care muzica barocă, clasică, jazz, muzica folk, Rock & Roll și soft rock. La vioară a ajuns să se cânte în multe culturi muzicale non-occidentale din întreaga lume.
Instrumentele din familia viorii s-au dezvoltat în Italia, în secolele al șaisprezecelea și al șaptesprezecelea și au atins un vârf în secolul al optsprezecelea, în mâinile unor maeștri precum Antonio Stradivari sau Giuseppe Guarneri del Gesu.
Sunetul unei viori depinde de forma sa, de lemnul din care este confecționată, de grosime și de lacul ce acoperă suprafața exterioară. Lacul și în special lemnul din componența sa continuă să se îmbunătățească cu vârsta, ceea ce face ca numărul limitat de viori vechi să le facă atât de dorite în întreaga lume.
Matematică vs. Muzică
Pentru mulți oameni, matematica este o enigmă. Caracterizată prin impresia de numere și calcule predate la școală, este deseori însoțită de sentimente de respingere și dezinteres, fiind considerată a fi strict rațională, abstractă, rece și lipsită de sentimente.
Cu toate acestea, muzica exprimă mai degrabă legătura cu emoții, sentimente și cu viața în sine. Este prezentă în toate activitățile zilnice și o poate certifica oricine a cântat vocal un cântec, a fluierat, a apăsat pe o clapă de pian sau a suflat într-un flaut. Muzica este ceva cu care oamenii pot interacționa, este o formă de expresie și face parte din existența fiecăruia.
Motivația pentru investigarea legăturilor între aceste două aparent opuse, prin urmare, nu este foarte evidentă și nu este clar în ce aspecte ale ambelor subiecte o astfel de relație poate fi de urmărit. Mai mult decât atât, dacă se acceptă unele aspecte matematice în muzică, cum ar fi ritmul și înălțimea sunetelor, este mult mai dificil de imaginat orice muzicalitate în matematică. Numărabilitatea și ordinea puternică a matematicii nu par să coincidă cu un model artistic.
Cu toate acestea, există diferite aspecte care indică acest tip de relație. De exemplu, anumite cercetări au demonstrat că acei copii ce știu să cânte la pian arată de multe ori bune abilități de raționament, cum ar fi cele aplicate în rezolvarea de puzzle-uri, a jocului de șah sau efectuarea de deduceri matematice. Prin contrast, s-a observat într-o anchetă particulară că procentul de studenți care au urmat un curs de muzică a fost cu aproximativ unsprezece la sută deasupra mediei din rândul absolvenților de matematică, ceea ce indică statistic o oarecare afinitate a matematicienilor pentru muzică.
Misiunea dificilă asumată de a analiza relația dintre matematică și muzică va arăta că există anumite legături și asemănări între cele două, ceea ce poate explica de ce unor muzicieni le place matematica și de ce matematicienii, în general, iubesc muzica.
Tonul și acordurile muzicale: percepția asupra muzicii a lui Pitagora
În perioada Greciei antice, matematica și muzica au fost puternic conectate. Muzica a fost considerată ca o disciplină strict matematică, ce avea la bază relații, raporturi și proporții. În Quadrivium (curriculum-ul de la Școala lui Pitagora), muzica a fost plasată la același nivel ca și aritmetica, geometria și astronomia. Această interpretare a neglijat în totalitate aspectele creative ale performanței muzicale. Muzica a fost știința sunetului și armoniei.
Noțiunile de bază în acest context, au fost cele de consonanță și disonanță. Oamenii au observat foarte devreme că două note diferite nu sună întotdeauna plăcut (consonant), atunci când sunt cântate împreună. Mai mult decât atât, grecii antici au descoperit că la o notă cu o anumită frecvență, numai acele note ale căror frecvențe au fost multipli întregi ai primei ar putea fi combinate în mod corespunzător. Dacă, de exemplu, a fost luată o notă de frecvență 220 Hz, notele de frecvențe 440 Hz, 660 Hz, 880 Hz, 1100 Hz și așa mai departe, ele sună cel mai bine atunci când sunt cântate împreună cu prima.
În plus, examinările de sunete diferite au arătat că acești multipli întregi ai frecvenței de bază apar întotdeauna într-o intensitate slabă atunci când nota de bază este cântată. Dacă vibrează o coardă a cărei lungime definește o frecvență de 220 Hz, sunetul generat conține, de asemenea, componente ale frecvențelor 440 Hz, 660 Hz, 880 Hz, 1100 Hz și așa mai departe. În timp ce ascultătorii percep în special nota de bază, intensitățile așa-numitei armonii, definesc caracterul unui instrument. Este în primul rând o urmare a acestui fenomen că o vioară și o trompetă nu sună la fel, chiar dacă acestea cântă aceeași notă.
Cel mai important raport de frecvență este de 1:2, care se numește o octavă în sistemul apusean de partituri. Două note diferite într-o asemenea relație sunt adesea considerate in principal aceleași (și, prin urmare, sunt date cu același nume), variază doar în înălțimea lor, dar nu și în caracter. Grecii au observat într-o octavă “o identitate ciclică”. Următoarele rapoarte construiesc cvinta muzicală, (2:3), cvarta (3:4), terța majora (4:5) și terța minoră (5:6), care au toate importanța lor în crearea de acorduri.
Diferența între o cvintă și o cvartă a fost definită ca un ton întreg, ceea ce duce la un raport de 8:9. Aceste rapoarte corespund nu numai frecvențelor sunetelor respective, dar si lungimilor relative ale coardelor, ceea ce a făcut ușor de a găsi notele consonante pornind de la o frecvența de bază. Spre exemplu, scurtarea unei coarde la două treimi din lungimea sa creează un interval muzical de o cincime.
Toate aceste studii de raporturi și proporții "armonice" erau esența muzicii în timpul lui Pitagora. Această percepție, cu toate acestea, și-a pierdut din importanță la sfârșitul Evului Mediu, atunci când s-a dezvoltat muzica mai complexă. În ciuda raporturilor "perfecte", s-au produs noi disonanțe atunci când s-au folosit anumite acorduri, chei diferite sau o scară mai mare de note.
Explicația pentru acest fenomen a fost incomensurabilitatea treimii, cincimii si octavei atunci când sunt definite prin raporturi întregi. Prin adăugarea mai multor intervale de aceste tipuri la o notă de bază, nu se ajunge din nou la o octavă din nota de baza. Cu alte cuvinte, o octavă (1:2) nu poate fi subdivizată într-un număr finit de intervale egale de acest tip pitagoreic (x: x +1 | x fiind un număr întreg). Adăugarea unor tonuri întregi definite de raportul 9:8 la o notă de bază cu frecvența f, de exemplu, nu creează o nouă notă cu frecvența , , sau similară. Totuși, adăugarea de șase tonuri întregi într-o notă, aproape creează prima octavă definită de frecvență dublă: .
Având în vedere aceste caracteristici ale intervalelor pitagoreice, s-a dezvoltat nevoia unui alt sistem de reglare. Mai multe încercări au fost făcute, dar numai unul s-a păstrat până în zilele noastre: sistemul de divizare a unei octave în douăsprezece semitonuri egale, introduse de Johann Sebastian Bach in secolul al 18-lea. Fondarea pe raportul 1:2 pentru octave, toate celelalte intervale pitagoreice au fost ușor ajustate pentru a se potrivi cu acest nou model. Astfel, un ton întreg nu mai este definit prin raportul: , ci prin două semi-tonuri (fiecare exprimate prin), obținându-se valoarea numerică: .
Controversele în cadrul acestui proces de revenire este că urechea umană preferă încă intervalele lui Pitagora "pure", în timp ce o scară temperată este necesară în linii melodice complexe, cântate la instrumente cu corzi. Muzicienii zilelor noastre sunt nevoiți sa se confrunte cu aceste mici disonanțe, în scopul de a acorda un instrument intr-un mod care se potrivește acestui model.
Cu evoluția acestui model matematic tot mai complicat pentru acordarea unui instrument, și cu creșterea importanței muzicalității și a performanței, muzica și matematica în acest aspect au pierdut relația strânsă cunoscută în timpurile antice grecești. Din moment ce intervalul uniform temperat nu mai poate fi exprimat ca un raport ( este un număr irațional), muzicienii au învățat să acordeze instrumentele prin antrenarea si formarea urechii lor muzicale, mai degrabă decât prin aplicarea principiilor matematice. Muzica, din acest punct de vedere, s-a eliberat de sub dominația matematică.
Muzica matematică: numere Fibonacci și proporția de aur în compozițiile muzicale
Întrebările despre tonuri și de acordaje muzicale sunt un aspect în care gândurile matematice intră în lumea muzicii. Cu toate acestea, muzica – cel puțin într-o percepție modernă – nu constă numai în note și armonie. Mai importante sunt schimbările de note, în raport cu timpul, și anume aspectul ritmului și al melodiei. Aici, conceptele matematice sunt din nou omniprezente. Nu doar că notația muzicală simbolică este în toate aspectele sale foarte matematică, dar, de asemenea, particularitățile aritmetice și reflecțiile geometrice pot fi găsite în compoziții muzicale.
Un aspect foarte interesant al conceptelor matematice în compoziții muzicale este apariția de numere Fibonacci și teoria proporției de aur. Formațiunea este un sir infinit de numere întregi numite după Leonardo de Pisa (alias Fibonacci), un matematician medieval. Prin intermediul primilor doi membri care sunt ambii 1, fiecare nou membru al secvenței este format prin adăugarea de două precedente (1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89 …). Cu toate acestea, caracteristica lor cea mai importantă în acest context este faptul că secvența de raporturi Fibonacci (care este raportul dintre un număr Fibonacci cu adiacentă mai mare) converge la o limită constantă, numit raportul de aur, proporția de aur sau secțiunea de aur (0.61803398 …).
Mai comună este interpretarea geometrică a proporției de aur: O diviziune a unei linii în două părți inegale se numește „de aur” dacă relația dintre lungimea întregii linii și lungimea părții mai mari este aceeași ca relația dintre lungimea părții mai mari și lungimea părții mai mici. Această proporție nu poate fi găsită doar în forme geometrice (de exemplu lungimea unei diagonale referitoare la lungimea unei laturi într-un pentagon), dar, de asemenea în natură (de exemplu, lungimea trunchiului în raport cu diametrul unor specii copaci, cum ar fi molidul Norvegian). Datorită considerațiilor bine echilibrate, frumoase și dinamice, secțiunea de aur a găsit diverse aplicații în domeniul artelor, mai ales în pictură și fotografie, în care elementele importante împart lungimea unei imagini sau lățimea (sau ambele) conform proporției de aur. Cu toate acestea, o astfel de divizare nu este neapărat efectuată conștient, dar rezultă într-o impresie de frumusețe si armonie.
Diverse studii au descoperit că același concept este, de asemenea, foarte frecvent în compozițiile muzicale. Secțiunea de aur – exprimată prin raporturi Fibonacci – este fie folosită pentru generarea de schimbări ritmice, fie pentru a dezvolta o linie melodică.
În plus, studiul lui James A. Rothwell (1977) a dezvăluit exemple ale proporției de aur în diverse perioade muzicale. În timp ce caracteristicile compozițiilor examinate au variat destul de mult, importanța organizării proporționale a fost în mare parte similară. S-a descoperit că locații structurale importante, marcate de evenimente melodice, ritmice sau dinamice, au împărțit compoziția în două părți, simetric sau in proporția de aur.
Astfel, un exemplu bine cunoscut este refrenul "Aleluia" în piesa Mesia, a lui G. F. Handel. Întrucât este format din 94 de măsuri, una dintre cele mai importante evenimente (intrarea solo trompete: "Regele Regilor"), se întâmplă în măsurile 57-58, după aproximativ 8/13 din întreaga piesă. În plus, se poate găsi o structură similară în ambele diviziuni din întreaga piesă. După 8/13 din primele 57 de măsuri, respectiv, pe măsura 34, intrarea temei "Împărăția slavei …" marchează un alt punct esențial, și după 8/13 din al doilea 37 de măsuri, în măsura 79 ("Și El va împărăți …), din nou, importanța locației este executată de către apariția de trompete solo. Este greu de spus dacă Handel a ales aceste locuri în mod deliberat, dar, cel puțin, acest fenomen subliniază importanța secțiunii de aur nu numai vizual, dar, de asemenea, în spectacolele artistice.
Un alt studiu (mai, 1996) a arătat că, în aproape toate sonatele lui Mozart, relația dintre expunere, dezvoltare și recapitulare se conformează cu proporția de aur. Aici, din nou, nu se poate stabili dacă Mozart a fost conștient sau nu de aplicarea proporției de aur, chiar dacă există suficiente dovezi care sugerează atracția lui față de matematică.
Este probabil mai puțin important să se evalueze ideea dacă oamenii iau sau nu matematica în considerare atunci când aceștia aplică sau percep proporția de aur; important este a se observa armonia și frumusețea faptului că acest aspect poate fi exprimat prin mijloace matematice. Raporturile Fibonacci în legătură cu divizarea unei compoziții, precum și raporturile întregi în legătură cu intervalele pitagoreice sunt exemple că armonia poate fi uneori descrisă de numere întregi pare și, prin urmare, are un aspect foarte matematic. Acest lucru ar putea fi o modalitate de a introduce o idee suplimentară: că frumusețea este inerentă în matematică.
Matematică muzicală: Reflecții asupra unui aspect artistic al matematicii
Toate aceste aspecte ale modelelor matematice în sunet, armonie și compoziție nu explică în mod convingător afinitatea remarcabilă a matematicienilor pentru muzică. A fi un matematician nu înseamnă doar descoperirea numerelor peste tot în jur și savurarea doar a problemelor cu puternice conotații matematice. Prin urmare, relația esențială se presupune a se găsi la un alt nivel.
Este de remarcat faptul că afinitatea menționată mai sus nu este reciprocă. Muzicienii nu arată, de obicei, același interes pentru matematică la fel ca și matematicienii pentru muzică. Prin urmare, trebuie să presupunem că aspectul decisiv nu poate sta în aritmetică, partea din matematică pe care oamenii o consideră uneori a fi, de fapt, întregul subiect. Cel mai probabil, mai degrabă aria gândirii matematice, a concentrării mintale și a rezolvării de probleme este cea care creează aceste conexiuni.
Un exemplu dat de este omniprezența cuvintelor precum frumusețe, armonie și eleganță în cercetarea matematică. În timp ce muzicienii, uneori, dezvoltă o melodie deosebit de bine formată sau se aplică o armonie remarcabilă, matematicienii caută de multe ori dovezi "simple" și elegante. Mai mult, senzațiile din rezolvarea unei probleme matematice par a fi similare cu cele care apar atunci când se efectuează o lucrare muzicală. Cel mai important este aspectul creativ, care se află în aceste două discipline.
Dovezi interesante pentru această idee au fost prezentate de către Henle, care a comparat istoria muzicii cu istoria matematicii bazate pe următoarele trei argumente principale:
„Matematica are multe din caracteristicile unei arte.”
„Privită ca artă, se pot identifica perioadele artistice în matematică: Renaștere, Baroc, Clasicism și Romantism”
„Aceste perioade coincid foarte bine și își împart multe din caracteristici cu epocile muzicale corespunzătoare, dar sunt semnificativ diferite de cele ale picturii și literaturii.”
Cu privire la concepte cum ar fi dualismul (Baroc), universalitate (Clasicism) și eternitate (Romantism), el evidențiază asemănări surprinzătoare între evoluția din matematică și muzică.
Mai mult decât atât, el subliniază necesitatea unei schimbări în educația matematică spre un stil mult mai muzical. "Elevii ar trebui să facă matematică împreună (așa cum fac matematicienii profesioniști ), nu singuri. […] Și, în sfârșit, elevii trebuie să interpreteze matematic; ei ar trebui să cânte matematica și să danseze matematica". Acest lucru i-ar ajuta, probabil, pe oameni să înțeleagă ceea ce matematica este cu adevărat, și anume nu divin, ci muritor; nu lege, ci gust.
În ciuda aspectului extrem de speculativ în astfel de idei, acesta este, probabil, punctul de vedere fundamental atunci când se caută conexiuni între matematică și muzică. Este muzicalitatea într-un mod matematic de gândire care atrage matematicienii de muzică. Cu toate acestea, este dificil pentru oamenii care nu sunt familiarizați cu acest tipar special de mentalitate, să înțeleagă esența. Prin urmare, este probabil faptul că gradul de înțelegere al unor astfel de relații este proporțional cu gradul de înțelegere al observatorului atât în cazul matematicii, cât și al muzicii.
Concluzie
În paragrafele de mai sus am încercat să subliniez trei abordări diferite la întrebarea referitoare la care este modul în care matematica și muzica relaționează. Primul a arătat particularitatea percepției față de muzică a grecilor antici, punând mai puțină importanță pe melodie și mișcare decât pe tonalitate, acordaj și armonia statică. În cel de-al doilea, conceptul porțiunii de aur a fost pus în legătură cu proporțiile numerelor și apariția lor în diferite compoziții. Cu toate acestea, abordarea fundamentală a fost cea de-a treia, în care s-au descoperit legături cu privire la aspectul artistic al modului matematic de gândire.
Este evident că acestea sunt doar exemple pentru investigarea unei astfel de relație și că alte comparații ar putea fi încercate. Cu toate acestea, cele trei teorii reprezintă, probabil, conceptele și ideile de cele mai multe ori discutate și sunt deosebit de adecvate pentru a furniza o primă impresie asupra acestui subiect.
Oricare ar fi legăturile dintre muzică și matematică, ambele sunt, evident, încă foarte diferite ca și discipline, și nu ar trebui să se încerce ca una sa se impună celeilalte. Ar fi greșit să se încerce explicarea tuturor formelor de muzică prin mijloace matematice, precum și faptul că nu ar avea niciun sens studierea matematicii numai din punct de vedere muzical. Totuși, ar fi necesar dacă aceste relații ar fi introduse în educația matematică, pentru a o elibera de conotațiile adesea prea serioase.
Este important să se arate oamenilor că matematica, într-un fel, este la fel de mult o artă, precum este și o știință. Acest lucru, probabil, ar modifica percepția comună, iar oamenii ar înțelege mai bine esența și universalitatea ei.
Fizica instrumentelor muzicale
Fizica producerii sunetului
Ori de câte ori auziți un flautist cântând, un semnal este trimis dinspre degetele sale, către urechile ascultătorilor. În timp ce se cântă la el, flautul vibrează. Vibrațiile se propagă prin aer și se transmit, prin canalul auditiv, in urechea interna, la timpan. Aceste vibrații sunt oscilații rapide in presiunea aerului, oscilații ce sunt detectate ca sunet de către ureche.
Elementele de bază
Cel mai simplu model al unui sunet muzical este o undă sinusoidală unde domeniul (axa x) este timpul și amplitudinea (axa y) este presiunea.
Unde: P presiunea, exprimata in decibeli sau Pascali
t timpul, in secunde
A amplitudinea (înălțimea undei) sau volumul, in dB sau Pascali
frecventa, in hertz
T perioada, in secunde; este durata unei unde.
Figura 2.1. Unda sinusoidală cu amplitudinea A = 60 dB și frecvența f = 100Hz
În general, un sunet are două caracteristici: înălțime și volum. Înălțimea, sau nota redată, corespunde cu frecvența undei. Notele înalte au frecvențe înalte, astfel încât presiunea variază rapid. Notele mici au frecvențe joase. Frecvența este măsurată în Hertz (Hz), care este numărul de unde pe secundă.
Figura 2.2. Două note, ambele cu amplitudinea A = 60 dB. Nota mai joasă are frecvența = 100Hz (continuu). Nota mai înaltă are frecvența = 125Hz (punctat).
Figura 2.3. Gamele de frecvențe la diferite instrumente, în Hz. frecvențele sonore variază de la 20Hz la 20,000 Hz.
Volumul sau intensitatea, corespunde amplitudinii presiunii. Când cineva aude muzica tare, cum ar fi la un concert rock, oscilațiile presiunii mari pot fi resimțite de către organism.
Figura 2.4. O notă puternică la A = 60 dB (solid) și o notă liniștită la A = 40 dB (punctată). Ambele note au o frecvență de = 100Hz.
Presiunea este în mod normal măsurată în Pascali, care este forța pe unitatea de suprafață (1 Pa = 1 N/m2). Cele mai multe sunete sunt mai mici de 1 Pa, în timp ce cele zgomotoase sunt între 5 și 10. Scara in decibeli este una de presiune logaritmica, folosită pentru volum, astfel încât sunetele liniștite sunt răspândite. Pascalii se convertesc în decibeli, după cum urmează:
Constanta a fost aleasă deoarece este considerat a fi pragul limită al auzului. Astfel, , deoarece, atunci când , .
Frecvențele octavelor și armonicelor
Pentru a înțelege de ce anumite combinații de note fac armonie și altele nu, vom studia cel mai simplu instrument, o coardă. Formula pentru frecvența unei coarde vibrante este:
Unde frecvența se măsoară in Hz = 1/sec
Lungimea, in metri
Tensiunea, in Newton, N=kg*m/sec2
Densitatea coardei reprezintă grosimea sa, în kg/m
Frecvența ori înălțimea se poate modifica în 3 feluri:
prin tensionarea coardei: ↑tensiunea ↑ frecvența
folosirea unei coarde mai groase: ↑densitatea ↓ frecvența
folosirea degetelor pe taste: ↓lungimea ↑ frecvența
Concret, frecvența este invers proporțională cu lungimea șirului. Acest lucru înseamnă că dacă am înjumătăți lungimea șirului, frecvența se va dubla. Se pare că o frecvență de două ori reprezintă o notă mai sus cu o octavă. Folosind acestea, putem construi graficul de mai jos:
Figura 2.5. Octavele coardei vibrante
Secvența frecvențelor acestor octave: 55, 110, 220, 440 este o secvență geometrică. O secvență geometric este o secvență în care termenul anterior este înmulțită cu o constantă. În acest caz, constanta este 2. Un exemplu foarte simplu de o secvență geometrică este 2, 4, 8, 16, 32, etc. Dacă această secvență ar fi fost reprezentată grafic, ar arăta ca o funcție exponențială.
Astfel, frecvențele octavelor formează o secvență geometrică.
Acest fapt are multe manifestări fizice, cum ar fi:
Instrumentele joase trebuie să fie mult mai mari decât instrumentele de înălțime. În general, un instrument care este mai jos cu o octavă trebuie să fie de două ori mai mare. De exemplu, în familia corzilor, progresând de la vioară, violă, violoncel, la contrabas, violoncelul este mare, iar contrabasul este foarte mare.
Tuburile orgilor trebuie să se dubleze, de asemenea, pentru a putea coborî o octavă. Acesta este motivul pentru care tuburile orgilor din bisericile catolice, dacă sunt aranjate în ordine descrescătoare, aproximează o curbă exponențială.
Tastele de pe o chitară sunt departe una de cealaltă la gât și apropiate lângă corp, un model care apare, de asemenea, pe hârtia grafică logaritmică. Tastele chitarei și hârtia logaritmică ambele urmează un model exponențial invers.
Dacă am putea urmări coarda noastră simplă vibrând cu ajutorul unei camere de filmat cu încetinitorul, am vedea că vibrează în mai multe moduri, după cum se arată mai jos. Modul principal este frecvența fundamentală sau prima armonică, și dă notei frecvența specificată. Coarda poate vibra în moduri mai ridicate, sau armonice, la momente diferite sau simultan.
Figura 2.6. Armonicile coardei vibrante
Secvența frecvențelor acestor armonici: 55, 110, 165, 220, 275, 330 formează o secvență aritmetică. O secvență aritmetică este o secvență în care se adaugă o constantă termenului precedent. În acest caz, constanta este de 55.
Pentru a rezuma punctele importante:
Frecvențele octavelor formează o secvență geometrică.
Frecvențele armonicilor formează o secvență aritmetică.
Cele două caracteristici ale unui sunet muzical sunt volumul si înălțimea. Cum se poate face însă diferența dintre un flaut și o vioară, în condițiile în care ambele redau aceeași notă, cu aceeași intensitate? Dacă am măsura presiunea aerului pe rând, în preajma unui flaut, a unui oboi și a unei vioare, fiecare redând aceeași notă La (440 Hz), graficul trasat ar arăta astfel:
Figura 2.7. Variația presiunii cu timpul în cazul celor 3 instrumente
Semnalele presiunii arată foarte diferit între ele, deși amplitudinea si frecvențele fundamentale sunt aceleasi. Această difernță este cauzată de amplitudinile relative ale armonicilor superioare. Aceasta se poate vedea trasând separat graficul volumului fiecărei armonici, după cum urmează:
Figura 2.8. Amplitudinile armonicilor unui flaut, oboi si vioară, pe nota La (middle A)
În matematica avansată, aceștia se numesc coeficienți Fourier ai formelor de undă din figura X. Analiza Fourier este folosită pentru a calcula acești coeficienți pentru un semnal dat.
Se poate observa că armonicile flautului sunt constituite in cea mai mare parte din fundamentala la 440 Hz si armonica secundară, la 880 Hz. Când măsurăm presiunea aerului din preajma unui flaut, vedem suma acestor două armonici. Aceasta este echivalent cu a adăuga două curbe sinusoidale, după cum urmează:
Figura 2.9. Însumarea primei și celei de-a doua armonice la flaut.
Cel de-al 3-lea grafic reprezintă semnătura undei de presiune a flautului. Același proces poate fi folosit pentru a produce undele de presiune ale oboiului și ale vioarei, dar pentru asta trebuie adăugate celelalte armonice din figura precedentă.
Muzica sintetizată imită instrumentele prin combinarea armonicilor, la fel cum am făcut și pentru flaut, mai sus. Cu toate astea, muzica sintetizată sună adesea fals, deoarece armonicele sale sunt constante, în timp ce muzica reală are armonice care se schimbă subtil, pe măsură ce muzicianul variază timbrul, vibrato-ul și frazarea muzicală.
2.1.3. Intervale și interferențe
Atunci când sunt redate două unde sinusoidale de frecvențe apropiate, apar interferențe. Acestea pot fi auzite, de exemplu, acționând două corzi de chitară identice tensionate la mică diferență una de cealaltă.
Figura 2.10. Suprapunerea a două oscilații de frecvență apropiată.
Se poate observa cum cele două curbe din primul grafic variază între aliniere totală și în opoziție. Curba de sumare din al doilea grafic este dublată atunci când aceste două grafice sunt aliniate și se anulează reciproc atunci când sunt in opoziție de fază.
Interferențele ating nivelul maxim atunci când separarea frecvențelor este între o jumătate de pas și o terță minoră. Atunci când separarea e mai mică de atât, interferențele sunt prea lente pentru a putea fi percepute de urechea umană. Când gradul de separare este mai mare, ele devin prea rapide pentru a putea fi auzite. Aceasta se poate vedea in graficul de mai jos.
Figura 2.11. Consonanța în funcție de gradul de separare al frecvențelor.
Astfel, se poate concluziona că frecvențele apropiate interferează și creează disonanțe.
Matematica armonicilor și a corzilor vibrante este un exemplu minunat de matematică ce ne înconjoară în fiecare zi. Muzica, una dintre tradițiile noastre cele mai vechi și universale, este în același timp cuantificabilă și emoțională, deopotrivă matematică și emoționantă. Putem afirma astfel, că matematica nu este deloc seacă și plictisitor, cum ar putea crede unii, dar captivantă, interesantă și distractivă.
Fizica instrumentelor muzicale
Relevanța undelor sinusoidale în discuția despre percepția înălțimii sunetelor stă în ecuația diferențială din mișcarea armonică simplă. Pe scurt, soluțiile ecuației diferențiale sunt funcțiile sau, echivalent,
Figura 2.12. Consonanța în funcție de gradul de separare al frecvențelor.
Ecuația de mai sus reprezintă ceea ce se întâmplă atunci când un obiect este
supus unei forțe către o poziție de echilibru, magnitudinea forței
fiind proporțională cu distanța de punctul de echilibru.
Majoritatea notelor muzicale nu constau într-o singură undă sinusoidală. De exemplu, în urma ciupirii unei coarde, va rezulta o undă periodică dar va consta, de obicei, într-o sumă de sinusoide cu diverse amplitudini. Vor apărea astfel diferite vârfuri diferite ale amplitudinii vibrațiilor membranei bazilare, și un semnal mult mai complex va fi trimis la creier. Descompunerea unei oscilații periodice ca o sumă de sinusoide se numește analiza Fourier, care este subiectul unui capitolul ulterior.
Mișcarea armonică
Considerând o particulă de masă m supusă unei forțe F către poziția de echilibru, y=0 și a cărei amplitudine este proporțională cu distanta de poziția de echilibru,
Aici, k este doar o constantă de proporționalitate. Legea de mișcare a lui Newton dă ecuația
Unde
este accelerația particulei si t reprezintă timpul. Combinând aceste ecuații, se obține ecuația diferențială de ordin 2
Vom nota cu ẏ și pe cu ÿ. Astfel, ecuația devine
Soluțiile acestei ecuații sunt
Coarde vibrante
Considerând o coardă vibrantă ancorată la ambele capete, și atașând în mijlocul acesteia o bilă cu masa m a bilei mult mai mare decât masa corzii și exercitând o forță F asupra bilei înspre poziția de echilibru a cărei amplitudine este proporțională cel puțin pe distanțe mici cu distanța y de la poziția de echilibru,
Conform secțiunii de mai sus, ecuația diferențială are soluțiile
unde constantele A si B sunt determinate de către poziția inițială și viteza bilei.
Figura 2.13. Consonanța în funcție de gradul de separare al frecvențelor.
Daca masa coardei este uniform distribuită, atunci mai multe „moduri” de a vibra sunt posibile. De exemplu, punctul median al corzii poate rămâne staționar, in timp ce cele doua jumătăți vibrează în opoziție de fază. La o chitara, aceasta poate fi obținută atingând mijlocul corzii in timp ce aceasta se ciupește și eliberând-o imediat. Efectul va fi un sunet cu exact o octavă mai sus de înălțimea naturală a corzii, sau exact dublul frecventei sale inițiale. Procedeul acesta este o practica comuna intre chitariști. Daca fiecare jumătate vibrează cu o undă sinusoidală pură, atunci mișcarea unui oricare alt punct decât cel median va fi descris de funcția
Figura 2.14. Consonanța în funcție de gradul de separare al frecvențelor.
Dacă este atins punctul la exact o treime din lungimea corzii fix in timpul ciupirii acesteia, efectul va fi un sunet cu o octavă și o cvintă perfectă deasupra înălțimii naturale a corzii, sau exact triplul frecventei acesteia. Din nou, daca cele trei părți ale corzii vibrează cu o undă sinusoidală pură, cu oscilația mediană în opoziție de fază cu cele două exterioare, atunci mișcarea unui punct nestaționar de pe coarda va fi descris de ecuația
Figura 2.15. Consonanța în funcție de gradul de separare al frecvențelor.
În general, o coardă ciupită va vibra cu o mixtură a tuturor modurilor descrise de multipli naturali ai frecvenței, cu amplitudini variabile. Amplitudinile implicate depinde de maniera exacta in care coarda este ciupita sau lovita. De exemplu, o coardă lovită de un ciocănel, așa cum se întâmplă în cazul pianului, va avea un set cu totul diferit de amplitudini decât în cazul coardei ciupite. Ecuația generala de mișcare a unui punct tipic de pe coarda va fi:
Modalitatea prin care o coardă poate să vibreze cu un număr de frecvențe diferite, în același timp face subiectul teoriei seriilor Fourier și ale ecuației undei, la care voi reveni în secțiunile următoare.
Unde sinusoidale și spectrul în frecvență
De vreme ce unghiurile în matematică sunt măsurate in radiani și un cerc cuprinde 2π radiani, o undă sinusoidală cu frecvența ν exprimată în Hz, amplitudinea maximă c și faza ϕ va corespunde unei unde sinusoidale de forma
Cantitatea se numește vitează unghiulară. Rolul unghiului ϕ este de a ne spune unde sinusoidală intersectează axa timpului. De exemplu, o undă exprimată printr-un cosinus, se leagă de una sinusoidală prin relația
Aceasta este deci o undă cosinusoidală este de fapt o sinusoidală cu faza diferită.
De exemplu, tonalitatea concertelor moderne plasează nota La (A) deasupra notei Do (C4) la 440Hz, ceea ce ar putea fi reprezentat de o undă de forma
Aceasta poate fi convertită într-o combinație liniară de sinusuri si cosinusuri folosind formulele standard pentru sinusul si cosinusul unei sume:
Se poate încheia această secțiune prin introducerea conceptului de spectru, care joacă un rol foarte important în înțelegerea notelor muzicale. Spectrul unui sunet este un grafic ce indică amplitudinile a diferitor frecvențe sonore. O imagine a spectrului unei coarde vibrante cu frecvența fundamentală
poate fi ilustrată astfel:
Figura 2.16. Sunet cu un spectru în frecvență discret
Analiza și sinteza semnalelor audio în MATLAB
Modul în care o coardă poate să vibreze cu un număr de frecvențe diferite, în același timp a ocupat mintea multora dintre marii matematicieni și muzicieni ai secolului al XVII-lea și al XVIII-lea. Printre cei a căror muncă a contribuit la soluționarea acestei probleme se numără Leonhard Euler, Marin Mersenne, familia Bach, Jean-le-Rond d'Alembert, Daniel Bernoulli și Jean Baptiste Joseph Fourier.
Teoria Fourier
În acest capitol se va discuta despre teoria lui Fourier a analizei armonice. Aceasta este descompunerea unui unde periodice într-o sumă (de obicei infinită) de sinusuri și cosinusuri. Frecvențele implicate sunt multipli întregi ai frecvenței fundamentale a undei periodice, și fiecare are o amplitudine care poate fi determinată ca o integrală.
Fourier a introdus ideea că funcțiile periodice pot fi analizate prin utilizarea seriilor trigonometrice, după cum urmează. Funcțiile cos θ și sin θ sunt periodice cu perioada 2π, în sensul că acestea îndeplinesc
Cu alte cuvinte, translatarea cu 2π de-a lungul axei θ lasă aceste funcții neafectate. Există multe alte funcții f (θ), care sunt periodice de perioadă 2π, ceea ce înseamnă că ele satisfac ecuația
Este suficientă specificarea funcției f pe intervalul semi-deschis [0, 2π) și apoi ecuația de mai sus determină valoarea tuturor celorlalte valori ale lui θ.
Fig. 3.1. O funcție periodică oarecare de perioadă 2π
Alte exemple de funcții periodice cu perioada sunt funcțiile constante, si funcțiile și pentru orice n număr natural. Valorile negative pentru nu influențează, deoarece
Într-un context mai general, putem scrie orice serie de forma
unde si sunt constante. Deci este o constantă – motiv pentru care factorul va fi explicat în timp util. O astfel de serie este numit serie trigonometrică. Cu condiția că nu există probleme de convergență, o astfel de serie va defini o funcție care îndeplinește .
Pentru a putea introduce coeficienții și într-o funcție definită de o serie trigonometrică, este necesară găsirea unei serii trigonometrice a cărei sumă este egală cu o funcție periodică dată. Astfel, pentru și , putem scrie
Aceste ecuații pot fi demonstrate prin utilizarea ecuațiilor pentru a rescrie produsul de funcții trigonometrice din interiorul integralelor ca o sumă înainte de integrare. Factorul suplimentar pentru va determina coeficientul lui in fata lui . Pentru avem
Astfel se va obține, pentru ,
În aceleași condiții, vom obține pentru
Funcțiile si sunt definite prin ecuații și sunt numite coeficienții Fourier ai funcției .
Putem explica acum aspectul coeficientului de o jumătate din fața în ecuație. Astfel, deoarece este jumătate din și ,
ceea ce înseamnă că formula pentru coeficientul am deține este valabilă pentru m ≥ 0.
Ar fi frumos să credem că atunci când vom folosi ecuații și pentru a defini am și bm, partea dreaptă a ecuației converge întotdeauna la Acest lucru este valabil pentru anumite funcții f, dar, din păcate, nu pentru toate.
Desigur, se poate folosi orice interval de lungime 2π, reprezentând o perioadă completă, în loc de integrare de la 0 la 2π. Uneori este mai convenabil, de exemplu, să se integreze de la la :
Dacă perioada este T secunde apoi frecvența fundamentală este dată de ν = 1 / T Hz (Hertz, cicluri pe secundă ). Substituția corectă este θ = 2πνt. Înlocuind F (t) = f(2πνt) = f (θ) seria Fourier ia forma:
și următoarea formulă pentru coeficienții Fourier.
EXEMPLU: Unda rectangulară sună vag ca forma de undă produsă de clarinet, unde armonicele impare domină. Funcția definită prin pentru și pentru (și apoi se extinde la toate valorile de θ, făcând-o periodică, ).
Figura 3.2. Unda rectangulară
Această funcție are coeficienți Fourier
Astfel, seria Fourier pentru această undă rectangulară este:
Analizând primii termeni din această serie, se pot remarca anumite caracteristici importante.
Figura 3.3. Primii termeni ai seriei
Prima observație este că aceste grafice par a fi convergente la o undă rectangulară, dar ele par a converge destul de lent. În continuare, se poate observa ceea ce se întâmplă în punctul de discontinuitate al funcției originale. Coeficienții Fourier nu au depins de valoarea asignată funcției în punctul de discontinuitate, așa că nu ne putem aștepta să recuperăm acea informație. În schimb, seria converge către o valoare egală cu media valorii maxime si a celei minime a funcției. Acesta este un fenomen general, ce va fi discutat cu alta ocazie.
În cele din urmă, există un fenomen foarte interesant, care se întâmplă chiar în apropiere de discontinuitate. Apare un suprareglaj, care pare sa nu se micșoreze.
Acest lucru nu înseamnă că seria nu converge corect. La fiecare valoare dată lui θ, seria este converge. Problemele apar doar atunci când privim valorile lui θ aproape de punctul de discontinuitate. Aceasta este din cauza lipsei de convergență uniformă. Acest suprareglaj este cunoscut ca fenomenul Gibbs.
Semnale digitale
Cea mai comună metodă de reprezentare digitală a unui sunet presupune digitizarea unui semnal analog prin discretizarea acestuia într-un număr considerabil de eșantioane pentru fiecare secunda, atribuind numere binare înălțimii fiecărui eșantion, proces numit cuantificare.
Figura 3.5. Semnalul analog (stânga) si discretizat (dreapta)
Aplicând procedeul„sample and hold” semnalului, se obține o formă de undă în scară, pentru care dacă digitizăm eșantioanele, fiecare din ele e ajustat la valoarea cea mai apropiată de cea acceptată.
Figura 3.6. semnalul digitizat
Pentru a evita cazul în care un semnal de intensitate joasă poate fi ignorat, putem folosi o metodă de micșorare a distorsiunii datorată digitizării, numit dithering, care presupune adăugarea semnalului unui zgomot cu o amplitudine apropiată de jumătate din valoarea dimensiunii treptei si trecut printr-un circuit rezistor-capacitiv pentru a-l netezi, acesta va aproxima in linii destul de mari semnalul original.
Figura 3.7. Procesul de netezire a semnalului
Fișiere WAV, MP3 si MIDI
WAV este un format comun fișierelor audio digitale, fișier constituit dintr-un antet ce cuprinde o bucata de tip RIFF de 12 octeți, o bucata de tip FORMAT de 24 de octeți si apoi restul de informație de tip DATA, ce ocupa restul fișierului. Alte formate uzuale sunt AIFF (Macintosh) si AU (Sun Microsystems – computere Unix).
Formatul MP3 este diferit, întrucât aceste folosește compresia de date. Câteva din tehnicile de compresie se refera la ignorarea anumitor frecvente care ar trece oricum neobservate de urechea umana, ștergerea unor sunete care de altfel sunt mascate, păstrarea acurateței pe anumite porțiuni in defavoarea altora mai Puțin importante, folosirea algoritmului Hoffman de codare sau combinarea unui semnal stereo, toate in vederea unei compresii utile.
MIDI este prescurtarea de la „Musical Instrument Digital Interface”, un protocol agreat internațional de transmisie a informației muzicale intre diferite dispozitive digitale. Acesta nu conține informații sub forma de forma de unda, ci transmite mesaje conținând o curta lista cu parametri abstracți: timpi, volum, reverb, informații specifice, etc.
Funcții delta și eșantionare
O modalitate de reprezentare a procesului de eșantionare a unui semnal este prin multiplicarea printr-un sir de funcții delta Dirac. Fie N rata de eșantionare, măsurată în eșantioane pe secundă, și t = 1/N intervalul dintre doua eșantionări. Se defineste functia de eșantionare cu spațierea t:
dacă f(t) reprezintă un semnal analogic atunci:
reprezintă semnalul eșantionat. El a fost digitizat în raport cu timpul, dar nu cu amplitudinea semnalului. Integrala semnalului digitizat f(t) pe orice perioadă de timp aproximează integrala semnalului analogic f(t) pe același interval, înmulțit cu rata de eșantionare.
Transformata Fourier a unui semnal eșantionat este dată de:
Pentru a înțelege o altă metodă de reprezentare a unui semnal eșantionat cu ajutorul transformatei Fourier este nevoie de formula de însumare a lui Poisson:
Teorema lui Nyquist
Teorema lui Nyquist spune că frecvența maximă care poate fi reprezentată atunci când se digitizează un semnal analogic este exact jumătatea ratei de eșantionare. Frecvențele mai mari de aceasta limită vor da naștere unor frecvențe nedorite sub frecvența Nyquist. Iar ce se întâmplă cu frecvențele egale cu cea Nyquist depinde de fază. Dacă întreg spectrul de frecvențe al semnalului este sub frecvența Nyquist, atunci teorema eșantionării spune că semnalul poate fi reconstruit din reprezentarea sa digitizată.
Dezavantajul teoremei lui Nyquist este necesitatea de a trece semnalul printr-un filtru trece-jos înainte de a îl digitiza pentru a scoate toate frecvențele care nu îndeplinesc aceasta teoremă.
Transformata Z
Pentru semnalele digitale, este de multe ori, mai convenabil să folosim transformata Z, decât transformata Fourier. Transformata Fourier a unui semnal digital este periodica, cu perioada egala cu frecventa de eșantionare N deci, conține multa informație redundanta. Ideea transformatei Z este de a înveli transformata Fourier in jurul cercului unitate in planul complex. Acest lucru se obține prin alegerea:
astfel încât atunci când își schimbă valoarea cu N=1/se duce exact o data in jurul cercului unitate in planul complex, întâlnindu-se la frecvența Nyquist
Filtre digitale
Subiectul filtrelor digitale este vast în literatură. Se consideră diagrama următoare:
Daca este intrarea și este ieșirea, atunci relația care reprezintă diagrama de mai sus este:
Relația cu transformata Z este:
Aceasta ne spune de răspunsul in frecvență al filtrului. O frecvență corespunde punctelor de pe cercul unitate in planul complex, cu frecvența de eșantionare înjumătățită corespunzătoare lui .
Mai general, daca relația dintre transformata Z dintre semnalele de intrare si ieșire, F(z) si G(z) este data de:
atunci, funcția H(z) se numește funcția de transfer a filtrului.
Timpul de scădere. Timpul de scădere al unui filtru pentru o anumită frecvența este definită ca timpul necesar pentru ca amplitudinea frecvenței respective să ajungă la 1/e din valoarea sa inițială.
Transformata Fourier discretă
Se presupune că lungimea unui semnal este M și că = 0 atunci când nu este indeplinită condiția 0Atunci transformata Fourier este:
Aceasta este o funcție periodică de cu perioada N = 1/ așa cum s-a observat si mai inainte.
Cum sunt doar M părți de informație in acest semnal, s-ar crede ca se poate reconstrui semnalul original din valoarea transformatei Fourier la M puncte diferite ale lui , dar nu este întotdeauna așa. În realitate, pentru M un număr pozitiv și k un întreg în intervalul 0 atunci:
Dacă = 0, cu excepția cazurilor când 0, atunci semnalul digital poate fi recuperat din valorile lui
pentru 0, formula devine:
Transformata Fourier rapidă
Transformata Fourier rapidă sau algoritmul Cooley-Tukey este o formă de organizare a muncii necesare determinării transformatei Fourier discrete în așa fel încât sa fie necesare mai puține operații aritmetice decât prin metoda normală.
Pentru a explica cum funcționează aceasta metodă, putem sa presupunem că M este număr par. Atunci putem împărți suma în două cu termenii pari într-o parte și cei impari în cealaltă:
Observația foarte importantă este aceea ca valoarea lui este foarte asemănător cu valoarea lui F(k). Observând de asemenea, faptul că
Deci, se pot calcula valorile lui F(k) si in acelasi timp pentru jumatate din munca necesara prin metoda normala.
Sinteza sunetelor muzicale
In general, sunetele muzicale tind sa aibă rareori un spectru în frecvență static. Evoluția in timp a spectrului unei note poate fi oarecum înțeleasă prin încercarea de a imita in mod sintetic sunetul unui instrument. Sintetizarea unor sunete mecanice si reci este chiar mai greu decât s-ar putea crede, datorita ușurinței cu care urechea reușește să identifice niște sunete create cu ajutorul unor algoritmi matematici si sa le asocieze unui sunet sintetic. Suntem astfel nevoiți să admitem complexitatea chiar si a celor mai simple sunete produse de instrumente convenționale.
Anvelope și Oscilatoare de frecvență joasă (OFJ)
Trebuie acordată o atenție deosebita anvelopelor, indiferent ce metodă se folosește pentru sintetizarea sunetelor, si de aceea este necesara o discuție preliminara despre acestea. Foarte puține sunete constau dintr-un spectru static in timp. Majoritatea instrumentelor muzicale au un atac clar definit la începutul sunetului, urmat de o decădere. Cea mai folosita abreviere este ADSR pentru anvelopele de atac/decădere/susținere și relaxare.
Ce nu a fost înțeles cu totalitate pana la începutul secolului al douăzecilea, când sinteza electronica își făcea primii pași, este faptul ca porțiunea de atac a unei note este cea mai importanta pentru urechea umana atunci când vine vorba de identificarea unui instrument.
La un sintetizator tipic, sunt mai multe generatoare de anvelope. Fiecare determina cum amplitudinea ieșirii unei componente a sistemului variază cu timpul. Este foarte important de înțeles faptul ca amplitudinea semnalului final nu este singurul atribut al unei anvelope. De exemplu, atunci când un clopot sună, inițial, spectrul frecventei este foarte bogat, dar foarte multe parțiale dispar foarte rapid lăsând un sunet mai pur. Imitarea unui astfel de comportament cu ajutorul sintezei FM este relativ ușor prin atribuirea unei anvelope unui semnal modulator, care controlează timbrul.
Un generator de anvelopa produce o anvelopa a cărei forma este determinata de un set de parametrii programabili. Acești parametrii sunt, in general, dați sub forma unor niveluri sau rate.
Conceptul oscilatoarelor de frecventa joasa este similar cu cel al anvelopelor. Acestea produc o ieșire care de obicei este in intervalul 0.1 – 20 Hz si a cărui forma de unda arata de obicei ca un triunghi, ca dinții unui fierăstrău, ca o sinusoidă sau ceva aleator. OFJ este folosit pentru producerea unor schimbări repetate intr-un parametru controlabil.
Parametrii asociați cu OFJ sunt rata(frecventa), adâncimea (amplitudinea), forma undei, si timpul de atac. Timpul de atac este folosit atunci când efectul este introducerea graduala la începutul unei note.
Sinteza aditiva
Sinteza aditiva este cea mai ușoară de înțeles metoda de sinteză care este în realitate inversul analizei Fourier a unui semnal. Pentru a sintetiza un unda periodica, generam componentele Fourier la amplitudinile corecte si le amestecam. Aceasta este o metoda ineficienta de sinteza(atunci când este comparată cu altele) deoarece pentru a produce o nota cu un număr mare de armonice, un număr mare de unde sinusoidale vor trebui sa fie amestecate. Fiecăreia i se va asocia o anvelopa pentru a crea dezvoltarea notei în timp. În acest fel, este posibil sa se controleze dezvoltarea timbrului in timp si la fel si amplitudinea. De exemplu, daca efectul dorit este de a produce o formă de undă a cărei faza de atac sa fie bogata in armonice si care apoi sa scadă la un ton mai pur atunci, componentele de frecventa mai înaltă vor avea o anvelopa ce va scădea mai rapid decât componentele de frecventa joasa.
Faza nu este importanta atunci când este vorba de percepția sunetelor neoscilante, dar este mai importanta in percepția transientelor.
In unele feluri, sinteza aditiva este o idee veche. Un organ tipic dintr-o catedrala sau biserica are un număr de regiștri de stop care determina care conducte sunt folosite pentru producerea unei note. Efectul acestui lucru este atunci când se eliberează o singura clapă se pot activa un număr de conducte legate din punct de vedere al armonicelor. Primele instrumente electrice, precum organul Hammond operează pe exact același principiu.
Modelarea fizică
Ideea modelarii fizice este de a lua un sistem fizic precum un instrument muzical si de a-l imita digital. De exemplu, atunci când este analizata ecuația unei unde pentru o coarda vibranta se găsește soluția generala a lui D’Alambert:
Având în vedere faptul că timpul este cuantificat (eșantionat) la o perioadă de t, are sens sa cuantizam pozitia de-a lungul coardei la intervale de x = ct. Atunci, la momentul nt si la pozitia mx valoarea lui y este:
Pentru simplificare se scrie:
unde y- si y+ reprezintă părțile undei care merg la stânga, respectiv la dreapta corzii. Atunci, la momentul nt si la pozitia mx avem:
Este o idee bună să împărțim coarda într-un număr întreg de puncte, să spunem . Atunci, conditiile limita la x=0 si x=l sunt:
Asta înseamnă ca la capetele corzii semnalul este negat si transmis către celalalt set de întârzieri. Atunci partea inițială este reprezentata prin setarea valorilor lui y−(n) si lui y+(n) in mod convenabil la t=0 pentru 0. Gândind în termeni de filtre digitale, transformata Z a semnalului y+
satisface
sau
Polii sunt distanțați în mod egal pe cercul unitate astfel încât frecvențele de rezonanta sa fie multiplii de N/2L, unde N este frecventa de eșantionare. Cum polii sunt chiar pe cercul unitate, frecvența de rezonanță nu scade niciodată.
Pentru a face coarda mai realista, putem sa facem sa se piardă energie la un capăt, fapt reprezentat prin multiplicarea cu un factor constant -µ cu 0 < µ 1, in loc sa negam.
Efectul pe care îl are acest factor in analiza filtrului este de a muta polii ușor in interiorul cercului
Modelul de mai sus tot nu este foarte complicat deoarece timpul de scădere este independent de frecvență. Cu toate acestea, este ușor de modificat prin înlocuirea factorului constant µ cu un filtru digital mai complicat.
Algoritmi de sintetizare
a) Karplus–Strong
– acest algoritm oferă corzi și instrumente de percuție foarte bune.
– tehnica de bază este modificarea metodei descrise mai sus și constă dintr-o întârziere digitală urmată de un proces de aproximare.
b) Modularea amplitudinii și frecvenței
– acesta este un concept vechi și familiar și reprezintă o modalitate de transmitere a semnalelor audio pe un purtător de radio frecvență.
– în cazul AM frecventa purtătorului este de obicei, in intervalul 500-2000 KHz, care este mult mai mare decât frecventa semnalului purtat.
– pentru FM frecvența purtătorului este în intervalul 90-120 MHz care este de asemenea, mai mare decât cea a semnalului purtat.
c) Sintetizările Yamaha DX7 si FM
– Yamaha DX7 a fost primul sintetizator digital comercial la un preț destul de scăzut pentru a putea fi cumpărat la o scara larga. Lucrează prin sintetizare FM cu șase operatori programabili.
Alte metode de sinteză
Eșantionarea nu este in realitate o metoda de sinteza, dar este folosita adesea in sintetizatoarele digitale. Este folosita pentru eșantionarea sunetelor la doar o colecție mică de sunete înalte și apoi pentru translatarea acestor puncte înalte prin lărgirea sau compresarea formei de unda pentru a umple golurile. Translatarea punctelor înalte introduce zgomote de frecvență înaltă, ceea ce vine de la faptul că rata de eșantionare nu este translatată în același timp.
Sinteza prin wavetable este o metoda înrudită cu eșantionarea în care fișiere audio înregistrate digital sunt folosite ca materie primara pentru producerea sunetelor care sunt un fel de hibrid intre sinteza si eșantionare.
Sinteza granulara este o metoda prin care sunetele vin in pachete mici numite granule ale căror durate sunt de obicei, de ordinul a zeci de milisecunde. Mii de astfel de granule sunt folosite in fiecare secunda pentru crearea unei texturi.
Reprezentarea în frecvență a formelor de undă
Studiul seriilor Fourier din punct de vedere muzical oferă o perspectiva mare în conceptele matematice și fizice de bază ale instrumentelor muzicale. Instrumentele disponibile în MATLAB permit analizarea cu ușurință a formelor de undă și a armonicelor sunetelor înregistrate și sintetizarea personală. Aceste experimente stimulează înțelegerea modului în care o formă de undă este compusă dintr-o sumă de serii Fourier și cum acest lucru se leagă de reprezentarea în frecvență.
Coarda ciupită. Una dintre problemele standard ce se impun este ecuația de undă cu condiții de margine Dirichlet,
Fizic, ne putem gândi la u (x, t) ca fiind deplasarea unei coarde ciupite de chitară cu deplasarea inițială α(x) și viteza inițială β(x). Termenii suplimentari pot fi adăugați la ecuația undelor pentru a ține cont de rigiditate corzii și amortizarea interna. Soluția, obținut prin separarea de variabile, este
unde
sunt coeficienții Fourier ai lui α (x) și β (x). Folosind identitatea trigonometrică putem rescrie soluția ca
Figura 3.9. Forme de undă ale corzii vibrante
Soluția este o suprapunere a mai multor forme de undă, în care fiecare dintre ele oscilează cu o frecvență diferită, precum în figura de mai sus. Primul factor din sumă, , este o reprezentare a corzii vibrante. Al doilea factor, , arată cum aceasta formă de undă vibrează cu timpul. A n-a formă de undă are o frecvență de , un defazaj de , și amplitudinea fiecărui mod este . Un muzician ar numi frecvența fundamentală și , ,… armonicele sale. Porțiunea fiecărei note de pe tastatură este asociata cu o frecvență fundamentala specifica. De exemplu un A descrescător are o frecvență fundamentală de 55 Hz, iar armonicile apar la 110, 165, 220, 275,… De reținut că armonicile formează o secvență aritmetică, = n . Acest lucru se datorează faptului că un șir cu obiective fixe poate fizic sa vibreze numai în modurile indicate în coloana 1 din figura 1. Viteza de undă C poate fi dovedita a fi rădăcina pătrată a tensiunii corzii de peste densitatea de linie. Astfel porțiunea unei corzi este descrisă de trei parametri,
Acest lucru are sens, căci strângerea unei coarde de chitară crește înălțimea sunetului, în timp ce alegerea corzilor mai lungi sau mai groase scade din înălțime. Un chitarist modifica înălțimea în timp ce cântă prin scurtarea corzii cu ajutorul tastelor de pe gâtul chitării.
Soluția
descrie o coardă vibrantă, dar și alte instrumente sunt similare. Atunci când un instrument care vibrează, pune aerul înconjurător în mișcare și produce oscilații ale tensiunii. Acestea sunt undele de sunet detectate de ureche. Astfel, un microfon aproape de coarda vibrantă ar înregistra un semnal cu ecuația
Fizic, amplitudinea pn descrie energia asociată fiecărei armonici. Spectrul de putere este distribuția energiei între armonici, în acest caz, vectorul [p1, p2, p3,. . .]. Pentru sunete reale puterea este concentrată în primele 10 până la 20 de armonici și spectrul de putere este o funcție continuă de frecvență.
Signal Processing Toolbox
MATLAB oferă prin acest set de instrumente algoritmi specializați în procesarea de semnal analog și digital. Acesta poate fi folosit pentru vizualizarea semnalelor in domeniul timp sau frecvență, calcularea de Transformate Fourier Rapide pentru analiza spectrală, modelarea filtrelor FIR și IIR și implementarea convoluției, modulării, reeșantionării sau a altor tehnici de procesare. Algoritmii din acest Toolbox pot fi utilizați ca baze pentru construirea unor algoritmi noi pentru procesare audio, recunoaștere verbală, procesare de instrumentație sau benzi de comunicație wireless.
Caracteristici cheie
Semnal și modele de sisteme liniare
Funcții de generare a formelor de undă și de puls, inclusiv cele sin, treaptă, dinți de fierăstrău, și Gaussian
De prelucrare a semnalului și de ferestre de date funcții statistice
Algoritmi de estimare densitate spectrală a puterii, inclusiv periodogram, Welch, și Yule-Walker
Digital FIR și IIR de proiectare filtru, analiza, și metode de implementare
Metode analogice de proiectare de filtrare, inclusiv Butterworth, Cebîșev, și Bessel
Semnal transformă, inclusiv transformata Fourier rapidă (FFT), Fourier discrete transforma (DFT), și de scurtă durată Fourier transforma (STFT)
Predicție liniară și parametrice modelare serii de timp
Unelte Interactive
Puterea algoritmilor din SPT este mult îmbunătățită de instrumentele sale interactive ușor de utilizat.
Uneltele de design si analiza (fdatatool) si filterbuilder oferă o colecție completă de caracteristici pentru soluționarea de designului filtrelor. Atât FDAtool cât și filterbuilder oferă acces nelimitat la metode de proiectare suplimentare de filtrare, caracteristici de cuantificare, generare cod C și la alte caracteristici îmbunătățite de filtrare ale produsului DSP System Toolbox ™ atunci când produsul este instalat.
Unealta de vizualizare a filtrelor fvtool oferă un mediu grafic pentru vizualizarea semnalelor, designul filtrelor si analiza spectrala.
Unealta de design si analiza a ferestrelor wintool oferă un mediu pentru designul si compararea ferestrelor spectrale.
Unealta de vizualizare a ferestrelor wvtool oferă un mediu grafic pentru vederea, adnotarea si printarea graficelor.
Analiza armonică
În acest moment există o mulțime de experimente pe care un student (sau instructor) le-ar putea efectua. Întrebări despre cum spectrul de armonici se modifică pentru diferite instrumente și note pot fi investigate cu ajutorul Matlab. Funcția analiza.m descrisă mai jos, folosește funcțiile wavread si fft din MATLAB pentru a calcula puterea spectrului unei unde Microsoft (.wav). O funcție similară numită auread poate fi folosită pentru fișierele audio UNIX.
function analiza(fisier)
% Functia Matlab analiza(fisier)
% traseaza graficul formei de unda si a spectrului de putere al unui fisier .wav
[y, Fs] = wavread(fisier); % y reprezinta datele sunetului, Fs este
%frecventa de esantionare
t = (1:length(y))/Fs; % timpul
durata = find(t>0.1 & t<0.12); % seteaza durata graficului formei de
%unda
figure; subplot(1,2,1) % traseaza graficul formei de unda
plot(t(durata),y(durata))
title(['Forma de unda a fisierului ' fisier])
Nr = 2^12; % numarul punctelor de analizat
calc = fft(y(1:Nr))/Nr; % calculul fft
put = 2*abs( c(2:N/2)); % calculul puterii pentru fiecare frecventa
fre = (1:Nr/2-1)*Fs/Nr; % corespondenta frecventei cu amp
subplot(1,2,2) % traseaza graficul spectrului de putere
semilogy(fisier,amp)
title(['Puterea spectrala a fisierului ' fisier])
Graficele produse de analiza.m pot fi folosite în identificarea înălțimii și a volumului unei probe de sunet. Figura 2 prezintă rezultatele A2, A3 și A4 cântate la un pian. Formele de undă pe stânga sunt variațiile de presiune cu timpul detectate de microfon. Amplitudinea undei este o măsură a oscilațiilor sale de presiune și corespunde volumului sunetului. Volumul este, de obicei măsurat în decibeli, logaritmul presiunii. Unii nu se gândesc de obicei la sunet în termeni de presiune, dar simt undele de presiune a sunetului la un concert sau în apropierea echipamentelor cu voce tare ca fiind o experiență obișnuită.
Forma undei Spectru
Timp, s frecvență, Hz
Figura 3.10. Analiza notelor de pian folosind analiza.m
Din formele de undă din figura 2 se poate vedea imediat caracterul periodic al fiecărui sunet și găsirea perioadei T1 fundamentală. Frecvențele fundamentale corespunzătoare () sunt 220 Hz, 440 Hz, 880 Hz pentru cele trei note și pot fi văzute ca primele vârfuri de pe spectrele de putere. Frecvența fundamentală se dublează cu fiecare octavă, și armonicele sunt spațiate în proporție cu , cum era de așteptat. Spectrul este nenul între armonici, deoarece undele nu sunt perfect periodice.
Se poate observa că diferența de frecvență dintre două armonice consecutive este frecvența fundamentală. Mintea umană folosește inconștient acest fapt pentru a identifica o anumita tonalitate, chiar dacă armonicile fundamentale și inferioare lipsesc. Acesta este modul în care difuzoarele mici de la o chitara bas fac sunete joase fără a produce frecvențe mici.
Mintea umană poate de asemenea identifica un număr aparent infinit de instrumente, chiar dacă se cântă aceeași tonalitate cu același volum. Cum se diferențiază semnalul de presiune al unui saxofon fata de cel al unei viori? Figura de mai jos prezintă forma de undă și spectrul a mai multor instrumente redate in tonalitatea A3 (220 Hz). Formele de undă arăta complet diferit, dar toate au aceeași perioada fundamentală de 0.0045 secunde. Timbrul, sau calitatea sunetului unui instrument, se datorează puterilor relative ale armonicelor. Un sunet pur, compus doar din fundamentală, este strident și metalic, precum un diapazon. Puterea în armonicile superioare adaugă căldura si culoare tonului.
Forma de undă Spectrul
Figura 3.11. Forma de undă și spectrul de putere al notei A3 redată de diferite instrumente
Sunetele muzicale pot fi analizate pentru a măsura distribuția de putere în armonici. Pentru un anumit instrument, această distribuție este cheia pentru sintetizarea sunetului. Având o frecvență f1 fundamentală și putere asociată cu armonica n, forma de undă este sintetizată
Sinteza armonică
Funcția sintetizare.m detaliată mai jos creează datele necesare undelor acustice în acest fel, și apoi convertește datele într-un fișier de tip wave cu ajutorul funcției MATLAB wavwrite. Frecvențele mai mari sună mai puternic pentru urechea umană decât frecvențele mai mici cu același nivel de decibeli (aceeași amplitudine). Concret, atunci când se face alegerea spectrului de putere pentru a crea un sunet, frecvențele cuprinse între 3000 și 5000 Hz ar trebui să aibă o zecime din amplitudinea pe care o au frecvențele mai mici, în scopul de a produce același volum aparent.
function sintetizare(fisier,frecv,dur,amp)
% Functia Matlab sintetizare(fisier,frecv,dur,amp)creaza un fisier
% audio .wav al unui sunet in care se pot specifica
% frecventa fundamentala si amplitudinile armonicilor
% fisier este un sir de caractere ce da numele fisierului ‘.wav'
% ce va fi sintetizat
% frecv frecventa fundamentala in Hz
% dur este durata in secunde
% amp este un vector de lungime n al amplitudinilor
% Exemplu de folosire:
% sintetizare ('test.wav', 440, 3, [1 .6 .2 .02])
% – creaza o mostra de 3 secunde la 440 Hz cu armonicile
% specificate.
Fs=22050; nrbiti=8; % frecventa si bitrate-ul fisierului .wav
t = linspace(1/Fs, dur, dur*Fs); % timpul
y = zeros(1,Fs*dur); % initializarea vectorului de sunet
for n=1:length(amp);
y = y + amp(n)*cos(2*pi*n*frecv*t); % sintetizarea formei de unda
end
y = .5*y/max(y); % normalizare – coeficientul controleaza volumul.
wavwrite( y, Fs, nrbiti, fisier) % crearea fisierului .wav
Muzica sintetizată timpurie a folosit un spectru de putere constant în timp, ceea ce făcea sunetele să sune fals, metalic. În realitate, spectrul de putere se schimbă în funcție de cum variază muzicianul volumul, vibrato-ul și frazarea. Tastaturile moderne variază spectrul de putere în timp, pentru a ține cont de atacul și decadența loviturii unei coarde de pian sau ciupirea unui banjo. Muzica sintetizată s-a îmbunătățit dramatic din anii ‘60, dar niciodată nu ar putea fi la fel de variabilă sau expresivă precum un muzician cântând live la un instrument.
Normalizare, filtrare și restaurare sunet cu Adobe® Audition® 3
În vederea producerii unei analize de calitate și cât mai naturale în capitolul anterior (3.5), am decis ca pe lângă analiza notelor digitale ale diferitelor instrumente, să pot obține forma de undă și puterea spectrală a propriei mele voci redând nota A3 la diferite intensități. Problema cu care m-am confruntat a fost de asemenea cât se poate de naturală, neavând la dispoziție un echipament profesionist cu care sa pot capta sunetul într-un mod cel puțin satisfăcător.
M-am aflat astfel în postura de a fi nevoit să recurg la metode ce nu fac tocmai obiectul acestui capitol, cu scopul precis de a obține un semnal audio demn de a fi interpretat fără mari marje de eroare.
Captarea sunetului am făcut-o cu ajutorul unui Audio Player uzual cu funcție de înregistrare în format Mp3, urmând ca fișierul obținut să fie transferat pe computer pentru a putea fi prelucrat, lucru ce mi s-a părut la îndemână, având deja experiență în domeniul audio-video și în particular cu Audition®.
Primul pas a constat în încărcarea fișierului și normalizarea volumului, întrucât pe anumite porțiuni, sunetul depășea limitele normale:
În continuare, am folosit filtrul FFT în vederea obținerii unei precizii mai bune în corectarea micilor zone de frecvențe și suprimarea părților zgomotoase:
La final, am folosit procesele de restaurare de reducere a zgomotului și a fâșâitului specific, cu ajutorul uneltelor de restaurare de Hiss și Noise Reduction, urmate de alegerea și păstrarea unei singure variante utilizate ulterior în analiză:
Figura 3.13. Procesul de prelucrare a semnalului audio in Adobe Audition
Aplicația grafică MATLAB
Pentru a putea utiliza la maximum algoritmii de sintetizare și analiză și a oferi unui utilizator comun șansa de a putea beneficia de aceștia într-un mod simplu și ușor de folosit, am profitat de kitul interactiv de construcție a interfețelor cu utilizatorul GUIDE (GUI Development Environment) prezent în MATLAB, pentru a crea un produs software care aduce în plus față de funcțiile de analiză și sinteză și capabilități de player audio. Am ales acest mediu de dezvoltare deoarece este un mediu intens folosit în prelucrarea de semnal, multitudinea algoritmilor deja existenți făcând foarte ușoară dezvoltarea aplicațiilor. Un MATLAB GUI este o fereastră figură la care se adaugă componente acționate de utilizator. Aceste componente se pot selecta, dimensiona, și poziționa după bunul plac. Folosind callbacks componentele reacționează interactiv atunci când utilizatorul face click sau manipulează componentele cu intrările de la tastatura sau mouse.
Această interfață conține funcționalități precum cele de încărcare în sistem a unui fișier audio sau a unei partituri scrise inițial, pentru care se poate face pe rând analiza formei de undă sau a spectrului de putere, grafice afișate în interfață. De asemenea, există posibilitatea opririi melodiei temporar sau definitiv, prin butoanele specifice de Play, Stop și Pauză, precum și posibilitatea reglării volumului. O partitură încărcată poate fi redată direct sau salvată pe disc ca fișier .wav și manipulată apoi după voie. În plus, există posibilitatea de a crea un fișier audio prin sintetizarea acestuia, primind parametri precum nume, frecvență (ori vector de frecvențe), vector de amplitudini sau vector de defazaje, în vederea creării unui sunet cât mai complex.
Această interfață se poate vedea în imaginea de mai jos:
Figura 4.1. Aplicația
Secțiunea de analiză
Încarcare fișier audio
Buton analiză formă de undă
Grafic
25. Buton analiză putere spectrală
Secțiunea de manipulare audio
Buton pauză
Buton redare
Buton scriere fișier .wav în urma citirii unei partituri
Slider volum
Buton stop
Caseta editare volum
Buton încărcare partitură
Secțiunea de sinteză
Slider durată
Casetă editare vector defazaje
Casetă editare amplitudini
Casetă editare durată
Buton sintetizare complexă
Casetă editare vector frecvențe
Casetă editare nume fișier
Buton sintetizare
Casetă editare durată
Casetă editare frecvență
Casetă editare vector amplitudini
Slider durată
Slider frecvență
Casetă editare nume
Secțiunea de analiză
Această secțiune este destinată analizării unui fișier încarcat prin callback la butonul 1, după cum se poate observa din codul MATLAB:
function incarcare_Callback(hObject, eventdata, handles)
global player;
global FileName;
[FileName,PathName] = uigetfile('*.wav','Selectati fisierul MATLAB');
if isequal(FileName,0)
error('Nu a fost selectat niciun fisier!')
end
global y, global Fs;
[y, Fs] = wavread(FileName);
Am setat variabilele player și FileName ca globale pentru a le putea folosi în tot programul. Odată salvate informațiile fișierului audio, de acestea se vor folosi funcțiile de analiză în plotarea graficelor. Un exemplu ar fi graficele notei de pian A2:
Figura 4.2. Graficele notei de pian A2
Secțiunea de manipulare audio
În vederea creșterii atractivității aplicației, am decis introducerea unor butoane de Redare (5), Pauză (4) și Stop (8), precum și un Slider de volum (7), care pot fi utilizate atât pentru manipularea unui fișier audio încărcat din butonul de mai sus (1), fie din butonul de încărcare a unei partituri, cum se va vedea mai jos (10).
Figura 4.3. Butoanele de manipulare audio și încărcare / salvare partitură
De asemenea, am fost introdus și un buton de salvare a unei partituri (6) existente, care nu este altceva decât un fișier .m în care sunt codate notele. Acest buton este programat sa citească secvențele de note și să le scrie într-un fișier .wav cu ajutorul funcției MATLAB wavwrite.
Secțiunea de sinteză
Această secțiune se folosește de algoritmul prezentat în Capitolul 3 pentru a sintetiza un sunet ce primește ca parametri, prin intermediul căsuțelor de editare (12, 13, 14, 16, 17, 19, 20, 21, 24) si a sliderelor instalate (11, 22, 23):
Numele fișierului (17, 24)
Durata (14, 19)
Frecvența / frecvențele dorite (16, 20)
Un vector de amplitudini (13, 21)
Vectorul de defazaje al sintetizării complexe (12)
Figura 4.4. Graficele notei de pian A2
Figura 4.5. Graficele notei de pian A2
Prin acționarea butoanelor de sintetizare, aplicația va crea în directorul curent un fișier cu parametrii dați, care poate la rândul său fi analizat prin intermediul butoanelor specifice.
CONCLUZII
Prin această lucrare am făcut un prim pas interesant în a demonstra capacitatea muzicală a programului MATLAB . Sunt astfel de părere că este posibilă modelarea unui instrument sau crearea unui sintetizator decent cu ajutorul MATLAB, însă nu la nivelul natural obținut pe cale clasică. Adăugarea de semnale modulatoare, filtre, și un secvențiator de pas ar putea închega o aplicație care sa constituie un instrument decent de producție de muzică digitală. Astfel, explorarea în continuare a muzicii în MATLAB ar putea produce modalități pentru muzicieni de a obține abilități de prelucrare a semnalelor și de programare, în timp ce inginerii si programatorii și-ar putea folosi abilitățile tehnice pentru a înțelege mai bine muzica.
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Analiza Si Sinteza Semnalelor Audio (ID: 136229)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
