Formate Audio de Inalta Rezolutie Pentru Aplicatii de Arhivare Si Masterare
CUPRINS
MODULAȚIA SIGMA DELTA……………………………………………………………. 4
1.1 Modelul liniar și modulația codată pe impuls…………………………………………. 4
1.2 Formarea zgomotului și supraeșantionarea……………………………………………. 8
1.2.1 STF și NTF în modelul liniar………………………………………………………………. 10
1.2.2 Convertorul A/D cu modulație sigma-delta de ordinul întâi………………….. 11
1.2.3 RSZ pentru modulatoarele sigma-delta de ordin mare………………………….. 13
1.3 Probleme în modulația sigma-delta………………………………………………………. 15
1.3.1 Ciclurile limită…………………………………………………………………………………….. 17
Tonurile redundante………………………………………………………………………….. 19
Distorsiunea armonică……………………………………………………………………….. 22
1.3.4 Modulația zgomotului………………………………………………………………………….. 24
1.3.5 Zonele moarte……………………………………………………………………………………… 26
1.3.6 Stabilitatea………………………………………………………………………………………….. 28
1. 4 Concluzii………………………………………………………………………………………………. 32
2. CODAREA DIFERENȚIALĂ TRANSPARENTĂ PENTRU DOMENIUL
AUDIO DIGITAL DE ÎNALTĂ REZOLUȚIE
2. 1. Introducere………………………………………………………………………………………….. 33
2.2 Comparații ale DM-lui și SDM-lui și observații asupra liniarității
sistemelor pe 1 bit………………………………………………………………………………….. 34
2.3. Supraeșantionarea, formarea zgomotului și egalizarea…………………………… 39
2.4. Codarea diferențială fără pierderi…………………………………………………………. 42
2.5. Limitarea blândă a amplitudinii folosind corecția dispersivă………………….. 44
2.6. Concluzii………………………………………………………………………………………………. 50
3. AVANTAJUL CODĂRII PE 1 BIT – DOVEZI PENTRU
ÎNREGISTRĂRILE VIITOARE………………………………………………………….. 51
Domeniul audio digital – scurt istoric………………………………………………….. 52
3.2 Progrese și discuții în tehnologia multi bit……………………………………………. 54
3.3 Avantajul codării pe 1 bit…………………………………………………………………….. 55
Mai puțin înseamnă mai mult………………………………………………………………. 56
Adevărata importanță a tehnologiei pe 1 bit – dovezi pentru
înregistrările viitoare…………………………………………………………………………………. 56
FORMATE AUDIO DE ÎNALTĂ REZOLUȚIE PENTRU APLICAȚII
DE ARHIVARE ȘI MASTERARE……………………………………………………… 59
4.1 Introducere…………………………………………………………………………………………. 59
Codarea diferențială fără pierderi………………………………………………………. 61
4.3 Corecția recursivă multinivel SDM cu o gama puternic limitată a
cuantizorului………………………………………………………………………………………… 73
4.4 SDM multietaj cu construcția ieșirii de date de tip LPCM…………………….. 77
4.4.1 Codorul de tip 1: SDM-ul pe 1 bit formează LSB-ul…………………………….. 77
4.4.2 Codorul de tipul 2: SDM-ul pe 1 bit formează MSB 78
4.4.3 Performanța Schemelor de Tip 1 și de Tip 2…………………………………………. 80
4.4.5 Compararea cu schemele de codare MASH …………………………………………. 82
4..5 Concluzii………………………………………………………………………………………………. 85
BIBLIOGRAFIE…………………………………………………………………………………… 87
6. LISTA CU ANEXELE PROIECTULUI…………………………………………………… 89
6.1 ANEXA 1………………………………………………………………………………………………. 89
6.2 ANEXA 2………………………………………………………………………………………………. 101
6.3 ANEXA 3………………………………………………………………………………………………. 102
1. MODULAȚIA SIGMA DELTA
Modulația Sigma-Delta (SDM) este probabil mai bine înțeleasă prin comparație cu modulația codată pe impuls tradițională (PCM). Un convertor PCM în mod obișnuit eșantionează un semnal de intrare la frecvența Nyquist și produce o reprezentare pe N biți a semnalului original. Totuși, aceasta tehnică necesită cuantizare pe 2N nivele. Fie că este implementată folosind registre de aproximare succesivă, convertoare ”pipeline”, sau alte tehnici, este greu de obținut rezoluția înaltă în conversia PCM datorită nevoii de a reprezenta cu acuratețe multe nivele de cuantizare și datorită complexitații circuitului subsecvență. Acesta este motivarea pentru modulația sigma-delta, un fel de modulație cu densitate pe impuls, care exploatează supraeșantionarea și realizarea filtrelor sofisticate, pentru a obține o cuantizare pe biți puțini, cu o rezoluție efectivă înaltă.
În acest tutorial vom considera modele comune ale modulatoarelor sigma-delta, așa cum se folosesc în conversia analog-digitală. Principiul de bază este același pentru SDM-ul folosit în D/A sau în conversia cu rată de eșantionare. Vom restricționa analiza la modelele asincrone, discrete în timp. Totuși, acestea sunt de departe cele mai întalnite modele și includ majoritatea implementărilor cu reacție pozitivă, cu reacție negativă și multietaj. Vom explica teoria operației, estimarea raportului semnal-zgomot accentuat și comparația cu conversia PCM. De asemenea, vom introduce modelul liniar, care ajută la înțelegerea proiectării filtrului precum și principiile formării zgomotului. Din moment ce modulația sigma-delta este profund neliniară, sunt diverse fenomene care nu pot fi explicate folosind acestă tehnică, cum ar fi instabilitatea și ciclurile limită. În ceea ce privește acest fenomen literatura poate fi confuză, astfel încât încercăm să dăm o definiție clară a termenilor și să clarificăm starea actuală a înțelegerii. În final, vom introduce câteva tehnici de principiu, care pot fi folosite pentru a ne descurca cu aceste fenomene nedorite.
1.1 MODELUL LINIAR ȘI MODULAȚIA CODATĂ PE IMPULS
Teoria cuantizării este bine stabilită. Valorile admise în semnalul de ieșire, după cuantizare, sunt numite nivele de cuantizare, unde distanța dintre 2 nivele succesive se numește mărimea pasului de cuantizare, q. Pentru un cuantizor cu b biți acoperind gama de la -1 la 1, sunt 2b nivele de cuantizare, iar lărgimea fiecărui pas este :
q= 2/(2b-1) (1)
Aceasta este indicată în fig. 1 pentru un cuantizor pe 3 biți.
Cuantizorul de rotunjire sau cu front la mijloc îi atribuie fiecărui semnal de intrare nivelul de cuantizare cel mai apropiat. Eroarea de cuantizare este pur și simplu diferența dintre intrarea și ieșirea cuantizorului, eq= Q(x)-x. Se poate vedea cu ușurință că eroarea de cuantizare eq(n) este delimitată de:
-q/2≤ eq(n)≤q/2 (2)
Deoarece cuantizarea este un proces puternic neliniar, efectul exact al cuantizării asupra conținutului semnalului și natura zgomotului de cuantizare ar putea fi dificil de determinat. Din acest motiv, adesea se fac câteva presupuneri:
Secvența de eroare, eq(n) este un proces aleator, staționar
Secvența de eroare este necorelată cu ea însăși și cu secvența de intrare x(n).
Funcția densitate de probabilitate a erorii este uniformă pe domeniul erorii de cuantizare.
Fig. 1. Caracteristicile de transfer pentru un cuantizor pe 3 biți si V=1
Astfel de ipoteze sunt, în general, false. Totuși, sunt aproximări satisfăcătoare pentru semnalele de intrare cu amplitudine mare și variație în timp, când b este mare și valorile erorilor de cuantizare succesive nu sunt puternic corelate. Mai departe, după cum vom vedea, rezultatele obținute prin utilizarea acestei aproximări produc estimări precise ale raportului semnal-zgomot (de cuantizare), sau RSZ.
Aceste presupuneri ne permit să reprezentăm cuantizarea ca introducerea unei surse de zgomot alb aditiv. Aceasta este reprezentată în Fig. 2. Precum vom vedea, acest model permite înțelegerea în amănunt a semnalului și a zgomotului în sistemele de cuantizare. Există modele mai precise care includ termeni de câștig aplicati semnalului si zgomotului de cuantizare, dar modelul înfățișat aici este suficient pentru analiză.
Fig. 2. Modelul liniar al cuantizării
Ipoteza că eroarea de cuantizare este distribuită uniform de-a lungul pasului de cuantizare determină:
p(eq) = 1/q |eq| ≤ q/2
0 |eq| > q/2 (3)
Deoarece eroarea este un zgomot alb, densitatea spectrală de putere a zgomotului va avea de asemenea o distribuție uniformă între limitele benzii Nyquist. Funcția densitate de probabilitate și funcția densitatea spectrală a puterii sunt reprezentate în Fig, 3a, respectiv 3b.
Fig. 3. (a) Funcția densitate de probabilitate și (b) funcția densitatea spectrală de putere pentru eroarea de cuantizare, sub modelul liniar
Dacă rata de eșantionare satisface teorema eșantionării, semnalul de intrare este eșantionat cu cel puțin de 2 ori frecvența sa maximă, fs>2fB, atunci cuantizarea este singura eroare în procesul de conversie A/D (jitterul și alte efecte nu sunt luate în considerare aici). Folosind ipoteza distribuției uniforme, zgomotul mediu de cuantizare este dat de:
(4)
și puterea zgomotului de cuantizare este dată de:
(5)
Din ecuația (1) obținem :
(6)
Pentru a determina RSZ-ul avem nevoie să estimăm și puterea semnalului. Presupunem că cuantizăm un semnal sinusoidal de amplitudine A, Atunci puterea medie a semnalului este :
(7)
Din ecuațiile (6) si (7), raportul semnal – zgomot poate fi calculat prin:
SNR(dB)= (8)
Astfel raportul semnal – zgomot crește cu aproxiomativ 6 dB pentru fiecare bit din cuantizor. Folosind aceasta formulă, un semnal audio codat pe CD (format pe 16 biți) folosind PCM, e un RSZ maxim de 98.08. De asemenea observăm din ecuația (7) că RSZ-ul este liniar corelat cu puterea semnalului în decibeli.
În Fig. 4 RSZ-ul este dat ca funcție de numărul de biți din cuantizor pentru 2 semnale codate PCM, eșantionate la frecvența Nyquist. Ecuația (8) este folosită pentru a calcula RSZ-ul și RSZ-ul simulat este măsurat direct în domeniul timp, din varianța semnalului și varianța erorii de cuantizare. Semnalele de intrare sunt 2 sinusoide de 2 kHz, unde se consideră rata de eșantionare de 44.1 kHz, cu amplitudinea vârf la vârf A=1 și cu amplitudinea mică A=0.1. Se poate observa cu ușurință că pentru un cuantizor cu multi biți, raportul semnal – zgomot este dat de ecuația (8). Singura eroare semnificativă este pentru un număr mic de biți datorită aproximării introduse în ecuația (6).
Fig. 4. RSZ-ul ca funcție de numărul de biți din cuantizor pentru un semnal codat PCM, eșantionat la frecvența Nyquist.
Ecuația (8) ne dă, de asemenea, o metodă prin care performanțele modulatoarelor sigma-delta pot fi comparate cu convertoarele PCM, de frecvență Nyquist. Inversând această formulă pentru un semnal de intrare de scală întreagă și încorporând tot zgomotul și distorsiunile în raportul e fenomene nedorite.
1.1 MODELUL LINIAR ȘI MODULAȚIA CODATĂ PE IMPULS
Teoria cuantizării este bine stabilită. Valorile admise în semnalul de ieșire, după cuantizare, sunt numite nivele de cuantizare, unde distanța dintre 2 nivele succesive se numește mărimea pasului de cuantizare, q. Pentru un cuantizor cu b biți acoperind gama de la -1 la 1, sunt 2b nivele de cuantizare, iar lărgimea fiecărui pas este :
q= 2/(2b-1) (1)
Aceasta este indicată în fig. 1 pentru un cuantizor pe 3 biți.
Cuantizorul de rotunjire sau cu front la mijloc îi atribuie fiecărui semnal de intrare nivelul de cuantizare cel mai apropiat. Eroarea de cuantizare este pur și simplu diferența dintre intrarea și ieșirea cuantizorului, eq= Q(x)-x. Se poate vedea cu ușurință că eroarea de cuantizare eq(n) este delimitată de:
-q/2≤ eq(n)≤q/2 (2)
Deoarece cuantizarea este un proces puternic neliniar, efectul exact al cuantizării asupra conținutului semnalului și natura zgomotului de cuantizare ar putea fi dificil de determinat. Din acest motiv, adesea se fac câteva presupuneri:
Secvența de eroare, eq(n) este un proces aleator, staționar
Secvența de eroare este necorelată cu ea însăși și cu secvența de intrare x(n).
Funcția densitate de probabilitate a erorii este uniformă pe domeniul erorii de cuantizare.
Fig. 1. Caracteristicile de transfer pentru un cuantizor pe 3 biți si V=1
Astfel de ipoteze sunt, în general, false. Totuși, sunt aproximări satisfăcătoare pentru semnalele de intrare cu amplitudine mare și variație în timp, când b este mare și valorile erorilor de cuantizare succesive nu sunt puternic corelate. Mai departe, după cum vom vedea, rezultatele obținute prin utilizarea acestei aproximări produc estimări precise ale raportului semnal-zgomot (de cuantizare), sau RSZ.
Aceste presupuneri ne permit să reprezentăm cuantizarea ca introducerea unei surse de zgomot alb aditiv. Aceasta este reprezentată în Fig. 2. Precum vom vedea, acest model permite înțelegerea în amănunt a semnalului și a zgomotului în sistemele de cuantizare. Există modele mai precise care includ termeni de câștig aplicati semnalului si zgomotului de cuantizare, dar modelul înfățișat aici este suficient pentru analiză.
Fig. 2. Modelul liniar al cuantizării
Ipoteza că eroarea de cuantizare este distribuită uniform de-a lungul pasului de cuantizare determină:
p(eq) = 1/q |eq| ≤ q/2
0 |eq| > q/2 (3)
Deoarece eroarea este un zgomot alb, densitatea spectrală de putere a zgomotului va avea de asemenea o distribuție uniformă între limitele benzii Nyquist. Funcția densitate de probabilitate și funcția densitatea spectrală a puterii sunt reprezentate în Fig, 3a, respectiv 3b.
Fig. 3. (a) Funcția densitate de probabilitate și (b) funcția densitatea spectrală de putere pentru eroarea de cuantizare, sub modelul liniar
Dacă rata de eșantionare satisface teorema eșantionării, semnalul de intrare este eșantionat cu cel puțin de 2 ori frecvența sa maximă, fs>2fB, atunci cuantizarea este singura eroare în procesul de conversie A/D (jitterul și alte efecte nu sunt luate în considerare aici). Folosind ipoteza distribuției uniforme, zgomotul mediu de cuantizare este dat de:
(4)
și puterea zgomotului de cuantizare este dată de:
(5)
Din ecuația (1) obținem :
(6)
Pentru a determina RSZ-ul avem nevoie să estimăm și puterea semnalului. Presupunem că cuantizăm un semnal sinusoidal de amplitudine A, Atunci puterea medie a semnalului este :
(7)
Din ecuațiile (6) si (7), raportul semnal – zgomot poate fi calculat prin:
SNR(dB)= (8)
Astfel raportul semnal – zgomot crește cu aproxiomativ 6 dB pentru fiecare bit din cuantizor. Folosind aceasta formulă, un semnal audio codat pe CD (format pe 16 biți) folosind PCM, e un RSZ maxim de 98.08. De asemenea observăm din ecuația (7) că RSZ-ul este liniar corelat cu puterea semnalului în decibeli.
În Fig. 4 RSZ-ul este dat ca funcție de numărul de biți din cuantizor pentru 2 semnale codate PCM, eșantionate la frecvența Nyquist. Ecuația (8) este folosită pentru a calcula RSZ-ul și RSZ-ul simulat este măsurat direct în domeniul timp, din varianța semnalului și varianța erorii de cuantizare. Semnalele de intrare sunt 2 sinusoide de 2 kHz, unde se consideră rata de eșantionare de 44.1 kHz, cu amplitudinea vârf la vârf A=1 și cu amplitudinea mică A=0.1. Se poate observa cu ușurință că pentru un cuantizor cu multi biți, raportul semnal – zgomot este dat de ecuația (8). Singura eroare semnificativă este pentru un număr mic de biți datorită aproximării introduse în ecuația (6).
Fig. 4. RSZ-ul ca funcție de numărul de biți din cuantizor pentru un semnal codat PCM, eșantionat la frecvența Nyquist.
Ecuația (8) ne dă, de asemenea, o metodă prin care performanțele modulatoarelor sigma-delta pot fi comparate cu convertoarele PCM, de frecvență Nyquist. Inversând această formulă pentru un semnal de intrare de scală întreagă și încorporând tot zgomotul și distorsiunile în raportul semnal-zgomot-distorsiuni (SINAD), avem numărul efectiv de biți al cuantizării:
(9)
1.2 FORMAREA ZGOMOTULUI ȘI SUPRAEȘANTIONAREA
Acum să presupunem că semnalul este supraeșantionat. Astfel, mai degrabă decât obținerea semnalului la frecvența Nyquist, rata de eșantionare efectivă este . Raportul de supraeșantionare este OSR=2r =fs/2fB. Deși zgomotul de cuantizare este împrăștiat pe o gamă mare de frecvență încă suntem preocupați de zgomotul sub frecvența Nyquist.
Fig. 5. Distribuția zgomotului de cuantizare pentru frecvența de eșantionare Nyquist, de 4 ori și de 8 ori supraeșantionare
Puterea zgomotului de cuantizare în bandă poate fi găsită prin integrarea densitații spectrale de putere în banda de trecere:
(10)
unde este densitatea spectrală de putere a zgomotului (neformat) de cuantizare.
Mare parte din puterea zgomotului este acum localizată în banda semnalului. Cum s-a arătat în fig. 5, puterea zgomotului de cuantizare în banda de interes a scăzut cu un factor OSR. Puterea semnalului apare doar în banda semnalului, deci aceasta rămâne neschimbată și este dată de ecuația (7). Raportul semnal-zgomot poate fi determinat prin relația:
SNR(dB)= 10log10 (11)
Astfel pentru fiecare dublare a raportului de supraeșantionare, RSZ-ul crește cu 3 dB. Se menține îmbunătățirea cu 6 dB pentru fiecare bit în cuantizor, astfel încât putem spune că dublarea raportului de supraeșantionare mărește numărul efectiv de biți cu jumătate de bit.
Supraeșantionarea ne dă motive să reducem numărul necesar de biți din cuantizor. Totuși, doar acest lucru nu e suficient. Conform ecuației (11), pentru a obține o înregistrare de calitatea celei a CD-lui (ENOB=16, fs=44,100 kHz) cu un cuantizor pe 8 biți am avea nevoie de un factor de supraeșantionare de 216 sau de o frecvență de eșantionare de 2.89 GHz, lucru irealizabil.
1.2.1 STF și NTF în modelul liniar
Sistemul de supraeșantionare de mai sus nu realizează formarea zgomotului. Considerăm un filtru plasat în fața cuantizorului (cunoscut sub denumirea de filtru în buclă), iar ieșirea cuantizorului este în reacție și se scade din semnalul de intrare, așa cum s-a arătat în fig. 6.
Fig. 6. Reprezentarea unui modulator sigma-delta folosind modelul liniar
Acum avem un sistem care poate fi reprezentat prin aplicarea unor funcții de transfer, atât a semnalului de intrare cât și a zgomotului de cuantizare. În domeniul Z, ieșirea poate fi reprezentată ca:
Y(z)=STF(z)X(z) + NTF(z)E(z) (12)
unde STF este funcția de transfer a semnalului, iar NTF este funcția de transfer a zgomotului. Pentru a afla aceste valori, se notează că intrarea filtrului în buclă este X(z)-E(z), astfel încât Y(z)=H(z)[X(z)-Y(z)]+E(z).
Rearanjând termenii avem:
Y(z)[1 + H(z)] = H(z)X(z) + E(z) (13)
și astfel,
STF(z) =,
NTF(z) = (14)
Deci modelul liniar ne permite să găsim efectele asupra semnalului și zgomotului prin alegerea funcției filtrului.
Această filtrare și reacție, combinată cu supraeșantionare, sunt elementele esențiale ale modulației sigma-delta. Principalul scop al modelului modulației sigma-delta este să alegem un filtru cu stabilitate ridicată și erori mici, astfel încât în banda de trecere:
STF(z) ≈ 1, NTF(z) ≈ 0 (15)
Dacă aceasta este situația, atunci s-a format zgomotul în afara benzii de trecere, iar semnalul trece neschimbat.
1.2.2 Convertorul A/D cu modulație sigma-delta de ordinul întâi
Un SDM de ordinul întâi are un singur integrator în filtrul buclă. Cel mai simplu model nu are termeni de câștig adiționali și poate fi descris în domeniul de timp ca:
u(n+1) = x(n) – y(n) + u(n) (16)
care este reprezentată în diagrama bloc din fig. 7A. Amintindu-ne că eq = Q-u și descriind precedentul pas de timp, avem :
y(n) = x(n-1) + eq(n) – eq(n-1) (17)
Fig. 7. (a) modulatorul sigma-delta de ordin 1 reprezentat prin diagrama bloc și, alternativ (b), prin diagrama bloc a transformatei Z , cuantizorul fiind aproximat printr-o sursă de zgomot
O diagramă bloc în domeniul Z este reprezentată în fig. 7B iar ecuația corespunzătoare este:
Y(z) = X(z)z-1 + E(z)(1 – z-1) (18)
Astfel funcția de transfer a semnalului este dată de z-1. Semnalul nu este afectat ci doar decalat cu un eșantion. Funcția de transfer a zgomotului este 1-z-1, care împinge zgomotul către frecvențe înalte. Folosind identitățile trigonometrice:
(19)
Spre deosebire de PCM-ul supraeșantionat, care are NTF unitară, formarea zgomotului în modulația sigma-delta implică o putere de semnal diferită de o constantă, dată în banda de trecere de relația:
(20)
unde SC(f) = σC2 / fS este densitatea spectrală de putere a zgomotului de cuantizare neformat. Puterea totală a zgomotului, σC2, rămâne neschimbată, dar acum zgomotul a fost ridicat către frecvențele înalte. Acest lucru este înfățisat în fig. 8, care arată densitatea spectrală de putere pentru SDM-ul de ordin întâi, în comparație cu PCM.
Fig. 8. Densitatea spectrală de putere normalizată pentru modulația codată pe impuls și pentru SDM-ul de ordin 1 (fără supraeșantionare). Valorile actuale se obțin prin înmulțirea cu σe2 / fs
Considerând un OSR mare, fS»fB și folosind o dezvoltare în serie Taylor, sin(x)=x-x3/3!+x5/5! …., ecuația (20) poate fi rezolvată și se obține :
(21)
Raportul semnal- zgomot poate fi dat de relația:
SNR(dB)=10log10 (22)
Este evident efectul formatorului de zgomot de ordin întâi. Obținem o îmbunătățire de 9 dB pentru fiecare dublare a frecvenței de eșantionare, preferabilă unei îmbunătățiri de 3 dB care apare în situația fără formare a zgomotului.
1.2.3 RSZ pentru modulatoarele sigma-delta de ordin mare
Această tehnică poate fi extinsă la filtrele de ordin mai mare. Funcția de transfer a unui SDM de ordin N este dată de:
Y(z) = X(z)z-1 + E(z)(1-z-1)N= STF(z)X(z) + NTF(z)E(z) (23)
Astfel funcția de transfer a zgomotului este :
(24)
Folosind o formulă de integrare, se obține:
(25)
unde egalitatea prin aproximare a fost obținută folosind o dezvoltare în serie Taylor asupra termenilor sinusului și reținând numai primii termeni diferiți de zero.
În comparație cu SDM-ul de ordin întâi, această variantă furnizează o suprimare mai mare a zgomotului de cuantizare în zona frecvențelor joase și o amplificare a zgomotului în afara benzii semnalului. Ecuația (25) poate fi folosită pentru a găsi formula generală pentru RSZ-ul unui SDM de ordin N ideal:
(26)
Astfel observăm o reală îmbunătățire o dată cu creșterea ordinului SDM-lui. Pentru un SDM de ordinul 2 (N=2) avem o creștere a RSZ-lui cu 15 dB pentru fiecare dublare a ratei de eșantionare.
În general, pentru un SDM de ordin N, avem o creștere a RSZ-lui cu 3(2N+1) dB, odată cu fiecare dublare a ratei de eșantionare și o creștere cu 6 dB pentru fiecare bit în plus din cuantizor. Deci, folosirea unui SDM de ordin mare și a unei rate de supraeșantionare ridicată oferă un RSZ mult mai bun decât cel obținut doar prin creșterea numărului de biți.
Bineînțeles aceasta este o aproximare. Este dependentă de coeficienții modulatorului, de aproximările folosite în derivare și de alți factori. Chiar și asa, furnizează o limită superioară pentru RSZ. Fig. 9 înfățisează RSZ-ul pentru codarea PCM, un SDM de ordin întâi și un SDM de ordin 2. În fiecare caz s-au folosit 217 eșantioane și un cuantizor pe 16 biți, iar semnalul de intrare are o frecvență de 101fS/217.
Fig. 9. RSZ-ul funcție de r, log2 al raportului de supraeșantionare. În fiecare caz, s-au folosit 217 eșantioane și un cuantizor pe 16 biți, iar semnalul de intrare are frecvența 101fs/217.
Spre deosebire de simularea PCM din fig. 4, eroarea de cuantizare și eșantionare a semnalului de intrare nu mai sunt aliniate în timp, astfel încât puterea semnalului și a zgomotului au fost calculate în domeniul frecvență. Există un puternic acord între teorie și simulări, diferențele fiind atribuite ipotezei unui raport de supraeșantionare mare (pentru trunchierea seriilor Taylor), dificultăților în măsurarea precisă a RSZ-lui, în special la valori mari, și ipotezelor menționate mai devreme, în special aceea referitoare la un PDF uniform, cu gama –q/2 până la +q/2. Chiar și așa, au fost confirmate creșterile cu 3 dB, 9 dB și 15 dB, obținute la dublarea RSZ-lui și avem un acord rezonabil în acest caz.
1.3 PROBLEME ÎN MODULAȚIA SIGMA-DELTA
Asa cum s-a văzut au fost proiectate convertoare A/D pe 1 bit, de 64 ori supraeșantionate, folosind un SDM de ordin 5 și s-a obținut un RSZ de peste 120 dB. Totuși din ecuația (26) descoperim că:
SNR(dB) ≈ 20log10A + 167.15 (27)
Până astăzi, nimeni nu a proiectat un modulator sigma-delta cu performanțe atât de ridicate. Ca un exemplu, considerăm un SDM cu reacție pozitivă pe 1 bit, de ordin arbitrar, care poate fi reprezentat prin:
y(n)=sgn(c·s(n))
s1(n+1) = s1(n) + x(n) – y(n)
s2(n) = s1(n) + s2(n)
…..
sN(n+1) = sN-1(n) + sN(n) (28)
Fig. 10. Implementarea unui SDM de ordin 5, real, cu buclă de reacție pozitivă
x este semnalul de intrare și y este șirul de biți de la ieșire, ca și înainte, iar u = c·s este intrarea cuantizorului, unde c este un vector de coeficienți care determină caracteristicile formării zgomotului. În Fig. 10 este descrisă o implementare de ordinul 5 a acestei proiectări și se intenționează să fie folosită pentru conversia analog-digitală în aplicațiile audio (mai târziu, ne vom întoarce la acest SDM pentru a demonstra alt fenomen). SDM-ul este trece jos are o frecvență de tăiere de 80 kHz, pentru o frecvență de eșantionare de 64 x 44.1 kHz și este dată de coeficienții:
c = [0.5761069262, 0.1624753515, 0.0276093301, 0.0028053934, 0.0001360361] (29)
Fig. 11 înfățișează RSZ-ul teoretic ca funcție de amplitudinea semnalului de intrare pentru un SDM ideal de ordin 5, precum și ambele estimări, teoretice sau simulate, ale RSZ-lui, date de ecuațiile (28) si (29).
Fig. 11. Estimări ale raportului semnal-zgomot ca funcție de amplitudinea semnalului de intrare pentru un SDM ideal, derivat din teorie, și pentru un SDM practic, ambele derivate din teorie și estimate prin simulări. În toate situațiile, s-a presupus că SDM-ul este pe 1 bit, de ordin 5, cu un raport de supraeșantionare de 64.
În ambele cazuri, s-a presupus ca SDM-ul este pe 1 bit, cu o rată de supraeșantionare de 64. RSZ-ul teoretic este format direct din puterea semnalului și puterea zgomotului în bandă. Puterea zgomotului în bandă este determinată prin integrala din ec. (20), care este numeric integrată pentru SDM-ul practic și poate fi găsită din ec. (26), pentru SDM-ul ideal. Este de remarcat că reprezentarea practică are un RSZ cu 80 dB mai mic decât cea ideală și că simularea indică o scădere semnificativă a performanței, pentru amplitudini de intrare mai mari de 0.77.
Arhitectura SDM-lui de ordin N cu NTF = (1-z-1)N este instabilă; așadar, se folosesc filtre în buclă cu procedeu de formare a zgomotului mai puțin agresiv. Dar chiar și acest SDM mai puțin agresiv devine instabil în cazul valorilor de intrare mari. Această problemă de instabilitate nu este explicată de către modelul liniar. De fapt, există o serie de probleme în modulația sigma-delta cauzate de reacția din jurul unui cuantizor puternic neliniar. În această parte ne vom concentra atenția asupra cauzelor legate de aceste comportamente nedorite și vom evidenția starea actuală a înțelegerii și cercetării.
1.3.1 Ciclurile limită
Considerăm un SDM de ordinul 1 pe 1 bit, dat de către ec. (16), cu intrarea fiind o constantă x=0.5 și o condiție inițială, să zicem u(n)=0.1>0 :
u(n+1)=0.5-1+0.1=-0.4
u(n+2)=0.5+1-0.4=1.1
u(n+3)=0.5-1+1.1=0.6
u(n+4)=0.5-1+0.6=0.1 (30)
Deci, intrarea cuantizorului se repetă cu o perioadă de 4 iterații și cuantizorul produce la ieșire un șir repetitiv +1,-1,+1,-1…. De remarcat că valoarea medie este [3*(+1)+1*(-1)]/4, care este la fel ca intrarea. Această relație se poate demonstra ușor pentru un SDM de ordin 1, din moment ce aplicarea repetată a ec. (16) duce la:
(31)
Dacă presupunem intrarea constantă și faptul că u se repetă după k cicluri, avem :
(32)
care implică faptul că ieșirea medie este egală cu semnalul de intrare. Apariția unei secvențe periodice în șirul de la ieșire este cunoscută sub numele de ciclu limită. Apar probleme în procesarea semnalului de la ieșire. Atunci când SDM-ul se folosește în aplicațiile audio, ciclurile limită pot duce la erori auditive. De exemplu, în situația menționată, intrarea a fost cu semnal continuu, însă ciclul limită duce la un semnal dreptunghiular cu 75% factor de umplere și frecvența la ieșire fS/4.
Teoria ciclurilor limită în modulatorele sigma delta de ordin mic (primul și al doilea) este bine cunoscută. Totuși ciclurile limită pot apărea și în SDM-uri de ordin mare, lucrând în condiții normale. Întorcându-ne la SDM-ul prezentat în partea de început, cu o intrare de 0.7 și condiții inițiale s=0, se obține un ciclu limită de scurta durată. Aceasta se poate observa într-o reprezentare în timp a intrării cuantizorului, ca în fig. 12. Acest exemplu ilustrează atât existența ciclurilor limită în proiectările de ordin mare, cât și faptul că ciclurile limită pot apărea, de asemenea, pentru durate finite.
Fig. 12. Graficul intrării unui cuantizor ca funcție de iterații, pentru un SDM de ordin 5. Intrarea cuantizorului și, deci, șirul de biți de la ieșire, introduc un ciclu limită la iterația 2300 și, din nou, la aproximativ 8400.
Doar în ultimii ani teoria ciclurilor limită a fost extinsă pentru a caracteriza comportamentul în SDM-urile de ordin mare [5-10]. Teoria lui Reefman ne spune că, pentru majoritatea schemelor SDM, intrările DC implică un semnal de ieșire periodic dacă și numai dacă variabilele de stare (un vector care descrie starea actuală a sistemului) sunt periodice. Folosind această condiție a fost posibil să se găsească toate ciclurile limită care pot apărea pentru un modulator sigma-delta cunoscut și seturile condițiilor inițiale care pot genera aceste cicluri. Aceasta a permis o descriere a senzitivității ciclurilor limită pentru diverse scheme SDM și usurința prin care diverse tehnici pot fi folosite pentru a ieși dintr-un ciclu limită. Alte rezultate recente importante includ analiza comportamentului ciclurilor limită în cazul semnalelor de intrare periodice și dezvoltarea detectării ciclurilor limită, precum și tehnicile de îndepărtare.
Proiectarea SDM-lor pentru a evita ciclurile limită este realizată fie prin utilizarea unor structuri de formare a zgomotului mai complexe fie prin adăugarea ditherului sau unui semnal de control, pentru a suprima ciclurile limită într-un model existent. Apar întrebări referitor la cât de problematice sunt ciclurile limită când semnalul de intrare are o cantitate mică de zgomot, cum ar fi implementările analogice ale SDM-lui, când ciclurile limită sunt de durată finită sau când intrarea nu este o constantă, dar raportul de supraeșantionare este destul de mare astfel încât semnalul de intrare pare aproape constant pentru o scurtă perioadă de timp. Fereastra descoperită poate fi folosită pentru a se adresa acestor probleme.
1.3.2 Tonurile redundante
Există o cunoaștere teoretică destul de succintă despre tonurile redundante, chiar și pentru cele mai simple modulatoare sigma-delta de ordin mic. Probabil cel mai semnificativ este studiul recent al lui Candy care a indicat că într-un modulator sigma-delta de ordin 1 tonul redundant este pur și simplu o suprapunere a unui supraton al unui semnal dreptunghiular care este discret eșantionat. Astfel se bănuiește că un fenomen asemănător poate aparea pentru tonuri redundante în SDM-uri de ordin mare. Fenomenul tonului redundant în SDM-urile de ordin mare a fost descris în alte articole, iar dovezi experimentale în legătură cu comportamentul tonului redundant într-un SDM de ordin 2 se regăsesc în alte studii.
Este important să facem distincția între ciclurile limită și fenomenele legate de tonurile redundante. Modelele repetitive existente în șirul de biți de la ieșire sunt numite modele redundante sau cicluri limită. Pe de altă parte un ton redundant este reprezentat ca un vârf discret în spectrul în frecvență al iesirii unui SDM, dar evidențiat pe un fundal de zgomot (vezi fig. 13). În acest caz nu există serii unice de biți care se repetă.
Fig. 13. Ilustrarea definițiilor folosite pentru a diferenția un ciclu limită (stânga) de un ton redundant (dreapta). Un ciclu limită constă într-un număr finit de vârfuri discrete în spectrul frecvenței;un ton redundant este un vârf în domeniul frecvenței.
Această diferențiere este deseori confuză și uneori se folosesc definiții alternative. Kozak and Kale nu fac distincție între ciclurile limită și tonurile redundante, dar în schimb se referă la tonul redundant ca la un model periodic cu semnal de intrare constant, iar tonurile armonice sunt considerate modele periodice rezultate din semnale de intrare sinusoidale.
Bourdopoulos s-a referit la tonurile redundante apărute atât de la un semnal de intrare constant, cât și de la unul sinusiodal, pentru un SDM de ordin 3. De acum încolo le vom numi distorsiuni armonice. De asemenea a făcut legătura între generația tonurilor redundante și tiparele aproape periodice existente. Ledzius a folosit această legătură pentru a concluziona că din moment ce un model liniar al SDM-lui nu poate fi răspunzător pentru ciclurile limită, nu poate justifica nici tonurile redundante. Această legătură cu ciclurile limită (secvențe total periodice) a fost de asemenea sugerată de către Angus și Jespers. Totuși, rezultatele recente au arătat că deși aceste tonuri au legătură cu intrarea cam în același mod ca și ciclurile limită, ele nu sunt răspunzătoare de aceasta în cadrul teoriei recente a ciclurilor limită.
Oricât ar fi de tentantă, ipoteza conform căreia tonurile redundante provin din cicluri limită a lăsat până acum câteva fenomene neexplicate. Mai întâi, ciclul limită produce un spectru cu vârfuri discrete, de amplitudini comparabile, care apar la multiplii ai frecvenței ciclului limită. Astfel, pentru un ciclu limită de perioadă scurtă, toate vârfurile ar fi în afara benzii audibile. Pentru un ciclu limită, cu o perioadă suficient de lungă pentru a produce tonuri audibile, aproape toate armonicele ar fi prezente și semnificative. Acest lucru este în contradicție cu tonurile redundante, care sunt cunoscute pentru producerea unui număr relativ mic de vârfuri, iar armonicele înalte au amplitudine mică. Mai mult, ciclurile limită sunt foarte sensibile la condițiile inițiale și la semnalul de intrare. O schimbare infinitzecimală la intrare va elimina total un ciclu limită, iar o schimbare în condițiile inițiale îl va destabiliza. Pe de altă parte, tonurile redundante pot fi observate indiferent de condițiile inițiale și se mențin pe măsură ce intrarea se modifică. În final, s-a demonstrat că ciclurile limită există doar dacă intrarea este constantă sau periodică [6], în timp ce pentru tonurile redundante nu sunt cunoscute constrângeri similare.
Fenomenul tonurilor redundante este ilustrat în fig.14, care afișează spectrul puterii unui SDM de ordin 5 descris în capitolul anterior, cu semnalul de intrare fiind o constantă: 0.7. Cel mai puternic ton redundant apare la frecvența 423.36 kHz, sau mai exact la 3/20 din frecvența de eșantionare de 64 x 44.1 kHz. Următorul ton puternic este prima armonică a acestui ton. Acest lucru reprezintă dovada unei relații simple observată în. În articol autorii au subliniat faptul că frecvența tonului redundant fundamental, numită fFIT, este proporțional raportată la amplitudinea semnalului de intrare,
fFIT = ADC fS (33)
Fig. 14. Spectrul puterii unui SDM de ordin 5 supraeșantionat de 64 ori, cu semnal de intrare o constantă: 0.7, evidențiând tonurile redundante.
Aici ne referim la amplitudine ca fiind raportată la întreaga gamă. Un semnal de intrare de amplitudine 0.7 reprezintă 17/20 din gama întreagă de la -1 la +1, sau 3/20 din scala întreagă pe o axă x inversată, de la +1 la -1. Deoarece 17fS / 20 este deasupra lui fS / 2, ne-am aștepta ca frecvența tonului redundant să fie 3fS / 20, după cum s-a observat. Celelalte tonuri redundante semnificative apar datorită armonicilor și alierii tonului fundamental. Deși tonul redundant fundamental este, de obicei, în afara benzii audibile, armonicile de ordin mare ale acestui ton se pot alia cu frecvențele mici.
Este important de notat că relația obținută prin ecuația (33), deși ușor de intuit, nu are nici o justificare teoretică cunoscută. Nici nu există, încă, o teorie care să estimeze amplitudinile tonurilor redundante. Aceasta este probabil mai relevantă din moment ce proiectantul este preocupat cu tonurile nedorite, aflate deasupra pragului de zgomot. Mai mult, tonul fundamental și armonicile sale nu vor fi reprezentative pentru toate tonurile observate. Astfel o înțelegere mai detaliată a tonurilor redundante rămâne o provocare importantă.
Soluțiile propuse pentru tonurile redundante și distorsiunea armonică sunt adăugarea ditherului sau folosirea SDM-lor haotice. Aceleași soluții sunt utile în eliminarea comportamentului ciclurilor limită. Deci, se crede că acestea reprezintă, parțial, fenomene ale sistemelor dinamice, dar nu o consecință directă a ciclurilor limită. Tehnicile dinamicilor neliniare ar putea avea în continuare succes în inventarea unei apropieri analitice, paralele, pentru înțelegerea tonurilor redundante.
1.3.3 Distorsiunea armonică
La fel ca și în cazul tonurilor redundante, în literatură există mai multe definiții ale distorsiunii armonice. Distorsiunea armonică, deși apare de asemenea ca ton nedorit, apare când se aplică un semnal sinusoidal la intrare. Poate fi definită ca prezența armonicelor (semnale ale căror frecvențe sunt multiplii întregi ai frecvenței semnalului de intrare) și a altor dinți în spectrul ieșirii, care nu existau în semnalul de intrare. În acest caz suntem preocupați atât de vârfurile care se datorează armonicilor sau alierii semnalului de intrare cât și de acelea care, aparent, nu au nici o legătură cu frecvența semnalului de intrare.
Kozak and Kale se referă la tonurile armonice ca la modele periodice rezultate din intrarea sinusoidală (acestea încă vor fi considerate limitări ciclice, sub aspectul definiției anterioare). Dovezile experimentale ale distorsiunii armonice au fost date în câteva articole. Rezultatele teoretice au fost limitate pentru a aproxima analiza armonicilor de ordinul 2 sau 3 sau a modulatoarelor de ordin mic. De asemenea sunt specificații în ceea ce privește distorsiunea armonică, care apare ca un rezultat al imperfecțiunilor circuitului, în opoziție cu componentele distorsiunii inerente din SDM-urile de ordin mare. Alierea componentelor distorsiunii în banda de trecere a fost prezentată, deși nu a fost furnizată nici o bază teoretică.
Distorsiunea armonică este reprezentată în spectrul puterii indicat în fig. 15, care este identică cu fig. 14, cu excepția faptului că semnalul de intrare, care este o constanta egală cu 0.7 a fost înlocuit cu un semnal sinusoidal de amplitudine 0.7.
Fig. 15. Spectrul puterii unui SDM de ordin 5, supraeșantionat de 64 ori, cu intrarea o sinusoidă de frecvență 5 kHz și amplitudine 0.7, înfățișând distorsiunea armonică.
Distorsiunile sunt mult mai numeroase decât tonurile redundante produse de către o constantă la intrare și sunt cu atât mai interesante datorită faptului ca nu indică vreo legătură evidentă cu frecvența sau amplitudinea semnalului de intrare. Din fericire, în ambele cazuri, tonurile sunt mult în afara benzii audio (deși nu se întâmplă întotdeauna așa).
Deși este o problemă importantă, distorsiunea armonică nu este bine înțeleasă. Se știe că este mult mai problematică în schemele cu ordin mic și se pot aplica aceleași tehnici care se folosesc la eliminarea tonurilor redundante. Originile distorsiunii armonice constau în faptul că, într-o reprezentare pe puțini biți, semnalele sinusoidale sunt reprezentate în fluxul de la ieșire cât mai aproape de un semnal dreptunghiular. Din moment ce undele dreptunghiulare au armonici puternice, aceste armonici apar în spectrul ieșirii. Totusi, nu există o teorie generală care să permită derivarea analitică a armonicilor dominante sau care să determine sensibilitatea diferitelor scheme de filtre pentru distorsiunea armonică.
1.3.4 Modulația zgomotului
Începem prin a ne uita la distribuția ditherului și la eroarea de cuantizare rezultantă în sistemele PCM. Abordarea folosită este ușor mai simplă, deși mai puțin riguroasă, decât cea folosită în alte studii. Analiza în acest capitol este prezentată în primul rând datorită faptului că analiza sistemelor SDM poate fi făcută printr-o extensie a acestei abordări.
Amintindu-ne că un cuantizor infinit cu front la mijloc are caracteristica intrare-ieșire Q(w) = q[w/q] + q/2, unde w este semnalul de la intrarea cuantizorului. Dacă intrarea unui sistem PCM, x, este introdusă direct în cuantizor, atunci eroarea totală dintre intrare și ieșire se calculează ușor:
eq = q[x/q] + q / 2 –x (34)
Astfel momentul m al erorii pentru un semnal x dat este
(35)
Sub aceste aspecte, toate momentele erorii sunt dependente de valoarea semnalului de intrare, x. În particular, al doilea moment, puterea zgomotului de cuantizare, depinde de semnal. Aceasta este cunoscută sub numele de modulație a zgomotului. Poate fi percepută în cuantizarea semnalelor audio și este, în general, nedorită.
Totuși, dacă se aplică imediat dupa cuantizare zgomotul aleatoriu, cu distribuția de probabilitate de la –q/2 la +q/2, cunoscută sub numele de dither cu PDF rectangulară (RPDF) de mărime 1 LSB, atunci PDF-ul intrării în cuantizor are forma:
p(w) = 1 /q x – q / 2 < w ≤ x + q/ 2
0 altfel (36)
Intrarea are o gamă peste 1 LSB, astfel că ieșirea nu poate avea decât 2 valori. Dacă definim y = x / q + 1 / 2 – [x / q + 1 / 2 ], atunci eroarea are distribuția
eq = q(1-y) p=y
-qy p=1 – y (37)
Să notăm ca acesta a fost și rezultatul ipotezei distribuției uniforme în modelul liniar, ecuația (4), numai că acum adunarea ditherului validează total ipoteza. De fapt, se poate arăta că ditherul de ordin n va face primele n momente ale erorii independent de semnalul de intrare. Ditherul triunghiular (TPDF) de amplitudine 2 LSB, care se poate obține prin adunarea a două dithere rectangulare PDF, de amplitudine 1 LSB, va genera atât momentul erorii de ordin 1, cât și pe cel de ordin 2, independent de semnalul de intrare. Astfel zgomotul de cuantizare va avea o medie constantă nulă și o putere constantă (nenulă), independent de caracteristicile semnalului de intrare. Ditherul forțează zgomotul de cuantizare să-și piardă coerența cu semnalul de intrare original, dar are dezavantajul creșterii pragului mediu al zgomotului spectral.
Efectul ditherului asupra momentelor condiționate ale erorii este înfățișat în fig. 16. Aceasta indică primele 2 momente condiționate ale erorii (zgomotul mediu de cuantizare și puterea medie a zgomotului de cuantizare) ca funcție de intrarea sistemului, pentru un sistem PCM fără dither, cu dither RPDF și, respectiv, dither TPDF. Acest sistem PCM folosește același cuantizor cu front la mijloc, pe 3 biți, reprezentat în fig.1. Rezultatele au fost obținute prin simularea a 100.000 puncte de date, cu un semnal constant la intrarea sistemului și un generator de numere aleatoare, folosit pentru a crea ditherul. Cu ditherul RPDF zgomotul mediu de cuantizare rămâne fixat la zero, indiferent de semnalul de intrare. Cu ditherul TPDF atât zgomotul de cuantizare mediu, cât și puterea zgomotului de cuantizare mediu, sunt constante, astfel modulația zgomotului a fost eliminată. Totuși, datorită numărului finit de biți din cuantizor, rezultatele nu se mențin pentru nivelul cel mai scăzut și cel mai înalt cu ditherul RPDF și nu se mențin pentru două dintre cele mai înalte nivele și două dintre cele mai scăzute nivele, în cazul ditherului TPDF.
Figure 16. The first two conditional moments of error (average quantization noise and average quantization noise
Până în prezent, teoria modulației zgomotului nu a fost extinsă de la PCM la SDM. Deși este bine înțeleasă utilizarea ditherului pentru a preveni modulația zgomotului în modulația codată pe impuls, rămân destule întrebări intrigante când ditherul este aplicat unui sistem cu modulație sigma-delta. Bucla de reacție afectează în moduri complicate distribuția semnalului de intrare al cuantizorului. Mulți cercetători au sugerat că aceasta conduce la o formă de ” auto-ditherare”, dar rămân corelațiile între zgomotul de cuantizare și semnalul de intrare. În plus, este des utilizată modulația sigma-delta pe 1 bit, însă ditherul RPDF de 1 LSB sau ditherul TPDF de 2 LSB vor cauza supraîncărcarea cuantizorului, iar nici o cantitate de dither nu va produce o putere a zgomotului constantă, într-un sistem pe 1 bit [30].
Zonele moarte
Figure 16. Primele două momente condiționale ale erorii (zgomotul mediu de cuantizare)
1.3.5 Zonele moarte
Pentru anumite semnale de intrare, s-ar putea ca intrarea să nu fie corect codată de către SDM. Acestea fiind spuse, există o gamă de semnale de intrare pentru care modulatorul sigma-delta ar putea produce aceeași valoare medie la ieșire. Această gamă este cunoscută sub denumirea de zonă moartă.
Considerăm că un SDM de ordin 1 cu un integrator cu pierderi, ca în ecuația (16), este înlocuit prin
u(n) = c·u(n-1) + x(n) – y(n-1) (39)
unde c<1. Pentru x«1, y(0)=+1, aceasta produce
u(1) = c·u(0)+x-y(0) = x-1<0
u(2) = c·u(1)+x-y(1) = (1+c)x+(1-c)>0
u(3) = c·u(2)+x-y(2) = (1+c+c2)x-(1-c+c2)<0 (40)
care generează șirul de la ieșire y(n) = +1, -1, +1, -1,…. Formula generală pentru intrarea cuantizorului devine:
(41)
Când x = 0 si c<1, se generează ciclul limită +1, -1. Pentru a ieși din acest ciclu limită pentru x nenul, la un moment dat ar trebui să avem, pentru k impar,
(42)
sau pentru k par
(43)
Între limitele lui k, aceste formule devin
și (44)
Astfel, toate semnalele de intrare din gama
(45)
nu vor ieși din ciclul limită și astfel nu vor avea efect asupra ieșirii. Regiunea de intrare definită de ecuația (45) este cunoscută sub numele de zonă moartă, iar fenomenului i se spune uneori efect de prag. Este puternic legată de ciclul limită, ieșirea fiind un flux infinit repetitiv.
O definiție formală ar fi aceea că o zonă moartă este o gamă continuă a semnalului de intrare al SDM-lui, astfel încât, pentru condiții inițiale date, s-ar produce același flux la ieșire.
Dacă se consideră o condiție inițială nenulă, atunci ecuația (41) devine
(46)
care în cazul unui k mare se reduce la ecuația (41). Astfel, această zonă moartă este independentă de condițiile inițiale.
Ar trebui menționat că într-un SDM de ordin 1 zonele moarte apar pentru fiecare ciclu limită. Din moment ce ciclurile limită există pentru orice semnal de intrare rațional, s-ar putea reformula că zonele moarte există în vecinătatea fiecărui semnal de intrare rațional. Fenomene similare apar în SDM-ul de ordin 2. Fig. 17 înfățișează ieșirea medie a unui modulator sigma-delta ca funcție de o intrare de semnal continuu. Se poate observa că atât SDM-ul de ordin 1, cât și cel de ordin 2, poate prezenta zone moarte.
Fig. 17. Ieșirea medie ca funcție de un semnal continuu la intrare, pentru un SDM de ordin 1 și ordin 2, cu integrator cu scurgeri
Zonele moarte sunt întâlnite în comunitatea SDM-lor și sunt menționate în multe broșuri de proiectare. În lucrările lui Feely a fost extinsă o analiză a zonelor moarte în SDM-ul de ordin 1 și ordin 2. Totuși, această analiză nu s-a referit la aceste zone în acest mod, discutându-se despre structura în scară a ieșirii SDM-lui ca funcție de intrare, lucru care caracterizează zonele moarte.
Până în prezent nimeni nu a caracterizat zonele moarte care pot exista în SDM-urile de ordin mare și nici nu a caracterizat complet relațiile posibile dintre zone, condiții inițiale și intrare. Totuși, deși acest subiect pare maleabil, sunt puține dovezi care să susțină că zonele moarte sunt o problemă serioasă în schemele SDM-urilor de ordin mare.
1.3.6 Stabilitatea
În prezentarea de la început a problemelor SDM-urilor, am nominalizat că principalul motiv pentru care nu se obține SDM-ul ideal cu ajutorul SDM-urilor de ordin mare este acela că multe dintre scheme sunt puternic instabile. Au fost făcute multe cercetări în ceea ce privește problema stabilității în SDM-uri, dar multe întrebări esențiale au rămas nerezolvate. În esență, am vrea sa derivăm valorile semnalului de intrare constant astfel încât, pentru anumite condiții inițiale, amplitudinea semnalului de la intrarea cuantizorului va tinde către infinit. O problemă similară este cum să se determine, cunoscând condițiile inițiale și semnalul de intrare, dacă această amplitudine conduce la un comportament stabil.
Pentru SDM-ul de ordin 1, este ușor de arătat că este stabil pentru toate intrările -1<x<1 și să găsim comportamentul fluxului corespunzător. Întorcându-ne la expresia în domeniul timp dată de ecuația (16), presupunem că x este o constantă și -1<x<1. Următoarele 2 relații arată că un semnal u negativ va crește până când ajunge pozitiv, iar un semnal pozitiv u va descrește până cand ajunge negativ.
u(n)<0 → u(n+1) = u(n)+x+1>u(n)
u(n)≥0 → u(n+1) = u(n)+x-1<u(n) (47)
Deci acest semnal oscilează între valori pozitive și negative. Acum vom presupune că cel puțin un salt de bit a avut loc (ex., regimul trannzitoriu a trecut și acum nu mai pornim de la condiții inițiale arbitrare). Din ecuația (47) valoarea maximă a lui u apare atunci când valoarea precedentă este puțin sub zero iar valoarea minimă apare când cea precedentă este egală cu zero:
(48)
Astfel u este încadrat în gama [-1+x; 1+x].
SDM-ul de ordin 1 poate fi iterat când toți biții de la ieșire au același semn:
u(n+m) = u(n) + m(x-y) (49)
Presupunem că sunt exact n+ biți pozitivi de ieșire într-un rând. Atunci avem:
u(1)≥0
….
u(n+) = u(1)+[n+-1](x-1) ≥0 (50)
Din moment ce valoarea maximă a lui u este x+1, apare numărul maxim de biți la ieșire atunci când
x + 1 + [n+-1](x-1) ≥0 (51)
deci numărul maxim de biți pozitivi de la ieșire este dat de cel mai mare n+, astfel încât
(52)
În mod asemănător, numărul maxim de biți negativi de la ieșire este dat de n-,
(53)
SDM-ul de ordin 2 standard are proprietăți de stabilitate asemănătoare, stabilitatea este independentă de condițiile inițiale, dar dovezile lipsei de delimitare nu sunt evidente. O interpretare a programării liniare este folosită de Farrell și Feely. Au presupus că au fost câteva iterații n-, cu ieșire negativă. Pornind de la aceasta, au identificat valorile maxime ale variabilelor de stare pentru primul bit de ieșire pozitiv. Această valoare este folositș pentru a identifica numărul maxim de biți pozitivi de la ieșire, care este dat de n+. Apoi au găsit numărul maxim de biți negativi de la ieșire, care au rezultat din cei n+ biți pozitivi. Această nouă valoare a lui n- este strict mai mică decât n+ și astfel oscilațiile sunt limitate. Acest procedeu descoperă cu succes limitările din SDM-ul de ordin 2 și poate fi extins la SDM-uri de ordin 2 cu integratoare haotice, iar rezultatele lor duc la o concordanță cu simulările.
Pentru o mai bună înțelegere, nu există o abordare analitică reușită pentru obținerea stabilității în SDM-ul de ordin mare (ordin mai mare decât 2). Sunt câteva abordări alternative ale stabilității în SDM-urile de ordin 2, câteva cercetări preliminare efectuate pe schemele de ordin 3 și doar câteva abordări schițate pentru stabilitate în SDM-urile de ordin mare. Astfel se pune întrebarea, „Pot fi extinse abordările existente la SDM-urile de ordin mare ?”. Desigur, se pune întrebarea dacă cumva abordările existente sunt corecte.
Risbo a discutat în detaliu despre stabilitatea SDM-urilor, în special dintr-o perspectivă a dinamicii neliniare. Dar, exceptând SDM-urile de ordin 1, nu a obținut o metodă pentru determinarea stabilității. O abordare computerizată pentru a găsi seturile invariante, care constă în faptul că condițiile inițiale cresc stabilitatea comportamentului, este abordată de către Schreier. Deși nu este analitică și nici riguroasă, această abordare este semnificativă, pentru că avem la dispoziție codul sursei și datorită faptului că sunt furnizate rezultate, care pot fi confirmate sau infirmate prin alte metode. Abordarea lui Hein și Zakhor este de a folosi ciclurile limită ca o masură a stabilității. Metoda lor nu este riguroasă, dar postulează că ciclurile limită au o limită convergentă pe variabilele de stare și că aceasta este și limita pentru comportamentul ciclului nelimitat. Wang a convertit un modulator de ordin 3 într-un sistem continuu în timp, urmărind ecuațiile vectorului de câmp. Considerând doar punctele limită, este în stare să convertească fluxul 3D într-o hartă de întoarcere 2D. Punctele fixe ale acestei hărți scot în evidență stabilitatea SDM-lui. Zhang a utilizat un model al cuantizorului pentru a estima stabilitatea unui SDM de ordin 3. Liniarizarea implică faptul că au fost neglijate fenomene importante. Mai mult, este o asemănare mică între rezultate și simulări. Un alt articol al lui Zhang seamănă foarte mult cu abordarea programării liniare a lui Feely.
Steiner și Yang au folosit o transformare care decuplează variabilele de stare, excepție făcând interacțiunea lor din funcția de cuantizare. Ei sugerează modul în care acest procedeu poate fi folosit pentru abordarea stabilității, dar sunt destul de puține cercetări. Această abordare a fost extinsă de Wong, pentru a se descurca cu SDM-urile practice de ordin mare. Wong furnizează rezultate ale simulării pentru mai multe SDM-uri de ordin mare, dar analiza sa nu confirmă simulările. Mladenov et al. folosește o transformare raportată la variabile și a obținut rezultate promițătoare pentru SDM-uri simple, dar de ordin mare. Autorul și colaboratorii sai investighează momentan potențialul acestei tehnici.
Acum vom arăta că variabilele de stare sunt întotdeauna nemărginite pentru . Este de notat că această oscilație nu garantează comportamentul stabil, dar o înțelegere a oscilațiilor poate conduce la o cunoaștere a stabilității.
Întorcându-ne la SDM-ul arbitrar determinat de ecuația (28), se poate vedea cu ușurință că
(54)
Dacă x>1, atunci x – y(n)>0, indiferent de c. Prin urmare, s1(n+1)> s1(n), s1 este mereu în creștere. Astfel, pentru un anume k, s1(k) > 0. În acest punct s2 va crește și în același punct va deveni pozitiv și așa mai departe. Aceasta implică faptul că într-un anumit punct toate variabilele de stare vor crește. În mod similar, dacă x<-1, la un moment dat, toate variabilele de stare vor descrește. Deci, pentru orice SDM cu buclă de reacție pozitivă în această formă, limitele sunt mereu <=1.
Presupunem că 0<x<1 și y(n)>0. Astfel:
(55)
Deci s1 scade, s2 ar mai putea crește, dar până la urmă s1 devine mai mic decât 0. Atunci s2 începe să scadă și așa mai departe. În cele din urmă sN(n)<0 sare la valoarea -1. Acum, procedeul se reia, dar cu fiecare variabilă crescând. Astfel se obține oscilația. Problema apare atunci când fiecare oscilație durează mai mult decât precedenta. Un exemplu al unei oscilații de acest tip este reprezentat în fig. 18. Pentru x=0.9, sistemul este instabil, dar încă oscilează între ieșirile -1 și +1, deși atât perioada, cât și amplitudinea oscilațiilor, cresc exponențial.
Fig. 18. Amplitudinea absolută a intrării cuantizorului, într-un SDM de ordin 5, funcție de iterații, pentru diverse amplitudini ale constantelor de intrare. La x=0.7, intrarea cuantizorului este stabilă, la x=0.9 intrarea este instabilă și oscilează odată cu creșterea perioadei și a amplitudinii, iar la x=1.1 intrarea cuantizorului este instabilă, dar nu oscilează.
1. 4 CONCLUZII
În această lucrare practică am discutat despre metode de operare, scheme și utilizarea modulatoarelor sigma-delta. Deși am luat în considerare schema unui modulator sigma-delta folosită în conversia analog-digitală, rezultatele obținute aici ar putea fi ușor generalizate. Descrierile se aplică în mod egal pentru SDM-urile folosite în alte aplicații, cum ar fi convertoarele sigma-delta sau amplificatoarele de Clasă D. Formulele RSZ-lui pentru modelul liniar, pentru capitolul cu modulație codată pe impuls, capitolul cu formarea zgomotului și supraeșantionare, pot fi modificate pentru diferite semnale de intrare sau model de filtru. Exemplele din această secțiune legate de problemele SDM-lui pot fi aplicate la fel de bine și SDM-urilor multibit.
Am identificat câteva probleme cheie în modulația sigma-delta: ciclurile limită, tonurile redundante, zonele moarte, distorsiunea armonică, modulația zgomotului și stabilitatea. Prin generalizare ciclurile limită ar putea fi considerate o problemă rezolvată, în timp ce pentru fiecare din celelalte probleme rezultatele sunt înțelese pentru scheme de ordin mic, dar teoria nu este încă stabilită pentru schemele de ordin mare. Zonele moarte au fost caracterizate efectiv pentru scheme de ordin mic, dar nu au ridicat probleme semnificative în schemele de ordin mare sau cele comerciale. Modulația zgomotului este bine cunoscută pentru PCM, însă nu există încă o teorie bine conturată pentru modulatoarele sigma-delta de ordin mic, pare. Tonurile redundante și distorsiunea armonică, deși nu sunt prea bine înțelese, sunt niște fenomene înrudite. În particular, pentru tonurile redundante, au fost observate relații simple și bine definite între semnalul de intrare și frecvențele tonurilor, relații care nu au încă o bază teoretică.
Ne putem descurca, cel puțin cu fiecare în parte, cu modulația zgomotului, tonurile redundante, distorsiunea armonică și ciclurile limită, prin aplicarea ditherului. Totuși, ditherul este mai puțin eficient când este folosit cu un cuantizor pe biți puțini, caz în care problemele apărute sunt cele mai serioase. Mai mult, ditherul nu este folositor când avem de a face cu probleme de stabilitate și va micșora gama stabilității unui modulator sigma-delta. Este necesară o mai bună înțelegere a stabilității (și a altor probleme) astfel încât să poate fi dezvoltate implementările robuste, cu performanțe ridicate. Au fost multe rezultate recente promițătoare care ar putea conduce la o teorie a stabilității în modulatoarele sigma-delta; această zona rămâne deschisă cercetărilor.
2. CODAREA DIFERENȚIALĂ TRANSPARENTĂ PENTRU DOMENIUL AUDIO DIGITAL DE ÎNALTĂ REZOLUȚIE
2. 1. Introducere
Este descrisă metoda prin care se utilizează etaje de codare diferențială în cascadă, împreună cu formarea zgomotului și egalizarea, ca o alternativă la modulația liniară codată pe impuls (LPCM) și la modulația sigma-delta (SDM). LPCM-ul este codul de bază care se găsește în majoritatea sistemelor audio digitale și este încorporat în noul standard DVD-audio, propus de către consorțiile WG-4. Avantajele LPCM-lui sunt bine stabilite și pot fi rezumate observând că singurele distorsiuni fundamentale sunt limitările de bandă de tip zid, rezultate din eșantionarea uniformă, împreună cu zgomotul aditiv, adaugată datorită cuantizării și ditherului. Într-un sistem care este bine implementat și este funcționabil, nici unul dintre aceste procese nu au ca efect distorisiuni corelate.
De asemenea, a devenit de actualitate să considerăm SDM-ul ca o modalitate de transportare/stocare a informației audio digitale, în mare măsură datorită răspândirii largi a utilizării convertoarelor pe 1 bit, atât pentru A/D cât și pentru D/A. Argumentul prezentat în favoarea acestei afirmații spune că într-o simplă înlănțuire de ADC-uri sau DAC-uri absența decimatoarelor și a filtrelor de supraeșantionare elimină eroarea corezpunzătoare procesării, oferă o lățime de bandă mai mare și astfel asigură o transparență mai mare sistemului. Contra argumentul susține că acest fenomen este valabil doar pentru convertoarele pe 1 bit și, astfel, este limitat în aplicații. Tehnologiile ADC și DAC îmbrățișează acum supraeșantionarea și formarea zgomotului, în conjuncție cu cuantizoarele uniforme cu rezoluție scăzută si cu metode de aleatorizare pentru a decorela erorile introduse de implementările reziduale, oferind avantaje de performanță ridicată în comparație cu convertorul pe 1 bit.
Teoretic, convertoarele multi-bit sunt dispozitive liniare care asigură ca anumite condiții să fie indeplinite. Un cuantizor uniform este încorporat și ditherul format corect urmează cuantizorului, atunci liniaritatea este obținută teoretic, corespunzătoare cu arhitecturile de procesare. În comparație cu aceasta, nu există un caz asemănător pentru SDM, unde datorită naturii de saturație a cuantizorului pe 1 bit, nu există o teoremă care să garanteze operația liniară. Totuși, în susținerea acestui argument, este recunoscut faptul că este posibilă o distorsiune redusă, prin folosirea ditherului și a unei scheme avanasate, cu buclă. În capitolul 1 sunt făcute unele observații legate de gama operației liniare a SDM-lui.
Odată ce frecvența de eșantionare a unui sistem este suficient de mare, atunci devine atractivă varianta folosirii formării zgomotului pentru a reduce rezoluția eșantionării., unde considerând că recuantizorul uniform nu este supraîncărcat, este posibilă păstrarea operației liniare. Studiul prezentat în acest articol are o abordare hibridă; cuprinde avantajele folosirii frecvențelor mari de eșantionare, împreună cu formarea zgomotului, dar aplică codarea diferențială pentru a obține o eficiență mai mare. Se va arata că se poate obține o performanță superioară SDM-lui, la ratele de bit corespunzătoare, dar cu avantajul liniar al LPCM-lui și cu performanțe de supraîncărcare mai bune.
2.2 Comparații ale DM-lui și SDM-lui și observații asupra liniarității sistemelor pe 1 bit
Concepția unui codor pe 1 bit a fost stabilită de modulația delta (DM) și prefațează vasta adoptare a LPCM-lui. În forma sa ce a mai simplă, constă într-un comparator cu o bucla de reacție negativă, conținând un integrator în calea de reacție, după cum se vede în fig. 1-1.
Figure 1-1 Modulatorul delta (DM) de ordin 1 (cu un singur integrator)
Transformarea clasică a acestei topologii din DM în SDM a fost prezentată prima dată de către Inose și Yasuda în 1962/63 și este prezentată în fig. 1-2.
Figure 1-2 Reconfigurarea DM-lui în SDM.
Motivul pentru care această transformare este reprodusă este acela că forma DM-lui are o legătură mai strânsă cu LPCM-ul. De exemplu, este posibil să simulăm operația unui DM de ordin 1, folosind un model cu buclă deschisă, cu constrângeri asupra ratei de creștere (slew-rate), aplicate pentru a activa condiția de supraîncărcare a pantei. Supraîncărcarea pantei este introdusă atunci când codul de la ieșire e o secvență numai de ’1’ sau numai de ’0’, iar semnalul eroare în bucla de ordin 1 depășește o treaptă de cuantizare. Din moment ce modelul folosește un cuantizor uniform, atunci pragul de supraîncărcare a pantei nu este depășit, poate fi adăugat ditherul iar operația liniară este dedusă ca pentru LPCM. Cercetările recente au arătat că în cazul de suprasarcină fără pantă, DM-ul este echivalent cu modulația de fază, cu timp cuantizat.
În consecință, liniaritatea codării în cazul codorului pe 1 bit este definită în locul în care semnalul refăcut poate fi configurat, într-o anumită etapă, ca LPCM și unde în timpul cuantizării ditherul adecvat este aplicat, iar semnalul este constrâns astfel încât să nu apară limitări sau orice fel de distorsiuni ale limitării pantei.
Pentru a ilustra această definiție, fig. 1-3 arată un DM cu buclă deschisă care include circuite de limitare a pantei.
Fig. 1-3. DM de ordin 1, cu buclă deschisă, cu circuit de suprasarcină a pantei
În esență, sunt 2 convertoare rapide intercalate, constând într-un banc de comparatoare și bistabile de tip D, intercalate pe cicluri de ceas alternative, pentru a simula cuantizarea unui DM de ordin 1. Totuși, bistabilii de tip D sunt de asemenea conectați vertical pentru a funcționa ca un registru de deplasare sus/jos de tip termometru, astfel încât succesiunea în sus și în jos a impulsurilor ’1’ este constrânsă de către rata de tact. Aceasta implementează chiar condiția de supraîncărcare a pantei unui DM de ordin 1. Codul de ieșire multi bit/ multi nivel al registrului vertical este apoi diferențiat logic pentru a forma secvența de ieșire binară. Cele 2 cuantizoare intercalate sunt reprezentate explicit în fig. 1-4a, deși în această configurație a fost omis circuitul de supraîncărcare a pantei. Totuși, introducând pe eșantioanele alternante o compensare de jumătate de treaptă de cuantizare, aceeași operație, deci și performanța canalului redundant, poate fi obținută folosind un singur cuantizor, după cum se vede în fig. 1-4b. În fig. 1-4a atât o pantă pozitivă, cât și una negativă, sunt supraimpuse la ieșirea fiecărui cuantizor, care apoi simulează comportamentul canalului redundant al DM-lui de ordin 1. Totuși, furnizându-i semnalului de intrare un dither, acesta este limitat astfel încât secvența de ieșire a cuantizorului diferențial să nu depășească limita de +1 sau -1, atunci codorul este liniar în cadrul învelișului de codare al DM-lui. Dacă pe de altă parte secvența de la ieșirea diferențială depășește această limită, atunci DM-ul ar cere limitarea pantei, iar aceasta ar implica o eroare suplimentară, care nu ar putea fi limitată de cea a unui cuantizor liniar. Acest mecanism stă la baza identificării comportamentului neliniar al DM-lui și prin deducție, a comportamentului SDM-lui.
Fig. 1-4a DM de ordin 1, cu buclă deschisă, fără suprasarcină a pantei
Fig. 1-4b DM de ordin 1, cu buclă deschisă, fără suprasarcină a pantei
SDM-ul și DM-ul pot suporta, în mod normal, un al doilea integrator, pentru a îmbunătăți performanțele codării, deși mai mult de 2 integratoare necesită o proiectare atentă a buclei pentru a asigura stabilitatea, lucru care reprezintă o consecință directă asupra suprasarcinii pantei, constrângând ieșirea. Este interesant că atunci când fie modelul din fig. 1-3, fie cel din fig. 1-4, includ integrarea într-o buclă cu reacție, această buclă aparentă de ordinul 1 este de fapt aceea a unui SDM/DM de ordinul 2. Fig. 1-5 indică integratorul suplimentar din calea de înaintare, în timp ce fig. 1-6 înlocuiește structura DM cu buclă deschisă cu o buclă cu reacție echivalentă, de ordinul 1. În final, în fig. 1-7 aceasta este reconfigurată pentru a forma SDM-ul de ordin 2 clasic, unde echivalența ar trebui să fie observată, deși această formă în scară include limitarea suprasarcinii pantei. În consecință, regimul liniar al codorului pe 1 bit poate fi determinat luând în considerare modelul echivalent care conține unul sau mai multe cuantizoare uniforme și care limitează semnalul de la intrare, astfel încât modulul ieșirii diferențiale să nu depășească unitatea. Aceasta se aplică atât pentru modelul de integrare simplu, cât și pentru cel dublu.
Fig. 1-5 DM în buclă deschisă cu un singur integrator în buclă de reacție negativă
Fig. 1-6 DM de ordinul doi echivalent (integratorul în calea înainte)
Fig. 1-7 DM clasic de ordinul 2
Dacă se anulează condiția de suprasarcină a pantei, permițându-i limitei semnalului diferențial să fie mai relaxată, se poate deduce liniariatea. Eliminându-se condiția de suprasarcină a pantei se permite, de asemenea, formarea zgomotului de ordin mare. În cazul de față o combinație de cod multi-nivel și formare de zgomot oferă un avantaj fundamental față de sistemele care folosesc numai codul pe 1 bit, fiindcă activează codarea liniară.
2.3. Supraeșantionarea, formarea zgomotului și egalizarea.
Aplicarea formării zgomotului a fost cercetată în amănunt pentru o serie de aplicații care includ ADC, DAC și PWM împreună cu recuantizarea semnalului, ca parte a unei arhitecturi de prelucrare a semnalelor mai generală. Un procesor de semnal include cuantizarea uniformă cu dither optimal, apoi se poate face un schimb între amplitudinea rezoluției și frecvența de eșantionare. De asemenea, se poate modifica relația între nivelul zgomotului și limitarea amplitudinii, prin includerea egalizării complementare cu preaccentuare și dezaccentuare.
Un codor cu front de sfârșit împreună cu un decodor complementar sunt reprezentate în fig. 2-1, care folosește un egalizor în cascadă cu un formator de zgomot de ordinul k.
Fig. 2-1 Formarea zgomotului, preaccentuarea și dezaccentuarea
Presupunem că sursa informației este codată cu LPCM iar frecvența de eșantionare este 8*fS. Scopul este utilizarea unei rate de eșantionare suficient de mare astfel încât să se obțină o mare parte din avantajul lungimii de bandă din SDM, dar cu avantajul suplimentar al liniarității, obținută prin folosirea unui cuantizor uniform multi-nivel cu dither. În forma sa de bază, ieșirea recuperată este derivată folosind un filtru complementar dezaccentuat, în cascadă cu ieșirea formatorului de zgomot.
Ținta acestui procesor este aceea de a simula, cât mai corect posibil, performanța unui sistem LPCM pe 24 biți, cu excepția unei relaxări la limita de suprasarcină de înaltă frecvență, pentru a se potrivi cu caracteristica semnalelor audio reale. Acestea fiind spuse, spectrul zgomotului din afara benzii 0-24 kHz ar trebui să fie asemănător cu nivelul zgomotului LPCM-lui pe 24 biți, deși această condiție poate fi mai blândă în regiunea ultrasonică. O abordare directă este aceea de a pune în cascadă un egalizor și un formator de zgomot, după cum se vede în fig. 2-1. Datele de la ieșirea egalizorului trebuiesc doar să mai fie trunchiate într-un cuvânt de lungime compatibilă cu lungimea cuvântului de la intrarea formatorului de zgomot (de ex. 32 biți), astfel încât cu ajutorul unei proiectări adecvate, să apară un compromis minim. Totuși, dacă folosim structura din fig. 2-2a, atunci ambele rețele, atât cea de preaccentuare cât și de dezaccentuare sunt controlate de același semnal cuantizat, cuantizarea putând fi inclusă în bucla codorului, împreuna cu propriul său dither.
Fig. 2-2 a, b Sistem conceptual care combină egalizarea cu formarea zgomotului, împreună cu modelul zgomotului
Sincronizând ditherul codor-decodor (sau fără să folosim dither), același semnal poate fi refăcut la ieșirea lanțului de codare. Se obține egalizarea complementară folosind topologia clasică cu reacție negativă – cu reacție pozitivă, care este similară din punct de vedere conceptual cu prima de acest tip folosită în Dolby – un sistem de reducere a zgomotului, deși aceasta a fost o realizare analogică. Pentru a investiga efectul a două procese de cuantizare din interiorul acestui sistem, în modelul zgomotului aditiv din fig. 2-2b sunt reprezentate sursele de zgomot înainte și înapoi, qf si qr.
Se folosește un model cu zgomot aditiv pentru ca ambele cuantizoare (deși diferite) sunt uniforme și se consideră că ditherul folosit este optim. Totuși, o problemă apărută la această metodă o reprezintă posibilele constrângeri suplimentare asupra stabilității, mai ales când se folosesc formatoare de zgomot de ordin mare; astfel egalizoarele în cascadă s-ar putea dovedi mai ușor de folosit și au fost implicate în simulările prezentate în capitolul 5.
O caracteristică a topologiei formatorului de zgomot indicat în fig. 2-1 și 2-2 este că funcția de transfer a semnalului este 1. Acest lucru se obține prin includerea unei căi cu înaintare direct la intrarea cuantizorului și, de asemenea, decalând intrarea principală cu o perioadă de eșantionare, cu scopul de a compensa pentru întârzierea cu o unitate a eșantionării în calea cu reacție. Acest proces este demonstrat în analiza următoare, împreună cu egalizarea complementară.
Secvența intermediară Vint(z) poate fi exprimată în funcție de secvența de intrare Vin(z) și de sursele de zgomot qf și qr în felul următor:
2-1
iar ieșirea refăcută Vout(z) este:
Vout(z) = Vint(z)(1 + z-1E(z)) + z-1qr 2-2
Deci, înlocuindu-l pe pe Vint(z), funcția de intrare-ieșire este:
2-3
Furnizând același semnal eroare, qr se regăsește atât în codor cât și în decodor, iar atunci ieșirea finală este independentă de zgomotul de trunchiere din canalul lateral. Acest lucru sugerează că nu este necesar ditherul în trunchierea ieșirii canalul lateral, eliminând necesitatea sincronizării ditherului.
Ecuația 2-3 confirmă că funcția de transfer global a semnalului are valoare unitară, în timp ce funcția de transfer a zgomotului este (1 + z-1H(z))-1. Totuși, o analiză a semnalului intermediar ne arată că E(z) realizează preaccentuarea, fenomen dat de funcția (1 + z-1E(z))-1 care are un efect direct asupra performanței suprasarcinii. Suprasarcina poate fi specificată prin plasarea unei limite a domeniului frecvenței asupra semnalului intermediar Vint(f), dirijat de către o funcție W(f), astfel încât:
Vint(f) |W(f)| ≤ λ 2-4
unde λ este o constantă. Totuși, pentru a determina |W(f)|, trebuie să se determine funcția de transfer a etajului de codare intermediar, care depinde în mod direct de numărul de diferențiatoare în cascadă (vezi ecuația 3-3).
2.4. Codarea diferențială fără pierderi
Capitolul 1 a descris o metodă care a combinat egalizarea și formarea zgomotului. În acest capitol, sunt explorate eficiențe mai mari, prin folosirea codării diferențiale multi-nivel fără pierderi, caz în care cercetarea noastră încorporează cel mult 3 etaje, împreuna cu corecția suprasarcinii. Codarea diferențială necesită integrarea ulterioară pentru a reface semnalul, deci este imperios necesar să nu fie erori între etajele de codare și decodare care conțin saturarea sau recuantizarea. În practică, pentru a reseta integratoarele în scopul luării în considerare a erorii, este necesară o cantitate mică din informația canalului lateral. De asemenea ”cuplarea AC” efectivă ar trebui întrebuințată în decodor pentru a elimina devierea semnalului pe termen lung și pentru a-l proteja împotriva regimului de pornire tranzitoriu. Totuși, se va arăta în capitolul 4 că sunt permise anumite distorsiuni, având în vedere că aria de sub secvența codată nu se schimbă într-o perioadă de timp dată și că erorile undelor de ordin înalt esențiale sunt ajustate.
Figura 3-1 indică un procesor fără pierderi cu 2 etaje care folosește integrarea și diferențierea complementară, deși pot fi adăugate etaje suplimentare de diferențiere și integrare.
Fig. 3-1 Diferențiator și integrator complementare, pe 2 etaje
Transformatele Z pentru codare, respectiv decodare, sunt
Ten(z) = (1 – z-1)2 3-1
și
Tdec(z) = (1 – z-1)-2 3-2
Din ecuația 3-1 se obține răspunsul în frecvență al amplitudinii codării, |EN(f)| ca fiind:
|EN(f)| = 3-3
Totuși, fiindcă codorul diferențiază ieșirea formatorului de zgomot, se obține un avantaj de codare dacă se limitează banda ieșirii formatorului de zgomot, pentru a minimiza rata schimbării. Un proces simplu poate media peste 2 eșantioane vecine, iar această opțiune a fost inclusă în model. Totuși, apare o problemă interesantă când semnalul are banda limitată, el producând cuvinte mai lungi la ieșire, pentru a putea crește diferența dintre eșantioane alăturate în funcție de treapta de cuantizare; astfel, trebuie găsit un echilibru.
2.5. Limitarea blândă a amplitudinii folosind corecția dispersivă
Pentru a se limita rata de bit a unui codor diferențial de ordinul N, lungimea cuvântului de ieșire trebuie să fie limitată, implicând limitarea amplitudinii și eroarea semnalului refăcut. Totuși, din moment ce decodarea poate conține până la N=3 integratoare în cascadă (vezi capitolul 3), orice modificare necontrolată a semnalului codat poate cauza divergențe în semnalul refăcut. Astfel, când apare limitarea distorsiunii, trebuie conservată suprafața impulsului, astfel încât semnalul integrat să rămână stabil și să conveargă către nivelul dorit. Totuși, deși e necesară o controlare a mediei semnalului, ea este insuficientă, demonstrându-se că trebuie să se țină cont și de erorile din undele integrale care rezultă din dispersia impulsului.
Introducând dispersia în timp, măsurată corespunzător, în elementele semnalului care sunt supraeșantionate, se poate păstra aria semnalului. Pentru a demonstra procesul de corecție apărut în codor, în fig, 4-1 este afișat principiul.
Fig. 4-1 Corecția dispersivă în domeniul timp a unei erori de suprasarcină
În prima formă de undă se reprezintă un impuls care depășește pragul, unde componenta eroare este hașurată. Primul exemplu utilizează o procedură de corecție a impulsului cu o singură corecție a frontului din spate, unde amplitudinea în exces a eșantionului n este transmutată și adăugată eșantionului n+1, în mod consecvent când impulsurile n și n+1 sunt considerate împreună, zona lor totală este conservată. Totuși, deși zona de sub această curbă este corectă și rezultă în primul integrator ce converge la valoarea corectă, există pierderi finite în zona de sub primul integrator. În consecință, al doilea integrator nu converge la valoarea corectă (ar trebui utilizate 2 sau mai multe etaje de diferențiere-integrare).
Al doilea exemplu ne arată o procedură similară, dar aici jumătate din amplitudinea în exces a eșantionului n este adaugată eșantionului n+1, iar cealălaltă jumătate este adăugată eșantionului n-1. Acest proces realizează o dispersie a erorii simetrică în timp, cu eroarea rămânând centrată simetric pe eșantionul n, efectul fiind asemănător cu distorsionarea simetrică cu rată de creștere. Totuși, deoarece impulsurile au amplitudinea cuantizată și multe rămân așa când se adaugă dispersia erorii, apoi eroarea de suprasarcină se împarte în două părți egale, este necesar ca eroarea să aiba ca valoare un număr par de trepte de cuantizare. În consecință, dacă eroarea de suprasarcină este un număr impar de trepte de cuantizare, atunci eroarea este mărita artificial cu o treaptă, înaintea divizării. Formele de undă reprezentate în fig. 4-1 dezvăluie că nu mai este o eroare în zona de sub forma de undă a primului integrator, doar o mică redistribuire a formei de undă în timp. Totuși, făcând trecerea la cel de-al doilea integrator, după cum se vede în fig. 4-2, se păstrează eroarea în zona de sub curbă, implicând apariția unei erori de convergentă în forma de undă cu al treilea integrator. Aceasta necesită prelucrare suplimentară pentru a garanta acuratețea celui de-al treilea integrator, lucru care este relevant dacă se folosesc trei etaje de diferențiere-integrare.
Fig. 4-2 Realizarea unei integrări pe 2 etaje
Pentru a face corecția, pentru eroarea de convergență în cel de-al treilea integrator, se folosește o secvență de substituție cu 5 impulsuri simetrice, după cum se vede în fig. 4-3.
Fig. 4-3 Substituția cu 5 impulsuri pentru corecția erorii în cel de-al treilea integrator
În toate calculele care urmează formele de undă sunt integrate de la secvența de început, la eșantionul n-2, până la secvența de sfârșit, la eșantionul n+2. Pentru o corecție a erorii acceptabilă, eșantioanele n+2 și cele următoare, din forma de undă a celui de-al treilea integrator, trebuie să fie identice cu acelea ale formei de undă fără limitare din cel de-al treilea integrator. În integrator, secvențele cu 5 impulsuri la eșantionul n + 2, sunt evaluate și comparate cu acelea de la eșantionul fără limitare după cum urmează:
Pentru primul integrator, evaluat la eșantionul n+2,
L = a0 + 2(a1 + a2)
Pentru al doilea integrator, evaluat la eșantionul n+2,
L = a0 + 2(a1 + a2) 4-1
Pentru al treilea integrator, evaluat la eșantionul n+2,
6L = 6a0 + 13a1 + 16a2 4-2
Notând eroarea de la eșantionul n cu e și după ce se introduce în ecuație cu suma impulsurilor de substituție la eșantioanele n-1, n-2, n+1, n+2, atunci
e = 2(a1 + a2) 4-3
și după ce se rezolvă ecuațiile 4-1, 4-2 și 4-3 se obțin amplitudinile celor 5 impulsuri de substituție:
a0 = L – e 4-4
a1 = 2/3 e 4-5
a2 = -1/6 e 4-6
Ecuația 4-6 dezvăluie o creștere cu 1/6 a erorii e. Ca o consecință, erorile trebuie să fie cuantizate cu multiplii a de 6 ori treapta de cuantizare, pentru a evita viitoarele distorsiuni de cuantizare, dacă este de evitat o creștere în rezoluția ieșirii.
Procedura de corecție funcționează în următorul mod: mai întâi sunt calculate diferențialele nedistorsionate (fie cu 1 etaj, 2 sau 3 etaje, depinde de preferințe) de la ieșirea formatorului de zgomot. Apoi rezoluția codului de la ieșire stabilește nivele de tăiere superior și inferior. Când apare o eroare de suprasarcină, valoarea absoluta a unui eșantion este redusă cu cel mai apropiat multiplu al de 6 ori treptei de cuantizare. Apoi cele 4 impulsuri de substituție rămase sunt calculate și adunate cu eșantioanele adiacente, în secvența de ieșire. Forma de undă rezultată este apoi scanată din nou pentru erori, dacă rămân unele, procedura este repetată ori de câte ori este nevoie, până când rezultatul de la ieșire se încadrează în limitele suprasarcinii. Deoarece formarea zgomotului este folosită înaintea diferențierii, ar putea apărea diferențe considerabile între impulsuri, astfel încât dacă un impuls este de, să zicem, valoare pozitivă mare, atunci impulsurile adiacente sunt de obicei negative pot ajusta eroarea fără supraeșantionare; acest factor ne ajuta la ajustarea secvențelor de eroare dispersivă.
Procedura poate fi extinsă la integratorul de ordinul 4 folosind o substituție de 7 pulsații simetrice, unde dacă de folosește o abordare asemănătoare celei anterioare (dar aplicată de la n-3 la n+3) se obține:
e = 2(a1 + a2 + a3 )
Pentru primul integrator, evaluat la eșantionul n+3:
L = a0 + 2(a1 + a2 + a3 )
Pentru al doilea integrator, evaluat la eșantionul n+3:
L = a0 + 2(a1 + a2 + a3 )
Pentru al treilea integrator, evaluat la eșantionul n+3:
10L = 10a0 + 21a1 + 24a2 + 29a3
și pentru al patrulea integrator, evaluat la eșantionul n+3:
4L = 4a0 + 9a1 + 12a2 + 17a3
de unde rezultă:
a0 = L – e 4-7
a1 = – 0.5e 4-8
a2 = 1.7e 4-9
Factorul 1.7 implică o valoare minimă pentru e de 10 ori treapta de cuantizare, determinând coeficienții pulsației din secvența de substituție a0 = L-10, a1 = 5, a2 = 17, a3 = 7. Totuși, coeficientul a2 fiind mai mare decât a0 implică câștigul, astfel încât este o probabilitate crescută ca această substituție ar putea să împingă eșantioane adiacente în limitare astfel această corecție de ordin mare nu a fost expusă în studiul de față.
2.6. Concluzii
Inițial acest articol a revizuit situația fundamentală a distorsiunilor nonliniare în codoarele cu flux de biți, apoi a continuat cu descrierea unei metode de codare a semnalului care combină formarea zgomotului cu codarea diferențială, cu scopul de a reduce lungimea cuvintelor. O caracteristică particulară a acestui studiu a fost dispersia în timp controlată, cu scopul de a îmbunătăți performanța suprasarcinii. Au fost prezentate rezultate pentru a confirma operația procesului și pentru a demonstra toleranța la suprasarcină. O caracteristică principală este aceea că pentru semnalele audio din gama medie spectrul erorii rămâne cu o caracteristică gen zgomot și nu indică caracteristicile obișnuite ale distorsiunii de limitare. Performanța acestei distorsiuni se obține din utilizarea integrării cu 3 etaje, care urmează limitării, lucru care furnizează un câștig spectral în amplitudine și împreună cu corecția cu 5 impulsuri dispersive menține o fidelitate a formei undelor.
Există o gamă largă de parametrii de sistem care pot fi selectați și există o interdependență între ordinul formatorului de zgomot, raportul de supraeșantionare și selectarea lungimii cuvântului de la ieșire (priori la diferențiere). Caracteristica mediei eșantioanelor adiacente s-a dovedit a fi avantajoasă atunci când semnalul de ieșire al etajului diferențiatorului a fost influențat de activitatea formatorului de zgomot. Odată ce nivelul semnalului a crescut deasupra ”zgomotului” formatorului de zgomot, a avut o formă mai coerentă astfel încât media a ridicat nivelul semnalului.
Se anticipează că pot apărea îmbunătățiri asupra funcției de transfer a formatorului de zgomot prin introducerea zerourilor la transmisie pentru a micșora distorsiunea cuantizării, în regiunea de 20 kHz. De asemenea, atunci s-ar putea obține o mai bună proiectare a caracteristicii de preaccentuare și dezaccentuare. Este de asemenea evident că pentru sistemele care folosesc o rată de bit mai joasă, principalul compromis este în depășirea la frecvență înaltă. Totuși, datorită probabilității de apariție la frecvență înaltă, semnalele de amplitudine mare sunt mai joase, atunci s-ar putea dovedi atractivă codarea cu rată de bit variabilă, prin atribuirea, în aceste circumstanțe, a unor cuvinte de lungime mai mare.
În final, rezultatele au confirmat caracteristicile distorsiunilor mici, inerente într-un codor care folosește LPCM, în opoziție cu codul pe 1 bit. Totuși, câștigurile din gama dinamică de joasă frecvență obținute cu procesarea complementară din integratorul diferențial sunt semnificative, iar aceasta este considerată o trăsătură importantă pentru canalele care tind către rate de date înalte.
3. AVANTAJUL CODĂRII PE 1 BIT – DOVEZI PENTRU ÎNREGISTRĂRILE VIITOARE
Pentru a putea discuta despre capacitățile și beneficiile oferite de aceste aparate de înregistrare, am pregătit mai întâi domeniul audio digital. În cadrul său, vom explora și discuta actualele tehnici audio digitale PCM și câteva dintre principiile și avantajele oferite de înregistrarea pe 1 bit, ambele în termeni ai fidelității și arhivării pentru viitoarele utilizări.
Captarea informației audio pe 1 bit/ 5.6 MHz permite ca înregistrările să fie arhivate cu cea mai înaltă calitate care a fost vreodată disponibilă consumatorilor și utilizatorilor profesioniști și permite re-intenționarea și distribuirea înregistrărilor arhivate în orice tip de format PCM actual, în timp ce păstrează fișierele audio originale pentru tipurile de formate viitoare.
Tehnologia înregistrării pe 1 bit nu este nouă în domeniul pro audio. A fost inițial dezvoltată de Dr. Yoshio Yamasaki, la sfârșitul anilor 80, la Universitatea Waseda din Japonia. Dr. Yamasaki a brevetat procesul pe 1 bit în 1992 și a intrat în istorie datorită cercetării și dezvoltării tehnologiei pe 1 bit. Tehnologia a fost adoptată și promovată de către Sony și Philips, drept o înregistrare a fluxului digital direct (DSD), în configurația SACD, iar aceste SACD-uri pe 1 bit au fost disponibile în comerț începând cu anul 1999.
3.1. Domeniul audio digital – scurt istoric
În sistemele analogice clasice fidelitatea și gama dinamicii erau limitate de către mediul fizic pe care erau imprimate – casetă, discuri vynil etc.
Introducerea audio digitalului. În toamna lui 1982 (primăvara lui 1983 în SUA), CD-ul a introdus înregistrările audio digitale pe piața consumatorilor. Domeniul audio digital oferea o serie de îmbunătățiri față de sistemele audio analogice – adică fidelitatea mai mare și gama dinamică crescută, furnizate de reproducerea nonmecanică. În plus, posibilități mai mari de stocare și arhivare.
Ce înseamnă audio – digital? În principiu, audio digitalul analizează un semnal audio continuu luând eșantioane în anumite puncte, de-a lungul acestei curbe. Când ne referim la eșantionare – conversia semnalelor audio analogice în date digitale, de obicei luăm în considerare două specificații: adâncimea bitului și frecvența de eșantionare.
În exemplul de mai sus, punctele albastre reprezintă punctele de eșantionare extrase din acest semnal audio. Liniile verticale reprezintă frecvența de eșantionare sau rata de eșantionare. Aceasta este exprimată în Hz, semnificând câte ”citiri” se fac pe fiecare secundă. Liniile orizontale reprezintă adâncimea bitului sau rezoluția. Primul lucru pe care îl observăm este acela că punctele nu reprezintă cu acuratețe semnalul original. Asta se datorează faptului că rezoluția, în cazul acestui exemplu, este destul de mică.
În cazul CD-lui înregistrarea s-a făcut folosind o adâncime a bitului de valoare 16, iar frecvența de eșantionare de 44.1 kHz (numită de obicei 16 biți / 44.1 kHz). Vom explica cum au fost alese aceste numere. Urechea umană reacționează la semnale audio în plaja de frecvență 20 Hz (20 cicluri pe secundă)– 20 kHz (20000 de cicluri pe secundă). Cercetările au dovedit că pentru a se face eșantionarea cu acuratețe, rata de eșantionare trebuie să fie mai mare decât dublul frecvenței celui mai înalt punct eșantionat. Această condiție este cunoscută sub numele de teorema Nyquist.
În graficul de mai jos, frecvența de eșantionare este de numai 30 kHz, pe când frecvența semnalului audio este de 20 kHz. Liniile punctate indică semnalul obținut din eroarea de eșantionare. Aceste erori se numesc zgomot de aliere.
După cum am menționat, urechea umană acoperă o gamă de frecvențe până la 20 kHz, iar teorema Nyquist ne spune că trebuie să eșantionăm la o frecvență puțin mai mare decât dublul acesteia. Acesta este motivul pentru care, în cazul CD-lui, se folosește frecvența de eșantionare de 44.1 kHz. Este cea mai mică frecvență care asigură acuratețea eșantionării de-a lungul întregului domeniu audibil.
Adâncimea bitului pentru eșantionare este exprimată în puteri ale lui 2 – 8, 16, 24, etc. Ratele de bit mai adânci furnizează o definire mai detaliată în domeniul audio, mărind acuratețea și curățenia semnalelor de nivel mic, înainte de a se pierde în nivelul de zgomot. Aceasta înseamnă că gama dinamică a sistemului este crescută prin scăderea intensității gamei, sau semnalele cu nivel întreg sunt mai ușor de reprezentat. Este cazul semnalelor mai scăzute în intensitate și al căderii în liniște, când devin sesizabile inexactitățile multor sisteme. Mărind adâncimea bitului de la 8 la 16 se obțin rezultate semnificative, gama teoretică a dinamicii crescând de la 46 dB la 96 dB.
Rezoluția de 16 biți reprezintă o creștere semnificativă în gama dinamicii față de mediile de înregistrare analogice, care erau, de obicei, în jur de 50 -60 dB. Sistemele pe 8 sau 12 biți nu ofereau acest avantaj, astfel că s-a adoptat rezoluția de 16 pentru formatul CD-lui.
3.2 Progrese și discuții în tehnologia multi bit
Aproape de îndată ce a fost introdus CD-ul, au început să se profileze noi formate de eșantionare, oferind adâncimi de bit mai mari și timpi de eșantionare mai rapizi. Am putea presupune că ratele de eșantionare, combinate cu creșterea adâncimii bitului, ar îmbunătăți calitatea eșantionării/înregistrării. Și în multe privințe chiar o fac. Creșterea de la 16 la 24 biți furnizează o gamă utilă a dinamicii de aproximativ 110 dB, care deși e semnificativă, a avut o creștere considerabil mai mică în comparație cu revenirea la 16 biți. În timp ce fiecare creștere a adâncimii bitului produce o expansiune reală a gamei dinamicii, îmbunătățirile devin de fiecare dată mai mici.
Nu există dubii că actualele semnale audio pe 24 biți/ 192 kHz se aud foarte bine. Dar mai sunt încă zone care pot fi îmbunătățite și abordate dintr-o perspectivă diferită, cu alte beneficii unice.
Procesul de codare PCM multi-bit
Conversiile A/D și D/A sunt făcute pe biți puțini (de ex..1-bit) la rate de eșantionare mari, apoi unul din X eșantioane este păstrat (procesul de decimare).
Decimarea apare în timpul înregistrării (conversia A/D), apoi interpolarea și modulația sigma-delta apar în timpul redării (conversia D/A)
În mod surprinzător, majoritatea convertoarelor pe 24 biți folosesc de fapt conversia pe 1 bit la sfârșitul frontului. După captarea unui flux de mare viteză pe 1 bit, convertorul folosește un filtru de decimare pentru a schimba datele pe 1 bit în formatul multi bit dorit. Se poate face o explicare simplă a filtrului de decimare, care este de fapt un fel de convertor sau divizor al frecvenței de eșantionare, care împarte fluxul de 1 bit în numărul necesar de eșantioane pentru formatul multi bit. Adică elimină informația de eșantionare (într-un mod inteligent, desigur) care nu poate fi folosită.
De asemenea trebuie să conțină un filtru la jumătate din frecvența de eșantionare pentru a elimina alierile – de ex. pt 44.1 kHz este necesar un filtru cu frecvența 22.05 kHz. Din moment ce modelul filtrului influențează semnalul audio, pentru calculele matematice prezintă subiectivism considerațiile legate de fază, liniaritatea, răspunsul tranzitoriu și riplurile, care sunt, de fapt, responsabilitatea persoanei care a scris codul pentru filtrul de decimare.
În procesul D/A datele PCM stocate sunt din nou folosite pentru a le transforma în audio (de fapt, tehnic vorbind, sunt tot tensiuni electrice până ajung la difuzor). În timpul acestui proces, trebuiesc făcute mai multe calcule pentru a ”reasambla” datele într-un șir audio, inclusiv mai multe procese de estimare care încearcă să reconstruiască semnalul audio cât mai aproape de forma în care a fost captat inițial. Acestea includ interpolarea pentru a reconstrui o aproximare cât mai detaliată a semnalului analogic inițial, iar modulația sigma-delta este folosită pentru a controla zgomotul și erorile inevitabile care apar în timpul estimării informației.
Un obicei practic este acela de a folosi supraeșantionarea pentru playback, a dubla frecvența de eșantionare a unei surse, ”estimând” unde ar fi putut fi datele dacă s-ar fi facut înregistrarea la frecvență dublă. Deși poate fi eficient, acest proces rămâne tot o estimare și nu este la fel de bun precum captarea și memorarea informației, în primă instanță.
3.3 Avantajul codării pe 1 bit
Într-un sistem pe 1 bit, semnalul audio este înregistrat la rate de eșantionare super mari, de obicei 2.8824 MHz sau mai recent, 5.6448 MHz. La această frecvență sistemul pe 1 bit este capabil să redea frecvențe ale semnalului continuu până la 100 kHz, performanță care depășește toate celelalte sisteme digitale și chiar banda magnetică, care poate reda până la frecvența de 50 kHz. La aceste frecvențe înalte nu mai este nevoie de filtre cu bandă de trecere îngustă, astfel eliminându-se un posibil element de culoare din lanțul de codare.
Codarea pe 1 bit în comparație cu PCM
Înregistrează direct semnalul original pe 1 bit.
Conversia A/D se limitează la trecerea unui șir de impulsuri printr-un filtru trece jos analogic
Mai mult de atât, păstrând formatul pe 1 bit pe care convertorul deja l-a folosit, nu mai avem nevoie de filtrul de decimare în timpul înregistrării și de filtrul de supraeșantionare și interpolare în timpul redării audio. Deci ce avem la intrare găsim și la ieșire, fără calcule matematice suplimentare, astfel eliminându-se orice necesitate a transformării șir de date/semnal audio. Să nu uităm că filtrele de decimare și proiectarea lor au o influență foarte mare asupra sunetului în înregistrarea PCM, iar înregistrarea pe 1 bit elimină nevoia folosirii lor.
3.4 Mai puțin înseamnă mai mult
Sunt ușor de observat performanțele obținute prin frecvențe de eșantionare mari și foarte mari. Ceea ce ar putea crea confuzie este beneficiul trecerii de la rate de bit mari la 1 bit. În mod sigur rezoluția crescută a ratelor de bit mari trebuie să fie mai precisă, nu?
Conceptul de bază este că odată ce rata de eșantionare este crescută la nivele suficient de înalte, fiecare pas nu mai trebuie să fie descris atât de detaliat. Cu citiri atât de dese ale stării actuale a semnalului audio, fiecare pas trebuie să fie definit în cei mai simpli termeni – a crescut semnalul față de pasul precedent, a scăzut sau a rămas la fel ? Codarea pe un bit oferă doar două valori, 1 sau 0. Fie în sus pentru eșantionul precedent, fie în jos. La aceste viteze de super eșantionare, o stare stabilă poate fi reprezentată prin alternarea lui 0 și 1. Probabilitatea apariției unei erori într-un sistem de acest tip este mult mai mică decât în abordările multi-bit. Se ia în considerare că într-un sistem pe 1 bit valorile posibile pentru fiecare măsuratoare sunt simple, fie 1, fie 0, deci este o probabilitate mică să avem o valoare gresită. Într-un sistem pe 24 biți avem 16,777,216 valori posibile.
3.5 Adevărata importanță a tehnologiei pe 1 bit – dovezi pentru înregistrările viitoare
Cum am precizat mai devreme, înregistrările actuale pe 24 biți / 192 kHz furnizează rezultate foarte bune. Din moment ce beneficiile codării pe 1 bit sunt reale, cea mai mare satifacție a noastră este aceea că e primul format de la banda analogică încoace care merită să fie folosit ca o soluție pentru arhivare și pentru mixarea finală. Majoritatea experților sunt de acord că banda de înregistrare rămâne cel mai dorit mediu pentru mixarea finală, atunci când este posibil. Dar nu este un format pentru arhivare perfect, deoarece se degradează în timp, iar potențialul pentru ca playerele respective să existe pe piață în decadele următoare este puțin probabil.
PCM-ul multi bit produce rezultate bune, dar nu a reușit să atingă performanța de 5 Hz – 50 kHz a benzii de înregistrare. Și nu este ușor de transportat la alte formate dacă luăm în calcul viitoare variante. Luând în considerare un semnal pe 16 biți / 44.1 kHz pentru a-l utiliza în remasterare, formatul pe 24 biți / 192 kHz va produce o îmbunătățire sau un beneficiu puțin perceptibil. Nu se poate îmbunătăți calitatea materialelor arhivate fără să se fi captat toate nuanțele și acuratețea semnalului audio. Acesta este motivul pentru care remasterarea serioasă a înregistrărilor clasice recurge la benzile master originale – ele au cea mai bună gamă dinamică, cel mai bun răspuns în frecvență și nu necesită convesia cu rată de eșantionare a unor date deja folosite. Dacă ar fi fost mai ”rigide” ar fi fost bune, dar se degradează odată cu fiecare trecere de-a lungul capetelor aparatului și cu fiecare an care se scurge.
Reducerea datelor și filtrarea au fost principalele obiective ale PCM-lui până acum. Dar vremurile s-au schimbat. Capacitatea discurilor și memoria sunt foarte accesibile, de ordinul gigabiților. Capacitatea ratei datelor și chipseturile sunt destul de la îndemână și pot mânui cu ușurință fluxurile de date. Deci singurul motiv pentru care suntem nemultumiți de PCM este că nu au apărut aparate de înregistrare la prețuri rezonabile. Până acum.
Beneficiile înregistrării pe 1 bit
Posibilitatea înregistrării și redării sunetului, care este foarte apropiat de semnalul analogic original.
Se poate folosi ca o arhivă a cărei ieșiri să fie orice format al PCM-lui
Acum, având la îndemână întregistrări pe 1 bit la prețuri accesibile, putem alege să captăm semnalul audio cu cea mai bună rezoluție și acuratețe disponbile și să-l arhivăm fără manipulările care apar în procesele de decimare și interpolare. Arhivarea noastră nu este nuanțată de către acești pași și putem alege procesul de conversie dorit. Pe măsură ce tehnologiile de conversie continuă să se îmbunătățească, putem să ne întoarcem la aceste arhivări și să remasterăm proiectul pornind de la o sursă ”pură”. În felul acesta vom manipula semnalul audio o singură dată, prin sistemul ales pentru proiectul nostru.
Codarea audio pe 1 bit ca format al arhivei
Capabilă să fie convertită în orice standard PCM actual
Semnalul audio pe un bit poate fi mai ușor convertit în toate formatele posibile, necesare proiectelor noastre și este mai folosit în zilele noastre decât PCM-ul. Dacă înregistrezi mixul final sau arhiva masterată pe 1 bit, apoi avem posibilitatea trecerii la oricare dintre aceste formate, cu obținerea unor rezultate acceptabile.
4. FORMATE AUDIO DE ÎNALTĂ REZOLUȚIE PENTRU APLICAȚII DE ARHIVARE ȘI MASTERARE
Pentru a stoca semnalele audio de înaltă rezoluție cu prioritate eficientă față de randamentul DSD sau LPCM formatul datelor audio ar trebui să aibă o gamă dinamică și o lungime de bandă care să fie substanțial mai mari decât forma finală lansată. LPCM-ul simplu ar dicta o rată de bit excesivă. Prin urmare este necesară codarea care ține cont de conținutul ultrasonic scăzut al semnalului audio și de ratele de eșantionare înalte inerente. Sunt prezentate câteva strategii, fiecare capabilă de a avea rezoluție crescută, care sunt cotate în termeni de lungime de bandă și performanța zgomotului spectral, în comparație cu referința LPCM pe 24 biți, la 88.2 kHz. Candidații includ codarea diferențială fără pierderi în mai multe etape și modulația sigma-delta (SDM), în care e angajată cuantizarea multi-nivel și formarea zgomotului parametric, folosind un algoritm cu buclă de reacție. SDM-ul multinivel și SDM-ul pe 1 bit sunt apoi combinate pentru a forma o nouă clasă de formate pentru arhivare, unde codul de ieșire poartă simultan datele de rezoluție extinse precum și o copie exactă a codului DSD pe 1 bit. O astfel de clasă de formate e considerată o candidată pentru datele audio de arhivare deoarece nu numai că poartă datele audio cu rezoluție și lungime de bandă aflate substanțial în exces față de referința LPCM, dar reține, de asemenea, datele formatului lansat DSD.
4.1 INTRODUCERE
Introducerea domeniului audio de înaltă rezoluție cu lungime de bandă extinsă și gamă dinamică mai mare a ridicat o serie de probleme pentru aplicațiile de masterare, unde se pretinde calitate maximă în domeniul transmisiunii. Deși caracteristicile modulației liniare codate pe impuls (LPCM) și a fluxului digital direct (DSD) [1], [2] sunt diferite, ambele sunt capabile să aibă o gamă dinamică mare cu lungime de bandă extinsă, în comparație cu formatul CD-lui. Totuși, când se realizează prelucrarea semnalului, o parte din acest avantaj poate fi sacrificată, din moment ce fiecare etapă de procesare compromite inevitabil gama dinamicii. Formatul DSD bazat pe modulația sigma-delta pe 1 bit ridică cea mai mare problemă atunci când formatul pe 1 bit nu este bine adecvat prelucrării semnalului. Deși au fost publicate câteva idei inovatoare legate de prelucrarea semnalului pe 1 bit, arhitectura, oricum ar fi fost structurată, necesită întotdeauna conversia semnalului de la 1 bit la mai multi biți și apoi invers. Chiar dacă aceasta se face cu ajutorul unei arhitecturi integrate, recodarea fluxului de biți este fundamentală, cu posibilitatea inevitabilă a introducerii zgomotului adițional și a distorsiunii de codare.
În aceste articol un semnal de înaltă rezoluție este definit ca fiind un semnal care are o compatibilitate totală cu rata de eșantionare DSD de 64 x 44.1 kHz, scopul fiind să nu se introducă limitări de bandă inutile. Multe sisteme de masterare existente sunt bazate pe LPCM-ul cu o rată de eșantionare tipică între 1 și până de 8 ori frecvența Nyquist. Conversia la DSD sau DVD audio compatibil cu LPCM se aplică ca o etapă finală. Chiar și cu aceste rate de eșantionare mari este necesară limitarea benzii, care într-o mică măsură poate compromite adevăratul potențial și eleganța șirului de date DSD.
Articolele publicate anterior [4]-[6] au considerat 3 concepte de sistem principale:
LPCM-ul cu modelarea zgomotului cu codare diferențială fără pierderi
Formarea parametrică a zgomotului
Tehnici recursive pentru obținerea stabilității când este folosit un cuantizor cu rază restrânsă.
Acest articol va explora extensiile principiilor de codare fundamentale într-un efort de a identifica opțiunile codării liniare cu o gamă dinamică înaltă și lungime de bandă largă, potrivită pentru masterarea și păstrarea inițială la un nivel de rezoluție în exces al lansării formatului final de înaltă rezoluție. Principalul obiectiv este de a menține o rată de eșantionare crescută care să permită menținerea întregului potențial al DSD. Lucrarea este teoretică dar este susținută pe parcurs de simulările în Matlab pentru a demonstra performanțele tehnicilor prezentate. Se discută un număr de abordari, bazate pe codarea diferențială și SDM-ul cu cuantizare multinivel și rate mari, împreună cu structuri hibride care integrează SDM și LPCM, cel din urmă menținând abilitatea de a extrage direct codul pe 1 bit. Aceste tehnici sunt comparate și cotate față de un LPCM pe 24 de biți la o frecvență de eșantionare de 88.2 kHz.
Ce este considerat esențial este un format de semnal intermediar [7]. Ideea este că prelucrarea normală a semnalelor ar fi realizată în standardul LPCM, chiar dacă cu o rată de eșantionare mare, corespunzător cu standardul DSD. Cu toate acestea, asumarea unui format de 24 biți ar necesita o rată tipică de 24 x 64 x 44.1 kb/s=67.7376 Mb/s pe canal. Pornind de la aceasta este necesar un cod intermediar care memorează majoritatea, dacă nu tot avantajul formatului LPCM, dar este poziționată la o rată de bit mai ușor de controlat pentru o păstrare temporară.
CODAREA DIFERENȚIALĂ FĂRĂ PIERDERI
O propunere timpurie [4] a explorat codarea diferențială, ca un scop de a comprima gama amplitudinii, folosită în aplicațiile de înaltă rezoluție. În acel sistem o buclă pentru formarea zgomotului precedă un codor diferențial multinivel. Cu toate acestea, în acest articol se explorează un format simplificat, care folosește doar codarea diferențiala simplă ca un compresor fără pierderi. Deși scopul este operația fără pierderi, este nevoie de restricții asupra lugimii cuvântului de ieșire. Pornind de la aceasta compresia nonliniară este inclusă pentru a ține cont de supraîncarcarea ocazională, dar totuși pentru a permite o reconstrucție nondivergentă a semnalului codat.
Bineînțeles există metode eficiente de codări cu pierderi bazate pe tehnici predictive liniare (LPC) [8]. Cu toate acestea, se ia în considerare aici o clasă specifică de semnale de înaltă rezoluție, unde, după cum s-a stabilit, rata de eșantionare este mare, cu o valoare de bază setată la valoarea tipică de 64 x 44.1 kHz, pentru a asigura compatibilitatea adecvată cu DSD. Aceasta este substanțial mai mare decât frecvențele Nyquist în contextul LPCM și în spectrul semnalului acustic. Din moment ce energia din semnalele audio tipice se diminuează rapid în regiunea ultrasonică, o rată de supraeșantionare mare oferă avantaje considerabile unui codor diferențial multinivel, fiind o corelație mare între eșantioane, corelație care se întinde pe un anumit număr de eșantioane. De asemenea, o cascadă de etaje diferențiale poate fi transformată într-un filtru echivalent cu răspuns finit la impuls (FIR), care permite ca structurile de filtre complementare FIR-IIR să fie folosite în sistemul codor-decodor general.
Semnalul de intrare prezentat codorului diferențial este supraeșantionat LPCM (de ex., de 64 ori supraeșantionat) și presupune utilizarea ditherului de banda larga triunghiular avand amplitudine 2 trepte de cuantizare [9]. Aceasta elimină necesitatea folosirii unui filtru trece jos cu banda de tranziție îngustă deoarece în practică o mare parte a energiei semnalului audio ocupă doar o fracțiune relativ mică a spațiului disponibil al semnalului, pe când ditherul ne asigură că spectrul zgomotului de cuantizare este uniform peste jumătate din lărgimea benzii Nyquist. Pentru a preveni erorile aritmetice este folosită aritmetica întreagă cu o cuantă LPCM. Aceasta este critică din moment ce erorile de rotunjire ar duce la divergențe în timpul decodării integrale. De asemenea formarea zgomotului nu este recomandată priori la filtrarea diferențială fiindcă orice zgomot emfazic de frecvență mare minimizează avantajul codării diferențiale.
În utilizarea codării diferențiale urmează ca decodarea semnalului să fie făcută prin mai multe etape de integrare. Evident un asemenea proces nu tolerează erori, cu excepția compresiei construite foarte atent și a tăierii [4]. Așadar este necesar să specifici exact condițiile inițiale și de asemenea să fie furnizate informații adiționale pentru a permite ca erorile de urmarire la codare-decodare, intrare-ieșire, să fie corectate. Utilizarea tehnicilor servo DC pentru a limita caștigul DC al decodorului integral este de asemenea o opțiune pentru a elimina propagarea erorilor pe termen lung, rezultate din informație sau din condițiile inițiale. Într-un sistem practic este recomandată codarea eroare-detecție-corectare care ar putea reflecta schemele implementate în CD și DVD. Aceasta ar adăuga o depășire în gama de 20 -50 %, în funcție de nivelul de protecție necesar.
Cum s-a raportat mai devreme [4] procesul diferențial de bază este definit în domeniul z ca
D1(z-1) = 1 – z-1
unde z-1 corespunde unei întârzieri de eșantionare la rata de eșantionare a sistemului de 64 x 44.1 kHz. Pentru un sistem de ordin N (unde N se referă la numărul de etaje în cascadă) operatorul diferențial DN(z-1) este
DN(z-1) = (1-z-1)N (1)
Simulările au indicat că ordinele până la 6 sunt adecvate pentru clasa de sisteme luate în considerare aici, determinând o familie de operatori diferențiali cu polinoamele:
Operatorii diferențiali sunt implementați aici folosind un filtru FIR cu coeficienți întregi. Fig. 1 indică arhitectura de baza, unde un decodor complementar este construit folosind o topologie recursivă, astfel pentru un operator de ordin N
DN(z-1) = 1 + (2)
și operatorul de decodare – integrare complementar, de ordin N, IN(z-1) este
IN(z-1) = (3)
Deoarece decodorul este o structură recursivă este important ca codorul și decodorul să fie corect sincronizate, în funcție de variabilele lor structurale. În acest fel se urmărește ca secvența de ieșire z(n) să egaleze secvența de intrare x(n) și pentru aritmetica întreagă acest proces este exact. Asumându-ne aceste condiții, nu este necesar ca filtrele recursive să fie stabile în sens general din moment ce sincronizmul permite urmărirea exactă a semnalului. Bineînțeles, dacă apare o eroare de transmisiune, decodorul este deviat ca și codor iar decodorul încetează să mai urmarească pista. O caracteristică a unui codor diferențial este aceea că preaccentuează conținutul de frecvență înaltă și menține banda de joasă frecvență la un nivel foarte redus. Presupunând că semnalul audio are un conținut ultrasonic scăzut, atunci la prima vedere s-ar părea că ieșirea diferențială va avea amplitudine scăzută. Totuși, trebuie reamintit că se aplica codorului diferențial un semnal de intrare cu dither cuantizat, unde zgomotul de cuantizare are un spectru de putere răspândit. Pe măsură ce este crescut ordinul codorului diferențial, crește nivelul zgomotului de cuantizare la frecvență înaltă.
Luând în considerare că rata de supraeșantionare dictată de formatul DSD este de 64 ori (frecvența Nyquist fiind de 44.1 kHz), atunci se pune întrebarea dacă ordinul cerut al decodorului care poate respecta specificațiile benzii audio care o egalează sau o depășește pe cea obținută prin, de exemplu, LPCM-ul pe 24 biți la 88.2 kHz. În această estimare inițială se presupune că nu există o truncare a datelor semnalului în domeniul de compresie. Totuși, este necesar să se mențină un nivel al semnalului cât mai scăzut cu putință pentru o excitație dată la intrare. Pentru un semnal necuantizat fără zgomot acest nivel poate fi prezis rapid cu ajutorul teoriei egalizării liniare standard, ținând cont de funcția de transfer a sistemului codor-decodor. Totuși, deoarece se presupune un proces cuantizat fără pierderi, zgomotul de cuantizare preaccentuat joacă un rol intrinsec în determinarea naturii semnalului de ieșire comprimat. Din eq. (1) răspunsul în amplitudine |DN(f)| al unui codor diferențial de ordin N are valoarea:
|DN(f)| = 2N/2[1 – cos()]N/2 (4)
unde fSDM este frecvența de eșantionare a DSD. Din eq. (4) rezultă o frecvență de tranziție naturală fT, unde câștigul este unitar, care are valoarea:
fT = . (5)
De asemenea rezultă câștigul vârfului la f=fSDM/2
= 2N (6)
Fig. 1 Codorul diferențial fără pierderi complementar
Răspunsurile în amplitudine ale codorului pentru ordinele 1÷6 sunt reprezentate în fig 2.(a), unde fig. 2(b) prezintă un zoom al regiunii apropiată de câștigul unitar, arătând cum câștigul este crescut în banda de frecvență dintre fT și fSDM/2.
Fig. 2. Răspunsul în frecvență al codorului diferențial. (a) Bandă largă; (b) Aproape de intersecția cu câștigul unitar
Caracteristicile din fig. 2 arată că se obține un avantaj al codării de joasă frecvență, cu costul creșterii în câștig deasupra frecvenței de tranziție fT. Scopul este minimizarea gamei semnalului codat y(n) în timp ce se maximizează gama dinamică a semnalelor de intrare și ieșire, x(n) respectiv z(n). Deși curbele din fig. 2 reprezintă răspunsurile câștig-frecvență, pot fi translatate într-un fel de funcție de transfer formatoare de zgomot (NSTF), formând la început o secvență întreagă cuantizată x(n) și apoi formând zgomotul cu ajutorul codorului diferențial. Secvența întreagă este derivată folosind semnalul de intrare adăugat unei secvențe cu zgomot aleator, cu funcția distribuție de probabilitate triunghiulară, de amplitudine 2 trepte de cuantizare, aplicată unui cuantizor uniform cu o treaptă de cuantizare. Pentru a ilustra operația codorului diferențial se dă un exemplu în care se formează un semnal de intrare folosind 3 unde sinusoidale de amplitudine mare. Amplitudinile și frecvențele respective sunt:
A1 = 224, A2 = 230, A3 = 230
f1 = 20 kHz, f2 = 10 kHz, f3 = 50 Hz
Aceste semnale sunt alese pentru a reprezenta un exemplu de codare extrem care depășește referința LPCM, cu rezoluția de 24 biți și frecvența de 88.2 kHz. Se poate observa că rezoluția amplitudinii la 20 kHz o egalează pe cea de 24 biți în timp ce, sub această frecvență, gama dinamică disponibilă crește progresiv datorită codării diferențiale multietaj. Fig. 3 arată un set de spectre pentru ieșirile codorului diferențial, cu ordinul de la 4 la 6. Pentru a stabili gama amplitudinii secvenței de ieșire, fig. 4 și 5 ne arată histogramele nivelului de ieșire corespunzător.
Fig. 3. Formarea funcției de transfer a zgomotului pentru semnalul comprimat.
(a) Ordinul 4; (b) Ordinul 5; (c) Ordinul 6
Fig. 4.Histograma în timp a ieșirii codorului diferențial. (a) Ordinul 4; (b) Ordinul 5; (c) Ordinul 6
Pe măsură ce ordinul compresorului diferențial crește de la 4 la 5, gama semnalului de ieșire este redusă substanțial pe măsură ce cantitatea zgomotului format crește. Totuși, pe măsură ce ordinul crește de la 5 la 6, gama semnalului de ieșire devine simțitor mai mare ca urmare a preaccentuării zgomotului de cuantizare de frecvență înaltă. Ne este de ajutor să observăm un segment al formei undelor de ieșire pentru fiecare dintre cele 3 codoare diferențiale date ca exemplu, asa cum se arată în fig. 5. Așa cum s-a anticipat, pe măsură ce ordinul codorului diferențial este crescut, semnalul de intrare devine progresiv mai scăzut ca amplitudine, în comparație cu zgomotul de cuantizare preaccentuat. În fig. 5(c) semnalul este îngropat în interiorul zgomotului, chiar dacă zgomotul este de amplitudine mai mare decât cea arătată în fig. 5(b).
Fig. 5. Ieșirea timp-domeniu comprimată. (a) Ordinul 4; (b) Ordinul 5; (c) Ordinul 6
Deoarece frecvența considerabil mai mare preaccentuează rezultatele după folosirea codării diferențiale, eventualul avantaj al încorporării frecvenței înalte moderate în filtrarea trece jos a fost folosit pentru a micșora zgomotul de ieșire. Totuși, pentru a aplica această filtrare, este necesară o structură FIR cu greutăți întregi astfel încât secvența de ieșire să rămână întreagă. Prin urmare, deși apare atenuarea la frecvență înaltă, aceasta este însoțită de o creștere generală în câștigul canalului, care tinde să contracareze avantajul filtrului, pentru un filtru FIR cu 2 celule de intarziere coeficienții fiind mai degrabă {1 1} decât {0.5 0.5}, fapt ce ar păstra câștigul la joasă frecvență. Cum era de așteptat, acest filtru a produs o transmisie zero la jumătate din frecvența de eșantionare, în timp ce a introdus un câștig la joasă frecvență de valoare 2. Fig. 6 arată spectrul ieșirii compresorului diferențial de ordin 6, unde se poate vedea nivelul rezultat, în timp ce fig. 7 arată semnalul de ieșire reconstruit, evidențiind o reducere a amplitudinii din zona spectrului de înaltă frecvență.
Fig. 6. Spectru comprimat cu filtru de ordin 6
Fig. 7. Semnal reconstruit cu filtru de ordinul 6
În sfârșit, fig. 8(b) ilustrează corespondența timp-secvență a domeniului de ieșire, indicând că în comparație cu fig. 5(c) gama semnalului vârf la vârf este aproape injumătățită. Totuși, această reducere a gamei semnalului nu a fost realizată cu un sistem de ordin 5.
Fig. 8 Semnal comprimat cu filtru. (a) Ordinul 5; (b) Ordinul 6
4.3 CORECȚIA RECURSIVĂ MULTINIVEL SDM CU O GAMĂ PUTERNIC LIMITATĂ A CUANTIZORULUI
Această secțiune extinde un codor SDM formator de zgomot folosind un algoritm recursiv pentru a include un cuantizor multinivel, astfel încât cu o rată mare de supraeșantionare (de obicei de 4 ori DSD) se poate obține codarea SDM de bandă largă, cu zgomot mic. Cuantizarea multinivel extinde gama dinamică în timp ce micșorează dramatic probabilitatea de instabilitate, chiar și atunci când este folosită formarea agresivă a zgomotului, crescând numărul traiectoriilor de semnal disponibile codorului. Totuși, pentru o codare eficientă, un cuantizor multinivel cu gamă dinamică limitată este extrem, astfel, atunci când este folosită formarea zgomotului de ordin mare pentru a obține nivele ale zgomotului în banda audio extrem de mici, cuantizorul este aplicat peste întreaga sa gamă, folosind aplicațiile raportate anterior. În consecință, dacă bucla de reacție SDM a fost proiectată doar din perspectiva teoriei liniare, atunci nu poate fi garantată stabilitatea necondiționată, rămânând astfel o probabilitate finită de instabilitate, în special pentru semnalele de intrare de nivel mare.
Cele 2 tehnici care se pot adresa acestei probleme în SDM-ul pe 1 bit sunt fie algoritmii Trellis sau folosirea unei proceduri cu întoarcere în timp. Totuși, deoarece simulările au indicat că un codor cu răspuns, care implică chiar și cuantizarea multinivel cu rezoluție scăzută, este aproape întotdeauna stabil pentru semnale care au vârful amplitudinii mai mic decât aproximativ 0.5 din încărcătură, atunci nu este necesar superiorul computațional Trellis. Atunci, acest articol ia în considerare doar metoda recursivă construită pe fundația prezentată într-un studiu anterior dar adaptată aici pe o cuantizare uniformă pe M biți.
Pentru a activa o procedură cu reacție trebuiesc îndeplinite 3 condiții. Semnalul de intrare al cuantizorului ss(n) pentru eșantionul n este examinat și comparat cu un nivel predeterminat de pragul λ, unde condițiile sunt definite în termenii specificațiilor if :
Condiția 1: dacă ss(n)*sign[ss(n-1)] > λ
Condiția 2: dacă abs[ss(n-1)]> λ
Condiția 3: dacă abs[ss(n)] > abs[ss(n-1)] > λ
Așadar, pentru a trece testul, ss(n) și ss(n-1) trebuie să aibă amândouă același semn iar amplitudinile lor trebuie să depașească nivelul de prag λ. De asemenea amplitudinea lui ss(n) trebuie să fie mai mare decât amplitudinea lui ss(n-1) pentru ca semnalul de intrare din cuantizor să diveargă. Când aceste condiții sunt îndeplinite, starea buclei se întoarce în timp, ieșirea cuantizorului este forțată să ia valoarea zero și o nouă secvență dither e calculată. Apoi codarea înaintează. Dacă este necesar, acest proces poate fi repetat la diferite intervale de întoarcere, pentru a căuta o traiectorie validă a semnalului.
Pentru a ilustra o procedură cu reacție, fig. 9 arată un plot al ss(n) și ieșirea multinivel corespunzătoare unde s-a invocat un incident la întoarcere. Figura indică atât calea inițiala a lui ss(n) cât și calea alternativă după procedura cu reacție. În exemplele discutate aici, este folosit același formator de zgomot agresiv. Este folosit un cuantizor multinivel pe 2 biți cu nivele de reconstrucție a ieșirii -3, -1, 1 și 3 pentru a facilita comparația, SDM-ul binar având ieșiri doar de -1 și 1. Semnalul de intrare constă în 3 sinusoide cu frecvența 4, 9 și 20 kHz, fiecare cu un vârf al amplitudinii de 0.8. Frecvența de eșantionare este fixată la 256 x 44.1 kHz. Pornind de la aceasta, rata de bit generală este de 4 ori rata DSD standard folosită în SACD. Pragul este setat la λ=5, unde linia punctată indică ss(n) înainte de corecție, linia continuă indică ss(n) după corecție.
Fig. 9. ss(n) cu corecție în bucla de reacție
În aceste exemple vârful semnalului de intrare este 2.4 în comparație cu un maxim al ieșirii de 3, unde simularea arată că această valoare este prea aproape de maximul care poate fi obținut. Pentru a ilustra comportamentul general pe o rază de n = 1 până la 218 eșantioane, fig. 10 arată un grafic al lui ss(n), unde asterixul indică momentele de întoarcere, pe când fig. 11 arată histograma corespunzătoare lui ss(n).
Fig. 10. ss(n) și probleme în buclă
Fig. 11. histograma lui ss(n)
Spectrul ieșirii este reprezentat în fig. 12, unde continuând aplicațiile anterioare, o fereastră pătrată Blackman este aplicată în domeniul timp înaintea transformării Fourier. În fig. 12 e inclus plotul etajului zgomotului spectral al unui sistem LPCM de 24 biți eșantionat la 88,2 kHz, care poate fi folosit ca o cotă de nivel și evidențiază că codorul SDM oferă un zgomot foarte scăzut, chiar și în exces de 100 kHz, ca o consecință a selectării unei rate de eșantionare mari. Un spectru similar este prezentat în fig. 13, dar se folosește bucla formatoare de zgomot moderată.
Fig. 12. Spectrul ieșirii cuantizate și referința de 24 biți
Fig. 13. Exemplu de modelare moderată a zgomotului
Pentru a observa probabilitatea instabilității pentru SDM-ul cu cuantizare multinivel, aceeași simulare a fost efectuată pe o fereastră de 220 eșantioane, dar cu intrarea redusă doar cu 6 dB pentru a da o amplitudine de 1.2 intrării. Aici nu au apărut incidente în cazul întoarcerii, demonstrând astfel că codorul este mult mai robust decât varianta sa cu 2 etaje.
4.4 SDM MULTIETAJ CU CONSTRUCȚIA IEȘIRII DE DATE DE TIP LPCM
În această secțiune sunt descrise 2 metode care înmagazinează atât SDM-ul pe 1 bit cât și SDM-ul multinivel uniform cuantizat, întipărite într-un sistem comun astfel încât deși datele de ieșire compuse sunt supraeșantionate și cu formarea zgomotului de tip LPCM, un șir de date de 1 bit pot fi extrase fără o computație suplimentară. Ambele metode sunt pretabile pentru arhivarea semnalelor audio de înaltă rezoluție deoarece capacitățile lor le depășesc pe cele ale formatelor LPCM pe 24 biți, 88.2 kHz și DSD. De asemenea când principala aplicație este DSD, atunci codul pe 1 bit folosit, de exemplu, într-o lansare SACD originală, poate fi extras cu precizie. În consecință nu este necesar să stocăm separat datele de înaltă rezoluție și pe cele DSD. Codurile sunt înmagazinate în mod unic și se completează unul pe altul.
În ambele scheme algoritmul recursiv este folosit pentru a calcula datele SDM pe 1 bit, deși pentru subcoderele multibit stabilitatea este mai robustă, lucru care facilitează folosirea unei arhitecturi simplificate. Fiecare SDM pe 1 bit este optimizat pentru rezoluție și în conformitate cu SACD în timp ce arhitecturile integrate oferă codare de înaltă rezoluție adecvată arhivării și postproducției. Cele 2 scheme se diferențiază prin felul în care șirul de date de 1 bit este înmagazinat în șirul de date compus. Totuși, ambele scheme produc date de ieșire LPCM pe M biți la rata de eșantionare de 64 x 44.1 kHz, aleasă pentru a se alinia cu specificațiile DSD. În timp ce în schema de tipul 1 șirul de date SDM pe 1 bit reprezintă bitul cel mai puțin semnificativ (LSB) în codul LPCM, în schema de tipul 2 reprezintă bitul cel mai semnificativ. O caracteristică principală a ambelor arhitecturi este suprimarea zgomotului de cuantizare SDM în codul ieșirii finale. În consecință oricare procesare a postproducției efectuată asupra șirului de date compus nu este compromisă de prezența resturilor reziduale ale codării pe 1 bit SDM. Astfel ambele variante candidează pentru un format de arhivare deoarece sunt reținute atât rezoluția ultraînaltă cât și datele pe 1 bit.
4.4.1 Codorul de tip 1: SDM-ul pe 1 bit formează LSB-ul
În schema de tipul 1 codul SDM pe 1 bit formează poziția LSB-ului în codul de ieșire LPCM, unde structura de bază este reprezentată în fig. 14. Sistemul încorporează 2 codoare SDM unde un semnal de intrare care are o gamă maximă a amplitudinii de -1 până la 1 (în practică un pic mai mică datorită comportamentului tipic al codorului SDM la ordin mare) este aplicat direct intrării unui codor SDM multinivel, unde dacă numărul total de biți este M, factorul de amplificare Gm = 2M. Totuși, pentru a elimina distorsiunile cuantizării codorului SDM pe 1 bit, semnalul eroare este scăzut din intrarea SDM-lui multinivel. În consecință când ieșirile celor 2 codoare sunt combinate, unde ieșirea SDM-lui pe 1 bit formează LSB-ul, atunci este aplicată efectiv sumarea compensațiilor corecte.
Fig. 14. SDM-ul compus de tipul 1
Ar trebui notat faptul că semnalul eroare al codorului SDM pe 1 bit este relativ mic în comparație cu maximul razei de amplitudine a codorului multinivel SDM. Astfel nu cauzează probleme de încărcare. De asemenea reprezintă o secvență de dither eficientă. În această schemă codorul SDM pe 1 bit este asociat unei ieșiri binare 1 sau -1 astfel încât în termenii codului compus LPCM cuantumul este 2. Fiindcă codorul SDM uniform cuantizat pe M biți ocupă spațiul rămas din semnal, care se întinde de la al doilea LSB până la MSB, mărimea sa efectivă este 4, implicând faptul că cuantizorul SDM multinivel are un interval de cuantizare de valoare 4. Așezarea datelor în acest fel ne asigură că ieșirea SDM-ului pe 1 bit controlează doar LSB-ul, indiferent de ieșirea codorului SDM pe M biți.
4.4.2 Codorul de tipul 2: SDM-ul pe 1 bit formează MSB
În cea de-a doua arhitectură, reprezentată în fig. 15, rolurile SDM-lui multinivel și pe 1 bit sunt inversate, cu cea din urmă formând acum MSB-ul în ieșirea LPCM. Inițial semnalul de intrare este aplicat codorului SDM pe 1 bit, unde folosind algoritmul cu întoarcere, codarea normală este realizată pentru a produce ambele erori de codare, ieșire pe 1 bit și intrare-ieșire. Totuși, în acest caz, eroarea de codare are amplitudine mare, lucru care în mod normal ar supraîncărca un codor proiectat pentru a funcționa în gama de semnal jos ocupată de LSB, până la al doilea MSB. În consecință semnalul eroare este de bandă limitată folosind un filtru digital FIR de fază liniară pentru a reduce amplitudinea. Acesta este apoi aplicat intrării codorului SDM multinivel. După ce semnalul eroare este codat, este sumat șirului ieșirii SDM-lui pe 1 bit, care a fost întârziat pentru a compensa pentru filtrul digital FIR. Cuantizorul folosit în cadrul SDM-lui multinivel are o gamă de amplitudine limitată astfel încât ieșirea sa să nu altereze MSB-ul, implicând că ieșirea compusă are o gamă a amplitudinii bine definită.
Fig. 15. SDM-ul compus de tipul 2
Efectiv codorul SDM multinivel este folosit pentru o coda doar eroarea de cuantizare a codorului SDM pe 1 bit, unde sumarea șirurilor a 2 ieșiri trebuie să realizeze anularea erorii. Întrucât se folosește un filtru trece jos, este imperativ ca câștigul acestui filtru să fie aproape de unitate în interiorul benzii de trecere, unde acest criteriu este mai riguros decât nivelul absolut al atenuării benzii de oprire. Oricare deviație de la câștigul unitar poate duce la erori mai mari decât erorile codorului SDM, datorită gradului foarte mare al rejectării zgomotului de cuantizare SDM căutat. Filtrul trece jos selectat este reprezentat în fig. 16 și este constituit dintr-un filtru FIR optimizat cu 2049 de coeficienți simetrici. Un filtru de ordin impar a fost selectat pentru a ușura acuratețea întârzierii compensate, cerută atunci când semnalele MSB din SDM-ul pe 1 bit și ieșirile SDM-lui pe M biți sunt combinate pentru a forma semnalul LPCM compus. Compensarea întârzierii τc este reprezentată în fig. 15.
Fig. 16. Răspunsul în amplitudine al unul filtru trece-jos
4.4.3 Performanța Schemelor de Tip 1 și de Tip 2
Ambele scheme au fost simulate folosind un semnal de intrare compus din 3 sinusoide de frecvențe 4, 9 și 20 kHz, fiecare având amplitudinea 0.1. A fost selectată o rată de eșantionare de 64 x 44.1 kHz, unde codorul de tip 1 a folosit un cuvânt de ieșire de lungime 8 biți, în timp ce tipul 2 a fost limitat la 5 biți. Aceasta corespunde ratelor pe canal de 22.5792 și respectiv 14.112 Mb/s. În ambele cazuri lungimea vectorului a fost de 218 eșantioane.
Fig. 17 arată spectrul asociat codorului de tip 1 și indică atât SDM-ul pe 1 bit precum și spectrul LPCM-lui compus, unde ieșirea SDM-lui pe 1 bit formează LSB-ul. Aceasta este cotată față de LPCM-ul pe 24 biți eșantionat la 88.2 kHz. Parametrul de formare a zgomotului folosit pentru SDM-ul pe 1 bit și pentru SDM-ul multinivel sunt luate din alte studii de referință. Cel mai agresiv formator de zgomot a fost folosit pentru SDM-ul pe 1 bit pentru a maximiza performanța raport semnal zgomot în bandă. Spectrul arată că SDM-ul pe 1 bit obține o performanță comparabilă cu aceea raportată anterior, dar atunci când este integrată cu SDM-ul multinivel, zgomotul de frecvență înaltă compus este redus foarte mult atât din punct de vedere al nivelului, cât și al penetrării sale în banda ultrasonică. Prin urmare, este confirmată în simulare anularea zgomotului pe 1 bit SDM.
Fig.17 SDM-ul de tip 1 și spectrul compus
Rezultatele codorului de tip 2 sunt indicate în fig. 18. Per total zgomotul de frecvență înaltă compus nu este atât de scăzut ca cel corespunzător tipului 1, deși ar trebui să se noteze că ieșirea este codată doar pe 5 biți, în loc de 8. Cu toate acestea, codarea la zgomot mic este indicată de DC la 100 kHz., cu un prag al zgomotului spectral sub 24 biți, spectrul de referință de 88.2 kHz LPCM fiind pentru frecvențe mai mici decât 50 Hz. Aceasta se compară grosolan cu cazul în care se ia un codor pe 1 bit și se crește de 5 ori rata de eșantionare.
Fig.18 SDM-ul de tip 2 și spectrul compus
În acest exemplu s-a obținut un avantaj destul de mic, crescând lungimea cuvântului de la ieșire, fiindcă deviațiile în răspunsul la frecvență al filtrului trece jos au restrâns anularea zgomotului. În practică sunt 2 limitări care apar odată cu codorul de tip 2. Prima se referă la performanța filtrului trece jos, unde devierea de la un câștig în banda unitar limitează gradul anulării zgomotului, în timp ce frecvența de tăiere superioară aleasă a filtrului determină gama frecvenței peste care apare anularea. În acest caz s-a setat la 100 kHz. Totuși, dacă se crește lungimea benzii, atunci amplitudinea semnalului eroare de asemenea crește, lucru care poate supraîncărca codorul SDM multinivel.
Apare un corolar interesant după atribuirea ieșirii SDM pe 1 bit MSB-lui ieșirii compuse. Prin procesarea semnalului compus de către un comparator pe 2 nivele, ieșirea conține numai MSB-ul datelor de intrare. În consecință intrarea comparatorului conține spectrul compus în timp ce ieșirea arată spectrul SDM-lui pe 1 bit. Aici este un exemplu al unei neliniarități grosolane ce se aplică unui semnal, acolo unde apare un minim în intermodularea benzii audio.
4.4.5 Compararea cu schemele de codare MASH
Arhitectura prezentată în secțiunile 3.1 și 3.2 are similarități cu schemele bine cunoscute ale convertorului MASH [14], [15]. Totuși, în cazul MASH conceptul este să se combine două sau mai multe convertoare de ordin secundar într-o structură interconectată astfel încât ordinul formatorului de zgomot general este crescut în timp ce se reține avantajul stabilității SDM-lui de ordin mic. În fig. 19(a) sunt indicate două SDM-uri pe 1 bit, unde w(z) formează semnalul de intrare pe domeniul z, x(z) ieșirea primului etaj și y(z) ieșirea finală. Filtrele respectivei căi sunt A1(z) și A2(z). Presupunem că cele 2 cuantizoare dither pot fi reprezentate prin sursele de zgomot aditive q1(z) și respectiv q2(z). Atunci pentru SDM-ul cu etaj primar,
(7)
Aplicând o analiză asemănătoare SDM-lui cu etaj secundar cu intrarea –q1(z) și incluzând filtrul de ieșire B(z), atunci y(z) rezultă sub forma
(8)
Înlocuindu-l pe x(z) din ecuația (7),
(9)
Expresia lui y(z) poate fi făcută independent de q1(z) scriind B(z) sub forma
(10)
după care y(z) se reduce la
(11)
Acest rezultat indică că doar zgomotul SDM-lui cu etaj secundar influențează ieșirea, unde zgomotul său de cuantizare q2(z) este modelat de către [1 + A2(z)]-1 și filtrat efectiv de [1 + A1(z)]-1, care este similar cu cazul în care am avea un singur formator de zgomot cu o funcție de transfer A1(z) + A2(z) + A1(z)A2(z), dar fără a creea penalități stabilității unei bucle de ordin mare. Totuși, în MASH, filtrul B(z) crește efectiv numărul nivelelor necesare codului de ieșire, pe când în structurile de tipul 1 și 2 eroarea este derivată de la intrarea și ieșirea SDM-lui mai degrabă decât din cuantizor, astfel aici B(z)=1. În consecință lungimea cuvântului de ieșire depinde numai de rezoluția ieșirii fiecărui SDM și de metoda prin care ieșirile SDM-lui sunt combinate. Se obține stabilitatea prin folosirea unei cuantizări multinivel, care s-a demonstrat că se potrivește unui formator de zgomot de ordin mai mare. Astfel conturarea esenței între schemele propuse cu MASH este calea prin se derivează semnalul eroare al primului etaj și se elimină filtrul de egalizare al zgomotului, B(z), precum este indicat în sistemul de bază reconfigurat din fig. 19(b). Pentru sistemul generic din fig. 19(b) se obține
. (12)
Ecuația (12) arată că zgomotul primului etaj este anulat, iar zgomotul ieșirii generale depinde doar de ordinul filtrului și de zgomotul de cuantizare al celui de-al doilea etaj. În final fig. 19(c) indică o reconfigurare a fig. 19(b), unde ieșirea primului etaj SDM este acum adunată ieșirii etajului secund SDM, dar în cadrul traiectoriei cu răspuns. Ambele etaje SDM sunt acum direcționate direct de la intrarea w(z), dar se pare că ieșirea primului etaj este modelată ca zgomot în cadrul celui de-al doilea etaj SDM. Totuși, dacă semnalul de eroare al intrării celui de-al doilea etaj SDM este determinat pentru ambele cazuri, atunci pentru fig. 19(b) intrarea lui A2(z) este
intrarea lui A2(z)|fig. 19(b) = w(z) – x(z) – cuantizor către ieșire
pe când în fig. 19(c) este
intrarea lui A2(z)|fig. 19(c) = w(z) – [cuantizor către ieșire + x(z)].
În consecință se poate observa că cele două topologii realizează aceeași funcție și astfel reprezintă perspective echivalente pentru arhitectura sistemului.
Fig.19 Relații între SDM-ul cu 2 etaje si sistemele de tipul 1 și tipul 2. (a) Arhitectura de bază MASH cu 2 etaje; (b) Structura generică folosită ca bază a sistemelor de tipul 1 si 2; (c) Sistemul reconfigurat, echivalent cu adăugarea ieșirii codului SDM pe 1 bit la ieșirea celui de-al doilea etaj SDM.
4..5 CONCLUZII
A fost prezentat un număr de strategii de codare la rezoluție ultra-înaltă, unde scopul a fost obținerea unei benzi audio largi, împreună cu o gamă dinamică ridicată, în special în interiorul benzii audio principale. ….Deoarece astfel de metode sunt compatibile cu cerintele stocarii intermediare in contextul unui mediu cu rezolutie foarte ridicata . Filosofia urmarită în continuare asigură rezoluția unui sistem care depășește rezoluția amplitudinii și frecvenței formatului preferat lansat cu o margine semnificativă, fără vreo restricție de a limita banda semnalului audio. Inevitabil, sunt necesare rate ridicate ale datelor. Totuși, cu îmbunătățiri moderne ale vitezei procesoarelor și densității de înregistrare în continuă creștere, atât pe hard disk cât și pe formatele optice, asemenea rate pot fi adaptate și astfel nu reprezintă un compromis virtual pentru arhivarea și stocarea inainte de utilizare.
Un obiectiv esențial al articolului de față a fost acela că datele audio ar trebui să fie compatibile cu datele de intrare ale procesoarelor cu LPCM pe 24 biți, 64 x 44.1 kHz, deși acesta ar necesita o rată a datelor pe canal extremă de 67.7376, în timp ce în practică această rată poate fi redusă substanțial datorită conținutului ultrasonic relativ redus al semnalelor audio și al corelației corepunzătoare dintre eșantioane. Prima metodă considerată a fost bazată pe etaje cu codare diferențială, în cascadă. Această tehnică constituie o modelare a zgomotului fără pierderi și oferă procesare simplă. Totuși, nu este tolerantă în cazul erorilor de canal și astfel necesită o corecție a erorii robustă, deși în practică aceasta ar fi inerentă în orice aplicație de arhivare. Astfel nu este o cerere anormală. Rezultatele spectrale sunt indicate în Secțiunea 1, unde o rată a datelor de 16.9344 Mb/s asigură performanțe fără pierderi cu o gamă dinamică substanțial mai crescută fațț de referința LPCM pe 24 biți 88.2 kHz. În consecință nu există zgomot adițional semnalului ca un rezultat al recuantizării și modelării zgomotului, chiar dacă semnalul comprimat expune un spectru al zgomotului modelat rezultând din necesitatea fundamentală a cuantizării semnalului de intrare, setat aici cu o cuanta întreagă. Simularea a confirmat că depășirea generală în codul de intrare ar putea fi corectată folosind un cod temporal dispersiv [4], care a returnat o performanță satisfăcătoare până la un ordin diferențial 6, prin conservarea unor zone atât din impulsul de amplitudine limitată, precum și un număr al întregilor săi.
Cu scopul de a reduce probabilitatea instabilității în SDM, Secțiunea 2 a explorat un codor cu cuantizare uniformă pe 2 biți. A fost confirmată o îmbunătățire substanțială în stabilitate, unde deși a fost păstrată o procedura cu reactie [6] în codor, a fost activată doar pentru intrări de peste 1.2 la vârf, 3 fiind cel mai ridicat nivel de cuantizare de la ieșire. Fig. 12 și 13 indică că a fost obținută codarea de zgomot mic, lucru semnificativ mai bun decât în cazul LPCM-lui 24 biți 176 kHz.
În final Secțiunea a 3-a a descris două variante în cazul SDM-lui multinivel supraeșantionat, unde efectiv două codoare SDM au fost interconectate, unul producând date pe 1 bit, celălalt date pe mai multe nivele. În ambele cazuri codoarele au fost configurate astfel încât zgomotul de cuantizare al SDM-lui pe 1 bit a fost adunat intrării SDM-lui multinivel într-un mod în care ieșirea compusă nu conținea, virtual, zgomotul SDM-lui pe 1 bit. Ambele arhitecturi au funcții de transfer identice și oferă performanțe ale spectrului zgomotului similare, precum s-a confirmat în grafiicele zgomotului spectral din fig. 17 și 18. Totuși, deoarece sistemul de tipul 1 prezintă, în esență, un semnal eroare de nivel mai scăzut și nu necesită un filtru FIR de ordin mare, are câteva avantaje față de sistemul de tip 2. Principala caracteristică a ambelor configurații este folosirea SDM-lui multinivel pentru a îmbunătăți gama dinamică și pentru a diminua zgomotul de înaltă frecvență, reținând în continuare un cod SDM pe 1, bit în conformitate cu SACD-ul.
5. BIBLIOGRAFIE
[1]. UNDERSTANDING SIGMA–DELTA MODULATION: The Solved and Unsolved Issues By Joshua D. Reiss.
[2] Ultrahigh-Resolution Audio Formats for Mastering and Archival Applications M. O. J. HAWKSFORD
[3] H. Takahashi and A. Nishio, “Investigation of Practical 1-bit Delta Sigma Conversion for Professional Audio Applications” J. Audio Eng. Soc., vol. 49, p. 544 (2001 June), convention paper 5392.
[4] M. O. J. Hawksford, “Transparent Differential Coding for High Resolution Digital Audio,” Audio Eng. Soc. (Engineering Reports), vol. 49, pp. 480–497 (2001 June).
[5] M. A. Gerzon, P. G. Craven, J. R. Stuart, M. J. Law, and R. J. Wilson, “The MLP Lossless Compression System,” in Proc. AES 17th Int. Conf. (1999 Sept.), paper 17-006.
[6] The 1-Bit Advantage – Future Proof Recording by KORG
[7] S. P. Lipshitz, R. A. Wannamaker and J. Vanderkooy, “Quantization and Dither: A Theoretical Survey,” J. Audio Eng. Soc., vol. 40, pp. 355–375 (1992 May).
[8] D. Reefman and E. Janssen “Signal Processing for Direct Stream Digital: A Tutorial for Digital Sigma–Delta Modulation and 1-Bit Digital Audio Processing,“ Philips Research, Eindhoven, White Paper 18 (2002 Dec.).
[9] D. Reefman, J. Reiss, E. Janssen and M. Sandler, “Description of Limit Cycles in Sigma–Delta Modulators,” IEEE Trans. on Circuits and Systems I: Regular Papers, vol. 52, pp. 1211–1223 (2005).
[10] H. Kato, “Trellis Noise-Shaping Converters and 1-bit Digital Audio,” presented at the 112th Convention of the Audio Engineering Society, J. Audio Eng. Soc), vol. 50, p. 516 (2002 June), convention paper 5615.
[11] D. Reefman, J. D. Reiss, E. Janssen, and M. B. Sandler, “Stability Analysis of Limit Cycles in High Order Sigma–Delta Modulators,” presented at the Audio Engineering Society 115th Convention, J. Audio Eng. Soc., vol. 51, p. 1240 (2003 Dec.), convention paper 5936.
[12] M. O. J. Hawksford, “Chaos, Oversampling, and Noise Shaping in Digital-to-Analog Conversion,” J. Audio Eng. Soc., vol. 37, pp. 980–1001 (1989 Dec.).
[13] O. Feely and L. O. Chua, “Multilevel and Non-Ideal Quantization in Sigma–Delta Modulation,” Int. J. of Circ. Theory and Appl., vol. 21, pp. 61 83 (1993)
[14] P. Steiner and W. Yang, “Stability of High Order Sigma– Delta Modulators,” Proc. IEEE Int. Symp. on Circuits and Systems, ISCAS’96, pp. 52–55 (1996).
[15] J. Verbakel, L. van de Kerkhof, M. Maeda, and Y. Inazawa, “Super Audio CD Format,” presented at the 104th Convention of the Audio Engineering Society, J. Audio Eng. Soc, vol. 46, p. 570 (1998 June), preprint 4705.
[16] H. Wang, “On the Stability of Third-Order Sigma–Delta Modulation,” Proc. ISCAS, pp. 1377–1380 (1993).
[17] A. J. Magrath and M. B. Sandler, “Efficient Dithering of Sigma–Delta Modulators with Adaptive Bit Flipping,” Electronics Letters, vol. 31 (1995).
[18] E. Janssen and D. Reefman, “Advances in Trellis-Based SDM Structures,” presented at the 115th Convention of the Audio Engineering Society, J. Audio Eng. Soc., vol. 52, p. 1257 (2003 Dec.), convention paper 5993.
[19] M. O. J. Hawksford, “Time-quantized frequency modulation, time domain dither, dispersive codes, and parametrically controlled noise shaping in SDM,” Journal of the Audio Engineering Society, vol. 52, no. 6, pp. 587–617, 2004.
[20] H. Takahashi and A. Nishio, “Investigation of Practical 1-Bit Delta Sigma Conversion for Professional Audio Applications,” presented at the 110th Convention of the Audio Engineering Society, J. Audio Eng. Soc, vol. 49, p. 544 (2001 June), convention paper 5393
[21] G. I. Bourdopoulos, A. Pnevmatikakis, V. Anastassopoulos, and T. L. Deliyannis, Delta-Sigma Modulators: Modeling, Design and Applications (Imperial College Press), London, UK, 2003.
6. LISTA CU ANEXELE PROIECTULUI
6.1 ANEXA 1
% CODAREA PCM CU SUPRAESANTIONARE SI FORMARE A ZGOMOTULUI (ordin de la 1 la k)
% codarea transparenta diferentiala pe 3 etaje pentru compresia fara pierderi
% 2 posibilitati de limitare incluzand corectia erorii pentru cel de-al treilea integrator (substitutia cu 5 impulsuri)
% date de intrare si control
order=5; % gama formatorului de zgomot de la 1 la k (k=5)
sec=3; % ordinul compresorului diferential: 1, 2 sau 3 etaje
adjc=0; % finisarea esantioanelor adiacente dupa compresie (1=activat)
clip=2; % limitare: clip=0 dezactivata, clip=1 substitutia cu 3 impulsuri,
% clip=2 substitutia cu 5 impulsuri
pass=10; % numarul maxim de puncte critice in bucla de corectie a erorii
A=32000; % amplitudinea semnalului de intrare
fin=20000; % frecventa semnalului de intrare
fs=48000; % frecventa de esantionare audio-digitala
m=8; % factorul de supraesantionare
v=16; % lungimea vectorului, numar de biti
qout=11; % lungimea cuvantului de la iesirea diferentiatorului; determina nivelul
limitarii, daca clip>0
qin=24; % rezolutia intrarii; gama intrarii de la -1 la +1, numar de biti
flo=20000; % flo frecventa de preaccentuare
fhi=8*fs; % fhi frecventa de dezaccentuare
power=5; % ordinul egalizorului
rng=1000; % gama graficului in domeniul timp
zero=0; % ordinul spectrului
win=0; % fereastra iesirii (win=1 cosinus ridicat, win=0 rectangulara)
% lungimea "n" a vectorului
n=2^(v+1);
f0=m*fs/(2^v);
nm=1:n;
n2=2:n/2;
% zgomot aleator
rnd=rand(1,n/2)+rand(1,n/2)-1;
rnd= [rnd rnd];
% frecventele de taiere la 3 dB pentru preaccentuare si dezaccentuare
fl=flo*(2^(1/power)-1)^(-0.5);
fh=fhi*(2^(1/power)-1)^(+0.5);
% semnalul de intrare ina, ina preaccentuat, har = armonica cea mai apropiata de f0 (frecventa minima)
q1=2^(qin-1);
A0=0; A1=A; A2=0;
har=ceil(fin/f0);
wt0=2*pi/2^v; wt1=har*wt0; wt2=(har+10)*wt0;
A0=A0*(fl./fh)*((1+(f0./fl).^2)./(1+(f0./fh).^2)).^(power*0.5);
A1=A1*(fl./fh)*((1+(f0*har./fl).^2)./(1+(f0*har./fh).^2)).^(power*0.5);
A2=A2*(fl./fh)*((1+(f0*(har+10)./fl).^2)/(1+(f0*(har+10)./fh).^2)).^(power*0.5);
A=(fh./fl)*((1+(f0.*(1:2^v)./fl).^2)./(1+(f0.*(1:2^v)./fh).^2)).^(power*0.5);
in(nm)=A0.*sin(wt0*nm)+A1.*sin(wt1*nm)+ A2.*sin(wt2*nm);
ina=in;
rndi=rnd(1:n);
mxa=max(abs(ina));
ina=mxa*round(q1*ina(nm)/mxa+rndi(1:n))/q1;
clear mxa
% date pentru sistem
clipl=2^(qout-1);
fprintf('\nOrdinul formatorului de zgomot')
order
fprintf('\nRaportul de supraesantionare')
m
fprintf('\nRata de esantionare a canalului (Mbit/s}')
sampling_rate=fs*m/1e1^6
fprintf('\nLungimea cuvantului din canal (bit)')
word_length=qout
fprintf('nLungimea cuvantului de referinta de la intrare (bit)')
word_length=qin
fprintf('\nRata de bit a canalului (Mbit/s)')
bit_rate=qout*fs*m/1e1^6
fprintf('\nRata de bit a canalului PCM raportata la m*fs (Mbit/s}')
bit_rate=qin*fs*m/1e1^6
% procedura de formare a zgomotului (ordin zero)
out0=round(in(nm)+rnd(nm));
% procedura de formare a zgomotului (variabila, de ordin maxim k)
outk=zeros(size(nm));
I(1:(order+1),nm)=0;
for z=n/2-20:n
I(1,z)=I(1,z-1)+in(z-1)-outk(z-1);
for x=2:order
I(x,z)=I(x-1,z)+I(x,z-1);
end
outk(z)=round((sum(I(1:order,z))+in(z))+rnd(z));
end
outk(n)=outk(n)-sum(outk(1+n/2:n));
outkx=outk;
clear I
outks(1:n)=outkx(1:n);
outks(1)=0;
% calcularea rezidului comprimat folosind codarea diferentiala cu un etaj
f1=zeros(size(nm));
home; clc
fprintf('semnalul de iesire formator de zgomot comprimat : 1 etaj\n')
fout1=zeros(size(1:n));
fout1(2:n)=outks(2:n)-outks(1:n-1);
foutk=fout1;
fl=fout1;
% calcularea rezidului comprimat folosind codarea diferentiala cu doua etaje
f2=zeros (size(nm));
if sec>1
fprintf('semnalul de iesire formator de zgomot comprimat : 2 etaje\n')
fout2=zeros(size(1:n));
fout2(2:n)=fout1(2:n)-fout1(1:n-1);
foutk=fout2; f2=fout2;
end
% calcularea rezidului comprimat folosind codarea diferentiala cu trei etaje
if sec>2
fprintf('semnalul de iesire formator de zgomot comprimat : 3 etaje\n')
fout3=zeros(size(1:n));
fout3(2:n)=fout2(2:n)-fout2(1:n-1);
foutk=fout3;
end
% adunarea esantioanelor adiacente ale iesirii etajului final al diferentiatorului
if adjc==1
foutk(1)=0; foutk(2:n)=foutk(l:n-1)+foutk(2:n);
outks(1)=0; outks(2:n)=outks(l:n-1)+outks(2:n);
end
% Limitarea canalului: fara limitare
if clip==0
fprintf('\nFara limitare, fara corectie a erorii\n\n')
ERR=zeros(size(l:n)); ERRCK=ERR; ERR0=ERR;
DET(2^v:n)=(sign(abs(foutk(2^v:n))-clipl)+l)/2;
ERR0(10:n-2)=(foutk(10:n-2)-clipl*sign(foutk(10:n-2))).*DET(10:n-2);
fk=foutk;
end
% limitare cu corectia erorii: TIPUL 1 [0.5*e clipl-e 0.5*e] substitutia
% impulsurilor
if clip==1
err=1; sx=1; ERR0=zeros(size(1:n));
while err==1
ERR=zeros(size(l:n)); ERRCK=ERR; DET=ERR;
DET(n/2+l:n-1)=(sign(abs(foutk(n/2+l:n-1))-clipl)+l)/2;
ERR(10:n-2)=(foutk(10:n-2)-clipl*sign(foutk(10:n-2))).*DET(10:n-2);
if sx==l
ERR0(10:n-2)=(foutk(10:n-2)-clipl*sign(foutk(10:n-2))).*DET(10:n-2);
end
ERRO=ERR-round(ERR/2)*2;
foutk=foutk+ERRO;
ERR=ERR-ERRO;
foutk=(1-DET).*foutk+DET.*(ERRO+sign(foutk)*clipl);
foutk(2:n-1)=foutk(2:n-1)+ERR(3:n)/2+ERR(l:n-2)/2;
if max(abs(DET))>0
fprintf('\nSe activeaza bucla de corectie pentru limitarea erorii sx: \n\n')
sx
end
fk=foutk;
% se verifica limitarea
sx=sx+l; err=0;
for p=2^v:n
if abs(foutk(p))>clipl
ERRCK(p)=-clipl*sign(foutk(p))+foutk(p);
err=l;
end; end;
if sx>abs(pass)
err=O;
end; end; end
% limitare cu corectia erorii: TIPUL 2 [-(1/6)*e (2/3)*e clipl-e (2/3)*e
% -(1/6)*e] substitutia impulsurilor
% de asemenea se specifica ca e=6
if clip==2
err=1; sx=1;
ERR0=zeros(size(1:n)); ERRQ=ones(size(1:n));
while err==1
DET=zeros(size(1:n));
ERRCK=zeros(size(1:n));
signf=zeros(size(1:n));
DET(n/2+1:n-1)=(sign(abs(foutk(n/2+1:n-1))-clipl)+1)/2;
signf=sign(foutk).*DET;
if sx==1
ERR0(10:n-2)=(foutk(10:n-2)-clipl*sign(foutk(10:n-2))).*DET(10:n-2);
end
ERRQ(10:n-2)=1+abs(round(((foutk(10:n-2)-clipl*sign(foutk(10:n-2))).*DET(10:n-2))/6));
foutk(10:n-2)=foutk(10:n-2)-6*ERRQ(10:n-2).*sign(10:n-2);
foutk(9:n-3)=foutk(9:n-3)+4*ERRQ(10:n-2).*signf(10:n-2);
foutk(11:n-1)=foutk(11:n-1)+4*ERRQ(10:n-2).*signf(10:n-2);
foutk(8:n-4)=foutk(8:n-4)-ERRQ(10:n-2).*signf(10:n-2);
foutk(12:n)=foutk(12:n)-ERRQ(10:n-2).*signf(10:n-2);
if max(abs(DET))>0
fprintf('\nSe activeaza bucla de corectie pentru limitarea erorii sx: \n\n')
sx
end
fk=foutk;
% se verifica limitarea
sx=sx+1; err=0;
for p=n/2+1:n-3
if abs(foutk(p))>clipl
ERRCK(p)=-clipl*sign(foutk(p))+foutk(p);
err=1;
end; end;
if sx>abs(pass)
err=0;
end; end; end; clear ERRQ
% reconstructia semnalului comprimat fout1 folosind integratorul digital cu 1 etaj
fprintf('decomprimarea semnalului: 1 etaj\n')
fout1=zeros(size(1:n));
for p=2:n
fout1(p)=foutk(p)+foutl(p-1);
end;
outkr=fout1;
% reconstructia semnalului comprimat outkr folosind integratorul digital cu 2 etaje
if sec>1
fprintf('decomprimarea semnalului: 2 etaje\n')
fout2=zeros(size(1:n));
for p=2:n
fout2(p)=foutl(p)+fout2(p-1);
end;
outkr=fout2;
end;
% reconstructia semnalului comprimat outkr folosind integratorul digital: cu 3 etaje
if sec>2
fprintf('decomprimarea semnalului: 3 etaje\n')
fout3=zeros(size(1:n));
for p=2:n
fout3(p)=fout2(p)+fout3(p-1);
end;
outkr=fout3;
end;
% Testul de recuantizare pentru precizia formatului datelor
outkrt=round(outkr);
if abs(sum(outkrt(n/2+1:n-3)-outkr(n/2+1:n-3)))>0
fprintf('\nTest de recuantizare a canalului esuat\n')
else
fprintf('\nTest de recuantizare a canalului realizat\n')
end
outkr=outkrt; clear outkrt
% preaccentuarea efectuata in domeniul frecventa, domeniul timp ramane nefiltrat
out=outkr;
% compensarea intrarii pentru adunarea esantioanelor adiacente (ina este inmultit cu 2)
if adjc==1
ina=ina*2;
end
% se sterge secventa introductiva si se seteaza la zero valoarea medie a secventei
off=10^(-300/20); nk=n/2;
p(1:2^v)=out0(nk+1:n); p=p-mean(p)+off; out0=p;
p(1:2^v)=outkx(nk+1:n); p=p-mean(p)+off; outkx=p;
p(1:2^v)=out(nk+1:n); p=p-mean(p)+off; out=p;
p(1:2^v)=outks(nk+1:n); p=p-mean(p)+off; outks=p;
p(1:2^v)=outkr(nk+1:n); p=p-mean(p)+off; outkr=p;
p(1:2^v)=ina(nk+1:n); p=p-mean(p)+off; ina=p;
p(1:2^v)=f1(nk+1:n); p=p-mean(p)+off; f1=p;
p(1:2^v)=f2(nk+1:n); p=p-mean(p)+off; f2=p;
p(1:2^v)=fk(nk+1:n); p=p-mean(p)+off; fk=p;
p(1:2^v)=ERR0(nk+1:n); ERR0=p;
p(1:2^v)=ERRCK(nk+1:n); ERRCK=p;
clear p off
% se redefineste lungimea vectorului pentru a elimina preambulul si pentru
% a seta perioada spectrului pe grafic
n=2^v;
nm=1:n; n2=2:n/2;
fr=f0*n2;
nb=2:round(fs/f0);
if m==1
nb=n2;
end
fb=nb*f0;
% formele de unda in domeniul timp
wind=ones(size(nm)); wx=-8+0.5*n;
if win==1
wind=[0.5*(1-cos(pi*(0:wx-1)/(wx+1))) wind(wx:n-wx-1) 0.5*(1-cos(pi*(wx-1:-1:0)/(wx+1)))];
end
% transformatele Fourier si dezaccentuarea
zinfs=abs(fft(ina.*wind))/(n/2);
zoutf0=abs(fft(out0.*wind))/(n/2);
zoutf=abs(fft(out.*wind))/(n/2);
infs(n2)=20*log10(zinfs(n2));
outf0(n2)=20*log10(zoutf0(n2)./A(n2));
outf(n2)=20*log10(zoutf(n2)./A(n2));
clear zinfs zoutf0 zoutf
% se normalizeaza infs pentru a se potrivi cu varfurile lui outf
infs(n2)=infs(n2)-max(infs(1:har+10))+max(outf(1:har+10));
% graficele spectrale
maxin=round(20*max(infs(n2)))/20;
minin=round(20*min(infs(n2)))/20;
if maxin<0
maxin=0;
end
axis([fr(2) fr(n/2-1) minin maxin])
hold on; grid
if zero==1
plot(fr,outf0(n2),'g')
end
plot(fr,infs(n2),'c')
plot(fr,outf(n2),'r')
plot(fr,+20*log10(A(n2)/A(1)),'b')
plot(fr,-20*log10(A(n2)/A(1)),'b')
if zero==1
title('Spectrul: cyan: intrare, verde: de ordin zero, rosu: de ordin n, albastru: preaccentuare/dezaccentuare')
else
title('Spectrul: cyan: intrare, rosu: de ordin n, albastru: preaccentuare/dezaccentuare')
end; pause
close; home; clc
% graficele spectrale extinse la fs
if m>1
axis([fb(2) max(fb) minin maxin])
hold on; grid
if zero==1
plot(fb,outf0(nb),'g')
end
plot(fb,infs(nb),'c')
plot(fb,outf(nb),'r')
plot(fb,+20*log10(A(nb)/A(1)),'b')
plot(fb,-20*log10(A(nb)/A(1)),'b')
if zero==1
title('EXTINDERE: Spectrul: cyan: intrare, verde: de ordin zero, rosu: de ordin n, albastru: preaccentuare/dezaccentuare')
else
title('EXTINDERE: Spectrul: cyan: intrare, rosu: de ordin n, albastru: preaccentuare/dezaccentuare')
end; pause
close; home; clc
end
% graficul formatorului de zgomot in domeniul timp
plot(outkx(1:rng),'r')
title('Iesirea in domeniul timp a cuantizorului formator de zgomot')
pause
close; home; clc
% graficul in domeniul timp al iesirii primului diferentiator
if sec==1
plot(fk(1:rng),'g')
hold
plot(sign(ERRCK(1:rng)),'r')
plot(clipl*ones(size(1:rng)),'y')
plot(-clipl*ones(size(1:rng)),'y')
plot(zeros(size(1:rng)),'w')
if adjc==l
title('Iesirea comprimata in domeniul timp (medierea cu 2 esantioane): verde etaj 1')
else
title('Iesirea comprimata in domeniul timp (fara mediere): verde etaj 1')
end; pause
close; home; clc
end
% graficul in domeniul timp al iesirii celui de-al doilea diferentiator
if sec==2
plot(fl(l:rng),'g')
hold
plot(sign(ERRCK(1:rng)),'r')
plot(fk(1:rng),'b')
plot(clipl*ones(size(1:rng)),'y')
plot(-clipl*ones(size(1:rng)),'y')
plot(zeros(size(1:rng)),'w')
if adjc==1
title ('Iesirea comprimata in domeniul timp (medierea cu 2 esantioane): verde: etaj 1, albastru: etaj 2 ,rosu: suprasarcina')
else
title('Iesirea comprimata in domeniul timp (fara mediere): verde: etaj 1, albastru: etaj 2 ,rosu: suprasarcina')
end; pause
close; home; clc
end
% graficul in domeniul timp al iesirii celui de-al treilea diferentiator
if sec==3
plot(f1(1:rng),'g')
hold
plot(f2(1:rng),'b')
plot(sign(ERRCK(1:rng)),'r')
plot(fk(1:rng),'c')
plot(clipl*ones(size(1:rng)),'y')
plot(-clipl*ones(size(1:rng)),'y')
plot(zeros(size(1:rng)),'w')
if adjc==1
title('Iesirea comprimata in domeniul timp (medierea cu 2 esantioane): verde: etaj 1, albastru: etaj 2 ,cyan: etaj 3, rosu: suprasarcina')
else
title('Iesirea comprimata in domeniul timp (fara mediere): verde: etaj 1, albastru: etaj 2 ,cyan: etaj 3, rosu: suprasarcina,')
end; pause
close; home; clc
end
% iesirea in domeniul timp a semnalelor reconstituite
plot(outkr(1:rng),'g')
hold
plot(outks(1:rng)-outkr(1:rng),'r')
title('verde: iesirea decomprimata inainte de dezaccentuare in domeniul timp, rosu: eroarea de reconstructie')
pause
close; home; clc
hold
plot(ina(1:rng),'g')
plot(out(1:rng),'b')
title('verde: semnalul de intrare, albastru: semnalul iesirii finale inainte de dezaccentuare')
pause
close; home; clc
% verificarea erorii in domeniul timp
plot(ERR0(1:rng),'g')
hold
plot(ERRCK(1:rng),'r')
plot(clipl*ones(size(1:rng)),'y')
plot(-clipl*ones(size(1:rng)),'y')
title('Verde: eroarea de limitare de la iesirea diferentiatorului inainte de corectie Rosu: verificarea limitarii independente')
pause
close; home; clc
% incheierea programului
return
6.2 ANEXA 2
% Implementarea unui modulator Sigma-Delta de ordin 1
[x,fs,fmt]=wavread('Yahoo_ring_03'); % se incarca un fisier audio pentru testare
x=x(2000:10000);
NumSamps=2000; % numarul de esantioane
OSR=10; % rata de supraesantionare
NumSamps=length(x);
% se intilizeaza datele
z1km1q = 0;
z1km1 = 0;
% Dimensioneaza datele in intregi pe 16 biti
x=round(x*32766);
for n=1:NumSamps
z1(1)=z1km1;
xn=x(n);
for k=1:OSR % Fiecare esantion este supraesantionat de OSR ori
z1(k) = z1km1;
z1km1 = z1(k) + xn – z1km1q;
z1km1q = (z1km1 > 0) * 32766 – (z1km1 <= 0) * 32766;
y(k+(n-1)*OSR) = (z1km1 > 0) – (z1km1 <= 0);
end
end
b=fir1(121,1/(OSR*2)); % Un filtru trece jos este de asemenea un integrator (sau
sumator), in ambele cazuri este necesara reconstruirea semnalului original
y=filter(b,1,y); % Astfel se elimina zgomotul, cea mai mare parte
% a zgomotului este mutata in afara benzii de trecere
y=decimate(y,OSR); % Pastreaza doar 1/10 din esantioane pentru a readuce
% rata de esantionare la valoarea initiala
plot(1:length(y),y ) % reprezentarea semnalului audio refacut
sound(y/3,fs);
6.3 ANEXA 3
% Raspunsurile in amplitudine ale codorului diferential pentru ordinele 1÷6
f=1:100:10^6;
fSDM=64*44100;
fT=fSDM/6;
N1=1; N2=2; N3=3; N4=4; N5=5; N6=6;
Dn1=10*log10((2.^N1/2).*((1-cos(2*pi*f/fSDM)).^N1/2));
Dn2=10*log10((2.^N2/2).*((1-cos(2*pi*f/fSDM)).^N2/2));
Dn3=10*log10((2.^N3/2).*((1-cos(2*pi*f/fSDM)).^N3/2));
Dn4=10*log10((2.^N4/2).*((1-cos(2*pi*f/fSDM)).^N4/2));
Dn5=10*log10((2.^N5/2).*((1-cos(2*pi*f/fSDM)).^N5/2));
Dn6=10*log10((2.^N6/2).*((1-cos(2*pi*f/fSDM)).^N6/2));
figure(1),semilogx(f,Dn1,'b–',f,Dn2,'b:',f,Dn3,'b-',f,Dn4,'b-',f,Dn5,'b:',f,Dn6,'b–'),
grid,ylabel('castigul in dB'), xlabel('scala logaritmica in frecventa ');
% Semnalul de la intrarea codorului diferential
A1=2;A2=2^6;A3=2^6;
f1=20000; f2=10000; f3=50;
N=44100;
t=[0:1/fSDM:(N-1)/fSDM];
x=A1*sin(2*pi*f1*t)+A2*sin(2*pi*f2*t)+A3*sin(2*pi*f3*t);
figure(2);plot(t,x,'b'); grid
title('Semnal sinusodal de intrare in sistem');
xlabel('Timp[ms]');
ylabel('Amplitudine[LSB]');
% Graficul semnalului dither:
Ad=1;
d=2*Ad*((rand(1,N))-0.5);
figure(3);plot(t,d,'b'); grid
title('Dither cu pdf triunghiular ');
xlabel('Timp[ms]');
ylabel('Amplitudine[LSB]');
% Graficul semnalului de la intrarea cuantizorului:
sgn=x+d;
figure(4);
plot(t,sgn,'b'); grid
title('Semnal intrare cuantizor');
xlabel('Timp[ms]');
ylabel('Amplitudine[LSB]');
% Graficul semnalui de la iesirea cuantizorului:
delta=1;
N=length(sgn);
q=delta*round(sgn/delta);
figure(5);
plot(t,q,'b'); grid;
title('Semnal iesire cuantizor');
xlabel('Timp[ms]');
ylabel('Amplitudine[LSB]');
X=fft(q,length(f));
% formarea NSTF(z)=H(z)/(1+H(z)) pentru ordinele 4÷6
b4=[1,-4,6,-4,1];
a4=[2,-4,6,-4,1];
b5=[1,-5,10,-10,5,-1];
a5=[2,-5,10,-10,5,-1];
b6=[1,-6,15,-20,15,-6,1];
a6=[2,-6,15,-20,15,-6,1];
H4=freqz(b4,a4,f,fSDM);
figure(6),plot(abs(H4));
H5=freqz(b5,a5,f,fSDM);
figure(8),plot(abs(H5));
H6=freqz(b6,a6,f,fSDM);
figure(10),plot(abs(H6));
% reprezentarea semnalului de la iesirea codorului diferential pentru ordin 4÷6
z4=10*log10(abs(H4).*X);
figure(7),semilogx(f,z4),grid,ylabel('Amplitudinea in dB'),
xlabel('scala logaritmica in frecventa ');
z5=10*log10(abs(H5).*X);
figure(9),semilogx(f,z5),grid,ylabel('Amplitudinea in dB'),
xlabel('scala logaritmica in frecventa ');
z6=10*log10(abs(H6).*X);
figure(11),semilogx(f,z6),grid,ylabel('Amplitudinea in dB'),
xlabel('scala logaritmica in frecventa ');
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Formate Audio de Inalta Rezolutie Pentru Aplicatii de Arhivare Si Masterare (ID: 132101)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
