Il dithering è il processo di aggiunta di una piccola quantità di rumore casuale a un segnale audio digitale per ridurre la distorsione causata dall’errore di quantizzazione. Questa tecnica è fondamentale per mantenere la qualità audio durante il processo di conversione da analogico a digitale e può migliorare notevolmente il suono complessivo di una registrazione digitale.
In questo articolo imparerai le basi del dithering, i vantaggi che offre e alcuni suggerimenti per utilizzarlo correttamente.
Cosa è il dithering in Audio?
Il dithering audio è l’applicazione intenzionale di rumore a basso livello a un file audio. Tale processo aiuta a rimuovere la distorsione di quantizzazione che si verifica quando si riduce il bit depth di un file audio.
Il dithering viene in genere applicato in fase finale mastering, ma dovrebbe essere utilizzato anche ogni volta che si riduce il bit depth del tuo segnale.
Dovresti applicare il dithering quando esporti con bit depth inferiore (ad esempio da 24 bit a 16 bit) allo scopo di soddisfare i requisiti di compatibilità di diversi formati di riproduzione.
Alcuni formati di riproduzione, come CD e alcuni servizi di streaming, possono gestire solo file di dimensioni inferiori, il che significa che avrai bisogno di un file audio con una risoluzione inferiore.
Tuttavia, la riduzione di bit depth dell’audio comporta una distorsione di quantizzazione che è possibile risolvere applicando il dithering.
Per comprendere meglio il dithering, analizziamo perché la distorsione di quantizzazione si verifica durante il processo di conversione da analogico a digitale e in che modo il dithering aiuta a migliorare la qualità complessiva del suono di una registrazione audio digitale.
Cosa è la quantizzazione?
La quantizzazione è il processo di conversione di un segnale audio analogico in un segnale digitale.
La quantizzazione digitalizza una forma d’onda continua in una serie di singoli livelli di ampiezza: converte l’audio in un formato comprensibile da un computer, ovvero un array di numeri.
Per fare ciò, un convertitore analogico-digitale (ADC) acquisisce singole istantanee (una serie di impulsi) di un segnale audio a una frequenza di campionamento e un bit depth specifico (es. 48 Khz/24 bit) . Maggiore è la frequenza di campionamento e il bit depth, maggiore è la risoluzione del segnale audio acquisito.
Pensa al campionamento audio come a un processo simile a come le videocamere catturano il video. Una videocamera ricostruisce un momento continuo nel tempo catturando migliaia di immagini consecutive al secondo, chiamate fotogrammi. Maggiore è la frequenza dei fotogrammi, più veloce è il movimento che puoi catturare e più fluido è il filmato.
Nell’audio, la frequenza di campionamento è il numero di volte al secondo in cui vengono catturati i livelli di ampiezza di una forma d’onda. Maggiore è il numero di istantanee al secondo, maggiori sono le frequenze che puoi catturare.
Fin qui tutto bene, il problema è che gli intervalli di quantizzazione sono finiti.
Quindi con un numero finito di campioni dobbiamo descrivere e riprodurre un segnale continuo! l’ampiezza della nostra onda potrebbe essere qualsiasi valore, ma noi dobbiamo quantizzarlo in un valore predefinito.
Perché ridurre la frequenza di campionamento e il bit-depth dell’audio?
Durante il mix di un progetto, è sempre vantaggioso lavorare con frequenze di campionamento e bit-depth elevati.
Ciò consente una maggiore risoluzione e un minor numero di errori di roundoff. Tuttavia, ci sono momenti in cui dovrai regolare la frequenza di campionamento e il bit-depth del tuo progetto in modo che sia compatibile con il formato di riproduzione audio previsto.
Tuttavia, il processo di riduzione della profondità di bit dell’audio (ovvero il downsampling) provoca errori di quantizzazione e distorsione.
Cosa è la distorsione di quantizzazione?
La distorsione di quantizzazione è il rumore e la distorsione del segnale che risultano dalla differenza tra un segnale analogico e il livello di quantizzazione più vicino.
Riducendo la frequenza di campionamento e il bit-depth dell’audio digitale, si riduce anche il numero di valori disponibili per misurare l’ampiezza di un dato campione.
In altre parole, ora hai meno valori per descrivere l’intervallo dinamico. Di conseguenza, alcuni valori che non esistono più verranno forzatamente troncati e arrotondati per eccesso o per difetto al valore di quantizzazione più vicino.
Quando si riduce il bit-depth da 24 bit a 16 bit, ad esempio, sono disponibili meno passaggi o istantanee per ricostruire i valori di ampiezza della forma d’onda originale.
Man mano che esegui il downsampling a 16 bit, la distorsione di quantizzazione inizia a diventare piuttosto evidente nelle code di riverbero, nelle dissolvenze e nei momenti di silenzio.
Quindi, come gestisci gli errori di quantizzazione e la distorsione che derivano dal downsampling?
Dithering.
A cosa serve il dithering audio?
Il dithering migliora effettivamente la qualità audio dell’audio a bassa risoluzione rimuovendo la distorsione di quantizzazione e sostituendola con il rumore bianco.
Applicando il rumore, il dithering trasforma la distorsione aspra e disarmonica degli errori di quantizzazione in un sibilo analogico di basso livello.
Il rumore nel randomizza i livelli di ampiezza del segnale originale, rimuovendo così la distorsione e mantenendo effettivamente livelli di segnale molto bassi che altrimenti quantizzerebbero in silenzio.
Diamo un’occhiata al dithering in azione. Nel video qui sotto, viene generata un’onda sinusoidale in iZotope RX che sfuma da -84 a -120 dBFS.
Quindi lo troncheremo a 16 bit senza dithering. Nota tutti i prodotti di distorsione tonale che compaiono! – effettivamente una distorsione del 100% – una volta che scende sotto -96 dBFS.
Dopo applicato il dithering. Nota che, anziché prodotti di distorsione tonale, abbiamo un rumore di fondo uniforme e che inoltre il livello dell’onda sinusoidale viene mantenuto al di sopra del rumore di fondo fino a quasi -120 dBFS. Questo è un miglioramento di 24 dB!
Quando usare il dithering.
Il dithering dovrebbe essere sempre disattivato, a meno che l’audio non venga esportato ad un bit-depth inferiore. Idealmente, dovresti eseguire il dithering dell’audio solo una volta durante la fase finale del mastering quando esporti un file ad un bit-depth inferiore (ad esempio da 32 bit a 24 bit o da 24 bit a 16 bit).
Tuttavia, quasi tutte le moderne workstation audio funzionano internamente a 32 bit floating-point, quindi se stai esportando un file WAV a 24 bit per il mastering, dovresti anche eseguire il dithering.
In generale, dovresti eseguire il dithering dell’audio solo quando esporti a 24 bit o meno. Non devi preoccuparti del dithering se stai esportando un file a 32 bit floating-point o superiore perché è una risoluzione sufficientemente alta da non produrre alcuna distorsione di quantizzazione udibile.
Altre considerazioni sul dithering
Prima di concludere, ci sono alcuni casi specifici, insieme a un paio di miti perniciosi, che vorrei affrontare.
- Auto-dithering: di tanto in tanto potresti sentire qualcuno dire che non è necessario applicare il dithering se stai utilizzando questo o quel plug-in, perché si autodithererà. Anche se tecnicamente questo può essere vero in alcuni casi molto specifici, è un’ipotesi rischiosa da fare. Che tu ci creda o no, tutto il rumore non viene creato ugualmente, quindi a meno che il dispositivo che stai utilizzando non abbia un’impostazione di dithering specifica, dovresti aggiungere dithering se stai riducendo la profondità di bit.
- 24 bit e modellazione del rumore: una cosa che non abbiamo davvero toccato è la modellazione del rumore. In poche parole, è fondamentalmente come applicare l’equalizzazione al rumore di dithering per renderlo meno udibile. A profondità di bit di 8 o 16 bit, questo può fare una differenza apprezzabile. A 24 bit, tuttavia, il rumore di dithering è così basso che a normali livelli di ascolto non è udibile, anche senza noise shaping. Tuttavia, rimuoverà la distorsione di quantizzazione che, a causa della sua natura tonale, ha una probabilità molto maggiore di essere udibile. In quanto tale, un dithering piatto di tipo TPDF è perfetto.
- Bouncing, flattening, freezing: no, non stiamo parlando di qualche oscuro metodo di preparazione del cibo. Diverse workstation audio operano in modi diversi, ma la maggior parte offre un metodo per “stampare” una complessa catena di effetti audio in un file. Se non hai esplorato le opzioni nella tua DAW, potrebbe essere il momento di dargli un’occhiata. Quando possibile, la virgola mobile a 32 o 64 bit sono le migliori opzioni, ma se sei costretto a utilizzare 24 bit, controlla se esiste un’opzione per abilitare il dithering.