Quanti di voi conoscono la fiaba “I vestiti nuovi dell’Imperatore” di Hans Christian Andersen?
Anche nel mercato finalmente trainante dell’audio immersivo o multicanale che dir si voglia, sono convinto che una voce innocente che si levi in mezzo all’assordante silenzio dei veri esperti sarebbe oltremodo necessaria. Io sono un falso grasso, vecchio e per niente innocente, però accontentatevi del mio vocione alla carta vetrata perché ho deciso di dimostrare anch’io, armato con semplici assunti oggettivi di psicoacustica e tanto metodo scientifico, quanto sia nudo e illuso il Re (leggi mercato attuale) quando parla di innovazione e qualità. In un precedente articolo abbiamo demistificato due pilastri del panning volumetrico in piano ed ecco che, parlando dell’ormai famigerata terza dimensione, si staglia all’orizzonte un’altra approssimazione grossa come una casa. Una presunta regola standard che si rivela, invece, alquanto arbitraria, approssimativa ed estremamente soggettiva: la head-related transfer function, in arte HRTF. Cercherò per quanto possibile di spiegarmi con un tono colloquiale non molto accademico ma sicuramente comprensibile per tutti.
Chiamata anche anatomical transfer function, ATF, la funzione HRTF è alla base della maggior parte dei calcoli effettuati da quasi tutti i produttori di sistemi hardware e software deputati alla valutazione, creazione o simulazione di ambienti immersivi o comunque multicanale per il cinema, la musica e l’analisi acustica. Ma vediamo in parole povere di cosa si tratta. La funzione HRTF esprime (io direi tenta di esprimere), con un valore numerico interpretabile, cosa e quanto arrivi in ingresso al nostro sistema uditivo di una onda sonora generata nelle nostre vicinanze. L’onda viene parametrizzata, cioè ridotta a numeri, utilizzando soltanto i valori di frequenza e posizione della sorgente audio nello spazio, tralasciando cioè tutto il resto (niente riflessioni, agenti atmosferici, ostacoli, direzionalità della sorgente di emissione, etc.). Non solo, la fisica ci insegna che tale valore viene filtrato (cioè modificato) dalle proprietà di diffrazione e riflessione della testa, Pinna e torso, PRIMA che il suono raggiunga il nostro sistema di trasduzione del timpano e dell’orecchio interno (leggi sistema uditivo).
Quanto se ne deduce, biologicamente parlando, è che gli effetti di prefiltrazione delle specifici di queste strutture esterne AIUTANO nella determinazione neurale della posizione della sorgente, in particolare la determinazione dell’elevazione della sorgente. Leggi bene, AIUTANO non DETERMINANO. Leggiamo ancora meglio. Tale valore viene filtrato (cioè modificato) dalle proprietà di diffrazione e riflessione della testa, pinna e torso. Ma io potrò muovere la mia testa o il torso mentre ascolto musica o mi devo far legare ad una seggiola prima? Poi la pinna… la pinna! Ce l’abbiamo tutti diversa, ringraziando chi di dovere, tutti estremamente, meravigliosamente e innegabilmente diversa l’una/o dall’altra/o!
Come pensate che si possa sentire la stessa cosa quando si utilizzano strumenti così diversi per ascoltare? Infatti, nessuno di noi sente la stessa cosa, più della metà di noi, andando nello specifico, l’effetto di un HRTF NON LO SENTE quando addirittura non lo sente magari all’opposto! Ecco il perché della mia domanda iniziale riguardante la fiaba… Tutti dicono “aaahh ma adesso con le tabelle di HRTF media” per darsi un tono, ma sapete di cosa caspita state parlando? L’elevazione di un suono in una simulazione potete ascoltarla soltanto quando avete degli speaker posizionati ad un’altezza maggiore della vostra testa ed in numero sufficiente. La HRTF, se per voi funziona, usatela come il vecchio comando di loudness negli impianti stereofonici, cioè per divertimento, consapevoli dei danni che probabilmente state facendo!
(NB: Quando indossate una cuffia poi, vanificate gran parte dei vostri sforzi di trovare verosimiglianza tra l’evento originale e la sua registrazione perché tagliate fuori, dal novero dagli elementi a disposizione del vostro cervello per effettuare la valutazione, le proprietà di diffrazione e riflessione della testa, della pinna e del torso…)
Insomma, qualità certamente appena sufficiente, innovazione inesistente (vedi articolo su ambisonics e Gerzon) su cosa si basa la “novità” innegabilmente affascinante che va per la maggiore nella produzione audio professionale in questo 2022 segnato dall’ennesima guerra e dalla presunta fine (andateci piano, date retta al matto) di una pandemia? Sulle vostre capacità umane che tanto poco considerate. Fantasia. Ironia. Arte. Interpretando l’ambiente senza alcuna pretesa di riproduzione dello stesso, ma con l’estro necessario per modificarlo donandogli un senso, un significato, estendendo in parole povere la realtà. Sono questi i parametri che dovete utilizzare creando ambienti immersivi, o come dichiarava il titolo di un saggio che scrissi molti anni fa, creando paesaggi sonori.
Il paesaggio sonoro è legato indissolubilmente al luogo in cui viene realizzato. Trasportato con mezzi meccanici (Benjamin) lontano dalla sua componente ambientale perde senso ed efficacia. La discografia, le radio, internet, sono mezzi per la distribuzione tagliati su misura per la forma canzone. La canzone, a sua volta, può resistere e mantenere un senso anche se evocata per mezzo di un segnale mono e compresso che però riproduca il “motivetto” principale. Provate a fischiettare un ambiente immersivo.
Ora qualcuno di voi potrebbe chiedermi “ma te non produci per lavoro ambienti immersivi? Con cosa li fai se tutti gli strumenti più usati non ti vanno bene?” Se volete farmi questa o altre domande sapete dove trovarmi. Intanto vi ringrazio per aver letto questo articolo e, se siete d’accordo, vi chiedo gentilmente di spargere la voce senza paura: “Il re è nudo!”
Luigi Agostini
ZioGiorgio Contributor
© 2001 – 2022 NRG30 srl. All rights reserved