Il livello di ridondanza – Part 1

Nel 2008, a Pechino, ho avuto l’onere e l’onore di progettare, programmare e gestire l’intero network a fibre ottiche che raccoglieva e distribuiva la totalità dei segnali audio (SMPTE per i fuochi artificiali incluso!) per le cerimonie di apertura e chiusura dei Giochi Olimpici.

Quando Gary Hardesty, capo supremo di tutto ciò che riguardasse l’audio per quegli eventi, mi disse “Luca, qualsiasi cosa succeda i segnali non devono interrompersi, qui ci fanno fuori!” ricordo che sorrisi e gli risposi “Gary, sai che “qualsiasi cosa” non posso garantirtelo, anche alla ridondanza c’è un limite!”.

Fu così che io e Gary spendemmo giorni nel definire nei minimi dettagli quali dovessero essere i livelli di sicurezza per i vari segnali, nei vari punti, quali sorgenti e per quali destinazioni. In quell’occasione, se nemmeno “sua maestà” Gary Hardesty lo utilizzava, mi è parso chiaro che non esisteva un metodo standard per inquadrare la ridondanza. Un paio d’anni dopo e svolte un po’ di ricerche, mi diedi proprio come obiettivo quello di idearne uno.

“Il livello di ridondanza come metodo per la progettazione di sistemi audio live” divenne così il titolo della mia tesi di laurea in ingegneria, finalmente portata a termine dopo tanti anni di “naftalina”. In questa mia nuova veste di collaboratore di ZioGiorgio e per l’articolo di esordio mi piaceva l’idea di estrapolare da quel lavoro l’essenza del metodo e proporre così a voi lettori nella maniera più sintetica possibile (suddivise in puntate per digerirle meglio) delle “dritte” che possano migliorare il vostro approccio all’analisi, alla progettazione e all’utilizzo di sistemi audio live.

Chi fosse interessato ad approfondire gli argomenti, con tanti dettagli tecnici in più, potrà inviarmi una mail e potrà ricevere un link per scaricare l’intera tesi.

Ridondanza

In certi ambiti il termine ridondanza può suonare negativo. Nel mondo dell’audio professionale è invece assolutamente ricercato, poiché eventuali inconvenienti non gestiti a dovere potrebbero davvero non far suonare più nulla! Quando si può sostenere che un sistema è ridondante? Facciamo un esempio congeniale ai più. Ogni automobile è di solito dotata di una ruota di scorta e, proprio per questo, si potrebbe affermare che l’automobile con ruota di scorta sia ridondante, in quanto la foratura di uno dei pneumatici, a patto di impiegare un po’ di tempo e pazienza nel cambio gomma, non interrompe il viaggio. Ma se per sfortuna se ne forasse un secondo di pneumatico? Se finisse il carburante? E se si rompesse l’albero di trasmissione? Allora la continuazione del viaggio sarebbe realmente a rischio. Ridondanza non è una parola magica, ma è materia complessa e da analizzare con metodi appropriati e specifici, che assume significati precisi soltanto se accompagnata da convenzioni esplicite, accettate e contestualizzate.

Problematiche

Con l’avvento dell’era digitale, anche il settore dell’audio professionale si è dovuto adeguare alle moderne tecnologie. Questo ha portato notevoli vantaggi, ma inevitabili complicazioni; all’epoca dell’analogico non ci si doveva confrontare con latenza, word clock, jitter, protocolli, firmware, software, formati e pertanto i problemi ad essi relativi non esistevano. A differenza di altri settori nei quali esistono degli standard di sicurezza, la ridondanza dei sistemi audio professionali, ad oggi, non è stata definita e regolamentata.

Obiettivi

Lo scopo principale di questo lavoro è quello di suggerire un metodo di analisi della ridondanza da applicare a sistemi digitali per la distribuzione, raccolta e trattamento di segnali audio in eventi dal vivo e, conseguentemente, una loro corretta progettazione.

Ci prefiggiamo quindi di dare uno strumento sia al progettista che al committente per definire quali siano le aspettative in termini di ridondanza. In assenza di chiarezza su cosa si intenda con tale termine, il progettista non sa a che livello si possa ritenere soddisfatto e il committente non conosce quali siano le contromisure agli inconvenienti previste per evitare interruzioni del servizio e, soprattutto, se queste siano incluse o meno nei costi che dovrà sostenere.

Contributi

Per fare questo si inizierà definendo nomenclatura, regole e simbolismi grafici, individuando le principali classi di inconvenienti e si accennerà agli aspetti salienti della rete di raccolta e distribuzione dei segnali e degli altri apparati. Si suggerirà poi come poter aumentare il livello di ridondanza e si illustrerà la sequenza dei passi da seguire per una corretta progettazione. Il lavoro si concluderà con una parte dedicata alle responsabilità, nella quale si suggeriscono strumenti che dovrebbero minimizzare le incomprensioni e le probabilità di contenzioso tra committente, progettista ed esecutore dei lavori. Ma cominciamo ad entrare nel vivo di questo primo articolo. Pronti? Via! 

Il sistema

Il primo passo del progettista deve essere quello di definire il sistema di competenza, ovvero dove iniziano e terminano le proprie responsabilità. Potrebbe essere richiesto di progettare un sistema di distribuzione di segnali audio per uno stadio, prelevandoli dalla console/matrice principale e consegnandoli ai vari diffusori disposti attorno al campo di gioco ed in vari settori delle gradinate. E’ fondamentale sapere se il sistema include la console/matrice e i diffusori o se invece è circoscritto alla rete di distribuzione.

Sistema comprendente la rete, i diffusori e la console

Nel primo caso si dovrà tenere conto dei potenziali inconvenienti che si possono verificare in tutti gli apparati menzionati, valutando, prevedendo e specificando soluzioni ridondanti per ognuno di essi. Nel secondo caso ci si limiterà a prendere atto di quali siano i segnali che la console/matrice consegnerà e quelli che i diffusori riceveranno, eseguendo progetto e analisi del sistema di competenza e cioè della sola rete di distribuzione.

Sistema comprendente la sola rete

Il funzionamento di console/matrice e diffusori sarà curato e certificato da terze parti. Quando la responsabilità è limitata ad un sotto-sistema, o più precisamente ad un sistema in comunicazione con altri, è buona norma definire in forma rigorosa delle interfacce con tutti gli interlocutori, specificando i dettagli delle connessioni quali natura (formato, tipo di connettore, …) e scopo (segnale principale, segnale di scorta, …).

La nomenclatura

Il sistema (system) è l’insieme logico di tutti gli apparati, le connessioni ed i segnali che, sotto la responsabilità del progettista, saranno utilizzati per raggiungere gli scopi richiesti. E’ opportuno definire una serie di convenzioni, a partire dai nomi che si daranno ai vari elementi del sistema.

Una parte fondamentale di qualsiasi progetto di una certa dimensione è la rete vera e propria (network) e cioè quell’insieme di apparati che opportunamente collegati tra loro trasferiscono nello spazio i diversi segnali. A seconda del tipo e del numero di reti utilizzate si potranno trasportare audio, word clock e segnali ausiliari quali video, Ethernet o altri protocolli.

Si definisce nodo (node) un singolo elemento della rete, cioè un apparato che può scambiare segnali con un altro nodo attraverso un mezzo trasmissivo, tipicamente una fibra ottica, ma anche cavi CAT5/CAT6 o coassiali. Si definisce foglia (leaf) un qualsiasi apparato collegato ad un nodo della rete ma che non faccia parte della rete stessa. Questo infatti differenzia la foglia da un altro nodo. Esempi di foglia possono essere console di missaggio, amplificatori, microfoni, preamplificatori, convertitori, splitters, etc. Si definisce zona (zone) un qualsiasi insieme di nodi e di foglie. Questa entità servirà per individuare un insieme logico di apparati eterogenei che si trovano in una zona geografica o che svolgono un determinato compito.

Si definisce percorso (path) l’insieme di tutti gli apparati che il segnale in analisi percorre dal suo ingresso alla sua uscita, relativamente alla porzione di sistema definita dal percorso stesso. Nel caso di sistemi ridondanti è intuibile che un segnale possa seguire più di un percorso. Si definisce funzione (task) l’insieme delle zone necessarie al fine di garantire uno specifico numero di compiti tra loro correlati. Un esempio di funzione potrebbe essere la diffusione sonora, la registrazione dell’evento, la messa in onda, etc. E’ assolutamente normale e possibile che diverse funzioni condividano una o più zone, ad esempio i segnali microfonici raccolti sul palcoscenico sono comuni a tutte e tre le funzioni sopracitate.

Rete, nodo, zona, percorso e funzione sono tutti esempi di sotto-sistema (sub-system). Questo concetto tornerà molto utile nello svolgimento dell’analisi della ridondanza.

Esempi di nodo, foglia e zona

Path (Console-NordOvest)

Da ora in avanti si utilizzeranno indifferentemente questi ed altri termini in italiano o in inglese, a seconda dei contesti o degli usi più comuni.

Il livello di ridondanza

Si definisce livello di ridondanza il numero di inconvenienti distinti e indipendenti che possono verificarsi senza che questi causino un’interruzione significativa del servizio, durante l’arco temporale del servizio stesso.

Come ben presto si capirà, il livello di ridondanza ha senso solo se attribuito al contesto da analizzare e cioè al sistema o ad un suo sotto-sistema. Si capirà che livello ha un nodo, il network, una zona, un percorso, un task e come questi livelli sono tra loro correlati.

E’ ovvio che la definizione data contiene termini non esatti, cioè passibili di interpretazione. Ad esempio si dovrà adeguare il concetto di interruzione significativa del servizio al contesto che si vuole analizzare e al tipo di servizio. Nell’amplificazione di un qualsiasi evento live, la perdita di un sample non può essere considerata significativa, ma un buco di 5 secondi può essere fatale. Al contrario se il task è la registrazione dello stesso evento, allora anche la perdita di un solo sample può rappresentare un problema serio. L’arco temporale può essere inteso come quello di una serata di spettacolo, durante la quale non si ha molto tempo a disposizione per porre rimedio ad eventuali malfunzionamenti, oppure la vita media di un’installazione fissa, che è di norma di diversi anni. Per l’analisi della ridondanza che in questo lavoro si propone, ove non specificato altrimenti, si prenderà come arco temporale la durata di uno spettacolo.

Esempi di livelli di ridondanza

Qualche esempio pratico renderà più chiara la definizione.

Livello_0: è un sistema totalmente privo di aspetti ridondanti e cioè anche solo un inconveniente determina l’interruzione del servizio. Si prenda come sistema una semplice foglia costituita da una console di missaggio dotata di un solo PSU, sarà sufficiente la mera caduta della tensione o la rottura del PSU stesso per interrompere il servizio.

Livello_1: se la stessa console è dotata di doppio PSU, uno collegato alla rete elettrica ed uno collegato ad un UPS6 , rappresenta un sistema a livello 1, in quanto sopravvive ad un eventuale caduta di tensione.

Livello_2: un sistema composto da due foglie, una console ed uno stage rack entrambi dotati di doppio PSU, collegati tra loro da due coppie di fibre (send+return main e send+return spare) sopravvive anche nel caso che si verifichino due inconvenienti nell’arco temporale di riferimento, quali la rottura di una coppia di fibre ed uno qualsiasi dei PSU presenti.

N.B.: il livello di ridondanza non è dato dal numero delle coppie di fibre o dal numero di alimentatori che possono presentare un problema, ma dal numero di inconvenienti di tipo diverso che possono verificarsi nell’arco temporale di interesse senza interrompere il funzionamento del sistema.

Nell’esempio appena citato, si ha livello 2 poiché il sistema sopravvive sia ad un problema elettrico che di fibre. Sebbene a livello 2, un’eventuale rottura anche della seconda coppie di fibre provocherebbe la “fine delle trasmissioni”. Il livello di ridondanza relativo ad una sola tipologia di possibili guasti (fibre, alimentatori, …) non è particolarmente interessante ai fini del metodo proposto, come si capirà in seguito. Si definisce comunque quest’ultimo livello come ridondanza specifica che è banalmente identificato da n − 1, dove n è il conteggio delle risorse fungibili a disposizione del sistema o sotto-sistema considerato.

Livello_3: Si aggiungano un paio di generatori di clock all’esempio precedente e si supponga che la console abbia necessariamente bisogno di un segnale di sincronismo esterno, fornitogli indifferentemente da uno dei due. Se si è particolarmente sfortunati e agli inconvenienti citati nell’esempio del livello 2 si aggiungesse anche il malfunzionamento di un generatore di clock, il sistema non interromperebbe il servizio. Si ha ridondanza a livello 3 poiché si sopravvive a problemi elettrici, di mezzo trasmissivo (fibra) e clock.

Interdipendenza dei guasti

E’ fondamentale analizzare l’eventuale interdipendenza dei vari inconvenienti che si possono presentare, sia in fase di progettazione ma soprattutto durante la valutazione dei livelli di ridondanza. Con riferimento all’esempio riportato al Livello_3, se viene commesso un banale errore di progettazione o di montaggio ed entrambe i PG (Pulse Generator o generatori di sincronismo) vengono alimentati dalla stessa linea elettrica, quand’anche dotati di doppi alimentatori, nel caso intervenga un differenziale/magnetotermico di protezione della linea, si spegnerebbero entrambi facendo perdere il segnale di sincronismo vitale per l’intero sistema analizzato.

Questo errore invalida il livello di ridondanza o, meglio, il livello che si credeva di avere in quando è bastato un solo tipo di guasto (quello elettrico) per interrompere il servizio. Quello che avrebbe dovuto essere un sistema a livello 3 si è rivelato, di fatto, a livello 0. Rimandando alla definizione di livello di ridondanza si ribadisce che i vari livelli (o analogamente le tipologie di guasti) considerati devono essere effettivamente indipendenti.

Classi di inconvenienti

Ora che diverse definizioni e concetti fondamentali sono assimilati, è comodo introdurre una nuova entità: la classe degli inconvenienti. Sebbene questa non aggiunga nulla di nuovo a ciò che si è esposto sino ad ora, risulterà molto comoda per alleggerire in seguito sia l’esposizione che la simbologia. La classe è dunque l’insieme degli inconvenienti che appartengono alla stessa tipologia, spesso quindi non indipendenti tra loro. Inconvenienti indipendenti appartengono sempre a classi diverse.

Esempi di classi, sono quelli degli inconvenienti elettrici, che si riassumeranno con Power, quelli relativi a word clock o affini, Synch, quelli relativi ai mezzi trasmissivi quali fibre, cavi coassiali, CAT5 che si raggrupperanno con il termine Wiring. A seconda dei progetti possono ovviamente esistere altre classi.

Si ribadisce ancora una volta che al fine di una corretta applicazione del metodo proposto, è assolutamente necessario che l’intersezione tra classi diverse sia l’insieme vuoto. In altre parole, un inconveniente deve afferire ad una ed una sola classe e, di conseguenza, le classi siano indipendenti.

Alla luce della definizione di classe, può essere riformulato il concetto di livello di ridondanza e cioè il numero di classi di inconvenienti che possono presentarsi senza che questi causino un’interruzione significativa del servizio, durante l’arco temporale del servizio stesso.

Fault di un apparato

Si prenda spunto da un settore diverso da quello in esame, nel quale molti più investimenti sono stati fatti in materia di sicurezza e ridondanza: l’Infomation Technology. Alcune osservazioni sul server, senza dubbio la macchina più importante di un sistema informativo fanno notare che spessissimo è collegato ad UPS, è dotato di doppio alimentatore, ha più processori, monta hard disk raid in mirror, ha metodi di backup automatici, etc.

Si prendono quindi tutte le precauzioni del caso, ma non si è mai sicuri al 100% che questo non possa fermarsi. Al suo interno ci sono milioni di componenti elettronici ognuno dei quali può, senza alcun preavviso, guastarsi, causando il fault totale del server stesso. In situazioni nelle quali non è proprio possibile tollerare questa eventualità, sono previsti uno o più server paralleli al fine di garantire la continuità di servizio.

E’ ovvio che ogni server aggiuntivo rappresenta un notevole investimento così come la tecnologia che si deve impiegare per riorganizzare i processi e garantire la non interruzione dei servizi. E’ altrettanto ovvio allora che si cerchino di individuare quali siano gli inconvenienti più probabili e si concentrino le risorse su aspetti ridondanti degli stessi. La scelta di alimentatori, dischi e processori non è affatto casuale.

Per analogia, nel settore dell’audio professionale, le classi di inconvenienti principali alle quali si deve prestare la massima attenzione sono, per esperienza, Power, Wiring e Synch e nella tesi completa c’è un apposito capitolo di approfondimento. E se questo non dovesse bastare? L’eventuale guasto di un apparato e cioè non un semplice alimentatore, cavo, segnale di sincronismo, ma un altro problema interno (elettronico, meccanico, …) che lo metta completamente fuori uso, come lo si può gestire?

Non è possibile prevedere tutte le classi di inconvenienti e non è nemmeno utile ai fini del metodo proposto. La soluzione (a livello progettuale) è molto semplice: se si deve prevedere la sopravvivenza al fault totale di un apparato basta definire come ulteriore classe di inconveniente l’apparato stesso. Si prevede che si debba poter farne completamente a meno e si aggiunge la classe che fa salire di un’unità il livello di ridondanza.

Supponiamo che il nodo N 1 sia collegato al resto del network con una doppia coppia di fibre e sia dotato di doppio PSU con alimentazioni indipendenti. Come si evince dalla figura il nodo ha livello di ridondanza pari a 2, in quanto sia l’interruzione di una delle due coppie di fibre che uno dei due PSU, non interrompe il servizio. Gli I/O locali da e per la foglia vengono comunque garantiti dal nodo che si è autoprotetto.

nodo N 1 a livello di ridondanza 2

Si è più volte sottolineato che c’è molta differenza tra livello di ridondanza (riferito a tutte le classi) e la ridondanza specifica (riferita ad una sola classe). In questo caso il livello di ridondanza specifica sia della classe Power che del Wiring è pari a 1, cioè si continua a funzionare solo se una coppia di fibre o uno dei due PSU si guastano nello stesso arco temporale, ma non si tollerano due inconvenienti dello stesso tipo e cioè l’interruzione di entrambe le coppie di fibre o il fault di tutti e due i PSU.

Questo significa che la ridondanza specifica “mortifica” il livello di ridondanza? Assolutamente no, perlomeno secondo il metodo che si vuole proporre. Questo risulterà più chiaro utilizzando quest’ultimo esempio: una seconda fibra interrotta (vedi figura 2.6) o entrambe i PSU guasti (figura 2.7), ai fini dell’analisi della ridondanza ed anche come effetto netto, è del tutto equivalente alla perdita totale (fault ) del nodo N 1 in quanto la foglia è isolata e gli I/O locali sono comunque persi.

E’ quindi molto più pratico ed efficace elevare a classe di inconveniente il nodo stesso piuttosto che iniziare a pensare a quante fibre stendere, quanti PSU predisporre per essere immuni da problemi e così via. Per di più, così facendo, in questa classe rientreranno gli innumerevoli inconvenienti potenziali non appartenenti alle classi già trattate che porterebbero l’apparato alla condizione di fault.

Fig 2.6: equivalenza tra perdita totale delle fibre e fault del nodo

Fig 2.7: equivalenza tra perdita di tutti i PSU e fault del nodo

Si decide quindi di limitare il livello di ridondanza del nodo N 1 al valore 2 e cercare una soluzione alternativa al di fuori di esso quando questo non dovesse essere sufficiente. Se si trova un rimedio al fault del nodo stesso, la zona contenente il nodo N 1 salirà al livello 3. Sebbene i metodi per incrementare i livelli di ridondanza saranno studiati più avanti, al puro fine di introdurre il prossimo argomento si accenna ad una possibile soluzione: si potrebbe introdurre nella zona un nodo N 1B (equivalente ai fini dei segnali ad N 1) e mettere a punto un piano di emergenza che, al momento del bisogno, provveda a re-indirizzare (re-patch ) i segnali necessari per la continuità del servizio.

Azionamento della ridondanza

Chi decide il momento di far intervenire un elemento ridondante? E in che modo? Negli esempi fin qui riportati si sono mostratati diversi casi e se ne aggiunge ora uno ulteriore:

• l’alimentatore di scorta è in realtà sempre in funzione;

• una coppia di fibre viene utilizzata dal nodo nell’istante in cui si accorge che l’altra non è più disponibile;

• il cambio di patch susseguente al fault del nodo è probabilmente azionato da un operatore mediante la pressione di un tasto;

• la sostituzione di un apparato, di un alimentatore o di un cavo è fisicamente effettuata da un addetto.

Tipologia di intervento

E’ di fondamentale importanza riconoscere e classificare in che maniera gli interventi vengono azionati.

Si definisce intervento automatico quello che avviene istantaneamente invocato dagli apparati stessi, senza bisogno dell’azione umana. Come intuibile questo è quello da preferire, ove possibile.

Si definisce intervento semi-automatico quello che viene invocato da un operatore ma eseguito da apparati. E’ questo il caso della pressione di un bottone per effettuare un cambio di patch, per togliere il MUTE dai processori di scorta, etc.

Si definisce intervento manuale quello effettuato fisicamente da un ad- detto. Esempi in tal senso si sprecano: scollegare/collegare un connettore, sostituire una fibra, un microfono, un cavo, un amplificatore e così via.

I tre tipi di intervento sono estremamente diversi tra loro per tempi di rea- zione e garanzia di risultato e, quando si farà riferimento al livello di ridondanza, si elencheranno le classi ad intervento automatico (A), quelle ad intervento semi-automatico (S) e quelle manuali (M), rigorosamente in quest’ordine.

Nella pratica, una volta definita l’interruzione significativa del servizio e approntati opportuni rimedi con classi ad intervento automatico, difficilmente si è in grado di rispettarne i canoni con ulteriori interventi semi-automatici e manuali. Si supponga che il task sia la registrazione e si adotti un network che si auto-protegge nel tempo di un sample. Si prevede quindi il tempo minimo di reazione e si definisce l’interruzione significativa del task quale la mancata registrazione di porzioni dell’evento superiori ad un sample.

Si supponga ancora che il task abbia livello di ridondanza 3 (con classi ad intervento automatico) e, per ristrettezza di budget, l’eventuale aumento di livello sia possibile solo con interventi semi-automatici. Per quanto attento e rapido, la persona addetta al livello 4 semi-automatico non potrà mai garantire tempi di reazione dell’ordine del sample e ciò porterebbe comunque alla significativa interruzione del servizio. Ci si dovrebbe quindi rinunciare? Si preferirà avere qualche secondo di nero che perdere tutta la parte dello spettacolo susseguente al fault.

In questi casi è importante avere le idee chiare e non mischiare interventi A con quelli S ed M per la stessa classe, magari al solo fine di “vendere” un progetto con livelli di ridondanza “drogati” e non per quello che in realtà sono.

Non c’è nulla di male ad avere interventi S o M, anzi nella quotidianità spesso è l’unica maniera per contenere i costi entro livelli ragionevoli e di mercato. Occorre però che questo sia chiaro ed accettato da tutti i soggetti interessati e che le procedure S ed M siano messe a punto con i requisiti che ne massimizzino la probabilità di successo e che vengano invocate nel minor tempo possibile.

Convenzione grafica per i livelli di ridondanza

Si introduce ora il simbolismo con il quale si indicherà il livello di ridondanza di un sistema. Questo permetterà di esprimere molte informazioni in maniera stringata e leggibile. Si indica il nome dato all’elemento in analisi con in pedice la porzione del sistema che rappresenta ed in apice il livello di ridondanza globale, una partenesi graffa che conterrà i livelli automatici, semi-automatici e manuali, ognuno dei quali preceduto dalla sigla RED (Redundancy) con in apice il livello e seguito dall’elenco delle classi:

La zona NORTH-EAST potrebbe avere ad esempio livello globale 5, con interventi automatici per Power, Wiring e Synch; intervento semi-automatico per il fault del nodo N 1 e manuale per la foglia L1.

Tutto questo si rappresenta con:

Per oggi possiamo ritenerci soddisfatti.

Nella prossima puntata analizzeremo come network e livello di ridondanza siano correlati. A presto!

Luca Giaroli
ZioGiorgio Contributor

info: www.lucagiaroli.com

Vai alla barra degli strumenti