Salve lettori dello Zio, è da un po’ che non ci si “legge”, ma è finalmente giunto il momento di fare un altro po’ di strada insieme: bentrovati!
L’occasione è buona per fare chiarezza su alcuni termini, per capire un po’ di differenze e per scoprire quale sia, ad oggi, la relazione che intercorre tra i vari audio network che sfruttano le infrastrutture ethernet, vantaggi e svantaggi delle varie implementazioni e lo stato attuale, reale, della interoperabilità e della compatibilità tra le diverse implementazioni.
Per l’esperto audio medio e per il lettore di Zio Giorgio questa materia potrebbe risultare relativamente nuova e abbastanza complessa.
Al fine di capire meglio e capire tutti, di comune accordo con la redazione, abbiamo pensato di dividere la trattazione in tre parti: in questo articolo parleremo delle differenze the intercorrono tra le soluzioni che si basano su diversi Ethernet layers, nel secondo approfondiremo concetti quali il sincronismo (PTP – Precision Time Protocol), il TimeStamp, il Payload e le latenze, mentre nel terzo e conclusivo articolo analizzeremo le principali soluzioni layer3 (Dante e Ravenna) e AES67, l’interoperability standard che ha definito le regole affinché diversi approcci over IP possano scambiarsi audio sincrono e non compresso senza alcun bisogno di conversioni esterne alla rete, portando esempi reali che meglio possano far capire cosa sia realmente possibile, cosa davvero funziona oggi, specialmente quando sono richiesti sistemi ridondanti.
Iniziamo dunque!
Per capire il perché dire “audio over Ethernet” è diverso dal dire “audio over IP” è necessario sapere cosa sono e come sono organizzati i vari Ethernet Layer, secondo quanto stabilito dal modello OSI (acronimo di Open Systems Interconnection), uno standard per la progettazione delle reti stabilito nel 1984 dall’International Organization for Standardization (ISO), il principale ente di standardizzazione internazionale.
Il layer 1, denominato “Physical” ha come obiettivo quello di trasmettere un flusso di dati non strutturati attraverso un collegamento fisico, occupandosi della forma e dei livelli di tensione del segnale. Ha a che fare con le procedure meccaniche ed elettroniche necessarie a stabilire, mantenere e disattivare un collegamento fisico.
Il layer 2, denominato “Data Link” ha come obiettivo quello di permettere il trasferimento affidabile di dati attraverso il livello fisico. Invia frame con la necessaria sincronizzazione ed effettua un controllo degli errori e delle perdite di segnale. Tutto ciò consente di far apparire, al livello superiore, il mezzo fisico come una linea di trasmissione esente da errori di trasmissione.
Come ben riassunto dalla figura precedente, a questo livello funziona il protocollo PPP sfruttando MAC Address (Media Access Control Address) e LLC (Logical Link Control).
Il layer 3, denominato “Network” ha come obiettivo quello di rendere i livelli superiori indipendenti dai meccanismi e dalle tecnologie di trasmissione usate per la connessione e prendersi carico della consegna a destinazione dei pacchetti.
E’ solo dunque dal layer 3 che si inizia a parlare di IP, IPSec, IGMP ed è a questo livello che entrano in gioco Routing, Address Mapping, la traduzione degli indirizzi di rete, la frammentazione dei pacchetti dati se le reti hanno una diversa Maximum Transmission Unit (MTU) e la trasmissione di dati di lunghezza variabile (datagrams).
Per capire quali principali differenze passino tra AVB e SoundGrid da un lato e Dante, Ravenna, AES67 dall’altro non è fondamentale continuare oltre l’analisi dei layer, ci basta arrivare al layer 3.
Chi fosse interessato comunque a capire di più le funzioni dei layer di rango superiore può consultare questi link: Livello 4: trasporto (Transport Layer), Livello 5: sessione (Session Layer), Livello 6: presentazione (Presentation Layer), Livello 7: applicazione (Application Layer).
AVB, EtherSound e SoundGrid operano sul layer2. Sfruttando unicamente i MAC address, gli apparati non hanno bisogno di avere assegnato un indirizzo IP. Tali audio network utilizzano protocolli e metodi di sincronizzazione tra loro diversi o proprietari, ma in comune hanno il fatto che per funzionare hanno bisogno di una banda di trasmissione garantita e riservata e trasferiscono Ethernet frames di dimensione fissa.
Questi audio network non hanno nulla a che fare con il protocollo IP, operano sul layer 2 e non è corretto dunque menzionarli nella categoria degli AoIP (audio over IP), ma sono pertanto tutti esempi di Audio over Ethernet.
Dante, Ravenna, Q-Net, WheatNet, LiveWire e AES67 operano invece al layer 3, quello IP. Questi sono dunque esempi di AoIP (Audio over IP) perché sfruttano la trasmissione di pacchetti di dimensione variabile all’interno di Ethernet Frames, il routing attraverso indirizzi IP, la diversificazione delle priorità di trasmissione per mezzo del QoS (Quality of Service) e la sincronizzazione mediante PTP (Precision Time Protocol).
Quali sono i vantaggi delle soluzioni al layer 2 o Over Ethernet?
Senza dubbio il fatto che i vari device sono identificati per mezzo del MAC Address (univoco) e non necessitino di un indirizzo IP è un vantaggio per l’utente che non si deve fare carico di distribuire indirizzi, ma il semplice collegamento degli stessi attraverso uno o più switch è sufficiente a metterli in comunicazione.
Un altro vantaggio è che, grazie al fatto che la banda di trasmissione sia riservata e garantita all’interno della infrastruttura ethernet, anche le prestazioni in termini di latenza lo sono e con valori molto bassi (buoni!), così come l’allineamento della fase in qualsiasi punto del network avvenga il playback.
Questi indiscutibili vantaggi non sono però “a costo zero”, ovvero esiste anche l’altra faccia della medaglia o, se così li vogliamo vedere, presentano svantaggi rispetto ad altre soluzioni.
AVB, ad esempio, necessita di switch particolari (non standard) denominati AVB Ready e ogniqualvolta nella “catena” sia inserito uno switch che non lo è, si crea un’isola e AVB si interrompe.
SoundGrid funziona con una selezionata lista di Switch generici, ma non è possibile utilizzarli per altre attività e vanno dedicati esclusivamente alla connessione di apparati SoundGrid, non “mescolando” altri tipi di dati.
Non potendo appoggiarsi su protocolli IP, hanno limiti dimensionali legata alla LAN (Local Area Network) o al massimo alla WAN (Wide Area Network) e hanno la necessità di conoscere e controllare l’intera infrastruttura di rete. In altre parole non sarà possibile utilizzare tali soluzioni per la trasmissione in tempo reale di audio non compresso tra Roma e Milano, giusto per citare due città italiane, in quanto la “dark fibre” messa a disposizione dalle compagnie di telecomunicazioni che collega le due città funziona solo ed esclusivamente attraverso il protocollo IP e non è gestibile dall’utente che vuole “essere trasportato”.
Quali sono i vantaggi delle soluzioni al layer 3 o Over IP?
E’ abbastanza chiaro che le “limitazioni” dei casi precedenti diventino punti di forza per le soluzioni Over IP, ovvero sono indiscutibili vantaggi la possibilità di trasmettere pacchetti di dimensione variabile (nella prossima puntata vedremo come giocare sul “compromesso” latenza Vs efficienza di trasmissione), il poter sfruttare reti di qualsiasi dimensione, utilizzare switch generici che trasmettono e smistano contemporaneamente altri tipi di dati e, addirittura, sfruttare i satelliti geostazionari per la sincronizzazione di locations molto distanti, mediante l’utilizzo di PTP GrandMaster.
Anche in questo caso c’è “un prezzo da pagare”. Mediamente i sistemi AoIP sono più complessi da impostare e gestire rispetto alle soluzioni Layer2, a seconda della quantità di dati presenti nella rete (non solo quelli audio) le latenze in gioco possono subire variazioni o necessitano di particolari attenzioni da parte degli operatori che, volenti o nolenti, devono aumentare le loro conoscenze in materia di IT (Information Technology) e non si possono più accontentare di essere buoni tecnici audio.
Buona “digestione” e alla prossima puntata!
Luca Giaroli
ZioGiorgio Contributor