Dossier : AVoIP et SDVoE creusent leur sillon

Les câblages de distribution audiovisuelle sur paires torsadées, en format propriétaire ou standardisés avec le HDBaseT, ne pouvaient pas rester plus longtemps à l’écart de la déferlante des technologies IP. D’où l’apparition d’un nouvel acronyme, l’AVoIP, pour « AudioVisual over IP » apparu chez de nombreux constructeurs. Ces nouveaux modes de distribution empruntent les réseaux informatiques d’entreprise, soit avec des solutions propres à chaque constructeur, soit standardisées selon le SD
1_Sono18_AVOIP_hdmi-module-netgear.jpg

 

Même s’ils empruntent des concepts voisins, les équipements AVoIP ne doivent pas être confondus avec les outils de streaming. Ces derniers ont pour objectif de distribuer des contenus audiovisuels à un large auditoire via Internet. Pour cela, ils utilisent des codecs à forte compression inter-images (H.264 ou H.265) pour réduire le débit vidéo, mais hélas au prix d’une latence importante de plusieurs centaines de millisecondes. L’usage des technologies AVoIP est destiné à une distribution audiovisuelle dans une salle de réunion ou un espace public, vers les locaux attenants ou au maximum à l’échelle d’un campus.

Pour des affichages sur grand écran, il est impératif que la qualité originelle des images soit préservée, éventuellement une compression légère ou un traitement non destructif. Avec des algorithmes de type Mpeg, la réduction de débit peut altérer la qualité des images. Les effets d’une latence non négligeable risquent de perturber l’attention de l’auditoire et de compliquer les échanges interactifs. D’autre part les contraintes induites par l’usage d’un réseau local sont plus limitées que celles d’Internet.

 

 

Remplacer la matrice de commutation par un switch réseau

L’objectif premier de l’AVoIP est de remplacer les câblages habituels propriétaires de l’audiovisuel par les réseaux informatiques banalisés en offrant plus de souplesse et des économies d’infrastructure. C’est aussi l’objectif affiché des systèmes de transport sur paires torsadées ou standardisés en HDBaseT. Mais pour assurer la distribution de multiples sources d’images vers de nombreuses destinations, il est indispensable de créer un nœud d’échanges central avec une matrice de commutation. Outre son prix élevé quand ses capacités dépassent le classique 4 x 8 ou 8 x 8, sa structure figée, son dimensionnement dans un format carré ou rectangulaire laisse peu de place à des évolutions futures ou pour des dessertes fortement asymétriques en nombre de sources et de destinations.

Le passage à l’AVoIP offre une souplesse beaucoup plus grande dans le dimensionnement des échanges, une matrice 6 x 17 ou 13 x 29 est facilement modifiable et reconfigurable au niveau d’un switch réseau, chacun de ses ports étant bidirectionnel, et de nombreux modèles sont stackables pour créer des matrices avec des capacités encore plus larges. La montée en débit des liaisons, 100 Mb/s, puis Gigabit et maintenant 10 Gb/s avec une baisse régulière des coûts facilite aussi la montée des résolutions et formats d’images, HD puis 4K et bientôt 8K pour des affichages multifenêtres ou d’applications graphiques sophistiquées.

 

 

Passer au réseau 10 Gb/s ?

Tous ces avantages pourraient laisser supposer que l’AVoIP emporte les suffrages des utilisateurs et balaie rapidement toutes les offres existantes basées sur des câblages dédiés (HDMI ou autres) ou des infrastructures basées sur la paire torsadée, soit propriétaires, soit standardisées en HDBaseT. Plusieurs obstacles techniques ou culturels subsistent néanmoins. D’abord le problème du débit et de la latence.

La grande majorité des points d’accès réseau (PAR) en entreprise (ainsi que les équipements actifs) est encore dimensionnée pour assurer un débit terminal au maximum d’un gigabit par seconde, avec des câbles réseau cat 5e, amplement suffisants pour les besoins du poste de travail. Le transport d’images vidéo ou informatiques dans des valeurs inférieures exige une compression qui, si elle devient importante, induit une latence gênante. Les offres des constructeurs sont très diverses à ce niveau où se côtoient aussi bien des produits basés sur la DCT (H.264 ou H.265), du Jpeg 2000 ou des codecs propriétaires à faible compression.

Les directions informatiques sont très réticentes à juxtaposer les flux liés à la gestion de l’entreprise avec des flux vidéo dans des infrastructures basées sur le gigabit. Très souvent cela conduit au dédoublement des dessertes réseau, avec un réseau gestion et un second réseau pour l’audiovisuel. Les gains financiers espérés dans la mutualisation des deux usages de communication disparaissent alors. Plusieurs industriels poussent à équiper les points d’accès réseau en prises à 10 Gb/s qui, elles, permettent une transmission des images HD et 4K sans compression, et donc avec une latence très réduite, (sauf pour le 4K à 60 Hz en mode 4:4:4).

Les interfaces à 10 Gb/s lancées en 2003 à des prix prohibitifs sont devenues classiques pour l’équipement des serveurs et des data centers. Le coût des infrastructures à 10 Gb/s baisse régulièrement, en particulier au niveau des switchs (certains équipements approchent le 100 €/port), leur généralisation est encore loin d’être atteinte pour les bâtiments existants, car le câblage doit être mis à niveau avec au minimum du câble cat. 6a pour assurer une desserte de 10 Gb/s sur une longueur de 100 mètres.

 

 

Un choc de cultures

Un autre obstacle concerne la culture technologique des équipes d’exploitation. Le monde de l’audiovisuel et celui de l’IT exigent chacun des compétences spécifiques et sont basés sur une culture et une expérience fort différentes. Jusqu’à présent les évolutions technologiques de l’audiovisuel, en particulier vers le numérique, étaient liées à des améliorations de performances ou de codages de signaux, mais dans une architecture qui restait toujours identique : départ depuis une source, vers un organe de sélection, puis de traitement et enfin de distribution jusqu’au matériel d’affichage, le tout de manière linéaire ou arborescente en mode point à point pour chaque tronçon. Avec les technologies IP, l’organe central est le switch qui assure l’aiguillage des signaux, mais dans un mode bidirectionnel et souvent associé à des équipements de traitement purement logiciels et donc virtuels.

Dès que le réseau grandit avec un nombre plus élevé de sources et de destinations, les switchs seront démultipliés avec des liaisons interswitches déployées selon des architectures redondantes de type Daisy Ring, Spanning Tree ou Spine Leaf. L’organisation du câblage n’a plus rien à voir avec la circulation des signaux telle que pratiquée en audiovisuel traditionnel, et en conséquence la résolution des pannes ou des difficultés d’exploitation est beaucoup plus ardue, en particulier pour ceux qui n’ont pas une culture « réseaux ». Du coup, de nombreuses installations sont déployées avec un réseau dédié à la gestion de l’entreprise et à ses outils quotidiens d’un côté, et de l’autre un réseau réservé à la communication audiovisuelle dans une architecture simplifiée. Et là encore, l’économie promise par la mutualisation des services sur un réseau unique s’évanouit.

L’architecture d’un système de distribution et de diffusion AVoIP est basée sur quelques principes constants, quel que soit le fournisseur du système. Comme pour les équipements basés sur le câblage à paires torsadées, la source d’image est raccordée à un émetteur qui convertit le signal HDMI ou équivalent en signaux compatibles IP envoyés sur une prise réseau. Ce flux IP aboutit sur un switch réseau qui l’aiguille selon les sélections et destinations choisies vers un récepteur qui transforme à l’inverse ce flux IP en signal HDMI ou équivalent pour l’afficher sur le terminal de destination, écran LCD ou vidéoprojecteur. Cette organisation est assez similaire à celle des systèmes à paires torsadées. À ce dispositif s’ajoute obligatoirement un contrôleur, c’est-à-dire un ordinateur ou un serveur selon la taille de l’installation, dont la fonction est de gérer les commutations de signaux entre sources et destination, en association avec le switch réseau et les protocoles multicast mis en œuvre sur le réseau.

Ce contrôleur offre la plupart du temps une interface graphique via un navigateur web reprenant les présentations habituelles des commandes de matrices audiovisuelles. Il sert également à piloter les émetteurs et les récepteurs au niveau de la résolution des images, de la gestion des canaux audio et aussi de donner des étiquettes compréhensibles en fonction de la localisation des diverses sources et destination, pour éviter de gérer des adresses IP ou Mac. Le coût du contrôleur AVoIP est loin d’être négligeable et s’ajoute au prix des émetteurs et récepteurs. Par rapport à une installation traditionnelle, le prix de la matrice de commutation qui n’existe plus vient bien sûr en déduction. Mais il est difficile d’évaluer a priori l’économie annoncée par les promoteurs de l’AVoIP, tant les éléments quantitatifs d’une installation sont fort variables selon chaque projet.

 

 

Standardiser l’AVoIP

L’offre commerciale des systèmes de distribution AVoIP se répartit entre une quinzaine de constructeurs (du moins pour ceux présents sur le marché français). Si les principes généraux sont assez similaires, ils divergent néanmoins sur plusieurs choix technologiques : l’usage ou non de la compression, et pour ceux avec compression le type de codec d’un côté et les performances du câblage, Gigabit ou 10 Gb/s. En l’absence de standardisation, les offres sont spécifiques à chaque constructeur et donc n’offrent aucune interopérabilité.

Ce fractionnement de l’offre a conduit des acteurs du marché à proposer une harmonisation des offres. C’est ainsi qu’a été lancée l’alliance SDVoE en 2017. Le sigle SDVoE pour Software Defined Video over Ethernet fait référence à une évolution des switchs réseau qui, pour leur configuration, sont passés d’un mode ligne de commande fastidieux et répétitif à un mode global de supervision logicielle via des API, mieux adapté aux larges réseaux et en particulier au cloud.

Selon une organisation assez similaire à celle du HDBaseT, on y retrouve Aptovision (racheté depuis par Semtech), un concepteur de circuits intégrés qui a fait ses armes dans le domaine du transport sur IP, un spécialiste des interfaces réseau, Aquantia intégré depuis à Marvell Technologies, Christie et Sony, spécialistes de la vidéoprojection, ZeeVee un fabricant spécialisé dans le transport audiovisuel sur réseau coaxial HF, en streaming et en IP, et enfin Netgear un constructeur d’équipements actifs réseau, switchs et borne wi-fi. Leur objectif est de définir une architecture capable de distribuer en IP des images 4K sans aucun compromis sur la qualité et avec une latence la plus réduite possible. Pour cela, ils ont fait des choix techniques radicaux, à savoir aucune compression et un raccordement des terminaux sur des prises réseau à 10 Gb/s.

Pour les membres fondateurs du SDVoE, il est évident que le passage des résolutions vidéo de la HD à la 4K est inéluctable et que les systèmes à base de paires torsadées ne pourront jamais offrir les performances nécessaires sans introduire une compression conséquente, d’où une latence préjudiciable au confort des spectateurs assistant sur place en direct à un événement culturel ou sportif. Ils parient sur la démocratisation rapide des infrastructures à 10 Gb/s, instruite par l’évolution des réseaux Ethernet au cours des vingt ou trente dernières années, qui sont passés du 10 Mb/s au 100 Mb/s, puis enfin au gigabit.

Depuis sa fondation, l’alliance SDVoE s’est élargie à des membres contributeurs comme Aurora, Audinate, DVIGear, IDK et Kramer entre autres. Les spécifications SDVoE ont été adoptées par une trentaine de constructeurs, dont Analog Way, Arista, Broadata, CYP, KanexPro, Purelink, Savant ou WyreStorm.

L’objectif du SDVoE est de standardiser le transport de signaux sans compression sur un réseau IP. Il n’intervient pas sur le signal vidéo lui-même et ses éléments complémentaires (audio, télécommande, signalisation et cryptage), mais organise tous les aspects du transport de ces signaux convertis en IP via les sept couches du modèle OSI, pour rendre interopérable les modules d’émissions au début de la liaison et ceux de réception. Christie et Sony sont parmi les fondateurs du consortium, car ils prévoient d’intégrer directement les modules de réception SDVoE dans leurs produits d’affichage, vidéoprojecteurs ou écrans LCD. Cette logique est similaire à celle du HDBaseT pour laquelle de nombreux constructeurs de vidéoprojecteurs ont incorporé l’interface HDBaseT dans leurs appareils.

Le SDVoE est également compatible avec le transport IP sur fibre optique. Il prend en compte les sept couches du modèle OSI au niveau physique (couche 1), la couche 2 pour la gestion des trames Ethernet, puis les protocoles réseau IP et IGMP (couche 3), du transport TCP et UDP en niveau 4. Il gère la session de la couche 5 et la présentation des données à la couche 6. Le SDVoE a conçu une API qui dialogue avec les applications de la couche 7. Comme dans de nombreux systèmes de transmission audiovisuelle sur IP, les protocoles SDVoE fonctionnent en mode IGMP pour éviter de surcharger les branches du réseau non destinataires des flux transmis.

Sur les 10 Gb/s du débit de la liaison IP, neuf sont réservés à la vidéo et le dernier gigabit sert au transport de l’audio, des signaux de télécommande et de signalisation et éventuellement à de l’USB pour des usages de type KVM ou à la gestion d’écrans interactifs. Cela permet de transmettre sans compression des images UHD (3 840 x 2 160 pixels) à 60 images par seconde avec un échantillonnage couleur 4:2:0. Par contre, pour les images en 4:4:4, le débit est de 12 Gb/s et dépasse les capacités de la liaison. Une légère compression de type pixel pipeline codec est donc appliquée, exactement comme pour le HDBaseT.

 

 

Gérer de multiples protocoles

Pour éviter de surcharger le réseau et de multiplier les flux, tous les systèmes de transmission vidéo sur IP mettent à profit le mode multicast de distribution. Cela se traduit par la mise en œuvre des protocoles IGMP Snooping. Si les contenus audiovisuels sont transportés en même temps que d’autres données, il est fortement recommandé de les affecter à des Vlans différents avec des limites de débit choisies en fonction des volumes consultés pour préserver la QoS de chaque service et ménager le confort de chaque catégorie d’utilisateurs.

Toutes ces précautions et bien d’autres réglages particuliers au transport audiovisuel sur IP rendent donc la configuration des switchs réseau assez délicate. C’est d’ailleurs, comme évoqué plus haut, l’un des freins à la mise en place d’outils AVoIP par des équipes audiovisuelles. La majeure partie des projets déployés sur une infrastructure unique associant données audiovisuelles et informatiques l’ont été dans des organismes où la DSI est largement impliquée dans le projet.

Lors de la création du consortium SDVoE, les fondateurs ont décidé d’accueillir parmi eux un équipementier réseau, en l’occurrence Netgear, pour prendre en compte et intégrer dans leurs spécifications les contraintes liées à la gestion d’un réseau IP. Le fabricant américain est donc associé depuis le début à l’élaboration des spécifications du SDVoE et apporte son savoir-faire sur les aspects transport des signaux et gestion des commandes liées à leur cheminement. Pour rendre la configuration des réseaux AVoIP la plus légère et la plus transparente aux exploitants audiovisuels, il a conçu une gamme de switchs spécifiques dénommés ProAV, la gamme M4300 de son catalogue.

La gamme ProAV des switchs Netgear

 

Pour répondre aux besoins spécifiques des réseaux IP desservant des équipements conformes aux spécifications SDVoE, Netgear propose une gamme de switchs réseaux regroupés sous l’appellation ProAV, désignés aussi sous la référence M4300. Elle comprend une vingtaine de produits offrant une capacité de 16 à 96 ports selon les versions. Selon les modèles, ils sont pourvus de ports RJ-45 avec un débit de 1 ou 10 Gb/s, et/ou de logements pour modules SFP pour fibres optiques, 10 ou 40 Gb/s. Netgear annonce de futures versions pour des liaisons dorsales à 100 Gb/s.

Il est important de noter que certains modèles, même de petite capacité (16 ports sur un boîtier demi-rack 1U), sont équipés en totalité de ports 10 Gb/s sur RJ-45, et donc parfaitement adaptés au SDVoE. Le modèle haut de gamme M4300-96X, avec sa capacité maximale de 96 ports, est de type modulaire. Il accueille au choix des modules de huit ports cuivre ou huit ports fibre. Il peut ainsi être adapté et configuré selon des architectures spécifiques et évoluer dans le temps en fonction de l’élargissement du réseau.

L’une des particularités des switchs de la gamme M4300 concerne leur capacité à être stackés (ou associés) pour constituer un réseau de plus grande capacité. Les unités associées peuvent être regroupées de manière classique dans une seule baie ou bien reliées à distance par fibre optique. Ainsi pour desservir en audiovisuel des locaux répartis sur plusieurs bâtiments, un switch sera installé dans chacun d’eux et relié aux autres via fibre optique. L’ensemble ainsi câblé ne constitue qu’une seule unité logique de commutation. Il est ainsi possible de constituer une matrice de 384 x 384 ports. Tous les modèles de la gamme M4300 sont compatibles avec les protocoles nécessaires à l’exploitation d’une architecture SDVoE et en particulier les protocoles IGMP Snooping, IGMP Querier, IGMP Fast Leave, ainsi que la fonction « Drop Unregistered Multicast Flooding ».

Pour faciliter l’exploitation et la configuration des réseaux SDVoE, Netgear va encore plus loin avec le modèle M4300-96X puisqu’il est fourni préconfiguré avec ces fonctionnalités opérationnelles dès le déballage de l’appareil. De plus elles sont pré-affectées au Vlan n° 1 que l’utilisateur réservera aux flux audiovisuels. Cela réduit fortement le nombre de manipulations à effectuer lors de la configuration du switch.

Tous les modèles de la gamme M4300 sont munis d’une interface web facilitant la configuration des switchs. L’API intégrée au switch et conforme au SDVoE facilite ensuite le dialogue avec le contrôleur associé aux modules d’émission et de réception SDVoE. Chaque constructeur de modules SDVoE propose une interface de pilotage de ses équipements avec une gestion de ses propres modules, mais aussi l’aiguillage des signaux entre les sources et les destinations. Cette interface graphique est similaire à celle des matrices de commutation vidéo et le contrôleur dialogue directement avec le switch compatible SDVoE.

Selon les constructeurs, les boîtiers encodeurs et décodeurs sont munis d’entrées/sorties SDI et audio numériques et analogiques. Ils sont aussi compatibles avec les signaux audio numériques Dante et AES67 et, pour les plus récents, transmettent des signaux vidéo compatibles HDR.

 

 

Des installations SDVoE

Peu d’installations ont été déployées pour l’instant en France avec la technologie SDVoE. Aux Etats-Unis, plusieurs universités et organismes importants ont choisi d’implanter leur réseau de distribution audiovisuelle avec les outils SDVoE. Plus près de nous, l’Université des Sciences et de Technologie de Norvège a mis en place un réseau avec plus de 150 boîtiers ZeeVee. À Londres, Samsung vient d’ouvrir son nouvel espace de découverte et de démonstration Samsung KX équipé de 200 boîtiers ZeeVee 4K avec transport de signaux HDR10 +. Ces quelques exemples montrent que les technologies AVoIP arrivent à maturité et qu’en particulier le standard SDVoE facilite leur mise en place et réduit les temps de configuration et de déploiement.

Le prochain salon ISE sera l’occasion de faire le point sur les évolutions de l’AVoIP, en particulier du standard SDVoE. En fonction des annonces des constructeurs et de leur ralliement ou pas à ce standard, il permettra de percevoir à quel rythme l’évolution du transport audiovisuel vers le tout IP se déroulera dans les prochaines années.

 

Article paru pour la première fois dans Sonovision #18, p.36-39. Abonnez-vous à Sonovision (4 numéros/an + 1 Hors-Série) pour accéder, à nos articles dans leur totalité dès la sortie du magazine.