Avec l’AVoIP, les liaisons HDMI et HDBaseT basculent sur les réseaux IP

L’AVoIP est le nouveau sigle mis en avant par tous les fabricants spécialisés dans le transport et la distribution des signaux vidéo et d’images informatiques. L’objectif est de basculer tous les câblages traditionnels spécifiques vers les infrastructures réseau déployées dans toutes les entreprises. Mais sous cette dénomination unique, les offres sont fort diversifiées avec des modes de compression, des interfaces réseau et des débits qui influencent directement les architectures de communication.
AVOIPMain.jpeg

 

Après la numérisation des signaux et des contenus, l’audiovisuel s’engage dans une nouvelle évolution majeure : le transport des signaux sur les réseaux IP. L’objectif est de remplacer les câblages dédiés par ceux des réseaux informatiques déployés au sein des entreprises. Cette mutation irréversible est déjà largement entamée dans le domaine de l’audio avec Dante, Ravenna ou l’AES67. La production vidéo live suit un chemin identique avec de multiples travaux de standardisation autour des normes SMPTE 2022 et 2110 (voir les articles de Mediakwest sur ces questions). Avec les technologies de streaming et l’OTT, la diffusion TV et vidéo n’est pas en reste.

Un nouveau sigle est apparu récemment, l’AVoIP pour AudioVisual over IP, dont le but est de remplacer les câblages traditionnels HDMI, DVI, DisplayPort et même vidéo SDI sur les infrastructures réseau qui innervent l’ensemble des bâtiments tertiaires. Au lieu de déployer des câbles spécifiques et propriétaires, dédiés à chaque type de liaisons, l’objectif est de simplifier la distribution des signaux audiovisuels en passant par un support unique, le câble à paires torsadées muni de son connecteur RJ-45, (ou éventuellement la fibre optique) déjà largement distribué dans les bureaux et salles de réunion.

L’utilisation du câble réseau, appelé aussi
 cat. 5, 6 ou 7, a déjà été mise en œuvre avec les liaisons HDBaseT ou avec des extenders propriétaires. Mais dans ce cas il s’agit d’utiliser uniquement le support physique à paires torsadées pour une liaison point à point similaire à celle d’un câble HDMI ou autre. On remplace un type de câble par un autre avec une longueur de desserte plus grande, mais sans aucune modification dans l’architecture de distribution. Avec l’AVoIP, on ajoute toute la richesse du protocole réseau IP, avec le routage de signaux, la multidiffusion et le multiplexage d’autres données sur un câble unique.

 

Plusieurs modes de compression en concurrence

Pour transmettre les signaux vidéo ou les images informatiques avec le protocole IP, des interfaces d’encodage et de décodage sont indispensables aux deux extrémités de la liaison. Ces interfaces sont également appelées encodeur/décodeur ou émetteur/récepteur selon les fabricants. Ils assurent des fonctions de conversion et de réorganisation des signaux pour les sérialiser, les découper en paquets successifs conformément au protocole IP, mais surtout effectuent une compression des images pour en réduire le débit à la valeur autorisée par le réseau. Les images en résolution HD, et plus encore avec la 4K/UHD, dépassent largement le débit d’un gigabit par seconde. Un codec de compression est donc indispensable. Cette réduction de débit n’est pas nécessaire si l’encodeur est muni d’une interface réseau à 10 Gb/s. Comme pour tous les outils de streaming, les paramètres du codec de compression relèvent d’un compromis entre la qualité d’image, le débit sortant et la latence (temps de traitement). Une forte compression, donc avec un débit réduit plus facile à transporter et moins susceptible de saturer le réseau, conduit à une moindre qualité et à une latence plus élevée. La technologie de compression choisie influe directement sur le débit du signal transmis. Les choix effectués varient selon les constructeurs.

Beaucoup s’appuient sur le codec H.264, déjà couramment employé pour la diffusion TV et les systèmes de streaming. Son inconvénient majeur pour une utilisation circonscrite à une salle de réunion est sa latence, de l’ordre de plusieurs centaines de millisecondes. Cela provoque une désynchronisation des images par rapport au son amplifié par la sonorisation. Le codage H.264 est adapté à des diffusions vers des salles distantes. D’autres constructeurs ont choisi des codecs basés sur une compression de type ondelettes. La latence est plus faible, de l’ordre de quelques dizaines de millisecondes (soit une ou deux images de retard) mais le débit sortant de l’encodeur varie alors entre 50 et 900 Mbit/s, compatible avec un port gigabit côté terminal, mais qui exigera des switchs et des dorsales en 10 Gb/s pour transporter plusieurs signaux simultanément sur la même installation. Enfin, dernière alternative, transmettre les signaux sans compression, mais dans ce cas les terminaux et toute l’infrastructure réseau devront être compatibles 10 Gb/s. Ainsi il n’y aura aucune dégradation des images, ni aucune latence.
 Concernant le choix de l’algorithme de compression, les constructeurs ont deux approches : baser leur offre sur une seule technologie de compression pour simplifier leur gamme ou, au contraire, proposer deux ou trois séries de produits différents avec chaque mode de compression, le H.264, les ondelettes et sans compression.

 

Des contraintes sur les caractéristiques des switchs réseaux


Comme avec les extendeurs sur câbles cat. 5 ou cat. 6, les interfaces d’encodage et de décodage sont installées à proximité respectivement des sources d’images et des dispositifs d’affichage. Si la liaison est directe en mode peer to peer, il suffit de tirer un câble RJ-45 entre les deux boîtiers. Des mécanismes de détection automatique simplifient grandement leur configuration. Dans le cas d’un affichage du même contenu sur plusieurs écrans ou de la sélection parmi plusieurs sources vers un écran unique, les distributeurs et sélecteurs classiques sont remplacés par un unique switch réseau. De la même manière, la matrice ou grille de commutation laisse la place au switch réseau.

Pour assurer ces fonctions de sélection et de distribution, les systèmes de diffusion AVoIP exploitent les fonctionnalités de diffusion multicast basées sur les protocoles IGMP. Contrairement au réseau informatique classique qui travaille en mode unicast, avec une liaison établie entre chaque équipement communiquant en mode multicast, une adresse particulière différente de l’adresse IP habituelle est attribuée à l’équipement émetteur, sur laquelle viennent se brancher plusieurs dispositifs récepteurs. Ainsi, un seul flux vidéo circule sur le réseau et il est répliqué au niveau du switch pour être renvoyé uniquement vers les récepteurs qui l’ont demandé. Ces mécanismes gérés par le protocole IGMP (Internet Group Management Protocol) sont assez complexes. Ils exigent des switchs
 dotés des fonctions IGMP Snooping, maintenant habituelles sur les switchs récents et performants. Néanmoins, il faut prévoir que l’ensemble des équipements actifs desservant le réseau soient compatibles IGMP pour éviter une saturation du réseau.

Une autre exigence des systèmes AVoIP concerne la taille des paquets IP. Habituellement, sur un réseau classique, la taille des paquets (ou MTU pour Maximum Transmission Unit) est fixée à 1 500 octets. Avec les débits engendrés par les flux audiovisuels, tous les constructeurs de systèmes AVoIP exigent de passer au mode Jumbo Frame qui relève cette taille à 9 000 octets. Chacun d’eux édite des notes techniques précisant les spécifications nécessaires au fonctionnement de son système. Elles sont à consulter impérativement avant tout choix d’une architecture AVoIP et à soumettre à la DSI si les utilisateurs ne gèrent pas directement le réseau informatique.

 

Des outils de configuration

La configuration des procédures multicast est plus complexe que celle d’un accès à un serveur ou d’une connexion à Internet, maintenant bien intégrée au niveau des systèmes d’exploitation. Elle exige une bonne connaissance des technologies réseau et il est hors de question de demander à un utilisateur final de pénétrer dans les menus de configuration des switchs réseau. Tous les constructeurs de systèmes AVoIP proposent des solutions pour contourner cet obstacle. En général, elles prennent la forme de pages web accessibles via un simple navigateur, avec un serveur web intégré aux modules encodeurs et décodeurs. Ce mode de configuration convient pour un système AVoIP constitué de quelques unités d’encodage et de décodage. Au-delà de cette taille, des outils dédiés plus sophistiqués sont indispensables. Ils prennent la forme d’un logiciel de contrôle et de management 
à installer sur un serveur avec une unité dédiée. Les fabricants d’outils AVoIP présents sur le marché des systèmes d’automation proposent également le pilotage direct des émetteurs/récepteurs au travers de leurs interfaces tactiles. Gefen a conçu un vrai pupitre de contrôle au format traditionnel XY comme on les trouve pour les grilles de commutation. Kramer et Biamp ont intégré, dans certaines de leurs unités AvoIP, un sélecteur de canal comme sur un téléviseur, de manière à accéder directement aux contenus distribués sans devoir passer par une interface logicielle.

L’obligation d’un outil dédié de contrôle et de paramétrage atténue fortement l’argument
 de la simplification de l’architecture mis en avant par les acteurs de l’AVoIP. Tous les fabricants expliquent que cela simplifie le hard-ware et réduit son coût avec la suppression de la matrice de commutation centrale, mais s’il faut rajouter un système central de pilotage, où se trouve le gain de simplification ?

 

Une dizaine d’offres AVoIP

Les premiers systèmes de transport et de distribution AVoIP ont été lancés il y a trois ou quatre ans. Depuis, tous les constructeurs spécialisés dans la sélection/distribution d’images informatiques proposent des outils AVoIP. On ne compte pas moins de dix fabricants qui commercialisent ce nouveau type d’architecture en France. Mais toutes les offres sont loin d’être équivalentes. Il y a un premier choix à faire au niveau de l’algorithme de compression des images, soit du H.264, soit des ondelettes ou des systèmes sans compression, avec les conséquences sur les débits et la latence des signaux. Certains industriels s’en tiennent à une seule technologie comme Crestron, Atlona, Gefen, Aurora ou Lightware, tous partisans des ondelettes, tandis que d’autres laissent à leurs clients le choix en proposant à la fois des systèmes basés sur le H.264 et une seconde gamme fonctionnant avec des ondelettes comme Kramer ou Muxlab. AMX, avec sa gamme SVSI, va encore plus loin puisque son offre se décline en trois gammes, l’une basée sur les ondelettes, une seconde sur le H.264 et une troisième travaillant sans compression.

Lors du choix d’un système AVoIP, un second paramètre important concerne le type d’interfaces réseau et son débit. La majorité des produits se raccordent sur une liaison Gigabit pour les modèles fonctionnant en H.264 ou grâce aux ondelettes. Pour les systèmes sans compression, plusieurs fabricants font le choix de l’interface 10 gigabits/s. encore peu répandue et exigeant souvent un déploiement réseau spécifique.

 

Choisir un mode de compression adapté


Le choix de la technologie de compression et son incidence sur les débits dépendent égale- ment de la zone de diffusion à couvrir. Si les images sont diffusées et affichées dans la salle ou l’auditorium où se tiennent les intervenants, les systèmes sans compression ou basés sur les ondelettes sont à privilégier pour conserver un synchronisme de l’image et du son. En revanche, s’il s’agit de desservir des salles périphériques situées dans le bâtiment ou sur le même site, des outils utilisant le H.264 seront mieux adaptés en économisant de la bande passante sur le réseau interne.
 Un autre avantage du codage H.264 réside dans ses protocoles de distribution similaires à ceux du streaming (RTP, RTSP…) offrant la réception sur un simple ordinateur muni d’un player comme VLC. Il n’existe pratiquement aucun décodeur soft pour les systèmes basés sur les ondelettes, à part chez Extron.

La plupart des fabricants complètent les entrées/sorties image, en général du HDMI, avec d’autres signaux séparés, de l’audio analogique souvent, mais aussi du Dante ou de l’AES67 parfois. Pour faciliter le pilotage à distance des sources et des écrans, ils ajoutent également des connecteurs RS-232, USB ou pour la transmission de signaux infrarouges. La combinaison de ces signaux associés varie beaucoup d’un fabricant à l’autre et oriente les usages soit vers des fonctions de type KVM pour centres informatiques ou plus orientés vers le marché résidentiel. Il faut également signaler que plusieurs constructeurs spécialisés dans les systèmes KVM comme Guntermann & Drunck et Adder basculent aussi leurs outils sur des architectures IP et se rapprochent des outils AVoIP.

Concernant les résolutions d’images transportées, tous les systèmes commercialisés fonctionnent avec des formats HD 1080i et souvent en 1080p60. Les produits les plus récents sont compatibles UHD et/ou 4K,
 mais attention à la fréquence image et au sous-échantillonnage couleur. Beaucoup transmettent les résolutions 4K à la fréquence de 30 images/sec. en mode 4 :4 :4, mais pour la fréquence de 60 images/sec., uniquement en mode 4 :2 :0. Peu de produits sont compatibles 4K@60 en mode 4 :4 :4. On peut citer sur ce point Crestron NVX, AMX série N2000, DVIGear DN-200 ou encore Biamp Tesiralux. Une grande majorité de systèmes sont conformes à la norme HDMI 2.0 et au cryptage HDCP 2.2.

 

SDVOE, une offre standardisée et interopérable


Tous les systèmes de diffusion AVoIP sont basés sur des codages et des paramétrages propres à chaque constructeur et constituent de fait des architectures propriétaires, même si elles empruntent un réseau IP standardisé. Pour favoriser l’interopérabilité entre les outils AVoIP, plusieurs industriels ont lancé l’alliance SDVoE, Software Defined Video over Ethernet. Elle regroupe des industriels spécialistes des réseaux informatiques, Netgear et Aquantia, des constructeurs d’équipements audiovisuels, Christie et Sony, ainsi que des fabricants de puces de traitement vidéo, Semtech et Zeevee. Depuis la création de l’alliance en janvier 2017, les membres fondateurs ont été rejoints par une trentaine de membres dont, parmi les plus connus, Kramer, Belden, Xilinx, Canare, Broadata.

Leur objectif est d’offrir une architecture globale de transmission AVoIP avec une latence extrêmement réduite et une qualité d’image sans compromis. Dans ce but, ils ont choisi un mode de transmission sans compression compatible avec les résolutions HD et 4K à 30 images par seconde. Un rapide calcul de débit démontre que seule une interface à 10 gigabits/s. est capable de transmettre de telles images. La conséquence directe de ce choix exigeant est une latence inférieure à 100 microsecondes, donc bien plus faible que celle offerte par un codage par ondelettes. Cette solution offre la possibilité d’une diffusion sans retard, quel que soit le chemin emprunté par les signaux, liaison directe en HDMI ou HDBaseT et transport par réseau IP. Le SDVoE prévoit d’ailleurs des outils de resynchronisation d’horloge pour éviter les retards induits par la gestion des paquets sur le réseau.

Pour les images UHD avec une fréquence de 60 images/seconde, une légère compression intra-image avec un taux de 1,3 est appliquée.

Les signaux audio multicanaux et de télécommande IR et RS-232, ainsi qu’une liaison IP gigabit, sont multiplexés avec le transport des images. En se basant sur un réseau à 10 gigabits/s., ils démontrent que la simultanéité d’un transfert de gros fichiers sur le même réseau ne vient pas perturber les images, contrairement à des systèmes basés sur des liens à 1 gigabit. Mais leur affirmation que 
les dessertes à 10 gigabits/s. sont largement déployées en entreprise et que le SDVoE constitue la meilleure solution pour supprimer les liaisons audiovisuelles propriétaires semble un peu prématurée. Quand on observe l’évolution des réseaux sur une longue période, il est évident que l’augmentation des débits est inéluctable et qu’un jour les prises terminales à 10 gigabits jusqu’au poste de travail deviendront la norme. Il est exact que les équipements actifs et les câblages à 10 gigabits sont de plus en plus répandus avec des coûts en baisse, mais ils restent cantonnés aux data centers pour le raccordement des serveurs et les liaisons dorsales desservant les commutateurs d’étage. On en est encore loin pour la desserte systématique des salles de travail. Même si le consortium communique beaucoup et s’élargit régulièrement avec de nouveaux membres, seuls deux constructeurs proposent des produits SDVoE, Christie avec Terra et DVIGear avec les convertisseurs DisplayNet DN-200.

 

Bientôt une réponse de HDBaseT ?

De son côté, le consortium HDBaseT ne reste pas inactif et a annoncé courant 2017 qu’il travaillait sur une version IP du HDBaseT. Pour l’instant, aucune spécification n’a été publiée et les premiers produits ne devraient pas apparaître avant deux ou trois ans. La stratégie des deux consortiums est assez similaire : regrouper les acteurs du marché autour d’un ou plusieurs fabricants de puces pour garantir une interopérabilité entre les produits et permettre d’intégrer directement dans les équipements l’interface pour éviter de démultiplier les boîtiers externes d’encodage et de décodage.

Mais des observateurs avisés constatent que le pari est loin d’être gagné car, outre un surcoût non négligeable pour l’instant, la volonté de séparer les flux audiovisuels des flux informatiques plus classiques reste une habitude fortement ancrée. La majorité des DSI reste frileuse dès qu’elles entendent le mot « vidéo ». Un réseau IP spécifique (y compris pour les actifs réseaux) réservé à l’audiovisuel rassure tout le monde et facilite la recherche des causes d’un dysfonctionnement. Il n’est pas sûr non plus que les contraintes et les spécifications induites par l’AVoIP soient aisément prises en compte sur l’ensemble de l’infrastructure réseau de l’entreprise. Enfin, dernier point, le large déploiement des systèmes HDBaseT lui donne une longueur d’avance. D’ailleurs son succès n’est pas dû tant aux avantages technologiques de ce standard, mais d’abord parce qu’il apportait une réponse concrète à deux difficultés : l’absence d’interopérabilité entre les extendeurs sur paires torsadées et la longueur des câbles HDMI limitée à une dizaine de mètres.

Enfin un dernier élément constitue un frein au déploiement des outils AVoIP, leur coût. Les couples émetteurs/récepteurs fonctionnant en mode AVoIP restent nettement plus chers qu’un couple d’extenders sur paires torsadées. Pour une liaison point à point ou avec une simple distribution vers quelques écrans peu éloignés, tous les industriels reconnaissent que la solution traditionnelle 
à base de câbles HDMI ou de transport sur paires torsadées reste nettement plus avantageuse. Pour des architectures plus vastes avec une matrice centrale, ils argumentent sur la réduction du coût grâce à sa disparition et son remplacement par un ou plusieurs switchs nancés sur le budget réseau. Mais il ne faut pas oublier d’ajouter le montant du serveur indispensable au contrôle et à la supervision du système, et aussi le surcoût induit au niveau des switchs par les spécifications exigées par l’AVoIP. Pour l’instant, il est impossible de conclure à un avantage financier apporté par la technologie AVoIP. Une étude détaillée liée à l’architecture globale envisagée et à la zone de desserte à couvrir, actuelle ou future, est indispensable.

 

* Article paru pour la première fois dans Sonovision #11, p.66-69. Abonnez-vous à Sonovision (4 numéros/an + 1 Hors-Série) pour accéder, à nos articles dans leur totalité dès la sortie du magazine.


Articles connexes