Les architectures des mélangeurs se sont diversifiées avec une extension permanente de leurs capacités mais aussi grâce à des combinaisons nouvelles d’outils en particulier pour faciliter la mise en place d’émissions live vers les réseaux sociaux (Facebook, Twitch, Instalive…) et les services de streaming (YouTube, DailyMotion, Vimeo…).
Sur un plateau multicaméra, les images captées par les diverses caméras aboutissent vers un équipement central, le mélangeur vidéo. Sa fonction initiale est d’assurer la commutation des images entre les caméras sans saute ni parasite, mais aussi celles fournies par des sources annexes, comme un lecteur de clips vidéo ou la sortie écran d’un ordinateur pour la diffusion d’illustrations. Au-delà d’une simple sélection en « cut », il sert également à combiner plusieurs sources avec un effet statique comme le PIP (Picture In Picture) ou l’incrustation sur fond vert, l’habillage graphique et l’insertion de titres. Il les complète avec des enchaînements animés grâce à des effets dynamiques comme le fondu enchaîné, des volets ou des effets numériques 2D ou 3D.

Avec des traitements numériques de plus en plus puissants, le nombre et le type d’effets spéciaux s’élargissent sans cesse et leur description détaillée pourrait remplir plusieurs chapitres. Les constructeurs profitent de la miniaturisation des circuits électroniques pour regrouper dans un seul équipement, des fonctions dédiées jusqu’à présent à plusieurs autres unités électroniques : ainsi le mixage son, la lecture de clips vidéo ou d’images graphiques, même parfois l’enregistrement du programme final, l’encodeur de streaming, mais aussi le contrôle et les réglages des caméras télécommandées. Cette intégration réduit fortement le nombre et la taille des matériels à déployer dans une régie et en simplifie les câblages.
Dans une situation de mobilité, cela apporte un gain de temps indéniable pour l’installation du plateau, mais au prix d’une relative complexité dans les interfaces de configuration. Et comme dans tout système multifonction, il est rare que tous les éléments le constituant soient aussi complets et performants que des appareils séparés et dédiés. Mais il est évident que le développement des WebTV a poussé de nombreux fabricants à proposer des systèmes intégrés « tout-en-un » adaptés à ce nouveau marché. Chaque solution, soit une régie équipée avec des matériels distincts pour chaque grande fonction ou un système « tout-en-un » présente des avantages et des inconvénients qui seront à pondérer en fonction de chaque situation de tournage ou mode de production.

Des mélangeurs « soft »
Une nouvelle catégorie de mélangeurs vidéo est apparue plus récemment : des logiciels tournant sur un ordinateur. Ils ont d’abord été développés pour les « gamers » qui souhaitent partager leurs exploits sur YouTube (ou autre) en mixant la copie d’écran du jeu en cours et les images du joueur commentant sa partie grâce à une webcam. Si l’ordinateur est équipé de cartes interfaces vidéo ou de boîtiers USB, il est alors possible d’y raccorder plusieurs caméras externes et constituer ainsi un vrai mélangeur vidéo. Parmi les principaux logiciels de mixage vidéo nous pouvons citer OBS Studio, Streamlabs, vMix, Livestream ou encore Wirecast de Telestream.

L’interface globale de tous ces logiciels reprend le principe du mélangeur classique avec deux fenêtres pour l’affichage des sorties programme et preview et une série de vignettes affichant les sources. Par contre, la préparation des effets passe par des modules de composition mémorisés dans une vignette directement accessible, comme pour une macro-commande sur un mélangeur traditionnel. Cette phase de préparation et sa mémorisation sont assez différentes de celle d’un mélangeur hardware et demandent un temps d’apprentissage. La sélection des sources lors du direct se fait à la souris ou par des équivalents clavier, ce qui est assez éloigné de l’ergonomie d’un pupitre de mélangeur classique sur lequel les touches sont en accès direct, avec une action plus instinctive et immédiate.
L’écran tactile est une alternative mais là aussi le déclenchement de la commutation n’est pas aussi franc qu’avec un vrai pupitre. C’est pourquoi des constructeurs ont développé des pupitres à touches, connectés en USB et dont le plus connu est le Streamdeck d’Elgato. Le choix d’un logiciel de mixage vidéo sur PC est tout à fait envisageable mais au prix d’une adaptation des habitudes de réalisation si le réalisateur est plus familier des pupitres des mélangeurs classiques.
Si de prime abord le choix d’une solution logicielle pour mettre en place un mélangeur peut sembler plus économique, il y a plusieurs paramètres à prendre en compte pour évaluer ce choix par rapport à celui d’un système hardware dédié. Premièrement, selon le nombre de sources vidéo et la complexité des effets à réaliser, il faudra choisir une unité centrale avec des processeurs suffisamment puissants et en les associant à des GPU (cartes graphiques à processeur dédié). Une lecture attentive des recommandations de l’éditeur est absolument nécessaire pour choisir une unité centrale adaptée à un mixage vidéo sans bug ni « freeze » au cours du direct. Si plusieurs caméras externes équipent le plateau, il faut prévoir des cartes interfaces comme celles de Blackmagic, Elgato, Magewell ou Aja pour les raccorder à l’unité centrale ou éventuellement des boîtiers interfaces USB ou Thunderbolt.

Par contre on peut inscrire au titre des avantages d’une solution software, une plus grande souplesse dans le choix des fonctions et surtout leur évolutivité, tant fonctionnelle qu’au niveau des performances. Un mélangeur vidéo hardware restera limité par son architecture interne initiale et offrira moins de souplesse en termes d’évolution, même à travers des mises à jour de son firmware.
Enfin, une dernière catégorie de mélangeurs « virtuels » est apparue avec des services fonctionnant dans le cloud, comme Easylive, Dazzl, Vodalys ou Virtual Production de Sony. Les images fournies par les caméras sont codées en streaming et envoyées vers le mélangeur via des liaisons Internet. Le réalisateur utilise un simple navigateur Web connecté au service pour effectuer la sélection et l’enchaînement des sources. La sortie « programme » est transmise directement depuis le service dans le cloud vers les divers plates-formes de streaming pré-configurées. Actuellement, les capacités de ces services sont limitées à six ou huit sources et sont plus adaptées à la couverture d’événements sportifs ou de conférences avec des caméras réparties sur des aires géographiques étendues (à condition qu’une connexion Internet, 4G, wi-fi ou autre soit disponible sur place) plutôt qu’un plateau où toutes les sources d’images sont regroupées sur un lieu unique.
Combien d’entrées vidéo ?

Lors du choix d’un mélangeur vidéo, l’un des premiers critères de choix concerne le nombre d’entrées vidéo pour y raccorder des caméras. Pour un petit plateau destiné à une WebTV, quatre sources raccordables constituent le strict minimum, avec par exemple trois caméras filmant la réunion ou l’événement et un ordinateur pour fournir des images informatiques, une présentation et/ou des contenus vidéo enregistrés, comme des interviews ou des reportages. Des mélangeurs pourvus de six à huit entrées couvriront les besoins d’un plateau avec un nombre plus élevé d’intervenants comme dans un auditorium ou un amphithéâtre. Au-delà, une capacité de douze ou seize entrées correspond à des capacités plus conformes à la captation de shows, d’événements sportifs, de convention ou de concerts.
La très grande majorité des mélangeurs proposés sur le marché fonctionnent en résolution HD (1080i ou 720p). Les modèles récents les plus performants acceptent aussi des sources UHD ou 4K. Pour des activités de communication en entreprise, l’usage de ce format reste anecdotique à cause des difficultés à afficher, transmettre et diffuser via Internet des images à cette résolution. Les entrées vidéo sont équipées selon les modèles de connecteurs BNC pour les signaux vidéo numériques SDI et/ou de connecteurs HDMI. Il faut éviter de choisir un mélangeur équipé uniquement en HDMI car pour les caméras, cette connectique pose de multiples problèmes en exploitation (longueur des liaisons limitées à une dizaine de mètres, connecteurs non verrouillables, entre autres). Néanmoins, le HDMI restera utile pour le raccordement de sources informatiques. Un ratio un quart en entrées HDMI et trois quarts en BNC constitue le bon compromis et correspond d’ailleurs à une majorité des modèles commercialisés.

Quelques modèles de conception un peu ancienne exigent que toutes les sources fonctionnent dans une résolution unique, celle choisie pour la sortie du mélangeur. Il faut donc veiller à une certaine uniformité dans le choix des caméras et autres sources vidéo y compris pour les sorties écran des ordinateurs utilisés comme sources informatiques. Ce point est important si l’utilisateur souhaite récupérer des matériels existants. Les modèles les plus récents sont souvent pourvus d’un circuit de conversion « up/down converter » pour panacher des sources fonctionnant avec des résolutions variées. Parfois, ces fonctions de conversion ne sont pas toujours disponibles sur toutes les entrées du mélangeur, ce qui oblige à disposer les sources dans un ordre moins logique que leur disposition sur le plateau. Quelques modèles perfectionnés donnent une totale latitude pour une réaffectation des sources physiques par rapport aux touches du clavier.
Les contenus traités par un mélangeur vidéo ne se limitent pas aux sources raccordées sur les connecteurs physiques de l’appareil. Aux entrées SDI, HDMI s’ajoutent des sources internes : image noire, fond coloré (avec choix de la teinte, du niveau lumineux et de la saturation), mémoires d’images fixes et de clips vidéo pour les mélangeurs les plus perfectionnés. Pour la bibliothèque d’images fixes, le nombre d’éléments en accès direct dépendra avant tout du volume de stockage dédié à cette fonction. En général, il est réparti sur plusieurs niveaux, les images en accès direct via une touche du mélangeur, limité à quelques unités, puis un stockage interne plus large mais auquel on accède via des menus. Enfin, plusieurs constructeurs prévoient une liaison directe, souvent par réseau local, avec un ordinateur pour accéder alors à des milliers d’images stockées sur son propre disque dur. Solution alternative, afficher les images en plein écran sur l’ordinateur et raccorder sa sortie écran comme l’une des sources externes du mélangeur mais au détriment du nombre de caméras.
Sur des mélangeurs récents conçus pour les WebTV et en particulier les logiciels de mixage tournant sur PC, en plus des sorties de flux de streaming pour la diffusion, apparaissent des entrées « virtuelles » disponibles via le port réseau. Elles sont configurées pour récupérer en entrée comme sources vidéo, des flux de streaming codées en RTSP, RTMP ou SRT, ou dans le protocole propriétaire de NewTek, le NDI. Ceux-ci proviennent selon les cas, d’autres encodeurs ou services de streaming ou bien de caméscopes connectés avec port wi-fi, clés 4G ou d’unités de codage 4G type LiveU, TVU ou Aviwest et enfin de smartphones pourvus d’applications de prise de vues « live » comme Larix Broadcaster ou ManyCam.
Ce nouveau mode de raccordement de sources vidéo démultiplie les configurations de prise de vues et surtout autorise la mise en place de caméras à distance sans être limité par la longueur des câbles vidéo traditionnels. Veiller néanmoins au temps de configuration du dispositif et au nombre important de paramètres à maîtriser. Brancher un câble restera toujours beaucoup plus rapide. La latence de codage et de décodage interdit également une prise de vue multicam sur la même scène en mélangeant caméras câblées et streamées. Seul un dispositif basé sur le protocole NDI à très faible latence permet d’aborder ce type d’architecture mixte. Si les caméras sont reliées au mélangeur via un réseau wi-fi, il est impératif de prévoir un réseau dédié et affecté uniquement à cet usage, pour éviter des ruptures d’images si d’autres usagers lancent des connexions un peu lourdes.
Les sources enregistrées, internes ou externes
Pour enrichir les prises de vues « live » fournies par les caméras, tous les constructeurs de mélangeurs les complètent avec une bibliothèque interne (ou library) servant à stocker des images fixes ou de courtes séquences vidéo. Le nombre d’images et la durée des séquences vont dépendre à la fois de leur résolution et de la capacité de stockage attribuée à cette fonction. Ces images fixes et séquences vidéo sont téléchargées selon les cas depuis une mémoire externe raccordée sur un port USB ou depuis un ordinateur raccordé en réseau.
Quand la capacité de stockage est importante et par conséquent le nombre de fichiers, plusieurs constructeurs prévoient un mode d’accès à deux niveaux, l’un avec une navigation traditionnelle comme dans l’explorateur de fichiers d’un ordinateur, donc plus lente pour faire défiler la liste complète des contenus, et un second plus rapide avec une présélection des fichiers affectés à des touches dédiées. D’autres offrent l’accès complet au contenu de l’ordinateur raccordé par réseau à la manière d’un accès de type FTP.
Le choix du mode d’accès et de navigation parmi les fichiers sera choisi en fonction de la quantité d’éléments auxquels il faut accéder au cours de la réalisation, de même pour la gestion des séquences vidéo. S’il s’agit d’un simple clip d’animation graphique ou d’un court jingle, leur stockage sur le mélangeur est à privilégier, surtout si le constructeur du mélangeur couple le démarrage de la lecture à celui de la sélection de la source. Par contre, pour l’envoi de reportages ou d’interviews plus longues au cours de l’émission, une lecture depuis un ordinateur raccordé sur une entrée HDMI ou SDI offrira plus de souplesse et sera moins soumise aux contraintes du player interne du mélangeur, en termes de formats et de durée.

Les sorties des mélangeurs vidéo
Les mélangeurs offrent tous plusieurs sorties vidéo avec au minimum, une sortie « programme » pour le contenu à diffuser vers les spectateurs. Celle-ci est toujours associée à la sortie « préparation » ou « preview » qui affiche la source présélectionnée au niveau de la barre de préparation, prête à être passée à l’antenne. Ces deux sorties sont complétées par un nombre de sorties « Aux » plus ou moins important (d’une à huit) selon la puissance du mélangeur. Elles servent à diffuser au choix, la sortie « programme » ou une source particulière par exemple pour alimenter un moniteur de retour « plateau », une image d’habillage en fond de plateau, un assistant qui a besoin de suivre le déroulement particulier d’une séquence, les usages des sorties « Aux » étant infinis.
À l’instar des modèles broadcast, quelques mélangeurs prévoient une sortie vidéo « clean feed » identique au programme final mais sans l’habillage graphique ajouté au niveau des fonctions d’incrustation ou du DSK (voir ci-après).
Au moins une sortie HDMI est toujours présente pour le « monitoring ». Elle est systématiquement munie d’un circuit multiviewer affichant sur un écran unique les images des sources (en général de six à huit selon le nombre d’entrées disponibles) et les sorties « preview » et « programme ». Selon les modèles, la répartition et l’agencement des fenêtres seront proposés avec un ou plusieurs canevas. Cet affichage gère aussi les signaux de tally : un cadre rouge entoure l’image à l’antenne et un cadre vert pour la source présélectionnée en « preview ». Tous les systèmes affichent également les niveaux audio sous forme de bargraphes et parfois aussi une horloge.
Des effets spéciaux grâce au DVE
Au-delà de la simple commutation « cut » entre les sources d’images, la fonction principale d’un mélangeur vidéo est d’agrémenter le passage d’une caméra à l’autre avec un effet spécial numérique (ou DVE pour Digital Video Effect), comme un volet ou un fondu, ou de combiner leurs contenus grâce à une incrustation, une découpe de type PIP (Picture In Picture) ou des effets 3D en volume. Avec la montée en puissance des circuits de traitement numérique, l’imagination des ingénieurs est sans limite et même pour des mélangeurs dans une gamme de prix de l’ordre de 2 000 euros, les capacités en termes d’effets spéciaux sont déjà conséquentes.
Ce n’est pas tant le nombre d’effets spéciaux ou leur sophistication, décrits dans la documentation du mélangeur, qui doit guider le choix vers tel ou tel appareil, mais plus l’ergonomie des panneaux de réglages et surtout les capacités à mémoriser les paramètres des effets spéciaux dans des mémoires faciles à rappeler au cours du direct. Il est également souhaitable de disposer de fonctions de mémorisation complète de la configuration de l’appareil pour recharger d’une émission à l’autre des jeux complets de paramètres sans devoir tout reconfigurer à chaque direct.
Au-delà des simples volets verticaux et horizontaux, la liste des effets géométriques s’enrichit sans cesse avec des formes multiples (cercles, ellipses, losanges, cœur…) avec une compétition entre les constructeurs pour annoncer le plus grand nombre d’effets de volets. Avec le développement des circuits de traitements numériques, les mélangeurs s’enrichissent d’effets DVE permettant de jouer sur la taille, la forme de l’image et même sa texture. Ainsi le classique effet PIP (Picture In Picture) avec lequel un orateur restera à l’image dans une vignette pendant que son PowerPoint est diffusé plein écran.
Mais avec le DVE, si la puissance de calcul est là, des effets plus sophistiqués comme le tourné de pages, les glissements de pages, le cropping pour recadrer la source, mais aussi des effets de flou, de scintillement, la liste est infinie. La multiplication des effets ne rendra pas passionnant un contenu insipide. Il est préférable de rester sobre avec un ou deux effets bien conçus et cohérents avec le contenu que de faire le tour complet des menus effets de son mélangeur. Une débauche d’effets est souvent l’indice d’un contenu pauvre en informations ou sans intérêt !

Les fonctions d’incrustation sur fond vert
L’incrustation vidéo (ou video keyer) constitue le second grand chapitre des effets vidéo d’un mélangeur. Elle consiste en la combinaison de deux sources vidéo selon un signal de découpe fourni par une troisième source, on parle alors d’incrustation externe. Si le signal de découpe est déduit du contenu de l’une des deux sources, il s’agit alors d’une incrustation interne. Dans ce cas, il faut régler le seuil de détection pour créer la découpe, soit via le niveau lumineux, incrustation en luminance, soit par sélection d’une couleur précise grâce à l’outil de chroma keyer. Ce sont ces outils qui sont mis à contribution lors de la prise de vues d’un personnage filmé devant un fond vert ou bleu. Le fond coloré est remplacé par une image ou une séquence vidéo en fond d’écran, comme le présentateur météo de la TV filmé en superposition sur les cartes qu’il commente.
L’incrustation est également utilisée pour superposer des titres, logos ou graphisme sur une image vidéo animée. Ceux-ci sont fournis soit par une librairie interne stockant des images graphiques (avec couche alpha), soit une source informatique externe affichant ces images avec un fond blanc ou noir pour créer la découpe, ou pourquoi pas une caméra.
Le DSK ou Down Stream Keyer
Il est parfois nécessaire d’ajouter en permanence un logo ou un sous-titre à l’image, quelle que soit la source choisie ou l’effet DVE mis en œuvre. Dans ce but et pour ne pas immobiliser en permanence l’unique barre d’effets du mélangeur, tous les constructeurs les équipent avec une fonction supplémentaire dénommée Down Stream Keyer ou DSK (« incrustateur aval » en bon français). Il s’agit d’un autre module indépendant de générateur d’effets, mais limité à des fonctions d’incrustation en luminance de titres ou de logos.
Les éléments ajoutés grâce au DSK viennent se superposer à ceux de la barre d’effets principale. Pour effectuer un enregistrement vidéo sans les titres, logos ou habillage graphique liés à la diffusion antenne, les constructeurs prévoient des sorties « clean feed » avec le contenu vidéo mixé sans ces éléments. Cette sortie est souvent utilisée pour un enregistrement local en vue d’un remontage ultérieur du plateau diffusé en direct, soit pour en proposer une version plus courte ou pour en éliminer les éventuels défauts de réalisation. Dans ce cas, les titrages ou l’habillage graphique seront rajoutés lors de ce remontage en fonction de son rythme propre.
Le titrage
Quelques mélangeurs sont équipés d’un module de titrage intégré. Celui équipé d’un éditeur de texte sert à préparer des titres ou sous-titres pour fournir des informations complémentaires comme le nom et la fonction de l’intervenant ou mettre en valeur certaines phases de l’émission. Dans le passé, cette fonction était dévolue à un générateur de caractères ou d’habillage graphique indépendant. Son intégration à l’intérieur du mélangeur ajoute un niveau de complexité aux menus internes de configuration.
Le rappel des titres composés en cours d’émission exige une certaine dextérité et une modification de dernière minute, sans parler des éventuelles corrections de fautes dans le nom ou le titre de l’intervenant vont conduire à faire monter le niveau de stress de l’équipe de réalisation. Comme les utilisateurs en veulent toujours plus, d’autres options pour le choix des polices de caractères, des couleurs et du style d’habillage ne font qu’accroître la complexité.
Maintenant que les ordinateurs sont richement dotés en termes de polices de caractères, de taille et de style, il est beaucoup plus aisé de dédier la préparation et la gestion des titres à un poste informatique à part. Un simple logiciel de présentation de type PowerPoint ou Keynote permettra de préparer des titres beaucoup plus riches que le générateur de titrage intégré au mélangeur, à moins d’aller vers des modèles haut de gamme. Il suffit de mettre le logiciel de PréAO en mode diffusion de slides avec gestion d’un écran externe en mode étendu.
En sélectionnant une résolution des diapos identiques à celle du balayage vidéo du mélangeur, on obtient des titres avec une qualité satisfaisante. Il suffit de créer des diapositives avec un fond noir qui servira à définir une découpe très simple avec l’incrustateur de la barre mix/effect ou du DSK du mélangeur. Une simple permutation dans l’ordre d’affichage des diapositives permet de faire face aux modifications de dernière minute du conducteur et le passage d’un titre à l’autre s’obtient par un simple retour chariot ou une flèche droite, sans devoir aller naviguer dans l’explorateur de fichier.
Pour limiter la complexité des menus de configuration interne au mélangeur, quelques constructeurs prévoient un module de titrage dans leur électronique mais piloté depuis un ordinateur externe relié en réseau ou via un port USB.
Un mélangeur audio intégré

Une majorité de mélangeurs vidéo, et en particulier les modèles intégrés « tout-en-un », sont équipés d’un mélangeur audio interne. Une première analyse laisserait penser qu’avec ce type d’outil, on pourra faire l’économie d’un mélangeur audio dédié dans la régie. Il n’en est rien car les entrées/sorties physiques audio avec connecteurs séparés sont très limitées en nombre. En général un ou deux couples stéréo en entrée et un couple stéréo en sortie.
Pour assurer la prise de son du plateau, il sera toujours nécessaire de prévoir un mélangeur audio séparé pour faire le mixage des micros des intervenants. D’autre part, l’absence de curseurs de réglages en accès direct sur le pupitre vidéo oblige à aller modifier les réglages de niveau au travers des interfaces de navigation déjà largement sollicitées pour la gestion des effets spéciaux. Enfin, les fonctions de correction ou de traitement audio sont nettement plus limitées que sur un vrai mélangeur audio.
Par contre cette partie mixage audio intégrée au mélangeur vidéo n’est pas totalement dénuée d’intérêt car elle remplit deux fonctions pouvant faciliter le mixage audio du plateau. Toutes les entrées et sorties aussi bien SDI que HDMI (et même celles transitant en réseau IP) sont munies de circuits désembedders et embedders audio. Il est donc aisé de récupérer ou d’injecter les signaux audio transitant sur ces liaisons vidéo sans devoir multiplier des boîtiers AFV (Audio Follow Vidéo) qui commutent les sources audio en fonction de la sélection de la source vidéo. Pour l’envoi d’un sujet enregistré, cela peut soulager le travail de mixage.
Cette fonction reste bien sûr débrayable source par source. En fonction des habitudes de l’ingénieur du son et du degré d’automatisme souhaité en fonction de la taille de l’équipe technique (il n’est pas rare qu’une seule personne assure les fonctions de réalisateur, de cadreur des caméras PTZ et du mixage son), plusieurs stratégies d’association du mélangeur audio externe et du mélangeur audio intégré au mélangeur sont possibles.
« Comment créer son plateau TV », paru à l’origine dans le hors-série « Comment créer son plateau TV », a été repris sous forme de dossier dans Sonovision #26 (p. 40-60). Nous l’avons divisé en cinq parties distinctes que nous publions ici au rythme d’une par semaine : Le tournage en multicaméra (1), Choisir son mélangeur vidéo (2), Le tournage sur fond vert (3), Conseils d’intégration et d’aménagement (4) et Comment préparer sa captation ? (5).


