Les mélangeurs vidéo, suivez le guide (Partie 2)

Suite de notre dossier relatif aux mélangeurs vidéo. Après avoir abordé les mélangeurs « soft », le nombre d’entrées vidéo, les sources internes et les sorties, nous traitons ici des points suivants : Effets spéciaux ; Fonctions d’incrustation ; DSK ; Titrage ; Pupitre séparé ou boîtier unique ?; Raccordement à un micro-ordinateur; Mélangeur audio intégré ; Automatisation.
Panasonic-melangeur-AV-UHS500.jpeg

 

Les effets spéciaux

Au-delà de la simple commutation « cut » entre les sources d’images, la fonction principale d’un mélangeur vidéo est d’agrémenter le passage d’une caméra à l’autre avec un effet spécial, comme un volet ou un fondu, ou de combiner leurs contenus grâce à une incrustation, une découpe de type PIP (Picture In Picture) ou des effets 3D en volume. Avec la montée en puissance des circuits de traitement numérique, l’imagination des ingénieurs est sans limite et même pour des mélangeurs dans une gamme de prix de l’ordre de 2 000 €, les capacités en termes d’effets spéciaux sont déjà imposantes.

Ce n’est pas tant le nombre d’effets spéciaux ou leur sophistication, décrits dans la documentation du mélangeur, qui doit guider le choix vers tel ou tel appareil, mais plus l’ergonomie des panneaux de réglages et surtout les capacités à mémoriser les paramètres des effets spéciaux dans des mémoires faciles à rappeler au cours du direct. Plusieurs constructeurs offrent des possibilités de macrocommandes facilitant l’enchaînement ou la combinaison d’effets simples pour obtenir un habillage sophistiqué. Il est également souhaitable de disposer de fonctions de mémorisation complètes de la configuration de l’appareil pour recharger d’une émission à l’autre des jeux complets de paramètres sans devoir tout reconfigurer à chaque direct. Un stockage sur un support amovible ou sur un ordinateur relié en réseau offre une souplesse inégalée et des capacités d’enrichissement au fur et à mesure des directs réalisés.

La mise en forme des effets spéciaux est contrôlée via un ensemble d’outils associés à deux barres de sélection pour choisir les deux sources combinées dans cet effet. Ils sont regroupés sous un terme global de générateur de mix/effets, avec l’abréviation M/E. L’une des caractéristiques majeures des mélangeurs vidéo est le nombre de générateurs ou de barres de mix/effets dont il est pourvu. Un mélangeur simple est toujours équipé d’une barre de mix/effets (ou M/E), la montée en gamme se déclinant en fonction du nombre d’effets disponibles.

Pour les productions les plus sophistiquées, les constructeurs enrichissent leur gamme avec des modèles à deux ou quatre M/E. L’avantage principal d’un mélangeur avec plusieurs M/E est de pouvoir enchaîner directement des effets spéciaux les uns derrière les autres, alors que sur un mélangeur avec un seul M/E, après la diffusion d’un effet spécial, il faut repasser par une source plein cadre sans effet ajouté, puis préparer l’effet suivant (c’est à cet instant que la fonction de mémorisation des effets prend tout son intérêt pour un rappel rapide des réglages), et commuter la barre d’effets à l’antenne.

Au-delà des simples volets verticaux et horizontaux, la liste des effets géométriques s’enrichit sans cesse avec des formes multiples (cercles, ellipses, losanges, cœurs…) avec une compétition entre les constructeurs pour annoncer le plus grand nombre d’effets de volets. Avec le développement des circuits de traitements numériques, les mélangeurs s’enrichissent d’effets DVE qui permettent de jouer sur la taille, la forme de l’image et même sa texture.

Ainsi le classique effet PIP (Picture In Picture) avec lequel un orateur restera à l’image dans une vignette pendant que son Powerpoint est diffusé plein écran. Mais avec le DVE, si la puissance de calcul est là, la liste des effets plus sophistiqués comme le tourné de pages, les glissements de pages, le cropping pour recadrer la source, mais aussi des effets de flou, de scintillement, est infinie.

La multiplication des effets ne rendra pas passionnant un contenu insipide. Il est préférable de rester sobre avec un ou deux effets bien conçus et adaptés que de faire le tour complet des menus effets de son mélangeur. Une débauche d’effets est souvent l’indice d’un contenu pauvre en informations.

 

Les fonctions d’incrustation

L’incrustation vidéo (ou video keyer) constitue le second grand chapitre des effets vidéo d’un mélangeur. Elle consiste en la combinaison de deux sources vidéo selon un signal de découpe fourni par une troisième source, on parle alors d’incrustation externe. Si le signal de découpe est déduit du contenu de l’une des deux sources, il s’agit alors d’une incrustation interne. Dans ce cas, il faut régler le seuil de détection pour créer la découpe, soit via le niveau lumineux, incrustation en luminance, soit par sélection d’une couleur précise grâce à l’outil de chroma keyer. Ce sont ces outils qui sont mis à contribution lors de la prise de vues d’un personnage filmé devant un fond vert ou bleu, remplacé par une image ou une séquence vidéo en fond d’écran.

L’incrustation est également utilisée pour superposer des titres, logos ou graphisme sur une image vidéo animée. Ceux-ci sont fournis soit par une librairie interne stockant des images graphiques, soit par une source informatique externe affichant ces images avec un fond blanc ou noir pour créer la découpe ou, pourquoi pas, une caméra.

Les mélangeurs vidéo dans leur grande majorité disposent d’un module d’incrustation amont au niveau de la barre de M/E. La richesse fonctionnelle, le nombre de couches d’incrustation, la diversité des sources d’incrustation et la finesse des ajustements (important pour les chroma keyers) varient selon les versions et s’enrichissent dans la montée en gamme des produits. Un bon usage des keyers enrichit les capacités d’effets spéciaux du mélangeur et il est préférable de choisir un mélangeur bien doté sur ce plan-là plutôt que de donner la priorité au nombre de volets qui eux restent toujours préprogrammés selon un catalogue figé.

 

Le DSK ou Down Stream Keyer

Il est parfois nécessaire d’ajouter en permanence un logo ou un sous-titre à l’image. Dans ce but, et pour ne pas immobiliser en permanence l’unique barre d’effets du mélangeur, tous les constructeurs les équipent avec une fonction de Down Stream Keyer ou DSK (incrustateur aval en bon français). Il s’agit d’un autre module de générateur d’effets, mais limité à des fonctions d’incrustation en luminance de titres ou de logos. Les éléments ajoutés grâce au DSK viennent se superposer à ceux de la barre d’effets principale. Pour effectuer un enregistrement vidéo sans les titres, logos, ou habillage graphique liés à la diffusion antenne, les constructeurs prévoient des sorties « clean feed » avec le contenu vidéo mixé sans ces éléments. Selon les cas, la sortie « clean feed » est prise soit à la sortie de la barre M/E avec ou sans incrustation amont, ou juste avant le DSK.

 

Le titrage

Quelques mélangeurs sont équipés d’un module de titrage intégré. Celui-ci, équipé d’un éditeur de texte, sert à préparer des titres ou des sous-titres pour fournir des informations complémentaires, comme le nom et la fonction de l’intervenant, ou mettre en valeur certaines phases de l’émission. Dans le passé, cette fonction était dévolue à un générateur de caractères ou d’habillage graphique indépendant. Son intégration à l’intérieur du mélangeur ajoute un niveau de complexité aux menus internes de configuration.

Le rappel des titres composés en cours d’émission exige une certaine dextérité ; une modification de dernière minute, sans parler des éventuelles corrections de fautes dans le nom ou le titre de l’intervenant, vont conduire à faire monter le niveau de stress de l’équipe de réalisation. Comme les utilisateurs en veulent toujours plus, d’autres options pour le choix des polices de caractères, des couleurs et du style d’habillage ne font qu’accroître la complexité.

Maintenant que les ordinateurs sont richement dotés en termes de polices, de taille, de style, il est beaucoup plus aisé de dédier la préparation et la gestion des titres à un poste informatique à part. Un simple logiciel de présentation de type PowerPoint ou Keynote permettra de préparer des titres beaucoup plus riches que le générateur de titrage intégré au mélangeur, à moins d’aller vers des modèles haut de gamme. Il suffit de mettre le logiciel de PréAO en mode diffusion de slides avec gestion d’un écran externe en mode étendu.

En sélectionnant une résolution des diapos identiques à celle du balayage vidéo du mélangeur, on obtient des titres avec une qualité satisfaisante. Il suffit de créer des diapositives avec un fond noir qui servira à définir une découpe très simple avec l’incrustateur de la barre mix/effect ou du DSK du mélangeur. Une simple permutation dans l’ordre d’affichage des diapositives permet de faire face aux modifications de dernière minute du conducteur. Et le passage d’un titre à l’autre s’obtient par un simple retour chariot ou une flèche droite, sans devoir aller naviguer dans l’explorateur de fichier.

Pour limiter la complexité des menus de configuration interne au mélangeur, quelques constructeurs prévoient un module de titrage dans leur électronique, mais piloté depuis un ordinateur externe relié en réseau ou via un port USB.

 

Pupitre séparé ou boîtier unique ?

Les mélangeurs vidéo sont proposés sous deux architectures de boîtiers (ou form factor en anglais) : soit un boîtier unique qui regroupe à la fois le pupitre de commande et toute l’électronique, soit un pupitre de commande indépendant relié par un câble unique au châssis électronique sur lequel sont implantés les connecteurs d’entrée/sortie. Chaque solution présente des avantages et des inconvénients.

Un châssis électronique séparé, toujours au format rack 19 pouces, sera installé dans une baie regroupant tous les équipements avec des liaisons internes courtes et dissimulant les câblages, alors qu’avec un boîtier unique, tous les câblages du mélangeur aboutissent à l’arrière du pupitre et viennent encombrer l’espace de travail. Le pupitre de commande d’un mélangeur vidéo est toujours un organe complexe avec ses nombreux boutons lumineux, le T-bar et souvent un mini-écran LCD, et donc reste un équipement onéreux. Il suffit de comparer les prix des deux versions lorsque le constructeur propose ses produits sous les deux architectures.

La plupart des mélangeurs organisés avec un châssis électronique séparé peuvent être pilotés depuis un logiciel installé sur un micro-ordinateur avec l’affichage en taille réelle d’un panneau virtuel reproduisant toutes les commandes du pupitre du mélangeur. Les actions sur le mélangeur se font soit à la souris, soit avec des touches du clavier pour assurer les commutations « cut ». Cela offre un peu moins de souplesse qu’un vrai pupitre dédié mais, dans le cadre d’un budget un peu serré, offre la possibilité de choisir des alternatives plus performantes pour d’autres postes techniques.

À noter également que certains logiciels de pilotage de mélangeurs par réseau autorisent l’affectation de panneaux de commandes spécifique (mixage audio, lancement des sujets ou gestion de l’habillage, commande de caméras) à des ordinateurs distincts pour répartir le travail de régie entre plusieurs opérateurs. Via le réseau, il est facile de répartir les postes de travail à des endroits différents du plateau et de la régie.

 

Un micro-ordinateur devient indispensable

Pour limiter le nombre de touches et de fonctions de son pupitre, Sony adopte pour son mélangeur MCX-500 une stratégie différente. Toutes les fonctions du mélangeur sont accessibles via le logiciel associé, et l’utilisateur présélectionne sur celui-ci les huit volets et les éléments graphiques utilisés lors du direct et qui sont accessibles via des touches dédiées ou des icônes sur un mini-écran LCD. Il est évident que la majorité des mélangeurs vidéo récents exigent le raccordement d’un ordinateur à proximité pour alléger le travail de configuration et en exploiter toutes les potentialités au cours du direct.

Plusieurs constructeurs, Sony avec son Anycast Touchscreen, Datavideo, JVC et la gamme StreamStar Case, Livestream, adoptent une troisième architecture de mélangeur en regroupant dans un coffret unique en forme de valise, l’électronique du mélangeur, le clavier de commande ou sous forme d’un écran tactile, et enfin un écran LCD reprenant un mode d’affichage multiviewer. Ces appareils sont plutôt destinés à des équipes de production mobiles devant assurer des directs depuis des lieux variés.

 

Le mélangeur audio intégré

Une majorité de mélangeurs vidéo, en particulier les modèles intégrés tout-en-un, sont équipés d’un mélangeur audio interne. Une première analyse laisserait penser qu’avec ce type d’outil on pourra faire l’économie d’un mélangeur audio dédié dans la régie. Il n’en est rien car les entrées/sorties physiques audio avec connecteurs séparés sont très limitées en capacité. En général un ou deux couples stéréo en entrée et un couple stéréo en sortie.

Pour assurer la prise de son du plateau il sera toujours nécessaire de prévoir un mélangeur audio séparé pour faire le mixage des micros des intervenants. D’autre part l’absence de curseurs de réglages en accès direct sur le pupitre vidéo oblige à aller modifier les réglages de niveau au travers des interfaces de navigation déjà largement sollicitées pour la gestion des effets spéciaux. Enfin les fonctions de correction ou de traitement audio sont nettement plus limitées que sur un vrai mélangeur audio.

Par contre cette partie mixage audio intégrée au mélangeur vidéo n’est pas totalement dénuée d’intérêt car elle remplit deux fonctions qui peuvent faciliter le mixage audio du plateau. Toutes les entrées et sorties aussi bien SDI que HDMI (et même celles transitant en réseau IP) sont munies de circuits désembedders et embedders audio. Il est donc aisé de récupérer ou d’injecter les signaux audio transitant sur ces liaisons vidéo sans devoir multiplier les boîtiers externes d’embeddage/désembeddage.

D’autre part ces mixeurs audio sont munis de la fonction AFV (Audio Follow Vidéo) qui commute les sources audio en fonction de la sélection de la source vidéo. Pour l’envoi d’un sujet enregistré, cela peut soulager le travail de mixage. Cette fonction reste bien sûr débrayable source par source. En fonction des habitudes de l’ingénieur du son et du degré d’automatisme souhaité en fonction de la taille de l’équipe technique (il n’est pas rare qu’une seule personne assure les fonctions de réalisateur, de cadreur des caméras PTZ et du mixage son), plusieurs stratégies d’association du mélangeur audio externe et du mélangeur audio intégré au mélangeur sont possibles.

Première possibilité : faire la totalité du mixage audio de l’émission sur un mélangeur audio indépendant, en laissant de côté les fonctions audio du mélangeur vidéo. Cela obligera à y raccorder les éventuelles sources de programmes enregistrés lues au cours du direct. Si celles-ci sont diffusées depuis des lecteurs vidéo classiques, il suffit de rajouter les câbles nécessaires, souvent en XLR ou en jack 6,35 mm. Si la lecture des séquences vidéo est faite depuis un ordinateur, le raccordement de la console de mixage audio sur la sortie écouteur équipée en mini-jack peut s’avérer une source de galères. Il faudra ensuite injecter la sortie finale du mélangeur audio dans l’encodeur de streaming, indépendant ou intégré au mélangeur.

Seconde solution : utiliser le mélangeur audio externe comme prémix des micros du plateau et récupérer sa sortie pour l’envoyer dans l’entrée audio externe du mélangeur vidéo. La fonction AFV sert à assurer la commutation des sources audio et le final est envoyé directement vers l’encodeur de streaming intégré ou externe. Cela peut compliquer la gestion des retours audio sur le plateau.

Une dernière solution reprend le même principe en l’inversant. Elle consiste à faire le prémix des sources enregistrées sur le mélangeur vidéo et à envoyer sa sortie finale vers une tranche du mélangeur audio externe en charge de la prise de son du plateau. La sortie de ce dernier alimente l’encodeur de streaming (de préférence externe). On perd dans ce cas l’avantage de l’embeddage audio dans le final vidéo du mélangeur vidéo.

Ces diverses architectures sont à adapter et à moduler en fonction des capacités respectives du mélangeur audio externe, des fonctionnalités de la partie mixage audio du mélangeur vidéo et enfin du nombre et des caractéristiques des lecteurs vidéo et de l’encodeur de streaming (intégré ou non au mélangeur vidéo).

 

Automatiser certaines fonctions ?

Les objectifs assignés à une web TV d’entreprise sont fort divers et couvrent des dispositifs de communication multiples. Ceux-ci ont une incidence sur le mode de réalisation et d’écriture du direct, souvent enregistré et mis en ligne pour une consultation ultérieure. Certaines web TV reprennent les canons de la réalisation des émissions live des grandes sœurs de la TV pour la couverture d’évènements importants ou la diffusion de plateaux similaires à des talk-shows. Dans une perspective de formation, il existe aussi de multiples webinars, conférences ou documents pédagogiques pour lesquels la réalisation sera beaucoup plus épurée et correspondra à des canevas prédéterminés.

Le nombre de séances à enregistrer et leur répétition alourdissent la charge de travail des équipes de réalisation. Pour la limiter et éviter une certaine routine, plusieurs constructeurs proposent des fonctions d’automatisation, destinées en particulier aux universités et centres de formation. Ces outils sont regroupés sous le terme d’enregistreurs de cours avec des constructeurs spécialisés sur ce segment de marché comme Ubicast, Multicam Systems, Mediasite ou encore Epiphan. Ce thème spécifique a déjà été développé dans des numéros précédents de Sonovision. Nous reprenons juste la description de quelques fonctions d’automatisation qui peuvent alléger le travail de réalisation lors de l’enregistrement d’une web TV en live.

La première fonction automatisable concerne le suivi du cadrage des caméras en fonction de l’intervenant qui a la parole. Ces systèmes ont été mis au point depuis de longues années pour la captation de larges assemblées politiques. Ils associent un système de micro-conférences (Bosch, Televic, Shure, Taiden, Beyer,…) avec postes microphones posés devant chaque intervenant. L’unité centrale électronique renvoie une commande vers le système de pilotage des caméras PTZ. Une caméra a été affectée à chaque intervenant ainsi qu’une mémoire de cadrage. Dès la prise de parole la caméra est orientée vers l’orateur et l’image est ensuite commutée.

Les systèmes de micros conférence sont d’abord réservés à des réunions officielles et donnent un aspect très institutionnel à son déroulement. Ils ne sont donc jamais mis en place pour un plateau vidéo. Par contre des mélangeurs audio sont capables de détecter le niveau audio maximum d’une tranche d’entrée qui correspond alors à celle de l’orateur et renvoie une information numérique vers le système de pilotage des caméras PTZ et le mélangeur pour automatiser le cadrage et la sélection des sources.

Le mélangeur Conf de Multicam Systems intègre un tel outil pour simplifier la réalisation de direct avec des intervenants multiples. Ce genre d’outil est aussi largement utilisé pour la captation des talk-shows des émissions de radio et leur diffusion vidéo sur Internet. Il est évident que ce type d’automatisme fonctionne correctement pour des échanges dont le déroulement est maîtrisé et conduit par un animateur qui distribue la parole selon les intervenants.

Un autre axe d’automatisation concerne la détection faciale et le suivi automatique d’une personne, soulageant ainsi le travail de l’opérateur en charge du cadrage. Panasonic propose en option, pour sa gamme de caméras PTZ, une fonction logicielle à installer sur PC ou tablette. Après avoir sélectionné la personne à suivre, le logiciel envoie les ordres d’orientation de la tête à la caméra PTZ et permet de suivre l’intervenant filmé, et ce sans l’équiper d’une balise ou d’un détecteur comme cela existe pour certains outils de visioconférence.

Il est évident que l’intelligence artificielle et la détection de forme vont se développer dans de nombreux produits, comme cela est déjà le cas de la caméra Rally de Logitech, mais uniquement en situation de visioconférence, car ce premier modèle n’est équipé que d’une interface USB. Elle recadre de manière automatique un ou plusieurs personnages de manière à remplir complètement le cadre sans devoir corriger en permanence le zoom ou adapte un cadrage aux dimensions exactes d’un tableau blanc ou de l’écran de projection.

Il reste à évaluer concrètement la fiabilité et la finesse de ces outils pour vérifier s’ils apportent une réelle assistance à la réalisation ou restent cantonnés au statut de gadgets avec un rendu saccadé et incohérent par rapport aux informations à transmettre.

 

Extrait de l’article paru pour la première fois dans Sonovision #17, p.32-47. Abonnez-vous à Sonovision (4 numéros/an + 1 Hors-Série) pour accéder, à nos articles dans leur totalité dès la sortie du magazine.

 

Retrouvez la première partie de l’article ici et la dernière par

 


Articles connexes