Les constructeurs proposent une large gamme d’outils adaptés à ces modes de communication. Le choix d’une caméra dépend à la fois des performances souhaitées, du nombre de participants et de la configuration de la salle de réunion. De nouvelles fonctions intelligentes d’assistance à la prise de vues élargissent la palette des options possibles.
Pour la mise en place d’une visioconférence ou l’enregistrement d’une réunion, certains pourraient penser qu’il suffit de prendre une caméra traditionnelle de production, comme celles recensées dans le Guide du Tournage publié chaque année par Mediakwest. Même si le marché offre une large palette d’outils couvrant des besoins fort divers, le choix d’une telle caméra exigerait la présence d’un cadreur et son installation sur un pied, ce qui serait peu commode pour un usage dans une salle de réunion aux dimensions souvent limitées.
Les constructeurs d’équipements vidéo, et plus particulièrement de visioconférence, l’ont bien compris et ils ont complété leurs catalogues avec des caméras conçues spécialement pour ces usages. Outre leur compacité, les caméras dédiées visioconférence présentent toutes au moins trois caractéristiques :
- un objectif grand angle offrant un large champ de cadrage, en général autour de 75 à 90° pour filmer simultanément au moins les trois ou quatre participants de la réunion. Les modèles les plus perfectionnés reçoivent néanmoins des objectifs zoom pour aller filmer une personne en plus gros plan lorsqu’elle intervient longuement.
- tous leurs réglages pour affiner le cadrage sont télécommandables à distance, avec pour le haut de gamme des modèles sur tourelle motorisée, dénommée aussi caméras PTZ (pour Pan, Tilt et Zoom). Nous verrons plus loin que ces fonctions de cadrage sont parfois remplacées par des circuits de traitement numérique de plus en plus efficaces.
- la présence de plus en plus systématique d’un raccordement via un port USB vers le codec de visioconférence ou l’ordinateur qui en fait office.
L’offre des caméras destinées à la visioconférence reste néanmoins très large et pour la décrire, nous proposons de la répartir en quatre grands segments de produits :
- Les caméras avec objectif à focale fixe, ou webcams
- Les caméras motorisées avec zoom et tourelle PTZ intégrés
- Les barres de son avec caméra incorporée
- Les caméras avec assistance à la prise de vue par traitement numérique.
Les caméras avec objectif à focale fixe
Les caméras avec objectif à focale fixe destinées à la visioconférence sont des modèles de très petite taille conçus pour se fixer ou se clipser au-dessus de l’écran de l’ordinateur fixe ou portable. Connues aussi sous le nom de webcams, elles permettent à des ordinateurs fixes ou portables qui en sont dépourvus, d’accéder à des services de visioconférence, ou pour éventuellement enregistrer des modules pour des Mooc ou des webinaires. Elles sont également très prisées des gamers pour commenter leurs parties de jeux vidéo sur Twitch ou autres réseaux sociaux.
Dans leur majorité, elles sont équipées d’un capteur 1/3 ou 1/2,5 pouce avec 2 millions de pixels, offrant en sortie une résolution HD 720p ou 1080p, complété par une ou deux capsules microphones pour capter la voix de l’utilisateur. Quelques modèles récents offrent une résolution 4K. Elles se raccordent directement à l’ordinateur ou au codec de visioconférence via un port USB grâce au protocole UVC.
Si le système d’exploitation et les circuits de traitement interne de l’ordinateur sont compatibles, elles sont reconnues par la majorité des logiciels de visioconférence et même au-delà, par tous les logiciels comportant des fonctions vidéo, mélangeur vidéo de type OBS, montage vidéo, encodeur de streaming, etc. À condition de bien sélectionner cette entrée vidéo et audio dans les fenêtres de paramétrage des logiciels.
Suite à quelques polémiques à propos du piratage via caméra vidéo, quelques modèles récents sont équipés d’un volet mécanique pour cacher l’objectif. Mais ne pas oublier que le microphone peut continuer à capter les conversations. Sa coupure via le panneau de réglage ne sera pas superflue !
Ces caméras à focale fixe sont d’abord conçues pour un usage individuel et leur objectif est calculé pour filmer une personne placée face à l’écran à une distance de 0,50 à un mètre. L’angle de captation est de l’ordre de 70 à 90 ° dans un plan horizontal. Il est possible de l’utiliser pour une visioconférence à plusieurs, mais au maximum pour trois participants. Au-delà, l’absence de fonction zoom conduit à un plan large dans lequel les intervenants sont filmés de trop loin et il devient difficile de suivre leurs interventions à l’écran.
Quelques modèles très récents sont équipés de capteurs avec une résolution beaucoup plus élevée de l’ordre de la dizaine de millions de pixels et offrent alors une fonction de zoom numérique pour cadrer de manière plus serrée chaque participant. Cette fonction est alors associée à des outils d’assistance décrits plus loin dans le paragraphe consacré aux caméras avec assistance à la prise de vues.
Le niveau de performance, équivalente aux caméras intégrées dans les ordinateurs portables ou les tablettes, et leurs fonctionnalités limitées en termes de cadrage réservent l’usage des caméras à focale fixe, ou webcams, soit à des ordinateurs dépourvus de caméra intégrée, ou équipés d’une caméra de piètre qualité. Ils concernent aussi des postes de travail où la disposition des équipements ne permet pas un cadrage satisfaisant et enfin l’équipement de petites salles de réunion à trois participants au maximum et pour des visioconférences épisodiques. Pour une utilisation régulière et des réunions accueillant plus de trois personnes, il est préférable de choisir des modèles plus perfectionnés comme ceux décrits ci-après.
Les caméras à tourelle PTZ
Les caméras à tourelle PTZ regroupent dans un châssis unique le corps d’une caméra vidéo, un objectif zoom à focale variable, un support motorisé et orientable pour diriger l’axe de la caméra en site et en azimut et tous les circuits électroniques de commande et de traitement vidéo. Au fil des ans, l’offre des caméras PTZ s’est considérablement élargie et couvre maintenant trois marchés principaux : la vidéoprotection, la communication unifiée et la production audiovisuelle. Pour chacun de ces domaines les caractéristiques techniques, les performances, les signaux vidéo disponibles en sortie sont adaptés aux besoins des utilisateurs.
Les caméras PTZ ont d’abord été développées pour les usages de vidéoprotection où un seul opérateur peut manipuler plusieurs dizaines de caméras depuis une salle de contrôle. De très nombreux acteurs interviennent sur ce marché, soit parce que spécialisés dans les activités de sécurité ou de réseau (Bosch, Axis, D-Link, Geutebrück…), mais également les constructeurs traditionnels d’équipements vidéo (Sony, JVC, Canon, Panasonic…) qui ont tous développé des gammes spécifiques orientées vidéosurveillance.
Pour la production audiovisuelle, les caméras PTZ ont dû attendre leur montée en performances avec le lancement de modèles à trois capteurs qui rivalisent avec certains modèles de caméras de plateau. Il devient habituel de les voir sur les plateaux des chaînes locales (la réduction du nombre de cadreurs est un argument favorable à leurs finances) mais aussi de nombreuses chaînes thématiques de la TNT. Les émissions de téléréalité sont aussi grosses consommatrices de caméras PTZ. Les caméras PTZ ont également trouvé leur place dans les studios de radio fort exigus, pour la reprise TV des multiples entretiens politiques du matin. Panasonic et Sony ont élargi leur offre de caméras en proposant dans leur catalogue toute une série de caméras PTZ orientée production. Ils couvrent également les besoins de la communication corporate avec des références adaptées à ce marché en forte croissance.
D’autres constructeurs comme Poly, Vaddio, Logitech, Aver spécialisés dans la visioconférence ont également de larges gammes de produits. Ils vendent des caméras indépendantes ou intégrées directement au codec de visioconférence. Pour leur raccordement sur un codec externe ou d’autres équipements (mélangeurs vidéo, enregistreur, système de streaming), la palette de connectique est fort variable d’une gamme à l’autre. Le connecteur HDMI est devenu le connecteur numérique standard et il est de plus en plus associé avec l’USB 3.0 ou type C pour un raccordement direct sur un ordinateur ou une unité d’audioconférence mixte avec capacité de visio.
Quelques modèles proposent des sorties réseau avec streaming IP. Pour de la visioconférence traditionnelle, ce mode de raccordement est inutile, mais il peut être exploité pour des diffusions à large échelle pour des activités de type webinaire. Certains modèles possèdent également des connecteurs propriétaires qui ne peuvent être exploités qu’en association avec les codecs du même constructeur. Avec une sortie simultanée en HDMI et un USB, l’utilisateur pourra faire face à une majorité de situations et de configurations.
Les caméras à tourelle PTZ ont été imaginées pour être commandées à distance tant pour leurs réglages que pour le choix du cadrage. Les modes de télécommande sont très nombreux : télécommande à signaux infrarouges, liaison filaire avec port série RS-232 ou par réseau, pupitre de télécommande dédié ou encore via le port USB pour celles qui en sont pourvues. Certains modes comme le pupitre dédié ou le port réseau sont plus adaptés à des situations de production multicaméras.
Dans le cadre d’une visioconférence avec un petit groupe, les deux outils les plus simples à mettre en œuvre sont la télécommande IR et le pilotage via le port USB. Si la caméra est de la même marque que le codec de visioconférence, les commandes de cadrage et de réglages de la caméra sont intégrées dans l’interface ou le pupitre de contrôle du système de visioconférence. Si la visioconférence est gérée depuis un logiciel de visioconférence installé sur ordinateur, il sera nécessaire d’adjoindre un logiciel spécifique pour contrôler la caméra souvent disponible sur le site du constructeur.
De nombreux modèles équipés d’un port réseau Ethernet sont aussi pilotables depuis une simple interface de navigateur web. Pour assurer le pilotage d’une caméra PTZ, de nombreuses solutions sont donc disponibles. Il faut juste faire l’inventaire des ports de télécommande disponibles sur la caméra et en fonction de l’architecture de visioconférence choisie, établir la liaison et la configurer pour assurer le pilotage de la ou des caméras.
La caméra à tourelle PTZ n’a d’intérêt que si les cadrages sont adaptés en fonction du déroulement de la réunion pour offrir aux sites distants des images de qualité et centrées sur la personne qui s’exprime. Ce suivi de l’intervenant doit être adapté à la phase de la réunion. Si la personne qui s’exprime démarre une intervention longue, le cadrage pourra être modifié et centré sur elle. Par contre si la réunion s’engage dans une période de dialogues avec des échanges animés, il est préférable de rester sur un plan large et de ne pas suivre les interventions de type ping-pong, pendant lesquelles le cadrage est toujours en retard d’un épisode. Ce type d’outils n’a rien à voir avec ceux utilisés sur un plateau TV ou pour une émission de variétés.
Sauf pour diffuser des évènements ou des conférences importantes, dans une visioconférence de type réunion, il n’y a jamais une personne en charge du choix des cadrages. C’est souvent l’un des participants qui s’en charge et il doit également en suivre le déroulement et les propos échangés. On constate souvent que quelques cadrages sont modifiés en début de réunion et qu’ensuite elle se déroule uniquement avec un plan large, même dans les salles de visioconférence équipées de plusieurs caméras. Face à ce constat, les constructeurs rivalisent d’imagination pour mettre au point des systèmes automatiques de cadrage et de suivi des intervenants, détaillés ci-après dans le paragraphe consacré aux caméras avec assistance à la prise de vues.
Les barres de son vidéo
La barre de son a été créée pour le marché audiovisuel domestique afin de renforcer et d’améliorer les parties audio des téléviseurs. Au fil des ans elles sont devenues un périphérique habituel dans les salons pour remplacer l’amplificateur hi-fi vidéo. Pour l’équipement des salles de réunion, cet équipement est souvent recommandé pour offrir un regain de puissance sonore lors de la diffusion de documents vidéo sur un écran LCD. Très vite, plusieurs constructeurs ont imaginé regrouper la barre de son avec la caméra de visioconférence puisque les deux périphériques sont placés ou fixés à côté de l’écran LCD. Et ainsi depuis quelques années pour l’équipement des salles de visioconférence est apparu un nouveau concept, la barre de son vidéo.
Selon les choix effectués par les constructeurs, l’association entre les deux outils est plus ou moins imbriquée. Une première série d’acteurs juxtapose les deux matériels sur un support unique en conservant leur connectique respective. Il s’agit alors d’un simple couplage mécanique. D’autres les associent avec un système de prise de son dans une électronique commune de manière à simplifier les raccordements vers un codec de visioconférence externe ou un ordinateur avec logiciel de visioconférence et à les piloter à distance.
Une troisième catégorie en profite pour incorporer dans la barre de son vidéo le codec de visioconférence avec ses interfaces réseau. Cette solution adaptée à des petites salles de réunion simplifie grandement le déploiement du système de visioconférence puisqu’il suffit de le compléter avec un écran LCD. Si le nombre de participants dépasse les cinq à six personnes, il sera préférable de pouvoir y ajouter un ou deux systèmes de micros de table. Les configurations sont fort nombreuses et certains constructeurs présentent sur leur site les diverses solutions selon la taille et la disposition de la salle de réunion.
Au niveau des caméras, selon les propositions des constructeurs, on retrouve des modèles à focale fixe avec des performances similaires à celles des webcams pour ordinateur, des modèles avec objectif zoom orientable mécaniquement et enfin des caméras fixes avec zoom numérique et outils d’assistance pour le cadrage, comme dans les barres de son vidéo Poly Studio USB Video Bar.
Les caméras avec assistance à la prise de vue
Lors d’une visioconférence, dans une salle équipée d’une ou plusieurs caméras à tourelle, suivre les divers intervenants avec des cadrages serrés sur leur visage reste un véritable défi, à moins d’avoir désigné une personne comme réalisateur. Les constructeurs n’ont de cesse depuis plusieurs années de mettre au point des dispositifs de suivi des locuteurs. Ainsi Poly avait présenté le système EagleEye Producer. La caméra PTZ est associée au système de prise de sons constitué d’une barre de capsules micros. Grâce à une analyse des retards entre les sons captés par les diverses capsules, la position latérale de l’intervenant qui s’exprime est déterminée et la caméra s’oriente vers lui au bout de quelques secondes.
Avec la montée en résolution des capteurs de caméras et la puissance des outils d’analyse numérique de plus en plus perfectionnés, un nouvel axe de recherche a été exploré. Les circuits de traitement de la caméra (ou intégrés parfois dans le codec) détectent les personnes dans le cadre en plan large et leur position. Si la caméra a été placée pour qu’en plan large elle puisse filmer une réunion avec cinq participants, automatiquement elle détectera que seules trois personnes sont présentes et resserra le cadre sur celles-ci. Si le système est couplé à un outil de détection sonore spatial, la caméra pourra zoomer vers la seule personne qui a pris la parole, puis élargir le cadre dès qu’un participant hors champ intervient ou entre dans la salle.
Ces outils peuvent être associés à des caméras motorisées. Mais de plus en plus de constructeurs privilégient ce type d’assistance avec des caméras à objectif fixe en les équipant de capteurs à très haute résolution, de l’ordre d’une dizaine de millions de pixels, et viennent zoomer en mode numérique dans l’image plan large, grâce à des circuits neuronaux ou des outils d’IA.
Ainsi la caméra Huddly IQ est équipée d’un capteur de 12 millions de pixels et d’un objectif fixe offrant un champ de 150 ° dans un plan horizontal. Avec son zoom numérique de rapport maximum de 4 x 1, elle est capable d’adapter le cadrage au nombre de participants de la réunion. La caméra EagleEye Cube de Poly reprend des principes similaires.
La barre de son Studio USB de Poly possède aussi des fonctions de suivi. Cisco intègre ces fonctions de cadrage automatique et de suivi des intervenants dans ses systèmes Webex Roomkit Pro. Le système Group de Logitech offre également des fonctions de cadrage automatique et d’améliorations de la qualité des images.
Jabra, constructeur spécialisé dans les casques audio professionnels et les systèmes mains libres, a conçu un système de prise de vues, le Panacast. Il est doté de trois têtes de caméra avec chacune 13 millions de pixels. Leurs trois images sont assemblées en une seule avec une couverture de 180 °. Un circuit de détection de présence adapte le cadrage immédiatement au nombre de personnes présentes.
Dolby a également lancé un système de visioconférence, le Dolby Voice Room, dans lequel il intègre à la fois tout son savoir-faire du traitement audio et du codage vidéo. Les traitements numériques mettent à profit un codage HDR pour optimiser le niveau d’exposition des participants, en particulier s’ils sont placés dos à une fenêtre, et améliorer la spatialisation de la capture sonore des participants pour la restituer sur le site distant. Enfin un outil de détection d’images est intégré pour ajuster le cadrage, et même redresser par exemple un tableau blanc filmé de côté. Le système Dolby Voice est compatible avec les logiciels BlueJeans et GoToRoom de LogMeIn.
Pendant des années, les caméras destinées aux systèmes de visioconférence ont vu leurs performances s’améliorer en termes de résolution, en passant de la SD à la HD, puis à la 4K pour quelques modèles haut de gamme, renforcés par la progression des codecs de compression. Avec l’introduction de puissants circuits de traitement et d’analyse des signaux, boostés par les techniques de l’IA, les outils de prises de vues, en association avec leurs codecs de transmission, s’améliorent sans cesse, mais surtout s’enrichissent de fonctions qui rendent les visioconférences plus confortables et plus simples à mettre en œuvre.
Retrouvez la première partie de l’article ici…
Article paru pour la première fois dans Sonovision #21, p. 44-48. Abonnez-vous à Sonovision (4 numéros/an + 1 Hors-Série) pour accéder à nos articles dans leur totalité dès la sortie du magazine.









