L’avenir de la voix off et l’intelligence artificielle

L’intelligence artificielle, ou IA : c’est LE sujet du moment. Avec l’avènement de ChatGPT, MidJourney et autres, c’est Peur sur la Ville, Deep Impact, Armageddon, Titanic, Don’t Look Up, Tempête de Boulettes Géantes, bref vous avez la ref. Alors, l’IA, grand méchant loup ou pétard mouillé ?

voyant et boule de cristal

Spoiler alert : non, je n’ai pas de boule de cristal. En revanche, je pratique le beau métier de comédien voix off depuis presque 30 ans (29 exactement à la date de publication de cet article), et je m’informe constamment des différentes tendances, avancées technologiques et autres en rapport avec notre profession. J’en discute périodiquement avec mes collègues ingés son travaillant en studio commercial, avec mes agents, ainsi évidemment qu’avec mes collègues voix off, qu’ils/elles travaillent en studio commercial, depuis leur studio privé ou un mix des deux.

On lit en ce moment beaucoup de choses sur l’intelligence artificielle : que ça va piquer notre boulot, que c’est vraiment trop injuste, que les robots c’est méchant. Alors oui, à terme, les voix off pour les projets n’ayant pas besoin d’humanité du type modules d’e-learning interne vont être faits par des voix de synthèse – ça a d’ailleurs déjà commencé depuis un moment.

Cette réaction épidermique – et naturelle, rappelle fortement celle apparue lors de l’avènement d’internet (et l’apparition des studios privés qui l’a accompagné) parmi certains de la vieille garde des comédiens : il fallait empêcher cela à tout prix, ça allait tuer le métier, bla bla bla. Ce que ces réfractaires refusaient de voir, c’est qu’internet avait aussi créé une nouvelle, gigantesque source de travail, et avait aussi donné accès à des clients du monde entier. Je parle du sujet épineux des enregistrements à distance et des studios privés ici.

Il est vrai que le web a ouvert le métier à nombre de personnes qui n’y avaient auparavant pas accès, et beaucoup de ces personnes, n’ayant pas le talent et les compétences nécessaires, n’ont rien trouvé d’autre que de se vendre à des tarifs au ras des pâquerettes. Ce qu’on oublie souvent, c’est que cela concernait principalement des jobs qui n’existaient pas avant internet : e-learning, motion design, spots web etc. Ce qu’on oublie aussi, c’est que même avant l’avènement du web, certain·e·s comédien·ne·s qui faisaient des voix off n’étaient pas forcément très bon·ne·s, mais comme la voix off était leur chasse gardée, les prods n’avaient pas vraiment beaucoup de choix…

Tout ce qui est nouveau fait peur, et provoque une réaction pavlovienne de rejet. Ça fait partie des mécanismes de défense dont nous, mammifères, sommes équipés pour nous protéger du danger. Mais avant de sauter des falaises d’Étretat en criant d’une voix théâtrale surjouée “nous sommes damnés”, posons-nous la question suivante :

Qui est intéressé par les voix de synthèse ?

Réponse : deux types de clients.
– Les premiers produisent du contenu didactique qui peut se passer d’humanité du type e-learning interne. Ne leur jetons pas l’opprobre : si vous étiez producteur, vous feriez la même chose. Pourquoi utiliser une Rolls quand une Dacia suffit ?
– Les deuxièmes : ceux qui bookaient déjà ces médiocres casseurs de prix, qui castent au tarif, qui ne comprennent pas qu’une voix off de mauvaise qualité retire de l’engagement plutôt que d’apporter une valeur ajoutée. Et c’est le seul intérêt de l’IA : son coût plus bas. Après tout, le TTS n’est pas nouveau. Et même si à l’époque, les voix de synthèse étaient créées par concaténation et que le résultat était bien pourri, ça n’avait pas empêché certains attirés par les prix pas cher mon frère de les substituer aux comédien·ne·s voix off.

Il est un fait que nous, professionnel·le·s de la voix off, avons déjà été remplacés depuis un moment par ces personnes qui ne savent pas travailler, qui lisent à voix haute en ânonnant leur texte, en se contentant d’une pitance pour rétribution. La peur d’être remplacé par l’IA remplace la peur des vétérans d’être remplacés par des nouveaux venus non comédiens. Mais au final, la crème remonte toujours à la surface.

IA et voix offLes clients qui comprennent la différence entre coût et investissement ne sont pas sourds : ils entendent bien que même avec les avancées les plus récentes, les voix de synthèse sont sans âme, ne connectent pas avec l’audience, et desservent leur projet. Ils savent qu’un·e comédien·ne voix off professionnel·le apporte une réelle valeur ajoutée, qui se traduit par de meilleures ventes.

Certains, effrayés par les progrès effectués ces derniers temps, avancent que bientôt, l’IA sera capable de générer des voix aussi ‘humaines’ que les humains. Ces ‘certains’ n’ont probablement jamais travaillé en séance dirigée sur des spots TV qui ont coûté des centaines de milliers d’euros à réaliser : ils se rendraient compte que les demandes extrêmement pointues d’un bon DA exigent une finesse d’écoute, une capacité à traduire des directions ‘créatives’ en intentions qui connectent avec l’audience.

Dire, par exemple, ‘je t’aime’ peut signifier ‘je t’aime’, ‘je te déteste’, ‘passe-moi le sel’, ‘fous-moi la paix’, ‘à ce soir’, ‘tu pourrais me prêter 100 balles, ça m’arrange, c’est par rapport à l’argent’… et des milliers d’autres choses, selon le contexte qui dirige les infimes différences d’inflexion, d’appui, de rythme, de projection, bref, des nuances extrêmement subtiles que seul un humain qui parle (et non qui lit à voix haute) peut traduire dans l’émotion juste selon ce qui est désiré. Autre exemple, que les vétérans de la voix off parmi nous auront vécu : “tu peux me le refaire plus marron, mais comme une girafe, avec la lumière au bout du tunnel ?” Va enseigner ça à l’IA.

Bref, les gens qui ‘lisent à voix haute’ en ‘mettant le ton’ et en respectant la ponctuation comme de bons élèves, sans réaliser que la transmission orale fonctionne différemment de la transmission écrite, devront quitter un métier dans lequel ils n’ont jamais eu leur place : l’IA le fait déjà mieux qu’eux. Mais les comédien·ne·s voix off qui savent travailler, qui connaissent et qui parlent à leur audience, qui mettent de l’humanité dans leur interprétation, seront beaucoup, beaucoup plus difficiles à remplacer. J’ai écrit un article sur le sujet de l’humanité dans l’interprétation, que vous trouverez ici.

Tendons-nous le bâton pour nous faire battre ?

Il faut aussi analyser, en tant qu’individus, notre relation à la communication. Les millenials, par exemple, sont souvent allergiques aux appels téléphoniques, leur préférant les textos écrits (avec peu de mots et beaucoup d’emojis), ou les MP vocaux. C’est notre attitude qui façonne la façon dont nous communiquons – et dont on communique avec nous. Si nous sommes à la recherche de plus d’humanité, le marché ira dans cette direction, en utilisant des professionnels et , par exemple, en spécifiant ‘spot enregistré avec une voix humaine’ pour renforcer l’importance que l’annonceur attribue à l’humanité. Là où nous allons, c’est collectivement notre choix.

l’IA, un mal pour un bien ?

Bien sûr, je pourrais me tromper et il est possible qu’un jour, l’espèce humaine soit réduite à l’esclavage par une supra-élite malfaisante qui se servira de l’IA pour arriver à ses fins avides et démoniaques. Ou non – le problème n’est jamais l’outil, mais celui qui s’en sert, et comment il s’en sert. Mais si l’outil permet de se débarrasser de celles et ceux qui ne travaillent pas mieux que lui, ce n’est pas forcément une mauvaise chose. L’avenir nous le dira.

Bon, sur cette note joyeuse et pleine d’espoir (si si), je vous souhaite plein de jolis contrats qui vous permettront de faire la différence ! N’hésitez pas à partager cet article avec vos collègues si vous vous sentez généreux, et pensez à vous abonner à mon blog (en haut dans la colonne de droite) pour être prévenu quand je publie de nouveaux articles. N’hésitez pas non plus à partager ici votre point de vue sur le sujet et à laisser vos commentaires, je ferai de mon mieux pour y répondre !

2023-04-17T18:11:38+02:00

Partagez cet article, choisissez votre plateforme !

12 Comments

  1. Luis A April 3, 2023 at 12:18 pm - Reply

    Excellent article Pier. Il ouvre une voie d’espoir pour ceux d’entre nous qui fondent leur travail de voix-off sur l’humanité. J’ai également écrit quelque chose en espagnol à ce sujet il y a quelques semaines sur mon blog.

    • Pierre Maubouche April 3, 2023 at 10:54 pm - Reply

      Merci Luis, quand on parle comme un humain, on a plus de chance de ne pas se faire imiter par un logiciel !

  2. Joanna Saura April 3, 2023 at 12:24 pm - Reply

    Merci pour cet article qui décrit parfaitement mon opinion sur cet avènement, à première vue inquiétant, mais qui j’en suis sûre sera à terme un avantage pour les voix-off qui préfèrent travailler avec leur cœur ! 🙂

  3. Sara April 3, 2023 at 1:54 pm - Reply

    Ca y est, tout bien lu ! Je suis toujours aussi admirative de ton travail d’écriture, alliant précision, humour et franchise.
    Merci encore !

  4. Delphine Lidove April 3, 2023 at 8:26 pm - Reply

    Un très bel article comme toujours. Merci

  5. Eric Lebret April 3, 2023 at 8:50 pm - Reply

    Bravo ! Tout est dit. Pour ma part, cette IA qui fait le buzz est somme toute inquiétante ! Pas tellement (je tenterais bien un pas du tout, ou si peu que pas…) pour notre métier de comédien voix : je suis beaucoup plus attentif aux montages de photos et de textes. Il y a là vraiment matière à réflexion. Quant à parler d’intelligence, on en est encore qu’à la compilation, bluffante, pertinente, de données (de monceaux de données !) créées par des humains -ce qui n’est pas rassurants ;).
    Restent, de mon point de vue, deux questions fondamentales : quid de l’identification des sources exploitées pour fournir les résultats de cette “intelligence”, et quid de l’utilisation des résultats de ces merveilleux outils/logiciels.
    Au passage, ces voix synthétiques, réellement bluffantes sur des textes sans difficultés, figures de style, dialogues ou bizarreries sont vraiment utiles à toutes les personnes empêchées de lire ! Et parfois plus faciles à écouter que certaines voix humaines.
    Merci, à nouveau, M. Maubouché, pour ce bel article. Paix et prospérité.

    • Pierre Maubouche April 3, 2023 at 11:15 pm - Reply

      Avec plaisir ! Il est sûr que l’IA doit être encadrée, on assiste juste aux prémices du deep learning.

  6. François Lidove April 24, 2023 at 9:50 pm - Reply

    Un très bel article ! Pour aller un peu plus loin sur ce que tu dis à propos du e-learning, j’ai constaté un changement assez positif et un saut qualitatif depuis l’utilisation plus importante des voix de synthèse. Il y a une dizaine d’années, quand j’ai commencé, j’enregistrais de longs modules écrits à la 3ème personne du singulier et parfois avec des phrases de 15 lignes… Aujourd’hui, ces modules ont été remplacés par des modules écrits à la première personne (de narrateur, on est devenu personnage et partie intégrante du module). J’ai également vu le développement de contenus de type “serious game” avec des saynètes bien écrites (et chez certains clients, une direction artistique très précise sur presque chaque ligne précisée sur chaque intervention), et des personnages vocaux à créer… Du coup, je trouve l’enregistrement de e-learning beaucoup plus sympa et intéressant et je laisse volontiers à l’IA les phrases de 15 lignes ,-)

Poster un commentaire

Go to Top