Pourquoi trancher la voix d’une chanson ? Un besoin vieux comme l’auto-tune

Le karaoké, c’est pas que pour les afterworks honteux ou les soirées mousse à Ibiza. Dans le métal, c’est l’arme ultime pour bosser son guttural dans sa salle de bain, tester ses limites de fausset ou riffer sur du Slipknot sans risquer l’éviction de la copropriété. Concrètement, virer la voix d’un morceau, c’est :

  • S’entraîner au chant ou à l’instrument sur une version « propre »
  • Créer une démo ou une cover blindée dans les règles
  • Préparer un show karaoké qui claque lors du prochain barbecue metal-heads

Rien de nouveau sous le soleil : le mouvement DIY s’est emparé de cette pratique depuis les 80’s (merci le home studio 4 pistes), mais la technologie a fracassé les limites ces 15 dernières années. Aujourd’hui, même ta grand-mère peut s’improviser Dani Filth en deux clics. Mais comment marche la magie noire du vocal removal ?

Les dessous techniques : le grand déchiquetage de la Stéréo

C’est pas de la science occulte, mais presque. 90% des voix lead sont mixées pile au centre du champ stéréo. Du coup, le premier réflexe, c’est la suppression du « centre » (center channel extraction, si tu veux crâner en soirée). Pour faire simple :

  • La plupart des logiciels vont soustraire le canal droit du canal gauche (ou l’inverse)
  • Résultat ? Tout ce qui est « mono » (la voix, souvent) dégage ou passe à la trappe
  • Bémol : les guitares, la basse, et certains effets risquent aussi d’être touchés, le résultat peut sentir l’amateurisme si le mix d’origine est chargé

À l’heure de l’IA, c’est l’avènement du source separation ou séparation de sources. En gros, les intelligences artificielles (genre AudioShake ou Splitter.ai) peuvent apprendre à reconnaître la forme de la voix dans le mix pour l’extraire plus proprement.

Le matos : armes gratuites et softs de tricheurs

Les rois de la bidouille l’ont compris : pas besoin de banquer un SM57 vintage ou une console Neve pour virer une voix. Voici les outils qui font grogner l’industrie du karaoké, entre plugins gratuits, applis web et dark magic open source.

Le bon vieux Audacity (et pourquoi il fait encore le job… parfois)

  • Audacity (Open Source, gratos) : le couteau suisse du home-studio. Depuis les 2000’s, il trône sur les vieux PCs de tous les ingés son fauchés.
  • Fonction « Vocal Reduction and Isolation » intégrée : facile à trouver sous Effets. Méthode : il vire ce qui est au centre.
  • Bilan : efficace sur les vieux tubes mixés à l’ancienne, mais rapidement à la ramasse si le morceau est moderne ou blindé d’effets stéréo. Recommandé pour « Prière du Métalleux Débutant » mais pas pour du Devin Townsend façon mur du son.

Le grand saut dans l’IA : les plateformes qui font peur aux maisons de disques

  • Splitter.AI :
    • Interface web ultrabasique
    • Sépare jusqu’à 5 stems : Vocals, Drums, Bass, Piano, Other
    • Gratuit jusqu’à 2 morceaux/jour (payant au-delà)
    • Résultats vraiment bluffants sur la voix, même sur des mix modernes (tests faits sur du Behemoth, du Nightwish et même du Meshuggah ; la voix gicle façon catapulte)
  • Moises.ai :
    • Possibilité de séparer la voix, les instrus, d’isoler la batterie…
    • Qualité audio supérieure à la moyenne pour les prods récentes
    • Version gratuite limitée, payant si tu veux jouer au grand sorcier sur des sessions longues
    • Permet même de changer le pitch pour ceux/celles qui chantent comme Corpsegrinder après trois paquets de Gitanes
  • Spleeter (by Deezer) :
    • Projet open source toujours actif
    • Permet, avec quelques lignes de commandes (Python), de splitter voix et instrumentaux (jusqu’à 5 stems)
    • Un peu plus technique, mais la communauté GitHub regorge de tutos si tu n’as pas été allergique à l’informatique de l'ère Windows XP
    • Source officielle sur GitHub

Petit warning : sauf exception, toutes ces solutions laissent parfois un fantôme de voix, surtout si le mix original a de la reverb de partout ou les chœurs éparpillés dans la stéréo (merci les albums 2000-2020). D’ailleurs, même les ingés sons de tournée galèrent parfois à obtenir une parfaite « a cappella » ou piste instru « clean » d’un seul coup de soft (cf. Sound on Sound Magazine, lire ici).

Le process béton : comment faire, pas à pas

  1. Choisis ton arme Veux-tu bidouiller gratuit à la maison (Audacity/Spleeter), ou passer en mode instantané avec une IA (Moises.ai, Splitter) ?
  2. Importe ton morceau Formats supportés : MP3, WAV, FLAC… Du quality au max si possible (un fichier pourri = un résultat digne d’un bootleg live sur téléphone Nokia en 2005).
  3. Lance la séparation vocale
    • Via Audacity : Effets > Vocal Reduction & Isolation > Remove Vocals > Exporte en MP3. Simple mais oldschool.
    • Via Moises/Splitter/Spleeter : Uploade ton morceau, choisis « Remove Vocals », télécharge la version instru.
  4. Peaufine ton rendu (optionnel) Ajuste l’EQ ou ajoute un poil de compression pour masquer les artefacts audio (petits résidus de voix, trous spectraux hérités du mix original).
  5. Enregistre en MP3 Si ton soft sort un WAV, rechoppe un convertisseur (MediaHuman, Online Audio Converter). Qualité 320 kbps recommandée, même si tu prévois juste d’enflammer un apéro Lambda.

Limitations, pièges et astuces de true-métalleux

  • Les versions studio récentes : Plus le mix est « dense », plus la voix est enfouie sous des effets ou doublée. Ce qui rend la suppression imparfaite, même pour un outil IA.
  • Les voix non centrées : Certains groupes aiment les expérimentations chelou (merci Faith No More, Tool, etc). Leur voix est parfois décalée dans le champ stéréo = galère assurée.
  • Les chœurs et backing vocals : Souvent étalés sur la stéréo, ils restent après extraction. Idéal pour angoisser ton propre public au karaoké improvisé.
  • Respect de la loi : Les morceaux « isolés » ou « remixés » sont, dans le cadre familial ou associatif, souvent tolérés. Pas de souci pour t’en servir chez toi, mais un conseil : ne balance pas tes instrus sur YouTube ou Spotify sans autorisation explicite, sinon tu goûteras à l’humour très limité des ayants droit (source : SACEM).

Quelques anecdotes… ou comment les pros flirtent avec la frontière

  • Nergal, le frontman de Behemoth, avouait en interview (source : Loudwire) utiliser parfois des pistes splitées IA pour s’entraîner sur des covers avant d’entrer en studio.
  • Certains clubs metal underground à Berlin (genre le Blackland) programment des sessions karaoké entièrement DIY, avec des pistes extraites à l’arrache via Spleeter ou Splitter.
  • La scène française : De plus en plus de groupes éditent eux-mêmes leurs versions instrumentales. A surveiller sur Bandcamp, sous le tag « instrumental » ou « karaoke ».

Plus loin dans la voix-off : apprendre, s’entraîner… et pourquoi pas bidouiller encore ?

Supprimer la voix, c’est que le début : on parle d’un premier pas vers la production amateur ou le live revisité. Tu veux aller plus loin ? Essaie de :

  • Replacer ta propre voix dans le mix, via des interfaces comme Reaper ou GarageBand et des plugins type LePou (pour la gratte).
  • Travailler ton « growl » ou tes harmonies sur une instru custom, pour te chauffer avant d’enregistrer ta reprise YouTube (attention, Internet n’a pas pitié…).
  • Tenter la production de stems complets (batterie/guitare/basse/chant/FX), le Graal pour les vrais fous de remix.

Et qui sait ? La prochaine bombe garage qui tabasse sur un détour Bandcamp, ce sera peut-être toi… ou ton pote qui a enfin osé pousser un scream sans risquer d’être explosé par la voix originale.

Ressources complémentaires pour aller headbanger plus loin

Créer un MP3 karaoké métal, c’est pas un sport de masse… mais c’est moins élitiste qu’on croit. Teste, foire, recommence, et surtout amuse-toi. Puis, si tu crèves l’écran avec ta version « Walk » sans Phil Anselmo pour te voler la vedette, fais tourner l’extrait sur le Discord A.C.Y.L : on jugera avec bienveillance (ou pas).

Pour aller plus loin

En savoir plus à ce sujet :