La piste numéro 8 du premier CD de l’OST de Final Fantasy VIII, The Landing, est un cas très particulier.

Afin d’en faire la partition exacte, j’ai d’abord regardé ce que les internautes ont proposé, notamment sur le site de MuseScore. Sans grande surprise, j’ai vu quelques partitions assez inexactes. Bien que dans l’ensemble ces partitions sonnent très proches du résultat final, j’ai constaté la présence d’instruments rajoutés, ou substitués à d’autre, et enfin d’une écriture fantaisiste de certains instruments. On peut par exemple y constater que la piste de synthétiseur a été substituée à un picolo, ou encore que certains cuivres jouent alors que sur le fichier d’origine, ils ne jouent. De même, le basson présent mesure 7 est en réalité une clarinette. Sur ces partitions les cuivres doublent souvent les voix de cordes ou enrichissent leurs harmoniques avec des quintes et des tierces. Donc en l’état, ça ne parasite pas vraiment le rendu audio.

J’ai alors décidé d’aller vérifier moi même dans les fichiers du jeu ce qui était joué, et je ne savais pas encore que j’allais découvrir des éléments très intéressants de programmation ou d’orchestration informatique…

L’extraction des fichiers, le début des ennuis

Afin de faire un relevé aussi efficace que « rapide » ( 🙂 ), j’ai une fois de plus opté pour le format .psf qui possède plusieurs avantages. Ils sont extraits des données directes du jeu, et laissent la possibilité de filtrer les 24 canaux qu’utilise la Playstation. Notons toutefois que le format .psf n’est pas un format d’origine, mais un format créé en 2002 par Neil Cornett, donc bien après la publication de Final Fantasy VIII. Si ce format n’avait posé aucun problème dans différents autres morceaux, lorsqu’il s’agit de musiques orchestrale, c’est une toute autre affaire. Je m’explique.

Pour avoir un multicanal « propre » ( 🙂 ), il faut utiliser le logiciel Audio Overload qui permet de lire les .psf et de cocher ou non l’activation des canaux. Le logiciel laisse aussi la possibilité d’extraire en .wav les canaux sélectionnés. Le meilleur moyen de faire un relevé de note aussi précis que possible est de créer un fichier .wav par canal, et d’écouter. Le seul bémol, et ce n’est vraiment que le début des embrouilles, le logiciel extrait les pistes à vitesse réelle. Cela signifie que, pour extraire le canal n°1 en entier, il faut attendre 4 minutes 36 puisque c’est la durée du morceau. Il y a 24 canaux. Cela m’a donc pris 2 heures et 18 minutes pour tout extraire, au minimum. N’oublions pas aussi le fait que je ne lance pas l’extraction de chaque canal dès l’instant que le précédent est terminé, et que j’ai trié les fichiers. Ce n’est rien, mais ça rajoute un peu de temps malgré tout.

Lors de l’extraction des canaux, j’ai constaté quelque chose qui allait drastiquement me compliquer la tache. En théorie, sur n’importe quelle console, les compositeurs rangent les instruments un a un par canal. C’est à dire que, par exemple, le canal 1 sera réservé à la flûte, le canal 2 au hautbois, le canal 3 à la clarinette … Ça, c’est la théorie. Dans la pratique, c’est un petit peu plus compliqué que ça, puisqu’il est possible d’utiliser plusieurs canaux pour un seul instrument si l’on souhaite ajouter un delay (une répétition de notes, comme un écho, avec un volume plus faible), ou pour tout autre effet souhaité. C’était le cas dans Flower Blooming by the Church, où chaque note est dans un canal, avec son écho. Ce qui veut dire que pour effectuer un arpège de 3 notes, mettons Mi Fa# Sol# comme c’est le cas ici; le Mi sera sur le canal 1, avec son écho, le Fa# sur le canal 2 et le Sol# sur le canal 3. Les compositeurs et programmeurs audio utilisent souvent ce genre d’artifice pour rendre la musique jouée par un ordinateur plus naturelle.

Pour The Landing, les canaux sont remplis de tout types de sons, issus du violon, de la trompette, un coup de caisse claire, ou encore une cymbale… Voici par exemple les 4 premiers canaux du fichier lors de la première minute du morceau :

Première minute du morceau, canaux 1 à 4 seulement

Sur l’image au dessus, on peut voir que le son Heartbeat est réparti sur plusieurs canaux, et qu’il disparait peu à peu, puisque qu’il utilisé sur les canaux suivants, non présents ici. Également, la première mélodie au Cor est présente en entier sur ces 4 canaux, mais la mélodie au Hautbois/Flûte/Clarinette n’est pas entière. Le fichier est construit ainsi sur toute sa durée. Voici de quoi compliquer quelque peu la tâche du relevé de notes. J’ai alors entreprit la longue ( 🙂 ) tache de ranger tout cela, ou tout du moins, de ranger uniquement les passages qui m’intéressent.

Au sujet de la répartition des instruments

Pour cela, j’ai donc extrait les 24 canaux du morceau, un a un, et je les ai ouvert dans mon logiciel d’édition, Studio One. J’ai ensuite créé une piste stéréo vide par instrument de l’orchestre, c’est à dire une piste pour : flûte, hautbois, clarinette, basson, cor, trompette, trombone, tuba, timbale, taiko, caisse claire, cymbale, synthétiseur, violons 1, violons 2, altos, violoncelles et contrebasses. Il me me manquait plus que de découper les notes qui m’intéressent et de reconstituer le tout dans mon multipiste fait maison.

Vous vous doutez bien que si la tâche était aussi facile, je n’en aurai pas fait un article entier.

Je pensais de prime abord que le fichier était bugué, et que la répartition des instruments sur plusieurs canaux était le résultat d’une mauvaise interprétation des données, ou d’un mauvais encodage. Mais en découpant petit à petit les samples, j’ai constaté que la programmation audio de ce morceau est diablement intelligente, et que le programmeur qui s’en est chargé a dû passer quelques nuits à jouer à Tétris dans les canaux. La première chose à constater ici, c’est que les sons ne sont pas synthétisés par la console dans ce morceau. Un tel résultat aurait été impossible avec un tel procédé. Ici, il s’agit bien, et j’en suis certain après avoir décortiqué toute cette masse musicale, que le morceau, utilisé lors d’une cinématique, lit tout simplement des canaux contenant des échantillons de son savamment agencés.

Pourquoi ? Parce que j’ai constaté qu’en rangeant les échantillons dans leurs canaux dédiés, ceux-ci ne correspondent pas exactement :

Mélodie d’introduction aux cors

Sur cette image, nous pouvons observer la première mélodie aux cors, issus des canaux 1 à 4 comme vu plus haut (le numéro du canal dont est extrait le son est visible sur l’étiquette de chaque échantillon). Ce que l’on peut constater, c’est que le release du premier échantillon commence sur l’attaque du second. En acoustique, un son est composé de 4 phases, nommés enveloppe ADSR pour Attack, Decay, Sustain, Release. Cela signifie qu’un son est tout d’abord « Attaqué », puis perd soudainement un petit peu d’énergie, le « Déclin », pour être « Soutenu » et enfin « Relâché ». Le cor possède une phase de decay qui peut être rendue à son minimum, ainsi que d’une phase de sustain dépendant du souffle de l’instrumentiste. Le release dans son cas, dépend en grande partie de l’acoustique de la salle et du système de prise de son. Si l’on regarde attentivement l’enchainement des deux premiers échantillons, on constate que la phase de sustain se termine exactement là où l’attaque de la note suivante commence. Si les échantillons étaient placés sur un même canal, un tel effet, surtout en 1998, aurait été très compliqué à faire, voire impossible. Aujourd’hui, les logiciels d’instruments virtuels possèdent des algorithmes pour imiter un tel enchainement de notes avec plus ou moins d’efficacité. C’est un « effet » très compliqué à rendre à l’aide d’un logiciel.

Qu’est-ce que cela apporte ?

Avoir recours à un tel procédé (répartir les échantillons sur plusieurs canaux) permet de lier les sons entre eux, et de mimer avec ingéniosité ce que l’on appelle en musique un legato. C’est à dire lier les notes de façon à ce que le release de la première note se superpose avec l’attack de la seconde. Chaque instrument demande d’effectuer un geste particulier pour faire cet effet. Sur un violon, par exemple, il faut jouer plusieurs notes dans un même coup d’archet. Pour les vents, de faire la même chose dans un seul souffle. Avec cet exemple du cor, nous avons eu le cas de figure le plus simple de ce genre d’effet. Voici, par exemple, les deux sections de violons sur l’envolée qui met fin à l’introduction du morceau :

Envolée aux violons

Avant de continuer à expliquer ce phénomène, attardons nous sur les « artefacts » d’autres instruments lors de ce passage. Les quelques bouts de notes venant d’autres instruments sur cet extrait ne sont pas témoin d’un mauvais découpage des échantillons. Les canaux sont enregistrés en stéréo, avec une spatialisation du son, c’est à dire qu’un instrument sera entendu plus à gauche ou à droite qu’un autre. Ici, les violons sont entendu vers la gauche (leur place dans l’orchestre). Les artefacts que l’on entend sont des bouts de queue de réverbération venant de la droite. Cela signifie qu’avant que le violon ne joue sa note sur le canal gauche du fichier, un autre instrument a joué une note sur le canal droit. Et la réverbération de sa note continue lorsque le violon attaque sa note. Afin d’éviter cela, il aurait fallut convertir chaque canal stéréo en deux canaux mono. Mais cela aurait alors porté le nombre de pistes à découper à 48…

Revenons-en à notre section de violons. La répartition des échantillons proposée sur l’image précédente est, selon moi, la meilleure qui permet à la fois de faire s’enchainer les échantillons sans qu’ils ne se superposent, mais également de rendre visuel le geste effectué. Le tout sur le moins de canaux possibles. Notons ici que les violons jouent une envolée en sextolets à 110 BPM. Les notes s’enchaînent très rapidement. Un tel enchainement de notes sans répartir les échantillons sur plusieurs canaux ferait que l’enveloppe ADSR aurait été très comprimée, et qu’au final, les sons seraient difficilement perceptibles. Si le programmeur audio a décidé de répartir les échantillons de violon sur plusieurs canaux, c’est pour cette unique raison. Cela permet de rendre le jeu du violon beaucoup plus humain. Le fichier n’est donc pas (ou peu) bugué. Petite anecdote intéressante, il manque sur l’image précédente 2 notes, une sur le premier violon en rouge, et une sur le second violon. Après avoir nettoyé l’intégralité des 24 canaux sur ce passage, j’ai constaté que ces notes sont tout simplement absentes. Je n’ai rien oublié, puisqu’il n’y a plus rien à découper dans les canaux. Je vous laisse le loisir de les trouver ! Pour vous aider, le nom des notes est visible sur l’étiquette de l’échantillon.

Le cas du basson et de la caisse claire

Sur plusieurs partitions en ligne, j’ai constaté comme dit brièvement plus haut, qu’à la mesure 7, la mélodie était jouée au hautbois ainsi qu’au basson. C’est une erreur (légitime, c’est très compliqué à entendre). Si l’on nettoie le fichier, on constate que la mélodie est jouée au hautbois, à la clarinette et à la flûte :

Flûte Hautbois Clarinette
Clarinette seule
Forme d’onde de la section de bois

Encore une fois, on peut observer grâce à l’étiquette de chaque échantillon, le canal dont il est issu.

Concernant la caisse claire, qui joue des roulements très rapides en croches et triples croches, je me suis demandé comment ils avaient réussi à obtenir un tel effet avec de la lecture d’échantillons. Chaque coup de caisse claire est isolé çà et là dans les canaux (là où il y a de la place, en fait) et placés exactement au bon endroit à chaque fois, ce qui permet d’obtenir un tel effet :

Passage de caisse claire, extrait

Admirez quelque peu la répartition de la caisse claire sur les différents canaux.

Les attaques aux violons du passage à environ 0:52

Lors de ma session de nettoyage des canaux, quelle ne fut pas ma surprise de voir un bordel sans nom dans les violons sur le passage à 0 min 52 sec du morceau. En principe, les violons attaquent des Mi en octaves sur un rythme guerrier de noire pointée, noire pointée, noire, noire, noire, en alternance (théorique) de 6/8 et 3/4, comme on peut l’entendre dans America de West Side Story. Voici une illustration de la notation (théorique) de ce passage sur The Landing :

Face à cela, je me suis dit que les échantillons devaient rendre état de ce motif rythmique là, sans rajouter d’éléments supplémentaires. Je suis donc parti à la recherche des échantillons de ces « Mi ». Une fois tout cela isolé, il ne restait dans mes canaux que les parties d’Altos et de Violoncelles et que j’ai également isolés. Les 24 canaux d’origine auraient dû être vides à ce moment là. C’en était loin. Très loin. Il restait un bon nombre d’échantillons de violons éparpillés un peu partout. A l’écoute individuelle, ces échantillons ont un volume très faible et ne semblaient correspondre à rien lorsque j’écoutais le morceau avec tous les canaux d’ouverts. Je les ai alors réunis dans des pistes à part pour les ranger et les écouter :

En rouge, nous avons à chaque attaque, deux pistes correspondant aux deux Mi en octave qui sont entendus. En vert, les échantillons restants, que j’ai regroupée par 4 en alternance. On peut commenter sur la durée exacte de chaque échantillon, très variable. Les échantillons les plus longs étant ceux qui ne sont pas suivis, par la suite, d’une autre note d’un autre instrument. Je les ai donc laissés résonner librement. Si un échantillon est cours, cela signifie que juste après la coupure de l’échantillon, un autre instrument attaquait une note. Cela coupe la réverbération de l’échantillon, mais je n’ai pas le choix. Et encore une fois, inversement si l’on entend ça et là des artefacts d’autres instruments : c’est leur queue de réverbération qui continue alors que le violon attaque sa note. Sur cette image, on peut très facilement voir l’incroyable bordel dans les canaux, en regardant les étiquettes de chaque échantillon. Les notes sont réellement éparpillées partout. Voici, en audio, ce que cela peut donner :

La section entière (échantillons rouges et verts)
La section sans l’effet d’attaque (échantillons rouges uniquement)
La section, effet d’attaque isolée (échantillons verts uniquement)

Les échantillons verts qui restaient sont en fait un effet d’attaque utilisé assez fréquemment lorsqu’il s’agit de donner de brefs coups d’archets pour marquer la pulsation du morceau. Le procédé est similaire dans l’introduction de One Winged Angel, et dans Liberi Fatali. Ces échantillons sont regroupés par 2 pour chaque Mi. C’est à dire que pour un échantillon rouge, il y a 2 échantillons verts, chacun sur une octave. Ce qui est imité ici, c’est un bref et rapide glissando de Ré à Mi en passant par Ré#. Répartir cet effet sur 3 échantillons, donc 3 notes, pour chaque attaque à l’octave, demandant l’utilisation de 6 canaux en simultané, est le seul moyen de mimer cet effet si l’on souhaite utiliser de la lecture de samples en 1998. En écoutant le morceau original le glissando n’est pas si facile à percevoir compte tenu de la rapidité d’exécution du motif rythmique. Il faut donc corriger la partition, et ce passage devrait s’écrire comme ceci :

Je ne sais malheureusement pas si une autre notation est plus adéquate pour écrire ce type d’effet.

Quoi qu’il en soit, je savais que The Landing allait représenter pour moi un travail énorme afin de reconstituer la partition telle que la musique est jouée, avec exactitude, par le jeu. Mais j’étais très loin de m’imaginer que cela allait me demander des jours pour traiter, trier, isoler, écouter chaque canal pour chaque instrument. Voici, pour terminer, une vidéo de ma session Studio One sur la première boucle du morceau. Je n’ai pas entièrement terminé d’isoler chaque échantillon, et je ne pense pas le faire (cela n’a pas de réel intérêt). J’ai réussi à isoler ce dont j’ai besoin pour faire la partition avec le plus grand soin. En blanc, tout en haut sont regroupées les 24 pistes des 24 canaux d’origine. Dès qu’il y a un trou dans un de ces canaux, cela signifie que j’ai isolé un échantillon et que je l’ai rangé sur la piste de l’instrument en question. Vous pourrez aisément reconnaître certaines des impression d’écran vues plus haut dans cette vidéo. En arriver là m’a pris environ une vingtaine d’heures pour comprendre comment l’orchestration est pensée, et ranger tous les échantillons dans les bonnes boîtes. L’audio de la vidéo est bel et bien l’audio de la session. Vous remarquerez qu’en découpant minutieusement les échantillons je n’ai pas altéré la qualité du morceau.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s