Conformation son : exporter un AAF du montage image vers le mixage
Ce qu'est la conformation, pourquoi l'AAF surpasse l'OMF, combien de handles laisser, et le 2-pop et l'image de référence qui font vérifier la synchro en quelques secondes.
Par Hanna Eng·Monteuse vidéo, diplômée du Conservatoire libre du cinéma français
Un AAF est le fichier qui transporte le montage image vers la session de l'ingénieur du son, avec les plans audio, leurs positions et leurs fondus. On l'exporte avec des handles de plusieurs secondes (beaucoup de mixeurs demandent de quelques secondes jusqu'à environ six ; la longueur exacte se fixe au cas par cas), la stéréo séparée en mono, à 48 kHz, accompagné d'une image de référence et d'un 2-pop, pour que le mixage se conforme exactement à l'image.
Quand le montage image est terminé, le son ne voyage pas sous forme d'un mixage aplati, il voyage sous forme du montage lui-même : chaque plan, à sa place, avec ses fondus, reconstruit dans la session de l'ingénieur du son. Ce passage, c'est le turnover, et réussir l'export fait la différence entre un mixeur qui démarre tout de suite et un mixeur qui passe la première heure à rattraper la synchro et les médias manquants. Voici comment le faire proprement.
AAF, OMF ou XML/EDL pour le passage au son
| Format | Ce qu'il transporte | Usage |
|---|---|---|
| AAF | Plans audio, points de montage, fondus, automation de volume et noms de pistes | Le standard moderne pour passer un montage à Pro Tools |
| OMF | Plans audio et montages, mais l'automation et les noms sont peu fiables ; les fichiers intégrés sont plafonnés autour de 2 Go (une limite propre à l'OMF) | Solution de repli quand l'AAF n'est pas possible |
| XML / EDL | Les décisions de montage seules, sans média audio embarqué | Conformation et relink, pas un passage de média audio |
Production Expert ; Avid
Ce que veulent dire « turnover » et « conformation »
Le turnover, c'est le moment où le montage image est remis au département son. La conformation, c'est ce qui suit : le mixeur reconstruit le montage exact dans Pro Tools à partir du fichier que vous envoyez, pour que l'audio se place image par image sur l'image verrouillée. (« Turnover » est un terme emprunté à l'anglais ; « conformation » est le mot français.)
Cela ne marche proprement qu'une fois l'image verrouillée, c'est-à-dire le montage, le minutage et l'ordre des plans définitifs. Conformer sur un montage non verrouillé oblige à reconformer le son à chaque changement d'image ensuite, le type de reprise le plus coûteux en post-production.
AAF, OMF ou XML : quel format envoyer
L'AAF (Advanced Authoring Format) est le standard moderne pour le passage au son. Il transporte les plans audio, leurs points de montage et fondus, l'automation de volume des clips et les noms de pistes, exactement ce dont le mixeur a besoin pour reconstruire le montage. L'OMF (Open Media Framework) est le format ancien : il fonctionne, mais il transporte l'automation et les noms de pistes de façon peu fiable, donc c'est un repli, pas un premier choix. Le plafond d'environ 2 Go des fichiers OMF intégrés est une limite propre à l'OMF : l'AAF n'a pas cette limite stricte, mais pour les grosses sessions il reste plus sûr de lier le média plutôt que de l'intégrer.
Le XML et l'EDL sont un autre outil. Ils décrivent les décisions de montage mais n'embarquent aucun média audio : on les utilise pour conformer ou relinker, pas pour passer une session audio complète. Pour un mixage, on envoie un AAF. Le tableau ci-dessus détaille les compromis.
Exporter avec des handles, et pourquoi une image ou deux ne suffisent pas
Les handles sont des images supplémentaires exportées au-delà des points d'entrée et de sortie de chaque plan, pour que le mixeur puisse rallonger un raccord, ajouter un fondu enchaîné ou lisser une transition sans que l'audio s'arrête net. Une image ou deux ne suffisent pas : la pratique professionnelle est de plusieurs secondes, avec une recommandation courante d'un minimum d'environ six secondes de handle sur chaque plan.
Sans handles, chaque fondu que le mixeur veut allonger bute sur un bord net et le plan n'a plus d'audio à donner. Des handles généreux coûtent un peu de poids de fichier et évitent d'enfermer le mixage.
Stéréo, mono et fréquence d'échantillonnage
On livre l'audio à la fréquence d'échantillonnage du projet, qui pour la vidéo est de 48 kHz, pas les 44,1 kHz du CD et de l'audio grand public, et en général en 24 bits, au format Broadcast Wave (BWF). Un fichier à la mauvaise fréquence se lit à la mauvaise vitesse et à la mauvaise hauteur dans la session de mixage.
On sépare les plans stéréo en pistes mono distinctes pour que le mixeur contrôle chaque canal indépendamment, et on choisit entre média embarqué (l'audio dans l'AAF) ou média lié (l'AAF plus un dossier de fichiers audio). L'embarqué est plus simple à remettre ; le lié garde l'AAF léger.
Le filet de sécurité de la synchro : un 2-pop et une image de référence
Un 2-pop est une seule image de tonalité à 1 kHz, placée exactement deux secondes avant la première image du programme, là où le « 2 » apparaîtrait sur un décompte, avec un pop de fin correspondant après la dernière image. Son niveau suit la référence d'alignement de la livraison : couramment -20 dBFS sur les livrables SMPTE/américains (où -20 dBFS = 0 VU) et -18 dBFS sur les livrables EBU/européens ; confirmez le niveau cible avec la spec du livrable. Il donne au mixeur un point de synchro unique et sans ambiguïté pour contrôler toute la session.
On l'envoie avec une image de référence, en général un export QuickTime de l'image verrouillée, avec le même timecode de départ et le même 2-pop incrusté. Avec les deux, le mixeur confirme que l'AAF se cale sur l'image en quelques secondes, au lieu de découvrir un décalage d'une image en fin de journée.
Exporter depuis DaVinci Resolve, et ce qu'il faut au mixeur
DaVinci Resolve exporte un AAF directement, comme les autres logiciels de montage dont un projet peut provenir, chacun avec ses propres options de longueur de handles et de séparation en mono. On règle les handles, on sépare en mono, on choisit média embarqué ou lié, et on exporte à 48 kHz.
Le paquet de turnover complet, c'est plus que l'AAF : l'AAF, une image de référence QuickTime avec timecode et 2-pop correspondants, l'audio de production si le média est lié, et un court fichier de notes indiquant la fréquence d'image, la fréquence d'échantillonnage, la longueur des handles et tout point inhabituel. C'est ce paquet qui permet de conformer le mixage du premier coup.
Check-list de turnover et erreurs fréquentes
Les erreurs coûteuses sont toutes évitables : faire le turnover avant le verrouillage image, des handles trop courts pour les fondus, pas de 2-pop, de l'audio en 44,1 kHz au lieu de 48, un média OMF intégré qui dépasse sa limite d'environ 2 Go, ou l'oubli de l'image de référence QuickTime qui empêche le mixeur de vérifier la synchro.
Un turnover propre tient en une courte check-list : image verrouillée, AAF avec handles de plusieurs secondes, séparation en mono, 48 kHz, un 2-pop, une image de référence correspondante, et un fichier de notes. On coche tout cela et le mixage commence dès la première minute.
Questions fréquentes
Qu'est-ce que la conformation son ?
C'est l'ingénieur du son qui reconstruit le montage exact du monteur image dans Pro Tools à partir du fichier que vous envoyez, pour que chaque plan audio se place image par image sur l'image verrouillée avant le mixage.
Quelle est la différence entre AAF et OMF ?
Les deux transportent les plans audio et les montages vers le mixeur, mais l'AAF conserve l'automation de volume et les noms de pistes de façon fiable, alors que l'OMF est plus ancien et transporte l'automation et les noms de façon peu fiable. On envoie un AAF et on garde l'OMF en repli. L'OMF plafonne le média intégré autour de 2 Go ; l'AAF n'a pas cette limite stricte, mais pour les grosses sessions il reste plus sûr de lier le média plutôt que de l'intégrer.
Comment exporter un AAF pour Pro Tools ?
Depuis DaVinci Resolve (ou un autre logiciel de montage), on exporte un AAF avec des handles de plusieurs secondes, la stéréo séparée en mono, à 48 kHz, en choisissant média embarqué ou lié, puis on l'envoie avec une image de référence et un 2-pop.
Combien de handles faut-il sur un AAF ?
Pas une image ou deux. Prévoyez plusieurs secondes de handle sur chaque plan : beaucoup de mixeurs demandent de quelques secondes jusqu'à environ six, mais la longueur exacte se fixe au cas par cas avec le mixeur, pour qu'il puisse rallonger les raccords et ajouter des fondus.
C'est quoi un 2-pop ?
Une seule image de tonalité à 1 kHz placée exactement deux secondes avant la première image du programme, avec un pop de fin après la dernière image. Son niveau suit la référence d'alignement de la livraison (couramment -20 dBFS en SMPTE/US, -18 dBFS en EBU/Europe). C'est une référence de synchro que le mixeur utilise pour contrôler toute la session.
Quelle fréquence d'échantillonnage pour l'audio vidéo ?
48 kHz, pas les 44,1 kHz du CD et de l'audio grand public, et en général 24 bits au format Broadcast Wave (BWF). Une mauvaise fréquence se lit à la mauvaise vitesse et à la mauvaise hauteur.
Que faut-il envoyer à l'ingénieur du son ?
Un AAF avec handles et séparation en mono, une image de référence QuickTime avec timecode et 2-pop correspondants, l'audio de production si le média est lié, et un fichier de notes indiquant la fréquence d'image, la fréquence d'échantillonnage et la longueur des handles.