Livre audio

Normes ACX : préparer et masteriser un livre audio pour Audible

Les valeurs exactes de RMS, pic et bruit de fond, la structure de fichiers attendue par ACX, et une méthode de mastering qui fait passer le contrôle technique automatique dès le premier téléversement.

Par Hanna Eng·Ingénieure du son, diplômée de l'Abbey Road Institute Paris

Mis à jour le 1 juin 202610 min de lecture

Pour passer ACX, soumettez un MP3 mono (ou stéréo) à 192 kbps CBR (minimum) et 44,1 kHz, avec un RMS entre -23 dB et -18 dB, un pic ne dépassant pas -3 dB, et un bruit de fond sous -60 dB. Chaque section est un fichier distinct de moins de 120 minutes, avec 0,5 à 1 seconde de room tone en tête et 1 à 5 secondes en fin.

ACX rejette les livres audio avant qu'un humain ne les écoute. Un contrôle automatique mesure votre loudness, vos pics, votre bruit de fond, le format et la structure des fichiers, et une seule valeur hors plage fait échouer tout le téléversement. Ce guide donne chaque exigence avec sa valeur exacte, puis montre comment masteriser proprement pour éviter les rejets techniques les plus courants. Passer ce contrôle automatique reste nécessaire mais pas suffisant : une revue qualité humaine examine ensuite la performance et peut elle aussi refuser un titre.

Spécifications audio ACX en un coup d'œil

SpécificationValeur exigée
RMS (niveau moyen)-23 dB à -18 dB
Pic-3 dB maximum
Bruit de fond-60 dB RMS ou plus bas
FormatMP3, débit constant (CBR)
Débit192 kbps CBR (minimum)
Fréquence d'échantillonnage44,1 kHz
CanauxMono recommandé, stéréo accepté
Durée de fichierMoins de 120 minutes chacun
Room tone0,5-1 s en tête, 1-5 s en fin
Narration IA / synthétiqueInterdite (narration humaine exigée)
Caractères de nom de fichierLettres, chiffres, tirets et underscores uniquement

Source : ACX, Audio Submission Requirements (officiel) ; ACX, Mastering Audiobooks with Alex the Audio Scientist (officiel)

Qu'est-ce que la norme ACX ?

ACX (Audiobook Creation Exchange) est la plateforme d'Amazon qui produit et distribue les livres audio sur Audible, Amazon et Apple Books. Chaque fichier téléversé passe un contrôle technique automatique portant sur le volume, les pics, le bruit de fond, le format et la structure. Tout fichier hors normes est rejeté avant même la revue humaine : respecter les chiffres est la première étape.

Les spécifications techniques ACX en un coup d'œil

Un fichier conforme est un MP3 mono (ou stéréo) à 192 kbps CBR (minimum) et 44,1 kHz, avec un RMS entre -23 dB et -18 dB, un pic ne dépassant pas -3 dB, et un bruit de fond sous -60 dB. Le mono est recommandé pour la voix seule, mais le stéréo est accepté. Il commence par 0,5 à 1 seconde de room tone et se termine par 1 à 5 secondes.

  • RMS (niveau moyen) : entre -23 dB et -18 dB.
  • Pic : maximum -3 dB.
  • Bruit de fond : -60 dB RMS ou plus bas.
  • Format : MP3, débit constant (CBR).
  • Débit : 192 kbps ou supérieur.
  • Fréquence d'échantillonnage : 44,1 kHz.
  • Canaux : mono recommandé, stéréo accepté, mais tout le livre doit être homogène (jamais de mélange mono/stéréo).
  • Chaque fichier sous 120 minutes.

RMS, pic et bruit de fond : que mesurent-ils ?

Le RMS est le niveau moyen de votre narration dans le temps, le meter le plus proche du volume perçu. Le pic est l'échantillon le plus fort. Le bruit de fond est le niveau de la partie la plus silencieuse, votre room tone, là où personne ne parle.

Nuance utile : ACX exprime tout en dBFS, et le RMS dont parle la spec est du dBFS RMS, pas du LUFS. Les livres audio sont antérieurs à la norme LUFS du streaming musical, d'où une échelle différente. En pratique, on vise environ -20 dBFS RMS, confortablement dans la fenêtre -23 / -18.

Structurer et nommer vos fichiers

ACX exige un fichier par section : crédits d'ouverture, chaque chapitre, crédits de fin. On ne peut pas téléverser le livre entier en un seul fichier, et chaque fichier doit durer moins de 120 minutes. Numérotez les noms de fichiers (001, 002, etc.) pour fixer l'ordre de lecture sans ambiguïté.

  • Crédits d'ouverture (fichier séparé) : titre, auteur et narrateur, dits à voix haute.
  • Crédits de fin (fichier séparé) : la phrase de clôture (par exemple « Fin »).
  • Room tone : 0,5 à 1 seconde en tête, 1 à 5 secondes en fin de chaque fichier.
  • Extrait de vente : 1 à 5 minutes, commençant par la narration (ni crédits ni musique), sans contenu explicite.
  • Couverture : carrée, 2400 x 2400 px minimum.

Masteriser aux normes ACX, étape par étape

La chaîne recommandée par ACX est simple : nettoyer les fréquences inutiles à l'EQ, maîtriser les pics avec un limiteur pour créer de la marge, puis remonter le gain global jusqu'à entrer dans la fenêtre -23 / -18 dB RMS. La cible pratique est d'environ -20 dB RMS, un pic réel sous -3 dB, et un bruit de fond sous -60 dB.

Réglez la loudness en dernier. L'erreur la plus courante est de normaliser un enregistrement bruité, ce qui ne fait qu'amplifier les défauts. Nettoyez d'abord, nivelez ensuite.

  • Réduisez le bruit de fond sous -60 dB par passes douces (iZotope RX, 6 à 8 dB à la fois plutôt qu'une passe agressive).
  • Atteignez la fenêtre RMS sans écraser la dynamique naturelle de la voix.
  • Mesurez le bruit de fond en sélectionnant 3 à 5 secondes de silence et en lisant son RMS, puis vérifiez le RMS global et le pic.

Outils pour mesurer et corriger

Une station professionnelle comme Pro Tools gère l'enregistrement et le montage. Le workflow fiable est d'exporter d'abord un master WAV 24 bits, puis d'encoder le MP3 avec le CBR explicitement réglé sur 192 kbps et 44,1 kHz (depuis la station ou un encodeur dédié) plutôt que de se fier à un export MP3 par défaut, qui ne garantit pas toujours le CBR exigé ; remesurez ensuite le MP3 final. iZotope RX profile et réduit le bruit de la pièce et lit les statistiques du fichier (bruit de fond, RMS, pic). Audacity avec le plug-in gratuit ACX Check reste une option d'entrée de gamme pour vérifier les trois chiffres avant le téléversement.

Les erreurs qui font rejeter un livre audio

La plupart des rejets ACX se résument à quelques défauts mesurables. Les corriger est mécanique une fois qu'on sait ce que le contrôle cherche.

  • RMS hors de la fenêtre -23 / -18 dB (monter ou baisser le gain global).
  • Pic au-dessus de -3 dB (appliquer un limiteur à plafond -3 dB).
  • Bruit de fond au-dessus de -60 dB (débruiter le room tone dans RX).
  • Room tone manquant ou excessif (ramener à 0,5-1 s en tête, 1-5 s en fin).
  • Mauvais débit ou mauvaise fréquence (exporter en 192 kbps CBR, 44,1 kHz).
  • Artefacts audibles laissés dans la piste (clics de bouche, respirations, souffle).

Soumettre votre livre audio sur ACX

Avant tout téléversement, vous devez lier la version imprimée ou Kindle de votre livre sur Amazon. Vous créez ensuite un projet ACX, téléversez chaque fichier de section, ajoutez la couverture carrée (2400 px minimum) et l'extrait de vente. Le délai d'examen varie et ACX ne publie pas de calendrier fixe ; prévoyez de la marge avant toute date de sortie.

Les paliers de redevances ACX : exclusif vs non exclusif

Les redevances sont une condition de la plateforme, distincte des specs audio, mais les créateurs qui préparent un titre posent sans cesse la question. ACX verse historiquement un taux plus élevé en distribution exclusive (vente via Audible, Amazon et Apple Books uniquement) qu'en non exclusive, où vous pouvez aussi vendre le titre ailleurs. Les conditions de la plateforme évoluent, donc considérez les chiffres ci-dessous comme la base établie et confirmez le taux lié à votre titre dans le tableau de bord ACX.

Les chiffres ci-dessous sont les pourcentages neutres de la plateforme, pas une recommandation. Le bon palier dépend de vos propres choix de distribution, et le taux exact lié à un titre s'affiche dans le tableau de bord ACX.

DistributionRedevance
Exclusive (Audible/Amazon/Apple Books uniquement)40 %
Non exclusive (vente ailleurs aussi)25 %

Source : options de redevances ACX (acx.com) ; confirmez le taux actuel dans votre tableau de bord ACX

Questions fréquentes

Quelles sont les normes ACX pour un livre audio ?

Un MP3 mono (ou stéréo) à 192 kbps CBR (minimum) et 44,1 kHz, avec un RMS entre -23 et -18 dB, un pic ne dépassant pas -3 dB, et un bruit de fond sous -60 dB. Le mono est recommandé pour la voix seule, le stéréo est accepté. Chaque section est un fichier distinct de moins de 120 minutes, avec 0,5 à 1 seconde de room tone en tête et 1 à 5 secondes en fin.

Quel niveau RMS pour ACX ?

Entre -23 dB et -18 dB RMS, mesuré en dBFS. Viser environ -20 dB RMS vous laisse dans la fenêtre avec de la marge des deux côtés.

C'est quoi le bruit de fond à -60 dB et comment le mesurer ?

Le bruit de fond est le niveau de votre room tone silencieux, et ACX exige -60 dB RMS ou plus bas. Mesurez-le en sélectionnant 3 à 5 secondes où personne ne parle et en lisant le RMS de cette sélection.

Faut-il du mono ou du stéréo pour Audible ?

Le mono est recommandé pour les livres audio en voix seule, mais le stéréo est accepté. La règle clé est l'homogénéité : tout le livre doit être en mono ou en stéréo, jamais un mélange des deux.

Pourquoi mon livre audio a-t-il été refusé par Audible ?

En général, une valeur mesurable est hors plage : RMS hors de -23 / -18 dB, pic au-dessus de -3 dB, bruit de fond au-dessus de -60 dB, room tone manquant ou excessif, mauvais débit ou fréquence, ou bruit audible laissé dans la piste.

ACX exige-t-il du 16 bits ou du 24 bits ?

ACX n'indique aucune profondeur de bits dans ses exigences de soumission. Le fichier soumis est un MP3 à 192 kbps CBR et 44,1 kHz, et le MP3 est un format compressé où la profondeur de bits n'est pas spécifiée. La profondeur de bits ne compte qu'à l'enregistrement : capturez votre master WAV en 24 bits pour la marge de montage, puis exportez en MP3 192 kbps. Aucune page d'ACX n'impose un minimum de 16 bits sur le fichier livré.

Le pic à -3 dB est-il un plafond strict, et comment rester en dessous après l'export MP3 ?

Oui. ACX veut des pics sous -3 dB pour éviter la distorsion : traitez -3 dB comme un plafond à ne pas atteindre, pas comme une cible. Le contrôle ACX mesure le pic d'échantillon (dBFS), pas le true peak inter-échantillons. Placez un limiteur à plafond -3 dB avant l'encodage et gardez un peu de marge (visez un pic d'échantillon autour de -3,5 à -4 dB avant l'encodage), car l'encodage MP3 peut faire légèrement remonter le niveau de pic. Remesurez toujours le pic sur le MP3 final, pas seulement sur le WAV, avant de téléverser.

Quelle redevance verse ACX, distribution exclusive ou non exclusive ?

ACX verse historiquement 40 % en distribution exclusive et 25 % en distribution non exclusive. Ce sont des conditions neutres de la plateforme, pas un conseil sur le choix à faire, et les taux peuvent évoluer ; vérifiez le taux lié à votre titre dans votre tableau de bord ACX.

Puis-je utiliser une voix IA pour narrer un livre audio sur ACX ?

Non. ACX exige une narration humaine et n'accepte pas la synthèse vocale, l'IA ni les autres enregistrements automatisés pour les soumissions classiques. La seule exception est une bêta limitée, réservée aux États-Unis, où des narrateurs invités peuvent créer une réplique IA de leur propre voix ; ces titres sont signalés dans le champ narrateur et le narrateur en contrôle l'usage titre par titre. En dehors de cette bêta, un fichier narré par IA est rejeté.

Puis-je utiliser des accents ou des caractères spéciaux dans mes noms de fichiers ACX ?

Non. ACX recommande de s'en tenir aux caractères alphanumériques, aux tirets et aux underscores dans les noms de fichiers ; d'autres caractères peuvent causer des problèmes de téléversement. Évitez les lettres accentuées (é, à, ç), les espaces, les barres obliques et les symboles. Numérotez chaque section en premier pour fixer l'ordre sans ambiguïté, par exemple 00_Credits-Ouverture, 01_Chapitre-01, 02_Chapitre-02.

Sources et références

Un projet qui a besoin d'être fait dans les règles ?

Si votre mix doit passer la spec d'une plateforme, parlons des livrables et du planning.

Démarrer un projet