Qu'est-ce qu'un échantillon - La compression - Les formats (comparatif MP3 - Ogg !)

Un brin de théorie audio ...

Qu'est-ce qu'un échantillon?

Dans ce paragraphe, le terme "échantillon" représente uniquement une valeur de sortie d'un convertisseur analogique-digital (A/D), et dans notre cas, il s'agit d'un nombre entier (8 ou 16 bit). L'image suivante montre une forme d'onde d'intensité et de fréquence variable:

Celle-ci montre la distribution des fréquences:

Les données audio sont caractérisées par un certain nombre de paramètres (qui correspondent aux réglages du convertisseur A/D lorsque les données ont été enregistrées). Naturellement, les mêmes paramètres doivent être utilisés lors de la restitution:

Les fréquences d'échantillonage sont souvent indiquées en Hz ou kHz ([kilo]-Herz), mais le terme à utiliser est échantillons par seconde (samples/sec). Elles sont toujours mesurées pour un canal, donc pour un enregistrement stéréo réalisé à 8'000 échantillons/sec, il y a effectivement 16'000 échantillons dans une seconde.

L'abbréviation bps ou kbps ([kilo]-bits/sec) dans le standard MPEG représente le nombre de bits par seconde, donc 1 kbps = 1000 bits par seconde. C'est le contraire de l'informatique ou l'on utilise plutôt les puissances de 2 (question marketing pour un vendeur de disques durs!)

En bref (et idem pour les mega, giga ou n'importe quoi "bits" ou "bytes"):

  1Kb = 1024 bits     1KB = 1024 bytes     (2^10=1024)
  1kb = 1000 bits     1kB = 1000 bytes

La Compression

La compression sert à diminuer la taille des données sans (trop) en altérer la qualité. Il existe une quantité d'algorithmes de compression audio tels que ITU-T G.711, u-law, A-law, CCITT G.721, G.723, MS-ADPCM, GSM 06-10, RealAudio, MPEG, Ogg, etc ...

Certains types de compression conservent la qualité des données (c'est à dire qu'il est possible de faire l'opération inverse et de retrouver exactement le contenu d'origine au bit près. C'est le cas du compresseur de fichiers ZIP) et d'autres suppriment une certaine quantité d'information qu'il n'est plus possible de retrouver. Les algorithmes qui suppriment des informations sont appellés "lossy" contrairement aux algorithmes "lossless".

Un petit exemple: prends une chanson de 4 minutes sur un CD. 4 minutes = 240 secondes. Avec une fréquence d'échantillonage de 44'100 kHz, il y a 240 x 44'100 = 10'584'000 échantillons par canal, donc 21'168'000 échantillons au total (stéréo). Comme chaque échantillon fait 16 bit, donc 2 bytes, on obtient une taille de 42'336'000 bytes. En divisant ce nombre par 1024² (pour obtenir des megabytes), on obtient 40.37 Mb (un gros fichier wav, donc).

Tu peux imaginer le temps qu'il te faudrait pour télécharger un album entier à ce rythme-là ... un CD entier "pèse" dans les 650 Mb!

En compressant ce fichier Wav en MP3, admettons une qualité de 128 kbps, on obtient un fichier d'environ 4 Mb soit 10 fois moins que l'original, tout en ayant une qualité "potable". Ca sera tout de même bien meilleur que la qualité d'une radio FM. mp3PRO fait encore mieux, puisqu'il diminue la taille du fichier encore de moitié.

Les formats

Il existe une quantité de formats audio. Certains sont commerciaux et d'autre sont totalement libres de droits. Ceux qui nous intéressent en particulier sont MPEG (Motion Picture Experts Group) et Ogg Vorbis.

MPEG

MPEG est décliné actuellement en 3 layers, dont le troisième est le plus populaire:

La quatrième déclinaison est mp3PRO, qui est une évolution du format MP3. Il permet d'avoir une excellente qualité de son avec des fichiers 2x plus légers, pour autant que le programme qui les joue supporte ce nouveau format. Avec un ancien player, le son sera "étouffé", horrible et inécoutable.

Malheureusement, le format MP3 est commercial. On ne peut pas l'utiliser comme on veut et il y a des royalties à payer.

Ogg Vorbis

Ogg Vorbis est un nouveau format de compression audio comparable au MP3, VQF, AAC, à la grande différence de ceux-ci qu'il est complètement libre et gratuit, ouvert et modifiable (Lire la suite de la FAQ).

Pour écouter des fichiers Ogg Vorbis avec Winamp, il suffit de télécharger le plug-in en question.

Pour te prouver que ce format est vraiment bien, voici la démonstration. Il y a deux fichiers, qui ont été encodés avec le même fichier source. A tes oreilles de juger ...

Chanson: Candy, by Lisa Standfield (30 sec)
LAME 3.90 Alpha 6 MMX
Débit: 80 kbps CBR
Taille: 300'240 bytes
Ogg encoder 1.0rc2
Débit: 80 kbps
Taille: 293'896 bytes

Bien sûr, ce test n'est pas représentatif ... beaucoup de choses changent dans la qualité du fichier compressé en fonction du style musical, mais dans ce cas, on peut aperçevoir une perte flagrante dans les aïgus avec le fichier MP3.

Pour les puristes, le fichier source a été extrait avec CDex 1.40b8 en mode "full paranoia" sur un HP 9210i SCSI et le fade-out avec SoundForge 5.0b.

Note1: Une partie des informations contenues sur cette page ont été tirées de la "Audio File Format FAQ".
Note2: Les copies d'écran ont été réalisées depuis SonicFoundry SoundForge 5.0.


master@wilou.ch - 05.08.2004