Pourquoi plusieurs formats audio et vidéo ?
En dehors de l’histoire de l’informatique et de la haute-fidélité, du cinéma et de la télévision, de nombreux éditeurs de logiciels ont créé leurs formats propriétaires. Les différents formats répondent à des besoins différents, soit la qualité la meilleure possible, soit la place la plus réduite possible. Pour transporter facilement et copier rapidement le fichier. Il existe donc plusieurs dizaines de formats audio et vidéo.
Les extensions de fichiers
Le format s’exprime par un point après le nom du fichier et quelques lettres ou chiffres appelé extension de fichier.
2 exemples
- Le format des disques Compact audio est le format .WAV.
- Le format .MP3 réduit la taille des fichiers en diminuant la dynamique. C’est-à-dire les écarts entre un son faible et fort ainsi que les extrémités du spectre audio.
La perception du son
Jusqu’à 20 ans si vous n’avez pas abusé des casques et concerts, la capacité à percevoir les fréquences est maximale. Soit environ de 20Hz à 20 000 Hz. 1 Hertz s’écrit Hz, = une oscillation par seconde.
Plus le son est aigu, plus il est directif dans l’espace comme un faisceau laser. C’est pourquoi il est conseillé d’avoir les tweeters à hauteur des oreilles, mais les aigus sont vite stoppés par les obstacles.
Plus le son est grave, plus il rayonne dans toutes les directions et traverse une bonne partie des obstacles tels que murs et plafonds.
Un orgue d’église peut descendre à 16Hz. Le do grave d’un piano à queue 26,7Hz, les basses électriques sont entre 40 et 50Hz. Les fréquences inférieures sont des vibrations que nous pouvons capter. Les fréquences supérieures, si elles ne sont pas audibles directement, peuvent influer sur les fréquences audibles par le jeu des harmoniques. Ces harmoniques sont des multiples ou sous-multiples des fréquences fondamentales. Elles caractérisent le timbre d’un voix ou d’un instrument ou d’un micro.
Les formats de livres audio
Le format DAISY Digital Accessible Information System depuis 1994
Ce format est devenu libre en 1997.
Il y a trois types de livres audio Daisy :
- livre audio avec des fichiers audio et un fichier de contrôle de la navigation. Il permet à l’utilisateur de naviguer aisément dans le document avec titres ou chapitres ; c’est ce type de livre audio que l’on trouve actuellement dans la principale médiathèque française pour personnes déficientes visuelles
- livre audio avec des fichiers audio. Un fichier structuré contenant le texte numérique complet, un fichier de synchronisation reliant des points dans les fichiers audio à des points dans le texte numérique et le fichier de contrôle de la navigation. Ce type de livre audio offre de multiples possibilités multimédia, mais il est plus compliqué et plus coûteux à produire
- livre sans fichier audio, avec le fichier structuré contenant le texte numérique complet et le fichier de contrôle de la navigation. La restitution du livre se fait soit par synthèse vocale, soit à l’aide d’une plage tactile braille.
La lecture logicielle par synthèse vocale de documents électroniques en 27 langues est désormais possible en utilisant le logiciel libre OpenOffice.org (version > 3.0) et une extension pour OpenOffice.org 3[3].
Un CD audio au format Daisy contient 40 heures d’enregistrement.
Le lecteur DAISY version 3.0 fourni avec JAWS 2020 permet la navigation par chapitre si le fichier le permet.
Avantages des livres audio Daisy par rapport au CD
- Navigation structurée dans le livre (par partie, par chapitre, par section, par phrase, etc) ;
- Possibilité de faire varier la vitesse de lecture sans distorsion de la voix ;
- pose de signets permettant de revenir à un endroit déterminé ;
- Mémorisation de la dernière position de lecture ;
- Informations sur le temps écoulé, le temps restant, le titre de l’ouvrage et celui du chapitre courant, etc. ;
- Abonnements gratuits pour personnes handicapées visuelles aux bibliothèques sonores en ligne, éole de l’AVH association Valentin Hauy http://eole.avh.asso.fr/ et de la BNFA Bibliothèque numérique Francophone accessible http://www.bnfa.fr/.
Le format .epub (2007) : Electronic Publication
C’est en fait un format texte amélioré, lisible par une synthèse vocale et plage Braille, dédié aux livres. La version 3.1 du 5 janvier 2017 est basée sur le HTML5.
- Un contenu dynamique et accessible ;
- Synthèse vocale et synchronisation du texte et de l’audio ;
- Balisage qui structure le texte et facilite la navigation ;
- Repérage facilité de contenus précis dans le document, y compris dans les fichiers audio et vidéo ;
- Table des matières navigable ;
- Possibilité de modifier la taille, le style et la couleur de la police. De même que la couleur du fond. Très utile pour les daltoniens et les gens atteints de dégénérescence maculaire ;
- Affichage du sous-titrage inclus dans les fichiers vidéo et audio ;
- Description textuelle des images.
Les formats audio les plus fréquents
.MP3 appelé MPEG 1 et 2 layer 3 (depuis 1992)
Évolution du format stoppée récemment, c’est un format compressé. Il existe en différentes qualités de 56Khz, suffisant pour écouter un texte dicté. 128kilo bits par seconde est correct pour de la musique électrique ou 320KBPS, le maximum de qualité en MP3. Il existe en qualité moyenne avec un débit variable VBR = variable bit rating. La qualité du flux varie en temps réel selon les variations du fichier audio.
.WMA Windows Media Audio (depuis 1999)
Format compressé utilisé par les logiciels Microsoft sous Windows avec une qualité variable, dans certains cas inférieure ou supérieure au MP3. Sur 8 ou 16 bits, échantillonné de 8Hz à 48KHz, mono ou stéréo avec un flux de données de 5 à 192KHz. A qualité à peu près égale au MP3 128KPPS, le fichier WMA à 96KHz tient 25% de place de moins que le MP3.
.OGG Vorbis (depuis 1993)
Format moins courant. C’est un format audio compressé qui vient de l’environnement libre Linux. Format un peu supérieur au MP3 et WMA adapté au streaming et sons surround 8hz à 48KHz 16 à 24 bits, avec un flux de données audio de 16 à 512KBPS, souvent autour entre 128 et 320KBPS. Il existe en qualité moyenne avec un débit variable VBR = variable bit rating. La qualité du flux varie en temps réel selon les variations du fichier audio.
.AAC Advanced Audio coding (depuis 1997)
Format compressé permet une meilleure qualité que le MP3. Une version améliorée HE-AAC ou eAAC+ (MPEG 4) est utilisé pour la radio diffusion numérique DAB (Digital Audio Broadcasting).
.M4a (audio) et .MP4 (audio ou video)
Formats compressés. Ils sont utilisés pour les produits APPLE et sont de très bonne qualité.
.WAV
Il s’agit d’un format non compressé de très bonne qualité. Par défaut, enregistrement haute qualité sur dictaphone. Pour un CD audio (700Mo), ce sont des paquets de 16 bits extraits ou lus 44100 fois par seconde = 44,1KHz avec un flux de 1411KBPS= Kilo bits par seconde. Ce qui est bien supérieur au MP3 qui plafonne à 320KBPS.
Autres appellations
Il existe aussi des appellations de qualité qui portent sur le soin apporté à l’enregistrement, la copie ou au support utilisé. SBM ( Super Bit Mapping), HDCD (high Definition), SHM (Super High Material) et XRCD. Il existe des formats audio de qualité supérieur et multicanaux tel que pour le SACD, le DVD-A des DVD Audio ou les Blu-Ray Audio extensions .bdmv et video.m2ts, avec des dossiers spécifiques sur 20 ou 24 bits au lieu des 16 bits du CD et 96Khz ou 192KHZ au lieu des 44,1KHZ du CD.
Les formats haute qualité DSD64 ou DSD128 pouvant être inclus dans un fichier conteneur en extension. FLAC lisible avec le lecteur VLC ou encore les Super Audio CD de SONY, lisible avec des lecteurs physiques compatibles. Le SACD physique peut être compatible CD car avec 2 couches de données gravées et des formats PRO de studio. L’échantillonnage peut être sur d’autres valeurs de 1, 20 ou 24, voir 32 bits et à une fréquence de 44,1KHz, 48KHz 96KHz, 192KHz, 256KHz, 352,8Khz jusqu’à 384KHz. Le DXD Digital Extrem Definition sert en studio pour le mastering ou mixage avec 24 bits à 352,8KHz. Le PCM ou Pulse Code modulation indique juste une conversion d’un flux analogique en flux numérique.
Dolby surround 1982 puis AC3
Audio Coding 3 depuis 1987, désuet. Ancien format numérique des laboratoires Dolby pour encoder une piste stéréo et une piste surround avec canal de grave subwoofer pour les effets sonores d’un film sur DVD ou laserdisc. Le format AC3 peut inclure jusqu’à 6 canaux sonores. Les 5 canaux dont on se sert le plus communément sont destinés aux enceintes stéréo plus un canal dédié aux basses fréquences (de 20 à 120Hz) pour le caisson des graves, dit subwoofer. Il s’agit respectivement de l’avant gauche, de l’avant droit, du centre, de l’arrière gauche et de l’arrière droit, dit 5.1. Ce qui est la configuration de son audio surround (ou ambiophonique) dans les salles de cinéma et les systèmes de « home cinéma ».
De nouveaux format DOLBY et DTS multicanaux
Ils sont devenus la norme pour le cinéma, le home cinéma, la télévision, les DVD et Blu-ray : Dolby Pro Logic, Dolby Digital5.1, Dolby Digital EX ou plus, Dolby Trus HD (14 canaux non compressés en 24bit 96KHz), Dolby Atmos ( jusqu’à 64 canaux 24bit 96KHz), et le DTS, le DTS-HD, DTS-NEO et le DTS-HD Master Audio 7.1 canaux et DTS X ( 32 canaux 24bit 96KHz).
Les formats vidéo les plus fréquents
En vidéo, on parle de norme MEPG, de conteneurs MKV, de formats MP4 et de codec H264.
La norme est un standard défini et choisi. Le conteneur est un format pouvant inclure différents fichiers dont des formats vidéo et audio. Le format est l’extension et le type de fichier. Le codec est le type d’encodage ou codeur-décodeur utilisé pour transformer un fichier natif dans un autre format.
.AVI Audio Video Interleave ( imbrication audio vidéo) depuis 1992
Format ancien. AVI de Microsoft était limité à 2 Giga Octets pour la diffusion des vidéo par Internet ou MPEG-2 conteneur avec flux vidéo MPEG-2 et audio MP3 ou AAC. Dans un fichier AVI, différents codecs peuvent être encapsulés, pour la vidéo : DivX, Xvid, DV, Mpeg2/4, etc., pour l’audio : AC3, mp3, PCM, etc.
.DiVX 1999 compression avec faible perte
Un peu moins utilisé actuellement, permet de compresser un film DVD de 4Go en réduisant sa qualité et ou taille à un CD de 700Mo. Il continue à évoluer et sa version MPEG-4 H264 gère la haute définition et la norme Ultra haute définition UHD, proche de la 4K.
.AVCHD format des caméras Haute definition.
.VOB : format vidéo des fichiers sur un DVD
MPEG-4 AVC/H264
C’est la norme de conteneur actuel pour gérer des flux vidéo de haute qualité.
.MP4
Il est utilisé par Apple et Youtube et certains smartphones évolués. C’est la norme actuelle la plus courante avec une bonne image nette et un son correct.
.M2TS
Pour les Blu-ray, c’est le format actuel le plus courant avec une très bonne qualité audio et vidéo.
.TS de MPEG-TS
Il est utilisé pour stocker sur clé USB ou disque dur ou Bluray des flux vidéo, de la TV enregistrée avec certaines TV si elle a la fonction enregistrement sur support externe.
.MKV
Conteneur audio et vidéo servant à sauvegarder des DVD et Bluray. Un film pouvant faire plusieurs giga-octets et au besoin être compressé pour réduire sa taille.
.3gp
C’est un format vidéo dédié aux smartphones.
En dehors des formats natifs, il existe des formats de conteneurs qui peuvent contenir, un peu comme une boîte vide les formats natifs, FLAC en audio peut contenir plusieurs qualités audio de la qualité MP3 à supérieur au CD audio et MPEG-2 ou MPEG-4 ou MKV sont des formats en vidéo.
Par exemple MPEG-2 contient un flux vidéo MPEG-2 et de l’audio en MP3 ou en AAC.
Conclusion
Cette revue des formats est loin d’être exhaustive mais donne des bases utiles pour mieux comprendre ces acronymes, conteneurs, formats et codecs audio et vidéo.