Une pinte de compression

Publié le 2 février 2018 par Gee dans Tu sais quoi ?
Inclus dans le livre Grise Bouille, Tome III

Vous aviez aimé la dernière tournée sur la compression ? Eh bien, garçon, tu nous mettras la petite sœur (enfin, la grande, plutôt…).

Une pinte de compression

Reprenons donc une petite tournée de compression…

La Geekette, blasée : « Donc toi, ton boulot, en BD, c'est d'ajouter un “con” à la “pinte de pression” ? » Le Geek, à côté de Gee, lève un sourcil : « C'est moi qu'elle traite de con, là ? »

La compression dont nous avons parlé jusqu'à présent consistait à représenter les mêmes données de manières plus ou moins économes en octets : on appelle ça de la compression non-destructive (ou sans perte).

En effet, il serait assez gênant que le contenu d'un texte (par exemple) change après compression/décompression.

Gee regarde le Code du Travail transformé en rouleau de PQ et commente : « Dans ce cas-là, on ne parle plus simplement de compression mais de “macronisation”. » Le smiley remarque : « Gee, on avait dit quoi sur les saillies politiques dans les articles de vulgarisation ?  PAS BIEN ! »

Par contre, il existe une certaine catégorie de fichiers pour lesquels on peut se permettre de modifier (légèrement) le contenu pour permettre une compression plus efficace (et donc destructive) : les fichiers qui contiennent des informations perceptuelles, dont l'interprétation dépend directement du fonctionnement des sens (ouïe, vue) de l'humain.

Deux images côte à côte. À gauche, des programmes, des textes, des tableaux de comptabilité : de l'information brute. Un octet de différent – une lettre d'un texte, un chiffre d'un tableur – rend l'information fausse. La compression destructive est donc inacceptable. À droite, des images, des sons, des vidéos : de l'information perceptuelle. Quelques octets de différents (pixels d'une image, microseconde de son plus ou moins forte) ne modifient pas nécessairement l'information perçue par l'humain. La compression destructive est donc possible.

Par exemple, le format Jpeg (l'un des formats de compression destructive les plus utilisés pour stocker des photos), exploite le fait que nos yeux sont plus sensibles aux basses fréquences (les formes générales d'une image) qu'aux hautes fréquences (les textures, le « bruit »).

Le Geek dit : « Et du coup, on peut se permettre d'encoder les hautes fréquences avec moins de précision que les basses… » Le même Geek, mais compressé au format Jpeg (on voit des pixels flous autour des contours) : « Le fichier devient plus léger ! Je suis un peu déformé mais on me reconnaît toujours ! » Une flèche indique : « Un passage net du noir pur au blanc pur est une très haute fréquence, mal encodée par le Jpeg. » Le smiley dit : « Enfin t'es quand même vachement moche, là.  Le Jpeg peut faire beaucoup mieux… et est surtout plus adapté aux photos qu'aux dessins nets comme ça ! »

Les formats audio comme le MP3 ou le OGG utilisent le même genre de principe : l'être humain étant bien plus sensible aux variations de fréquences dans les graves que dans les aigus, il est bien plus intelligent de stocker les fréquences graves avec plus de précision que les fréquences aiguës…

Gee, à côté d'un graphique de fréquences, dit : « On perçoit les fréquences audio logarithmiquement. » On voit qu'à 55 Hz, on a un « LA » grave, et à 58 hz (3 hertz plus haut), un « LA dièse ». À 440 Hz, on a un « LA » aigu, et le « LA dièse » suivant est à 466 Hz, soit 26 hertz plus haut ! (À 443 Hz, on a un « LA » un peu faux.) Le smiley commente : « D'où le logarithm'n'blues. »

C'est ce qui a permis le développement fulgurant de la musique en ligne, avec des fichiers nettement plus légers et donc plus facilement partageables que leurs équivalents en compression sans perte (comme le format FLAC).

Avec un débit binaire suffisant (supérieur à 256 kbps), les pertes des formats destructifs comme le MP3 sont quasi-indétectables par la grande majorité des oreilles.

La remarque de Gee provoque un énorme scandale, des gens hurlent à la mort dans tous les sens : « QUOI ?! » « N'IMPORTE QUOI ! » « PAS POSSIBLE D'ENTENDRE ÇA ! » « C'EST SCANDALEUX ! » « QUAND ON A DE BONNES OREILLES… » « ET DU BON MATOS ! » « BOOOUUUUUH !!! » « LE MP3 C'EST CACA ! » « LE NUUUL !!! » « ÇA N'A RIEN À VOIR ! » En dessous, il est écrit en rouge un gros : « STOOOOOOOOOOOOOOOOOOP ! »

Bon.

Le sujet délenche régulièrement des flamewars, alors plutôt que de vous répéter que personne n'a jamais réussi à me démontrer qu'il ou elle arrivait à différencier le CD du MP3 à 320 kbps

(l'expérience personnelle ayant une valeur scientifique proche de 0)

je vais plutôt vous parler d'un article de recherche…

Gee, représenté avec des lunettes, en train de lire sur son ordinateur : « Ça s'appelle “Subjective evaluation of mp3 compression for different musical genres” et ça a été mené par le “Centre for Interdisciplinary Research in Music Media and Technology” en 2009. » Le smiley, taquin : « Roh le fourbe. Il sort la bibliographie. »

Le protocole expérimental ? Treize individus « auditeurs qualifiés » (ingénieurs du son, musiciens), cinq morceaux de genres variés (pop, metal, classique…), un dispositif d'écoute de qualité et différents formats : CD et MP3 avec des débits de 96kbps à 320kbps. Des tests à l'aveugle.

Les résultats ?

Un graphique montre qu'à 96 kbps, les gens identifient le CD dans 75 % des cas, puis ce taux diminue à mesure que la qualité augmente : à partir de 256 kbps, on est dans une zone autour de 50 %. Gee explique : « Pour les débits de 256 kbps et 320 kbps, les participants ont préféré le format MP3 au format CD dans environ 50 % des cas (et vice versa, donc).  Pas mieux qu'un tirage aléatoire. »

Donc cette expérience tend à montrer que la différence de qualité entre CD et MP3 (supérieur à 256 kbps) n'est pas suffisante pour être détectée par une oreille humaine.

Gee enfonce le clou : « MÊME une oreille entraînée.  MÊME sur un dispositif audio de qualité. » Le smiley rigole : « Il est sans doute exceptionnel de trouver des gens qui peuvent faire la différence. Sauf sur Internet où 90 % des commentateurs en sont capables. »

Alors certes, cela reste un article scientifique isolé qui doit être soumis à critique : on pourrait par exemple pointer le faible nombre de participants.

(Au passage, si vous avez l'occasion et que vous lisez l'anglais, l'article est aussi vachement intéressant sur d'autres points, comme les différences de sensibilité selon les styles.)

Mais ça reste plus crédible que les déclarations enflammées que l'on voit souvent pour sauver les oreilles de l'immooOÔOonnde compression MP3…

Un type qui en fait des caisses, en agitant les bras, un air désespéré sur le visage : « Nan mais tu vôa, avec le format MPtrôa, le son est compressé-han…  maintenant, c'est la course au volume-han, tout doit être compressé pour que ça sonne plus fort-han… »

Ça, c'est un vrai argument que j'ai lu une fois dans un journal en ligne…

Et ce genre de connerie, ça me fait bouillir.

Pas seulement parce que c'est dégueulant de mauvaise foi, mais parce qu'en plus ça confond deux choses qui n'ont rien à voir entre elles (à part leur nom) : la compression de données (comme le MP3) et la compression audio (en sens de traitement du signal).

On voit un fichier binaire avec plein plein plein de zéros et de uns transformé en un plus petit fichier avec moins de zéros et de uns : la compression de données de CD vers MP3, qui réduit la taille des données et réduit un peu la qualité en perdant en précision dans les aigus.

On voit un signal audio avec des passages forts et des passages faibles transformé en un signal où tout devient fort ou légèrement moins fort : la compression audio, qui nivelle le son vers le haut, booste les parties à bas volume pour que tout soit à volume élevé.

Gee, un éclair au cholocat dans la main, précise : « Utiliser la nature de l'un pour critiquer l'autre, si vous voulez, c'est un peu comme si je disais… “Franchement, j'aime pas les éclairs au chocolat : mettre de l'électricité dans une pâtisserie, c'est abusé.” »

Le fait qu'il y ait, effectivement, dans la musique populaire, une course au volume souvent basée sur de la compression audio (notamment pour les diffusions radio) n'a absolument RIEN À VOIR avec les formats de type MP3.

D'ailleurs, la compression audio existait largement avant la démocratisation du numérique dans la musique…

1979. On voit Roger Waters et David Gilmour de Pink Floyd chanter : « We don't need noooo educaaaatiooon… » Le même mec qu'avant continue son cinéma : « Booouh ! C'est nul-han, cette guitare compressée ! Booouh MPtrôôaaa ! » Le smiley explique : Ouais, la guitare d'Another Brick in the Wall (part II) passe dans une pédale de compression. Audio donc. Ça peut être un effet recherché. »

En fait, je crois qu'utiliser du CD ou du FLAC pour la qualité de son, c'est un peu comme préférer lire un livre papier plutôt qu'un livre électronique…

Au fond, on sait bien que l'expérience physique et rationnelle ne change pas, mais il y a un plaisir irrationnel à trouver de la beauté dans un objet auquel on prête une complexité ou une perfection, même si elles sont parfois fantasmées…

Gee, assis dans son fauteuil, un café à la main et une pipe à la bouche, à côté d'une platine vinyle : « Et c'est un type qui écoute des vinyles en 2018 comme un gros hipster qui vous le dit… » Le Geek commence à dire : « Ah ? Mais pourtant la qualité des vinyles est moins bo… » La Geekette le coupe vite : « CHUT ! CHUT!  Ne réveille pas sa part d'irrationalité ! »

Bref, c'est un peu ça qui est intéressant quand la technique se mêle de l'art et de ce qui dépasse la simple information cartésienne : derrière toutes les théories et tous les chiffres qu'on pourra montrer, il restera un ressenti, un ensemble de croyances et de sensations qu'on calquera dessus.

Il y a des gens qui trouvent le FLAC ou le CD (ou le vinyle ou même le livre papier, soyons fous) indispensable à leur confort.

Moi, je trouve de la beauté dans les formats de compression comme le MP3, parce qu'il y a une intelligence folle convoquée là-dedans : une technologie qui s'adapte à nos sens.

Le smiley se moque : « Tssss, toute une BD juste parce que t'assumes pas d'avoir des oreilles de merde qui détectent même pas la compression MP3.  Hé loser, va. Pfff… » Gee, allongé dans une chaise longue, écoutant une radio mal réglée : « Qu'importe le format pourvu qu'on ait l'ivresse… » Note : BD sous licence CC BY SA (grisebouille.net), dessinée le 1er février 2018 par Gee.

Article cité :

Publié le 2 février 2018 par Gee dans Tu sais quoi ?

🛈 Si vous avez aimé cet article, vous pouvez le retrouver dans le livre Grise Bouille, Tome III.

Soutenir

Ce blog est publié sous licence libre, il est librement copiable, partageable, modifiable et réutilisable. Il est gratuit car financé principalement par vos dons. Sans inscription, vous pouvez très simplement me soutenir :

Pour l'année 2023-2024, 9 496 € ont pour l'instant été collectés sur un objectif annuel de 21 000 € (SMIC brut), soit 45 % de l'objectif :

Sources de revenu

L'année étant entamée à 63 %, il y a actuellement un retard de 3 734 € sur l'objectif.

Avancement de l'année

Vous pouvez également, si vous le souhaitez, passer par une plateforme de financement participatif :