楽曲配信とハイレゾ音源の関係

従来の圧縮音声

ハイレゾな音源ソースを入手するには、従来のようにCDを買ってきただけではダメな時代になってしまったが、ハイレゾ音声が音が良く、CDは音が悪いのかという疑問。確かに、従来の主流であったMP3やATRAC3などは、容量的な制約から、MP3であれば、44.1kHz / 16ビットを192kbpsまで圧縮して、本来のCDの容量である650MB~700MBを1/10程度の50MBまで圧縮して音楽プレーヤーなどに保存して音楽を鑑賞するというスタイルとなっていた。
これを一般的に、非可逆圧縮という。非可逆なので、もとの音声に戻せない方式である。ただ人間の耳はよくできていて、抜けた音をデジタル的にゆらぎ復元を行うと、まるで圧縮してない音声のように聞こえると言うわけなのだ。

現代の圧縮音声

現在の圧縮音声技術は、非可逆のものを除けば、可逆圧縮となっていて、データが入っていない部分の空白部を詰めて、ムダな容量(本当はムダではない)を圧縮する技術である。これらの圧縮技術は、可逆圧縮といい主には、FLACなどがそれにあたる。WAVフォーマットの圧縮バージョンである。
細かいことは気にしないのであれば、圧縮率は1種類で良いと思うが、可逆圧縮であるはずが、圧縮率を変化させることが可能である。細かく言えば、似たような連続する音声ビットを同じとみなして圧縮率を上げている。生音源の大半はノイズなので、ノイズはまずいらないものとして処理される。

非圧縮音声

非圧縮音声と言えど、アナログではないので、一定の周波数と一定の音圧解像度によってデジタルサンプリングされた音声のことを非圧縮音声と呼ぶ。
例えば、CDであるなら、44.1kHz 16bitのデジタル音声となっているので、16ビットの数量分2の16乗=65536段階の音圧レベルで表現した音声(量子化)になる。
0db ~ -96dbを表現しているので、便宜的に1ビットあたり6dbとしている。つまり、運が悪いと、-15db と -10dbは同じ音圧になっている場合があり得るわけだ。

DVDなんかでは、サンプリング周波数48kHz 量子化ビットが、24ビットになるのでダイナミックレンジは、24 x 6db = 144dbとなる。
分解能に換算すると、96db / 24 = 4dbということになる。

ハイレゾ音声

どこから、ハイレゾなのかと言うのは、明確な定義がないが、少なくとも、48kHz / 24bit以上のものをハイレゾとするのが一般的である。音声記録方式は、WAV形式をはじめDSFなどがある。FLAC形式で入手するのが一般的である。DSFの中には、11.2MHz/1bitというものまで登場していて、これを例えば1Hz~22kHzで収録する場合には、
11.2MHz / 2 / 22kHzとなるので、254.5bitの量子化に相当するので、96db / 254.5 = 0.38db分解能となり、よりアナログ音声に近づき、たぶん録音機の性能以上の分解能となるのではないだろうか。

ハイレゾ音声を再生するのは

11.2MHz/1bitの音声の例のように、これを再生するには、少なくとも、11.2MHz / 32bit = 350kHz / 32bitのDACが必要になるが、一般的に普及している比較的良い方のDAC、192kHz / 32bitでも充分な再生ができない。
DSF専用機を使ってやっと再生できるレベルである。

ハイレゾ対応プレーヤーと専用ヘッドフォンを推奨というのは、このためなのだが、問題は、既に一般普及型のスピーカーで聴けるレベルではなくなってしまっていることにある。

サンプリング周波数とそれぞれのフォーマット

  • 48kHz 24bit(FLAC or WAV)
  • 96kHz 24bit(FLAC or WAV)
  • 192kHz 24bit (FLAC or WAV)
  • 5.6MHz 1bit (DSF)
  • 11.2MHz 1bit (DSF)

平たく言えば、24ビット(量子化ビット)以上のものをハイレゾといい、概ね48kHz以上のサンプリングレート、すなわち、0~24kHzが表現できれば良いということになる。
96kHz以上のサンプリング周波数は微妙ではあるものの、今どきのミュージックプレーヤーなら、48kHz/24bitに対応しているものが多いので、特にハイレゾを謳っていなくてもハイレゾ対応と言って差し支えない。

ヘッドフォンの周波数特性に関しても、ハイレゾ対応であっても、40Hz~22kHzというのが多いので、厳密には、48kHzで頭打ちとなっているので、あとは、よく言う空気感の問題となる。
要は、記録されている音声が聞こえなくても、ハイレゾ再生となり、聴感的には微妙にニュアンスが変わるので、デジタルでは理屈が合わない現象があるようだ。

ハイレゾ音声を圧縮するとローレゾになる?(付録編)

これも、微妙なところなのだが、例えば、44.1kHz / 16bit のMP3圧縮を、320kbpsのCBRで表現すると、CDクオリティーになるが、それなら、48kHz / 24bit を 320kbpsに圧縮するとどうなるのか。
ハイレゾクオリティーとまではならないまでも、22kHzまでを再生できていて、量子化ビットも24ビットなら、1段階クオリティーが上がっても不思議ではない。

見た目は、320kbpsのMP3でも元の音声が48kHz/24bitだったりすると、圧縮過程で僅かに違いが生じハイレゾ音声寄りの音声が出来上がっている可能性も否定できない。
もちろん、圧縮音声なのでインチキなのだが、聴感的にはそれほど変わらないものを最近のGoogle Play Musicでみかけることがある。

もともとの音源がハイレゾで、320k MP3 CBRに圧縮されたGooglePlayMusicの音声スペクトル

ネイティブなハイレゾ音声(96kHz /24bit )

確かに、ネイティブなハイレゾ音源では、非圧縮で、22kHzまで再生できているのに対し、320kbps MP3 CBRのGooglePlayMusicの音声は、概ねの容量が、9MBで最高周波数も20kHz近辺にある。

両者を見れば一目瞭然なのだが、聴感的には、GooglePlayMusicの320k MP3はCDクオリティーを超えているように感じた。検証方法は聴いて確かめるしか無いので、興味がある方は聴いてみると良い。
今どきのDAC(96k 24bit)なら、充分に違いはわかると思う。

比較に用いた音源

アブソルートリー・ライヴ!(コンプリート・エディション)
寺久保エレナ

ハイレゾ版

元が良ければ、音質はCDクオリティーをわずかに超えることが可能なようだ。
ここまで来ると、聴いてみて判断するという難しい領域になるので、ハイレゾ=音が良いというのは聞き方次第な面もあるように感じる。

最近、妙に音がいいGooglePlayMusic配信楽曲に出くわす機会が多くなったので、改めて、詳細を調べてみたのだが、ハイレゾで配信しているわけではないが、確かに音がいい楽曲があるのは間違いなさそうである。
侮れない存在となったものである。