サンプリング定理の誤解とCD規格の大罪 |
||||
■ サンプリング定理 『原信号に含まれる最大周波数成分を f とすると、 2f よりも高い周波数 f_s で標本化した信号は、 低域通過(ローパス)フィルターで高域成分を除去することによって 原信号を完全に復元できる』(Wikipedia より)というのは誤解です。 音楽関係のPCM屋にとって必要なのは楽音波形の復元です。 |
||||
▲ 原波形周波数の 2.14 倍のサンプリング周波数 f_s でサンプリングしたようすです。 AM変調がかかってしまっています。 FM変調と言うよりはジッタが発生してしまいます。 これらによりスプリアス・サブハーモニックスなどが発生してしまい、 音が汚くなってしまいます。 スプリアス・サブハーモニックスを許容レベル以下にするには、 最低でも原波形の8倍周波数以上でサンプリングすることが必要です。 後方と前方のサンプルデータを参照して補間するにしても、(復元時に補間するという条件が必要。リアルタイム性は?) 原波形が定常波の場合は復元できそうですが、非定常波の場合は逆にズレそうです。 ■ サンプリング定理を曲解して、 CDは f_s の1/2(22.05KHz)までの楽音(サイン波)が録音されていると勘違いしている方が少なからずおられますが、 高域分は、 波形そのもの = 楽音 が録音されているのではなく、 周波数成分情報(楽音とは言えないもの)が録音されているのです。 周波数成分情報→楽音復元処理を行わないと正しい楽音として再生できません。 ■ アナログで言う周波数帯域(例えば 10Hz〜20KHz -3dB)はサイン波を通過させ得ることを指していますが、 デジタルで言う周波数帯域(例えば f_s の1/2 までと表現されている場合)はアナログとは全く違います。 これをアナログと同じであると錯覚誘導するような広告とか記事が CDの出始めの頃に多く見られました。 数学的に完璧なサンプリング定理のお墨付きが付いたシステムであるとして・・・。 ■ PCM録音/再生システムの評価実験の経験者にとっては常識ですが、 fs = 2×fmax が金科玉条のごとくまかり通っていることは問題です。 |
||||
▲ それでは fig.1 の音を実際に聴いて見ましょう。 まず、AudaCity で 1,990Hz のサイン波をサンプリングレート 44.1KHz で作ります。 |
||||
▲ 1,990Hz のサイン波(サンプリングレート 44.1KHz)の波形です。 |
||||
▲ エンベロープです。揺らぎはありません。 |
||||
▲ SoundEngine にて サンプリングレート 4,000Hz でサンプリングした結果です。 原波形周波数=1,990Hz でサンプリングレート=4,000Hz ですので、 Fs は原波形周波数の 2.01 倍になります。 fig.1 の状態を再現しています。 ■ 原波形の wav ファイル(5秒間)試聴 レベルを -10dB してあります。 サンプリング後の wav ファイル(5秒間)試聴 レベルを +2dB してあります。 こんな音になってしまいました。 サンプリングレート=4,000Hz ですが WMP で再生可能です。 百見は一聞に如かずですので、是非お聴き比べください。 両者の違いの元を正せば、サンプリング定理の『完全に復元できる』の解釈の相違からです。 サンプリング定理を理解すれば自明のことですが、誤解を招く表現は改めるべきでしょう。 |
||||
▲ CDでは 20KHz サイン波はこのように録音されています。(但し、データ間は直線補間で表示) 周波数成分情報は完全に含まれていますが、 波形情報としては欠落が多すぎます。 ■ デジタル系の 利得−周波数特性 はアナログ系とは全く別物です。 上図波形を適当な時間幅を持って p-p値で測定すると、利得=0dB と測定されます。 したがって『CDの周波数特性は20KHz までフラットに延びている』という論者が居ますが、これは誤りです。 周波数特性はRMS計で測定すべきでしょう。 実際、上で比較試聴していただいた二つの1990Hz .wav は聴感上等しくするために、合わせて12dBの補正をしてあります。 ■ こんなのものがありました ↓ 世の中には真実を知らない方が幸福ということもあるのです。 |
||||
パソコンのオーディオ利得ー周波数特性を測定 |
||||
▲ HP 社製 HP Pavilion Elite HPE-360 内臓の Realtec High Definition Audio
の利得−周波数特性です。 22,050Hz に急峻なディップが有ります。 赤色で示された範囲は、測定方法により異なる値が測定されてしまいます。 アナログスペアナで測定する場合は、局発のスイープを超スローにしないと見落としてしまいます。 アナログ機器の場合は、波形劣化は徐々に増してゆきますが、 デジタル機器の場合は、波形劣化が離散的に突然起こるので注意しないと見逃してしまいます。 ■ 利得−周波数特性はフラットですが、波形がぐちゃぐちゃになる周波数があります。 また、エンベロープ歪が発生する周波数があります。 このような歪み波は、RMS計で測定してもダメです。 元は P-P値で測定して、それを実効値換算しているだけですから。 真の実効値計・パワー計で測定すると聴感に一致します。 |
||||
▲ 同じく、HP社製 HP Pavilion Elite HPE-360 内臓の Sound Blaster X-Fi
Xtreme の利得−周波数特性です。 22,050Hz に急峻なディップが有ります。 ■ Realtec と Sound Blaster のf特はほとんど同じですが、音質は全く違います。 Realtec はドライで金属的な音質です。刺激が強いので長時間聴くと疲れます。 Sound Blaster は高域は出ているのですがウェットでビロードみたいな音質です。 |
||||
▲ SONY社製 VAIO PCG-GRX72 内臓の YAMAHA AC-XG WDM Audio の利得−周波数特性です。 なっ、なっ、なんと、MIC-IN → HP-OUT はデジタル処理されていません。 アナログスルーです。 ということは、音量調節はアナログ乗算器ということ? ということで、このパソコンの A/D, D/A を通過したオーディオ信号の利得−周波数測定はできませんでした。 500KHz 以上で出力信号レベルが下降しないのは、入力信号が HP-OUT へリークしているからです。 ■ 富士通社製 FM-VIBLO-NE3/500LR も同じ YAMAHA AC-XG WDM Audio 搭載ですので、同じ周波数特性です。 |
||||
▲ Realtec High Definition Audio の 20,000Hz 出力波形です。 大きく歪んでいます。 このような波形はパワー計で測定すると聴感に一致します。 バードのパワー計です → 現役時代に使いました。 |
||||
▲ ところが、MIC 入力ではなく、wav ファイルを再生すると写真のように綺麗な正弦波が再生されます。 ■ 補間機能付D/Aでは、計算で作った wav ファイルは計算通り綺麗に補間されますが アナログ発振器から出力されるサイン波を再生すると、ぐちゃぐちゃな波形になってしまいます。 |
||||
▲ Realtec High Definition Audio の 22,053Hz 出力波形です。 エンベロープが大きく歪んでいます。 ■ このエンベロープ歪みは、補間機能付D/Aでも元に戻りません。 |
||||
▲ ちなみに、Realtec High Definition Audio の fs=192KHz のときの利得−周波数特性です。 80KHz まで延びています。 96,000Hz 近傍は注意深くは見ませんでした。 |
||||
▲ 倉庫に永らく眠っていた測定器を目覚めさせてしまいました。 菊水社製 CCOM7101 は 100MHz帯 4チャンネル デジタルストレージオシロスコープです。 10GHz サンプリングオシロスコープとしても利用できます。GP-IB 付です。 菊水 ORC11 の周波数設定ダイアルは2重式になっていて、周波数設定が精密にできます。 無線機のチューニングダイアルみたいです。 CRT撮影用のポラロイドカメラです。フードをデジカメに付けて撮影しました。 |
||||
量子化ノイズ |
||||
▲ DVDでは 20KHz サイン波はこのように録音されています。(但し、データ間は直線補間で表示) 原波形に近くなりました。CDとの差が歴然です。 ■ 数学屋は サンプリング周波数を上げる → 復元可能最高周波数を上げる だけに目が行き、 音楽屋は サンプリング周波数を上げる → 高音域の音質を向上させる に結び付けます。 したがって、CD規格制定の際にサンプリング定理信奉者は、 最高復元周波数だけに留意して音質は Out of Mind. だったことでしょう。 音質はどうでも、とにかく高域が出てれば良かったんでしょうね。 ■ 然しながら、当時の技術としてはここまでが限界だったのかも? ■ CD規格のもうひとつの大罪は、 プリエンファシス・デエンファシスを採り入れなかったことです。 ティンパニーの一撃 16ビットフルスイング のために、 ストリング等は実質 12ビットダイナミックレンジ になってしまっています。 バイオリンソロの pp 部は悲惨です。 ■ 確立された原理・定理・法則・テクノロジーも、今一度立ち止まって脳を柔軟にして見直してみると 思わぬ一面を覗き見ることができます。 exp.1 飛行機の主翼に働く揚力の源は、従来はベルヌーイの定理によるものと信じられて来ましたが、 最近では、空気の粘着性とその質量によるものという説に取って代わられようとしています。 教育現場も真っ青です。 exp.2 アルキメデスの原理について正反対の論者が居ます。 『水底にある物体に浮力は働かない』という論者と、 『水底にある物体に浮力は働く』 という論者です。 拙筆 アルキメデスの原理:浮力の正体の一考察 をどうぞご覧願います。 exp.3 エレキギターの電磁的ピックアップの発電原理について、 弦が水平振動した場合は従来の説明とは違うということ。 拙筆 弦が水平振動した場合のピックアップ出力波形 をどうぞご覧願います。 権威あるページの説明 とは違います。 |
||||
▲ 一般的に、原波形と復元波形の差が量子化ノイズと説明されていますが、 量子化ノイズ(赤色三角波)は基本周波数が 44.1KHz で可聴周波数帯域外ですので聞こえません。 ところがこの三角波を良く見ると青色で示された直流成分が重畳されていることがわかります。 この量子化ノイズの直流成分波形が可聴ノイズとなって聞こえます。 ラグランジュ補間などによりインターポレーションすることでノイズが軽減されます。 |
||||
補間と復元 |
||||
■ 補間と復元を狭義に捉えることにして、 補間は、音響的に自然になるようにすることとし、 復元は、飽くまで原波形を復元すること、 と分けて考えることができそうです。 ■ 補間 ・ フィルターによるリアルタイム補間 ・ 各種アルゴリズムによるハードウェアによるリアルタイム補間 ■ 復元 ・ 計算機による復元 下図の上側波形は 20KHz サイン波 fs=44,100Hz の波形です。 これをフリーソフトの Upconv で fs=192,000Hz で復元すると下側波形になりました。 エンベロープ歪が無くなりました。 一寸待ってよ。ソースがビート波の場合でも下側波形になってしまうということですね! エンベロープ平滑化問題があります。 |
||||
▲ 3種のアップコンバーターソフトウェアによる補間・復元のようすを調べてみました。 無音から音の出始め部分です。 Sound Engine はほとんど直線補間です。破綻を来たさないアルゴリズムです。 AudaCity と Upconv は良く似ています。波形復元処理をしています。 フムフム、先頭は無音のはずが前方の音が滲み出てしまっています。 エッジの滲み問題があります。 ■ 原波形をサンプリングしたデータは不可逆圧縮されたデータであり、完全に復元できるというのはウソです。 |
||||
▲ 同じく、5波繰返し部分です。 いずれのアップコンバータも、原波形のプロット点を経過しています。 禁断のプロット点を弄くるエンジニアはいないのかな〜。 小田氏から次のような情報を戴きました。Thanks! ■ リアルタイムにアップコンバートする実験回路では、ラグランジェ補間が聴感上一番良好でした。 ■ 一時期流行したMD規格が普通の耳を持った音楽リスナーでさえ耐えられない音質のために 不評を買って消滅してしまったように、CD規格も近い将来消滅することでしょう。 以上、白衣を着た研究者とは違い、現場で泥まみれ・汗まみれ(冷や汗、油汗)になった経験に基づいて書き記しました。 |
||||
リンク |
||||
■ フリーソフト
その他、拙筆 "オーディオ計測器フリーウェア"をご覧ください。 ■ 記 事
|