« 『朝の小鳥』スタジオ収録-ウグイス | トップページ | 大谷川公園-日光 »

2017年1月13日 (金)

野鳥の声とmp3

 現在、取りかかっている『Miniこのは-声から鳥がわかる本(仮題)』の音源は、mp3で納品です。現在、欧米で多くの鳥の鳴き声のCDやアプリが発売されていますが、収録されている多くの音源がmp3となっています。この機会に、野鳥の声とmp3ついて考えてみました。
 mp3は、音源ファイルの形式の一つです。圧縮されていますので、waveの10分の1以下の容量になります。たとえば、音楽CD10数枚がCD1枚に収まることになります。これは、高音域をカットしていること、言葉が適切かどうかわかりませんが、必要のない音をはしょっているからです。人の聴力は、耳から聞き情報を脳で処理します。そのため、情報が失われていても補ってくれます。ある意味、それを利用してのはしょりです。ですから、10分の1以下の情報量でも大丈夫というわけです。また、音楽CDはトラック数に限りがあり最大で99までです。しかし、mp3の場合、データとして収録されますので無制限です。
 もちろんデメリットもあって、基本コンピュータがないと聞くことができません。あとは、どうしても音質の劣化はさけることはできません。以前、CDそのままとmp3に変換した同じ音楽を聞き比べてみたことがあります。イヤーフォン程度だと違いはわかりませんが、大きなスピーカーで聞くと違いがわかります。音の厚みや奥行きが、薄く浅く感じました。
 mp3の音源を声紋表示させると、10,000Hzから上がなくなっています。CDでは22,000Hzまでありますから、およそ半分がカットされています。ですから、もっとも高音のヤブサメの8,000Hzのさえずりは、mp3に変換しても聞くことができます。
 mp3に変換すると、音がある部分の上の音がなくなります。音があるのだから、その上の音がある必要がないためでしょうか。あとは、全体にところどころ音がなくなっていて、全体に荒い感じの声紋となります。そのため、薄すさや浅さを感じるのでしょう。ただ、低音はそのままで、たとえば100Hzのヤマドリの歩母衣打ちは、ほぼそのまま残っています。
 では、どれだけ変化するか、見てみましょう。まず、ミソサザイのさえずりのwave音源を声紋表示してみます。
Wren1701131

 同じ音源をmp3に変換して声紋表示です。

Wren1701132

 わかりやすいようにモノラル表示しています。10,000Hz以上がなくなり、ところどころ音がはしょられていることがわかると思います。ただ、聞いてみるとミソサザイのさえずりであることはわかり、waveと大きな違いはありません。
 先日のミヤマホオジロの地鳴きでは、音がものすごく変質してしまいましたので、アップするのをあきらめました。参考のために、mp3に変換した音源をアップします。こんな感じになってしまいました。


 
 これを声紋表示すると、すかすかになっていることがわかります。
Yellowthroated_bunting1701131

 どうも、高さに幅のある音は、すかすかになりやすいようです。野鳥の声の特徴のひとつが、音に幅があることです。ミソサザイやカヤクグリは、一つの音が5,000Hz以上の幅を持って鳴いています。3,000Hz程度ならば、ホオジロ類など多くの鳥のさえずりで鳴いています。楽器では、ここまで幅ある音を出せないと思いますし、こうした音が影響を受けやすいようで注意が必要です。
 また、鳥の声のあるところとバックグランドの音だけのところで、途切れたようになります。音楽であれば流れるように音が続くので、こういった長い間があることは少ないので影響は少ないと思いますが、鳥の声では気になります。
 実は、mp3と一口にいっても、いろいろな段階、ビットレートに違いがあります。Audition 3.0の場合、「mp3で保存」でオプションのアイコンを開けると「128Kbps,48000Hz,ステレオ」が表示され、これがデフォルトです。そのため、今までこのビットレートで保存をしていました。この結果、おおむねデータ量が20分の1になっていました。
 Audition 3.0では、最低で「20Kbps,11025Hz,ステレオ」、最高で「320Kbps,48000Hz,ステレオ」まで47段階あり、それぞれモノラル変換もできます。結果、約100パターンあることになります。ちなみに、デフォルトの「128Kbps,48000Hz,ステレオ」は上位3分の1くらいのステータスとなります。ですから、さらにビットレートを上げてやれば、音の損失が減るはずです。その代わり、どれだけ容量が増えてしまうのか、試してみました。
 ということで、前掲のミヤマホオジロの地鳴きを上の「192Kbps,48000Hz」に変換してみました。



 音は、すかすか感がなくなり、ちゃんと聞くことができます。

Yellowthroated_bunting1701132

 声紋表示させても、音の欠損が少ないことがわかります。
 しかし、どれだけ容量が増えているでしょうか。元のwaveで、8,000バイトです。「128Kbps,48000Hz,ステレオ」で、335バイトとなり約20分の1以下です。そして「192Kbps,48000Hz」だと500バイト、16分の1となりました。たしかに、圧縮率を下げることで、高音が残り聞きやすくなりますが、容量は多くなりました。それでも、waveに比べれば、かなり小容量となっています。
 現在、BBSやブログにアップできる容量は500KBが上限であることが多いと思います。ですから、waveで20秒程度に編集し、mp3「192Kbps,48000Hz,ステレオ」に変換すれば、音質の損傷を少なくしてアップできることができます。あるいは、モノラルにして40秒まで可能となります。
 どうもmp3は、音楽のためのもので、低音は残し高音はなくす仕組みのようです。そのため、高音や音の幅のある野鳥の声は、変質してしまうことが多いことになります。また、ビットレートを上げれば、変質は軽減されることもわかりました。
 Webサイトへのアップは、mp3がほとんどです。そのため、野鳥の鳴き声をより自然に聞いてもらうことができるよう参考になれば幸いです。 

« 『朝の小鳥』スタジオ収録-ウグイス | トップページ | 大谷川公園-日光 »

考証」カテゴリの記事

コメント

いつも鳥の録音の話題ありがとうございます。私もまったく同じ経験をしました。自分の取ったミヤマホオジロの地鳴きを仲間と共有しようとmp3フォーマットでエンコードすると、デフォルトの設定では聞けたものではありませんでした。そのときはやはり非圧縮のWAV形式にしました。
「Miniこのは〜」はmp3とのこと、分析用の音源としても期待しております。再現性の高いビットレートでお願いします。

大阪英樹様
 こちらこそ、いつもありがとうございます。
 全部やり直しています。元のwaveファイルを削除してしまったので、ゴミ箱から救いあげて再度、同じ作業を繰り返しています。野鳥の声をmp3音源での発売は、日本ではあまりない試みなので、緊張します。

コメントを書く

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/556172/64758406

この記事へのトラックバック一覧です: 野鳥の声とmp3:

« 『朝の小鳥』スタジオ収録-ウグイス | トップページ | 大谷川公園-日光 »

2017年3月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

最近のトラックバック

無料ブログはココログ