April 19, 2012

第75回 サラウンド寺子屋 フィールドサラウンド実験報告

By Mick Sawaguchi 沢口真生

日時:20121月28日(土)
場所:東京芸大 千住キャンパス
講師:土方裕雄(フィールドサラウンド研究会 代表) 亀川徹 (東京芸大 音楽環境創造科教授)
テーマ:「フィールドサラウンド録音における音源別最適マイキングの究明」結果と主観評価実験法について


沢口:20121月のサラウンド寺子屋は2パートにわかれていまして、パート1は一昨年1年間研究しましたフィールドサラウンド研究会の実際の実験をどうやったかを土方さんにお話いただき、パート2は学術的に6種類の主観評価の方法と結果について東京芸術大学の亀川さんに説明いただきます。それでは早速土方さんからよろしくお願いします。

土方:よろしくお願いします。この研究には多くの方が参加してくださり約1年間かけて「フィールドサラウンド録音における音源別最適マイキングの究明」というテーマで実験と研究をおこなってまいりました。今日はその成果を寺子屋でも発表させていただきます。この研究を始めたきっかけは、私がサラウンド番組の録音をしているということがあるのですが、毎日放送の入交英雄さんを代表としたAESサラウンド研究グループが2007年に放送文化基金の助成で「地上波デジタル テレビ放送におけるサラウンド収録法の研究 オーケストラホール編」というのをやられて、その発表が横浜で開かれたA&Vフェスタでありまして、そこで何種類ものマイキングの違いを聞かせていただき、すごくわかりやすかったんです。

 当時私はフィールドでのサラウンドでの最適なマイキングを模索していて、同じような実験をしてみようと思い自分の持っているマイクロフォンとレコーダーでやり始めました。沢口塾長にもマイクロフォンとレコーダーを借りにいって、録音したものを聞いていただいていました。そこで放送文化基金の助成制度のお話を伺い、申請をしたところ運良く通りまして、この研究を進めることが出来ました。


 目的と意義



音源や制作目的に応じた最適なマイキングを探るということですね。実際音源の質や音源との距離、空間の広さなどにより最適なマイキングは違ってくるということは音響制作を通じて我々の仲間はわかっていたのですがよりよいマイキングはどういうものがあるかというのを探るということではじめました。音源は日本の季節を感じるものや自然音の中からバリエーションをもたせられるように選定しサラウンドマイキングは、以下の6種類選定しました。

1.
単一指向性を利用したサラウンドセット
2.
全指向性と、リアチャンネルに単一指向性のマイクロフォンを組み合わせたサラウンドセット
3. 一本のマイクでサラウンド収録ができるMS方式のワンポイントサラウンド
4. 私が独自に考案したガンマイクロフォンを利用したサラウンドセット
5.
単一指向性マイクロフォンを利用したIRT-Cross方式のサラウンドセット
6. Holophone H2-PRO
というワンポイントサラウンドマイク

 
2 6種類のマイキング解説

1.
単一指向性を利用したサラウンドセット


これはサンケンマイクロホンのCUW-180というマイクロフォンがありまして、これはX-Yステレオという方式のものです。X-Yステレオのマイクロフォンとはどういうキャラクターかというと定位がかなりシャープでリアリティーが感じられます。そのステレオマイクをフロントに1セット、リアに1セッ ト、センターにはわりと指向性がゆるやかなショットガンマイクロフォン Sanken CS-1が組み入れられています。このセットのメリットは1つのカゴ型ウィンドスクリーンの中にすべてのマイクが入ってしまいますので見た目にはガンマイク1本で録音しているように見え、機動力があり取り回しがすごく楽な方式です。サウンドキャラクターはシャープでリアリティーがあるものですから、ドキュメンタリー番組などの収録に適しています。


この図は日東紡エンジニアリングの崎山さんの協力によりインパルス応答の測定をさせていただいたグラフです。指向性のパターンがくっきりと出ています。これは1kHzのグラフですが実際の測定ではもっと他の周波数帯でも記録してあります。
 

2.
全指向性と、リアチャンネルに単一指向性のマイクロフォンを組み合わせたサラウンドセット

 これはコンサートホールでの収録によく使われる方式なのですがマイクロフォンはsanken CO-100kをフロントチャンネルに使いました。このマイクロフォンは非常に細かな空気の振動を捉えることができるマイクロフォンで、周波数特性が100kHzまで伸びている高性能なマイクロフォンです。リアチャンネルにはSanken CU-44XⅡという単一指向性のマイクロフォンを使用しています。マイクロフォンの配列ですがこれは深田晃さんが考案されたFukada- Tree2006というマイクレイアウトでやりました。本来Fukada-TreeDPA4006というマイクロフォンを使っています。全指向性のマイクロフォンを使ったときの特徴ですが細かな空気の振動をピックアップする能力があり、サウンドは密でとても豊かな響きをもたらします。(単一指向性 の)X-Yステレオがシャープでリアルなのに対して全指向性は密な心地よさが得られるとうのがあります。観賞用の音源やバックグラウンドノイズの収録に適 しています。インパルス応答のグラフですが、全指向性ですからかなり円の中が埋まっています。リアチャンネルはくっきり単一指向性のパターンが現れていま す。




3.
一本のマイクでサラウンド収録 MS方式のワンポイントサラウンドマイク



これはマイクロフォン1本だけでサラウンド収音ができるというワンポイント5.0chサラウンドマイクロフォンです。このマイクはすごく軽量・コンパクトなので例えばENGのロケではとても機動力がありいいですね。またENGのカメラマイクとして取り付けることもできるようになっています。その際には3チャンネルでMSを分離して記録して、あとで5.0チャンネルのサラウンド化もできます。インパルス応答のグラフです。ガンマイクのようなかたちをしているのですがこれだけ綺麗なパターンが描かれています。


4. 土方方式ーガンマイクロフォンを利用したサラウンドセット


 これは超指向性のガンマイクロフォンと双指向性のマイクロフォンと組み合わせてMS収録することによって、フロントLRと、センターは独立したチャンネル、 リアもMSLRを作り出します。そのMSデコードをするときの音圧のバランスをこういうふうにするとい心地の良いサラウンド感が得られる例で、 Sennheiser MKH-70超単一指向性のマイクロフォンはセンターが強すぎるため-12dBまで音圧を落とします。ファンタムセンターでも-6dB落として正相と 逆相の双指向性マイクロフォンとミックスしてステレオ信号を作り出します。このサラウンドセットの特徴は遠くの音をピックアップできて繊細なニュアンスを再現することができます。MKH-70が繊細なニュアンスをキャッチしています。広い空間の表現力はとても豊かです。以前蒸気機関車の通過音を録ったことがありますが縦方向の移動音には遠くからキャッチしているためかなり強いです。センター方向の収音力は抜群で自然環境番組、動物番組などのフィールド録音に最適です。そのインパルス応答の図ですが、これはミックス前のマイクロフォン1本ずつのインパルス応答のグラフです。ミックス後に分析するとまた違ったかたちになるとは思います。左右の方にある一瞬音がなくなる方向があり、それがこのマイキングの欠点でもありますがセンター方向はすごく強いです。

 5. 単一指向性のマイクロフォン IRT-Cross方式のサラウンドセット


 とてもポピュラーな方式でSchoepsCCM41というマイクロフォンを使ったIRT-Crossの方式です。4方向90度ずつに向いておりとてもバランスの良い収音ができます。このマイクロフォンは小さくて軽量コンパクトです。360度の包まれ感に優れていて定位もしっかりしています。今回はCCM41という超指向性のマイクロフォンを使いましたが実際にメーカーで推奨しているのはCCM4という単一指向性のマイクロフォンを使った IRT-Crossの収音方式です。このマイクもとても細かな空気の振動をピックアップすることができて、観賞用の音源やバックグラウンドノイズの収録に向いています。そのインパルス応答のグラフです。

 6. Holophone H2-PROワンポイントサラウンドマイク



Holophone
にはこれ以外にも廉価版の同じようなタイプのマイクロフォンがありますが、このH2-PROはおむすび型のボディにミニチュアコンデンサーマイクが8個組み込んでありそれがかなり感度が良く細かな響きをキャッチしてくれます。このボディ1つから1本のケーブルが伸びているだけのコンパクトな方式ですのでこれとマルチトラックレコーダーがあればサラウンド収録ができます。このマイクロフォンの特徴は、360度の均等な定位を求めるときには最適です。実際にこのマイクの周りを自動車でぐるぐる回ったことがありますがそのつながり感が抜群でした。他のマイクロフォンも同時に試しましたがこのH2-PRO つながりは一番良かったです。アンビエンスやバックグラウンドノイズの収録に適していると思います。そのインパルス応答のグラフです。埋めこまれているミニチュアコンデンサーマイクは全指向性かと思います。


3 収録の実際



現場の実験はこういうかたちでやりました。これは戸隠高原で森林の野鳥を収録しています。朝2時半起床で現場には3時頃には着いていたと思うのですが、実際 シュートできたのは5時ぐらいだったかと思います。それだけセッティングが大変でした。レコーダーはいろいろなところからお借りして6セット分用意しました。次が銚子にある屏風ヶ浦というところで波の通過する音を収音しました。海の中は危険なので手持ちでやりました。

 






この写真は無響室でインパルス応答の測定をしている様子です。スピーカーから信号音を出して測定しています。Fukada-Treeは、無響室の大きさが限られているため10分の1縮尺率で測定しました。






    


























では実際に収録した音をシーン別に10秒ずつ、順番に聞いていただきます。
<音源視聴>

聞いていただいて各マイキングによって特徴があるということがわかっていただけたかと思います。次に、実験の成果を実際の録音に活かしてみようということで私自身が試した例を紹介します。まずドキュメンタリー番組でのサラウンドのマイキングです。最初に登場した Sanken CUW-180を利用した収録法の例です。まずその音をお聞きください。

 <音源視聴>

出演者の声はピンマイクなのですが、カメラの動きに合わせてサラウンドのマイクの方向を合わせています。カットが変わると音像も変わってしまうのですが、違和感なくできたと思います。リアルなものに向いているのではという考えで試しました。次に、同じCUW-180のサラウンドマイキングなのですが、人の話を聞いている様子でそれをガンマイクで収音していますガンマイクの音がセンターに、残りの4チャンネルをCUW-180で拾っています。市場での収録です。

<音源視聴>

このときセンターのガンマイクが強すぎるのではと心配したのですが、実際にはCUW-180の感度が良かったのでわりと違和感なくつながったのではないかと思います。次に、ガンマイクロフォンによるMS収音方式です。アフリカの動物を収音した例です。

<音源視聴>

いまのは動物が題材なのですが、最近は映像と同時に録音してそれが成立しているというのはいまの世の中極めて稀ではないかと思います。放送で目にする番組のほとんどがアテレコです。それがこの方式ではマイクロフォンとレコーダーが1本のケーブルでつながっているだけなので機動力をもたせ同時録音を成立させることができます。ドキュメンタリーにおいて同時性とリアリティーの成立は非常に価値があるのではと考えます。次はサラウンドの音声は別収録のベースノイズという例です。ドラマなどはほとんどが別録りの音を使用しているかと思います。ベースノイズをサラウンドにするとどういった効果があるかというのをお聞きください。

<音源視聴>

ベースは何かというと風音です。この風音がつくりだす現場の雰囲気、空気感に関しましてこの時のプロデューサーはかなり絶賛してくださいました。やはりベースに空気感を感じさせるものがあるというのがかなりなファクターであると思います。いまのベースはガンマイクロフォンによるサラウンドセットで収録しましたが、条件によってはどういうタイプのマイクアレイでもいいと思います。特にバックグラウンドノイズで評価実験で優れていたのはIRT- Crossや、全指向性のものなど、あまり定位感を感じさせてない手法の方が都合がいい場合も多々あるかと思います。実際の応用例は以上です。

次にアフリカのサバンナで風音を録音していて気がついたことのご紹介です。前半にお聞きいただくのがCUW-180で収録したもので、後半がガンマイクで収音したものです。

<音源視聴>

この2つの違いは、前半のものはカゴ型のウィンドスクリーンが吹かれている、というような音になっていたかと思いますが、後半のガンマイクロフォンの方は ウィンドスクリーンではなくその外側に照準があっていたという気がします。ですのでガンマイクロフォンによるサラウンドマイクセットは風音の収録にも向いているのがわかりました。次も前半がCUW-180、後半がガンマイクロフォンによる収録で、こちらは日本の夜の虫の音です。

<音源視聴>

どちらが心地よいかというと前者のほうが良かったのではと思います。ですからケースバイケースで最適なマイキングが違うという例で、紹介しました。あとは人間が注意している対象とマイクロフォンがピックアップしている対象が一致しているかというのも重要だと思います。こういった兼ね合いについても今後もいろいろな場面で試してみないといけないと思っています。


 4 ハイレゾリューション録音のメリット
普段私の自然音は192kHzというサンプリング周波数で録音しています。なぜかというと、自然音のような音圧の低い音源はサンプルレートを上げると再現性がいいことが経験からわかっているためでここ数年実践しています。その違いを聞いていただきます。それがわかったのは、ある雑誌で新製品レビューを頼まれたことがありまして、ステレオのレコーダーだったのですが192kHz96kHz48kHzすべてのサンプルレートで録音して比較試聴してくれと編集部に頼まれましたので、滝の音を録音して聞いてみたところサンプリング周波数が上がれば上がるほど再現性が豊かでした。それ以来できる限りハイサンプルで記録しようと心がけています。聞いていただくのはアマゾンの源流で収録したバックグラウンドノイズです。これは192kHzで録音したものを96kHzにダウンコンバートして、いまこの再生しているプロジェクトが192kHzなのでさらにアップコンバートしたというものなのですが、それでも違いが感じられますので参考までにお聞きください。前半が192kHz、後半が96kHzです。

<音源視聴>

水の質感が明らかに変わったと思います。放送のスペック的には明らかにオーバースペックなのですが例えばある程度の広い空間で催されるイベントや展示映像関係の音はなるべくハイサンプルでやるのがいいんじゃないかと思って、なるべくハイレゾ リューションで収録するようにしています。例えば192kHzで収録したものを48kHzに単純にタウンコンバートすると音やせしたようになってしまいますので、少しでも劣化を抑えようという例でSteinbergWaveLabというアプリケーションの中にクリスタルリサンプラーというのがあり、これがポリフェーズフィルターというのを使ってサンプルレート変換をしているそうです。私は、テレビ番組の効果の作業をする前にこれで48kHz化しています。このアプリケーションのメリットとしては例えばワークステーションのように8コアのCPUがあるものなどでは一度に音声ファイルを8個変換作業できますのでかなり効率良く仕事ができます。
今度は観賞用の音源をハイサンプリングで録音したものを再生した場合の心地よさを感じていただきたいので音源を用意しました。川のせせらぎと浜辺の波音です。

<音源視聴>

このように密度の濃い状態で記録しておきますと、音量を下げていっても存在感が損なわれないという効果もあって例えば部屋で音量下げ目に再生してリラクゼーションの効果に使うとかの用途にも使えるのではないかと思います。


Q:レコーダーの設定なのですが、リミッターやローカットーを入れる場合はありますか?
A
あります。これは(オーバーレベルが)危なそうだなと思った場合はリミッターを入れる場合もありますし、ローカットは風が強い時は必然的にいれます。野外の場合は、暗騒音など特にガンマイクがかなりローを拾ってしまうため習慣的に80Hz以下はほとんど入れています。風が強い時は160Hzや、場合によって 200Hzまで入れる場合もあります。

Q
:逆に入れないことは?
A
風が穏やかなことです。あとは例えば象の集団が来たときがあったのですが、象はなるべく進路を変えたがらない習性がありまして、我々はそれを知っているので前で待ち構えるのですが、必ず威嚇の声をものすごい低音で出すんですね。そういう時はローカットせずその低音をフラットで録ります。フラットどころか LFEチャンネルも専用のマイクロフォンで録音しました。

沢口:土方さんありがとうございました。次は、これらを主観評価実験した内容について亀川さんにお願いします。

5 主観評価について

 亀川:主観評価実験を担当しました亀川です。
 6種類のサラウンドマイクアレーを比較しました。6種類のマイクアレーと6種類の音源を一度に評価できる方法を考えました。今回は、変形MUSHRA (Multiple Stimuli with Hidden Reference and Anchors) (ITU-R BS.1534-1)を使いました。本来この方法は、基準があってそれと提示音とを比べる方法ですが、今回は基準となるものがありませんので、厳密に言うとMUSHRAとは呼べません。
評価語を、定位・臨場感・包まれ感・距離感・迫力の5つに絞りました。これも、いろいろな評価で行えばいいのですが、それだけ時間がかかるので、5つに集約して行いました。

● 定位は、波の場合などは移動感も含むことにしました。花火は定位がわかりやすいですが、セミや小川はわかりにくいですが、そこも判断してもらいました。
● 臨場感は、主観的な評価になると思います。
● 包まれ感は、音に包まれている感じです。
● 距離感は議論がありましたが、空間の奥行き・パースペクティブの再現が上手くできているか。
● 迫力

5つの評価としました。
評定者は、MAやフィールドレコーディングのエンジニアと私どもの学生の19名です。この、スタジオで5チャンネルの音を聞きながら行いました。この部屋は、ITR-BS 1116の試聴室の国際規格に準拠して作っていますのでここで評価すれば、国際規格で行ったことになります。


これが、実際に使ったソフトウエアのSTEPの画面です。


ABCDEFのボンタがあり、音が切り替わります。プレイ・ループ・ポジションがあり再生する場所を設定して何度も聞くことができます。スライダーを動かして、6つの音の序列を付けていきます。だだし、評価者はどのアレーなのかは分かりません。この場所には評価者だけで、隣の部屋で遠隔でモニターしました。評価にかかった時間は、休憩をはさみながら、一人あたり1時間から2時間程度でした。何度も聞くことができますので、早い方やじっくり時間をかける方がいました。


6 結果
例えば、滝の定位はMKHのアレーがもっと評価が高い、CCMが評価が低いと見ます。この縦のバーは、信頼空間と言いまして、19人で評価していますので、最もいい評価と、最も悪い評価にばらつきがあります。この縦のバーが長いほど、人による評価の、ばらつきがあることになります。だいたいの見方ですが、この縦のバーの間に入っているものは、ほとんど変わりがないことになります。


次に定位と臨場感を比べると、だいたい同じ傾向ですが、わずにか違いがあるものもあります。

 包まれ感に関しては、はっきりと違いがあります。アレーの配置でマイクの距離を離したものが、同軸のようなものより評価が良くなっています。




 距離感は、音源によってばらつきがあります。

 次に迫力ですが、一般的に心理実験では周波数特性、低音の出かたに親和性があると言われています。CO&CUの全指向性マイクを使ったものは、低音が出ています。MKHも低音が出て、評価が高くなっています。H2proも音源によって評価が高くなっています。これは、音質の関連による評価だと思います。



これは、MDS(因子分析)、印象空間です。2次元で実験の結果をプロットすることができます。これは、それぞれの評価が、どのような方向を向いているかを空間上に配置する手法です。



例えば、包まれ感はCCMCO&CUが良かったですが、それぞれの評価の似具合を配置すると、包まれ感の方向に割りと近いことがわかります。(縦軸の)定位感はH2Proが一番良かったとなり、WMS5が良くないとなります。これを見ると、定位の評価と包まれ感の評価は、ちょうど90度のところにあるので、包まれ感がいいのと、定位がいいのは連動していないと言えます。今回の実験に限っては、迫力と臨場感がほとんど重なって一致することになります。ただし、WMS5が全般の評価でいづれもネガティブの結果ですが、このような6種類のマイクで、このような実験を行うと、このような結果にるということです。例えば、別のサラウンドアレーが加わると、全く別の配置になることも考えられます。


さらに、音源ごとの評価を加えるとこのようになります。例えば、WMS5の森林での定位は、MKHよりも良かったと言えます。また、セミの包まれ感も、MKHよりも良かったと言えます。これを見ると、音源によって評価が違ってくることがわかります。もう一点補足しますと、

さらに、三次元・四次元・5次元と表すことで、また、別の評価が出てくることもあります。迫力と臨場感は同じ軸になっていますが、若干、迫力のほうが短くなっていますが、言い換えると、こっち側に何かが起きているかもしれません。この図は、大きく2つの次元で見ると、このような結果になります。

6 主観評価から見えた結果
まとめますと、音源によって評価が違うことが言えます。
滝ような点音源では、単一指向性のマイクの評価が良く、
バックグランドノイズの集音では、全指向のマイクがつながりがよく、包まれ感が良かった。
移動感や定位は、指向性のあるマイクが評価が良いようです。

音源に依存しますが、大きくこのような傾向があると理解して頂ければと思います。

MKHと書いてある、ガンマイクを使った、土方方式の方法は、フィールドで離れた音源を録るときには有効です。次に、私は現場に行っていませんが、フカダツリーは大変なセッティングですし、CO-100Kを野外で使うのは、かなりリスキーではありますが、包まれ感では評価が高く、関係者の間ではやって良かったな、と言ったところです。ただし機動力で言うと、フカダツリーを持って動き回るのは、ほとんど不可能です。IRT-Crossは、同じ傾向として評価が高かったので、機動力の面では、良いと思います。今回のIRT-Crossは、CCM41のハイパーカーディオイドを使いましたが、単一指向性のものを使うと、さらに、包まれ感は、向上するのではないかと思います。先ほどの土方さんのデモでありましたが、実際にサラウンド収録すると、質の良い音で、番組質の向上になるのではないかと思います。ここまで、質問はありますか?



Q:先ほど説明がありましたが、三次元までのグラフですと理解できますが、4次元の場合には何を加えるかは、どう選ばれるのでしょか?
A:今回は出していませんが、次元を説明する場合に、どの位のウエイトを占めているか計算し、次元をどこまで使うか決めます。今回の場合は、2次元で説明できると思います。確かに、次元を増やして行くとより詳細な説明ができますが、4次元以上になると我々は空間のイメージができなくなりますでの、一次元・二次元・三次元・四次元・5次元と空間ごとに抜き出して見ていきます。また、四次元以上になると認識できなくなるので図では表しません。普通、三次元までですが、実際には立体を動かすように見ていければいいのでが、平面では見づらいので、有効ではありません。今回は直感的に見て、グループわけとして、
 MHKCCMCO&CUは似たグループ、
 H2ProCUW
 WMS53つグループに評価が分けられたことになります。
先ほども説明しましたが、包まれ感と定位感が、このような評価の軸(傾向)になると言えます。他のサラウンドの実験でも、包まれ感と定位感は、直交する(関連が低い)傾向が見られますが、臨場感に関しては、主観的な印象が強いので、実験によっては結構変わってきます。それでは、先ほどの評価のソフトを実際に見て頂きます。

[ 操作説明 ]


実際にやってみると、6つの音源で、一番いいものとそうじゃないものはすぐに選べますが、間を埋めていくのはなかなか難しいです。この方法ですと、10個くらいが限界でしょうか。その他の評価の方法として、一個づつ点を付けて評価をしたり、一対比較と言って、ABを聞いて、どちらがいいですかと、ただ今回のように、6個の場合などは、組み合わせの順序をかえない場合15回となり、今回の6個を一度に評価するほが早いのではないか、このような方法にしました。本当は、厳密な評価の場合は、一対比較がいいとされています。



沢口:土方さん、亀川先生ありがとうございます。日頃は、経験則や直感で判断することが多いのが制作側ですが、今回のようにそれらを学術的にも評価し裏付けをとってみるというアプローチは、大変参考になると思います。長期間の実験、研究大変ありがとうございました。(拍手)

[関連リンク]
サラウンド寺子屋に参加するには?
「実践5.1ch サラウンド番組制作」
「Let's Surround(基礎知識や全体像が理解できる資料)」
「サラウンド入門」は実践的な解説書です
「サラウンド寺子屋報告」Index にもどる

下書き担当サラウンド寺子屋サポーター:tomomiMUSHnemoto and NSSJP