本記事ではゲーミングイヤホンやゲーミングヘッドホン、またFPSゲーム(以下ゲームと呼称)で定番になっているイヤホンが数多く流通している中、それらは実際のところ人間の聴覚/脳の方向認識に対して本当に最適なものなのか、原理から考えていきます。
[注意]この記事はマニアックな内容です。
噛み砕いて書いているため正しい表現ではなかったり、誤りがあるかもしれません。
そういった場合にはTwitterDMなどでご指摘いただけますと幸いです。
まず、日常生活の中で、人間はどのように音の方向を認識しているのかに着目する必要があります。
音の方向を聞き分けるためには主に耳介と体での音の変化に頼っています。
(耳介:耳たぶなどがある顔から突き出ている部分、ピアスなどを開ける部分)
イメージしやすいものとして、前方から来た音、後方から来た音では聞こえ方が違うのは耳介や体で音が反射、回析、変化しているためです。
また、上下や左右に関しても、自分の右側で鳴った音は右耳だけではなく、反射などを含めて左耳にも入ります。
(これらは日常生活の中で無意識的に脳が処理しているはずです。)
ほとんどの場合、イヤホンやヘッドホンは左右のステレオで音が出る部分は2つしかありません。
当然ゲームから出る音もこの左右だけですが(5.1ch/7.1chなどで出力した場合は除く)、この左右の中には前後左右上下の情報も含まれています。
その情報を織り込む処理は各方向の音をHRTF(頭部伝達関数)で計算して、特定の方向から鳴ったときの音が鼓膜に届いたときに実際の聞こえ方に近似するような処理をしているのです。
※ただし、ゲームによってはHRTF処理がされていないと思われるものもあります。
HRTFで計算されて生成された音声とは別で(概念としてはほぼ同じ)、ダミーヘッドを使用して収録されたバイノーラル音源というものがあります。
これは人間の耳や頭部、胴体を実際に再現して鼓膜の位置のマイクで収録することで、イヤホンなどで視聴した際にかなりリアルな空間の音を再現できるといった趣旨のものです。
このバイノーラル音源には、一般的な部屋やスタジオを使う場合と、無響室(壁で音が吸収されて反射しない部屋)を使う場合があります。
前者の場合、部屋の壁などで音が反射(響く、エコー)したものも含んでいて、拡散音場と呼ばれます。
後者の場合、音源から出た音が直接マイクへ届くもので、自由音場と呼ばれます。
自由音場の音と拡散音場の音とで鼓膜に届いた時の音がよりリアルに聞こえる音になるためには、それぞれ別の特性の音である必要があります。
その音の周波数特性のカーブが、自由音場ではFree-Field Curve、拡散音場ではDiffuse-Field Curveと呼ばれます。
このカーブの音に近いとなぜリアルに聞こえるかというと、日常で聞いている経験の音、慣れ親しんでいる音であるためです。
ゲームで再生されるHRTF処理された音はどちらなのでしょうか。
ゲーム内で、壁による反響や音源と自分の間にあるオブジェクト(壁を完全に挟んでいる場合を除く)によって音は変化していません。(VALORANT、PUBG、CSGOで検証)
また、現実では壁際に立つと、壁に近い耳の音は圧迫感のあるような音になりますが、それを再現されているようなこともありません。
そのため、自由音場の音に対して壁を隔てた場合のみこもった音になる、そして音の距離を掴むためエコーをかけた、「自由音場をベースとした音」と考えられます。
現代のヘッドホンやイヤホンはDiffuse-Field CurveをベースにしたHarman Curveという特性の音に近づく設計になっています。
というのも、音楽を聴く際には、Diffuse-Field Curveで作られた音よりも、Harman Curveの音のほうが迫力があり、心地よく聞こえるためです。
ゲームで再生される音は、鼓膜に届いたときにFree-Field Curveに近い音であればあるほどリアルで脳が方向を認識しやすいものと考えられます。
しかしながら、世に出回っているイヤホン/ヘッドホンにFree-Field Curveに近いものはほぼ無いようで、FPSに本当に最適な設計にはなっていないと考えられます。
さらに、人は耳の形状が個人個人で大きく異なります。
この個人差は外耳道の鼓膜までの距離、直径、角度やカーブなどがあり、個人個人で聞こえる音を変化させる要因となります。
ヘッドホンでは、外耳道だけではなく、耳介の形状でも音が変わります。
このようなことを加味すると、しっかりと耳奥まで差し込めるような形状で、個人差による音の変化を最小限に抑える必要があると考えられ、音の変化する要因が多い「ヘッドホン」はあまり最適ではないように思えます。
ゲームで重要なのは音の方向のわかりやすさだけではありません。
ゲームによっては一度に鳴る音源が多く、それらがそれぞれ何か聞き分ける必要があります。
またボイスチャットなどを使用している場合には、さらに音源が増えます。
こういった部分では、様々な音が同時になっても、きめ細かく聞こえ、かき消されないために音の解像度とダイナミックレンジが必要となります。
また、ダイナミックレンジを十分に確保するには、現実での音(PCのファンの音や空調、屋外の騒音など)を十分に遮音する必要があります。
まとめると
- Free-Field Curveに対してできるだけフラット(近い音)
⇒現実の日常的に聞いて方向を判断している音に近づける - 解像度が高い
⇒様々な音の聞き分け - 耳の外耳道で、できるだけ奥まで差し込める
⇒耳の形の個人差で音が変化してしまうのを最小限に抑える - ノイズを拾いにくい感度でダイナミックレンジおよびSN比が十分にある
⇒重要な音がしっかりと聞こえるようにするため - 遮音性が確保できる
現実世界の部屋の雑音を抑えるため
これらの要素を踏まえたイヤホンこそがFPSゲームに最適なものと考えらえます。
しかし、1つ問題があり、別のイヤホンで完全に慣れている場合にはこれらの音のイヤホンに切り替えた際にまた慣れが必要になってしまいます。
実際に起こったこととして、音源までの距離感を再度掴む必要がありました。
音の広がりが大きいイヤホンから切り替える場合には、かなり音が近づきます。
結局、最低限の設計であればどのようなイヤホンやヘッドホンでも慣れればある程度は十分に使用できますが、一番最適で理想的なものは上記の条件のものではないかと考えています。