音響学-キーワード
周波数と周期
周波数:1秒間に繰り返される波の数。単位はHz。人間の耳で聴こえる音の周波数範囲は20Hz~20000Hz
周期:1波長進むのに要する時間。単位はms
波長
波長:1周期に、その振動が伝わる距離。単位はm
音速
音速:音の伝わる速さ。約340m/sである。音速=周波数×波長/秒で求められる。
純音と複合音
純音
周波数成分を1つしか持たない音のこと。正弦波で表現される。線スペクトルとなる。明確な音の高さを感じる。基音、倍音、非整次倍音(整数倍でない倍音)、部分音(基音、倍音、非整次倍音全てのこと)、上音(部分音から基音を抜いたもの)は全て純音を差す。
複合音
周波数成分を2つ以上含む音のこと。無数の成分を含む音も多い。自然界に存在する音は複合音。明確な高さがある複合音(楽音)もあれば、明確な高さのない複合音(雑音)もある。純音以外の音、全てが該当する。
粗密波
音が空気中を伝わるとき、空気粒子の振動によって、空気の密度が高い(密)部分と低い(疎)部分が交互に生じ、それが縦波となって伝わる。
反射と干渉
反射:音は入射角と反射角が等しくなる(反射の法則)。
干渉:1つの音波の山と他の音波の山が重なって強め合ったり、山と谷が重なって打ち消し合ったりする現象のこと。
スペクトル
純音の成分を周波数順に並べて一覧グラフにしたものを音のスペクトルと呼ぶ。周波数に対する振幅のグラフであり、各正弦波成分の振幅を表す。
基本周波数
複合音の中で、声の高さを決める基本的な振動の音。人の発話では一番低い音が基本周波数で、振動が最もゆるい音となる。
音声では喉頭原音の周波数のこと。
基音
声の基本的な高さになる音。基本振動(喉頭原音)によって生じる音のこと。周期的な音波において、その周期と同じ周期を持つ正弦波成分。
倍音
200の基音から倍ずつ400、800など倍音が産生される、それが倍音という。周期的複合音の成分中、基音以外のもののこと。
基本周波数の整数n倍の振動で生じる。
部分音
周期的複合音は、複数の純音(基音・倍音など)が重なってできる音であり、その成分となる純音を部分音と言う
線スペクトルと連続スペクトル
線スペクトル
単一正弦波を示す純音は、ある周波数に音のエネルギーが集中しているので、スペクトルは一つの線で表される。複合音は、複数の正弦波が組み合わされたものであるので、スペクトルには倍音の振幅を表す複数の線が現れる。このように線で構成されるスペクトルは線スペクトルと呼ばれる。
連続スペクトル
雑音はいくつもの異なる周波数エネルギーから構成される不規則なスペクトルとなり、これは連続スペクトルと呼ばれる。
定在波(定常波)
適当な条件で進行波を重ね合わせることにより、見かけ上は波形の移動が見られない、その場で振動する波。⇔進行波
共鳴
喉頭原音が声道を通るときに干渉しあうことで、特定の周波数が強められたり弱められたりすること。強められた周波数を共鳴周波数といい、弱められた周波数をアンチフォルマントという。
ソース・フィルタ論
音声の物理的性質は、音源特性、声道特性、放射特性という3つのそれぞれ独立した特性によって決定されるとみなす考え方。ソースは音源(喉頭原音)で、フィルタは声道のことである。
サウンドスペクトログラム
音声信号に含まれる周波数成分の強弱が時間的に変化する様子を表したもの。広帯域分析と狭帯域分析がある。
広帯域分析と狭帯域分析
広帯域分析
採取した音声の分析時間を短くしたもの(時間窓が短い)=時間分解能が高い。分析する時間が短いため、1音1音が細かく分析できることでフォルマント周波数の時間的変化を分析できる。
狭帯域分析
採取した音声の分析時間を長くしたもの(時間窓が長い)=時間分解能が低い。発話全体を同時に分析するため共通する基本周波数とその倍音が分析できる。
フォルマント周波数(共鳴周波数)
母音を変えるためには周波数を変えなくてはいけない。その変えなくてはいけない周波数の事をフォルマント周波数という。F0(基本周波数)、倍音などでF1,2,3~とあるが、日本語の場合F1,2の周波数比で母音の種類が決定される。
第一フォルマント
閉管(声道)の基本振動に対応する共鳴周波数帯を第一フォルマントと呼ぶ。/a/(広母音)が最も高く、続いて/e/、/o/、次に/i/、/u/(狭母音)となる。したがって、開口度が高いほど、また舌の位置が低いほど第一フォルマントは高くなるといえる。
第二フォルマント
閉管(声道)の3倍振動に対応する共鳴周波数帯を第二フォルマントと呼ぶ。第二フォルマントは/i/(前舌母音)が最も高く、続いて/e/、/u/、/a/、/o/(奥舌母音)の順に低くなっていく。したがって、舌と口蓋の接近する位置が前方にあるほど第二フォルマントは高くなる。
音圧レベル (dB Sound Pressure Level)
音圧レベルの単位はdB(dBSPL)で、実用上は音の強さのレベルと音圧レベルは同じ値とみなしてよい。0dBSPL=20μPaを基準値とし、この値は、周波数や、実験や測定時の被検者によって変動することはない。
聴力レベル (dB Hearing Level)
0dBHL=健聴者の聴覚閾値の平均。
感覚レベル (dB Sensation Level)
0dBSL=各々の被検者の聴覚閾値。
最小可聴値 (閾値)
音の感覚を生じさせる最小の音圧。
弁別閾
音の違いが知覚できる最小の物理量の差。
等感曲線 (ラウドネス曲線)
音の大きさが等しく感じられる音圧レベルを曲線で結んだもの。各曲線上の音は全て同じ大きさに聞こえる。
Phon (ラウドネスレベル)
音の大きさのレベル。1000HzのときのdBSPL(音圧レベル)をphonとする。
例:1000Hzの時の40dBSPL(強さの単位)が40phon(大きさの単位)。
sone
音の大きさ。基準の音に対して何倍の大きさに聞こえるか。1000Hz、40dBSPL(40phon)の時、1soneとする。
マスキング
他の音の存在によりある音の聴覚閾値が上昇する現象。
マスカーとマスキー
マスカー:マスキングする音 (ノイズなど)
マスキー:マスキングされる音 (信号音など)
マスクされやすい音
マスカーと同じ周波数帯域の音が最もマスキングされやすく、マスカーとマスキーの周波数が異なる場合、マスカーより高い周波数の音は比較的マスキングされやすいが、低い周波数はマスキングが起こりにくい。
同時マスキングと継時マスキング
同時マスキング:マスキングする音とされる音が同時に呈示される場合のマスキング。
継時マスキング:2つの音が0.1秒以下の短い間隔をおいて引き続いて聞こえる場合に起こるマスキング。時間的に先に聞こえる音が後から聞こえる音をマスキングする場合を順向マスキング、後から聞こえる音が先に聞こえる音をマスキングする場合を逆向マスキングという。
BMLD (Binaural Masking Level Difference)
両耳マスキングレベル差。左右の耳に加わる信号音間あるいは騒音間に音圧差あるいは位相差があると、両耳間に生じるマスキング量が減少する。左右耳に加わる音の条件が変わることによって生じるマスキング量の変化をBMLDという。
臨界帯域
純音を効果的にマスキングする雑音は純音の周波数付近の一定幅の周波数帯域に限られ、それ以上帯域幅を広げてもマスキング効果は変わらない。この帯域を臨界帯域という。
カクテルパーティ効果
多数の話し声が同時に耳に入ってくる状況においても、その中から特定の音声だけを選択的に聞き取ることができること。
音源定位
音源の方向や距離を正確に知ること。左右方向の定位能力は両耳聴で著しく改善される。
【参考文献】
著: 吉田 友敬「言語聴覚士の音響学入門」
監: 廣瀬肇「言語聴覚士テキスト 第2版」,2012年