Twitter-site 2020年10月2日~10月8日
Blog-site 2020年10月1日 「は」を「た」や「か」に聞き間違える??
古田:引き続き、補聴器適合検査の指針(2010)で用いる67-S語表の単音節「は」が音圧を上げると「た」、さらに上げると「か」に変わって聞こえるという現象について、議論を重ねます。
古田:「は」が「た」「か」に聞こえる可能性について、単音節の「た」「か」に帯気音/h/が内在しており、また短く強く発音した「は」は摩擦成分がかなり短くなり、帯気音/h/に近くなる。それが誤聴を生じているのではないか?そうだとしても、「た」→「か」はどう説明する?
古田:横道にそれるかもしれませんが、「聴覚フィルター」と音圧の加減の関係を少し教えて頂けませんか?音圧の上昇で聞こえが変わるという点を考えると蝸牛のシステムも少し気になるんです。
〈付記:聴覚フィルターとは?〉
蝸牛は音のパワーと位相の両方を正確に分析して神経信号に変換し,各聴神経線維はある特定範囲の周波数成分だけを伝えるスペクトル分析器であるが,この周波数分析機構を説明するために考えられた仮想の帯域通過フィルタ。即ち,聴神経全体を見ると,それぞれが少しずつ異なった周波数を通過させる帯域フィルタの集まりと見なせるが,以下のような特徴を有する。
①ヒトでは20数個の帯域フィルタで構成される。
②入力音の周波数や音圧に応じてバンド幅が変化する。
③低周波数側と高周波数側で傾斜が異なる(非対称)。
④感音難聴者では,帯域幅が広がる。
引用:日本聴覚医学会:https://audiology-japan.jp/c/315/
Katharina Zenke (2014) Estimation of the Phase Responseof Auditory Filters: p11. Figure 2.6: Auditory filters with characteristic frequencies from 500 to 8500 Hz: [Columbia College Chicago].
西岡:音圧が大きくなると、周波数特異性が低くなり、広い範囲の周波数を含むようになります。つまり聴覚フィルタだけで言うと、一般的イメージと逆になるかもしれないですが、大きい音ほど子音の特徴は捉えづらくなりますね。蝸牛内の話と合わせるとイメージしやすいのですが、大きい音の方がたくさんの外有毛細胞が反応する(後述)ので、より多くの周波数に反応してしまっている状態ですね。
古田:私たちは、「すべての場合ではないが」、その音波を構成している周波数の違いを頼りに音韻の同定している。音圧が上がるという出来事は、蝸牛の段階で不利益を生じさせる可能性があるということ?
西岡:周波数を頼りに違いを同定しているものに関しては、音圧上昇によって同定しづらくなっている可能性はあるかもしれません。 例えば「か」を3000Hzのエネルギーの強さで認識しているならば、音圧が大きくなれば3000Hzの周囲の周波数も捉えやすくなるので「か」の特異性がわかりづらくなりますね。
古田:気になったのだけれども、「外有毛細胞」は聞こえを担う内有毛細胞に対してその感度を抑制させる系の働きだと記憶しています。外有毛細胞の多くが反応するということと、それがより多くの周波数に渡るという点をもう少し教えてください(^^)
西岡:仰せの通り、外有毛細胞には内有毛細胞の感度を抑制させる働きがあります。大きい音圧が入った場合は。逆に小さい音圧だった場合は増幅させようという働きもあります。外有毛細胞と周波数の関係ですが、簡潔にいうと100Hz担当の外有毛、1000Hz担当の外有毛、といったように周波数の担当があります。例えば3000Hzに強いエネルギーを持つ声を聴いたとします。声が小さければ3000Hzの外有毛細胞だけが反応するのですが、声が大きくなると3000Hzの周りの外有毛細胞も反応してしまいます。
古田:「た」「か」の破裂成分が持ち得そうな周波数の違いと蝸牛の基底板の周波数配置を簡易な(安易なw)図にしてみました。
古田:その上で、音圧が高いことで生じる蝸牛基底板への影響を安易に図にしてみました。この青〇と赤〇が重複する部位での周波数特定の不明瞭さが、誤聴、つまり音韻同定(カテゴリー知覚)に揺れを生じさせる原因になりえそうだということ?
西岡:スピーチバナナ上では/ta/,/ka/どちらも3000Hzあたりが特徴とされていますが、実際SSGで見てみると周波数帯って結構差があるものですね。蝸牛(直線管模式図)と楕円で示していただいくととてもわかりやすいですね。
西岡:周波数と音圧の関係図を見てみると音圧がかなり大きくても影響する周波数帯は±2000Hz程度です。つまり/ta/を4500Hz,/ka/を1500Hzと考えて互いに寄っていったとすると2500Hz~3500Hzあたりの周波数でどちらかの判断がつきにくくなっているイメージでしょうか?
古田:このグラフ・・・すいません、文系の私には読解が不慣れで。音量を上げる(曲線上の数字)と、フィルタ内で増幅(gain)される(=縦軸の値が下がる)、それが2000Hzあたりを中心に起ってますよ~、音量を上げるともっと起こりますよ~(縦軸の値が下がる)という理解で良い?
西岡:図、申し訳ないです。2000Hzにエネルギーを持った音(声)を生じた場合を仮定して、真ん中の数字(30,40…dB)が大きくなるほど山が低くなっているので、2000Hzの特徴がフィルタで遮られますよということです。
古田:私の「た」と「か」が図示した周波数帯にあったというだけで、私の共鳴構造(調音位置から口唇あたり)が典型例とはいいがたいね。ましてや、発端となる検査の音声は女性でしたね。そろそろ私たちが今考えられる仮説について「検証する方法(聴取実験)」を考えてみるのはどう?
(Blog-siteに、音声知覚の参考文献をUPしています。なっがいですから、時間ある時にどうぞ。)
西岡:聴取実験賛成です。なにはともあれ実際に聞いてみてですね。
古田:聴取実験を「おんせいげんご」などで行いたいと思います。その為、どのような音源を準備するのかについて、新しいスレッドを立てます。またRepでよろしくです。