Fundamentals of Acoustic Analysis

Copyright (c) 1993-1997 Jouji Miwa. All rights reserved.

1 音声分析の基礎

 1.1 音声分析の基本概念

 太陽の光は、一般に、人間の目では白の一色であると感じる。 しかし、プリズムという器具を使用することにより、図1.1に示すように、 虹のような沢山の色が含まれていることを理解することができる。 これは、光の屈折率が波長により異なる性質を利用して、 光を周波数分析することにより、光に含まれる成分を分析し抽出できたことになる。 同様に、音声も、周波数分析装置等を利用することにより、 音声に含まれる成分を分析し抽出することができる。
fig1
図1.1 プリズムによる光の周波数分析

 音は、空気中を縦波として伝搬している。図1.2のように、コップに水を入れた場合、水の深さにより音の高さが異なることを経験する。これは、音の高さ(周波数)が、片端点開放の管では、4分の1波長分が基本モードの共振が生じるからである。この基本モードの共振周波数は、以下の式で計算される。
 基本モードの共振周波数 = 音速 / 1波長
             = 音速 / (4*管の長さ)   (1−1)
fig2
図1.2 コップの水の深さと共振周波数の関係

 これより、同一の温度では音速は一定であるから、管の共振周波数は、管の長さに反比例することになり、長い管の共振周波数は低く、短い管の共振周波数は高くなることが分かる。
 さらに、第2モードの共振周波数は、4分の3波長分が共振周波数になり、第3モードの共振周波数は、4分の5波長分が共振周波数となる。すなわち、第k番目のモードの共振周波数では、4分の(2k−1)波長分が共振周波数となる。
 例えば、音速を320m/秒、管の長さを16cmとすると、図1.3に示すように、基本モードの共振周波数は、320*100/(4*16)=500 Hzとなる。第2番目のモードの共振周波数は1500Hz、第3番目のモードの共振周波数は2500Hzとなり、さらに、第k番目のモードの共振周波数は1000*k−500Hzとなる。
 音声を生成する調音器官も、コップと同様に、図1.4に示すように、唇を開放端、舌による狭めの位置を閉鎖端とする管であると、近似的に考えることができる。このため、コップの中の水の量により音の高さが変わるように、舌による狭めの位置により、音の高さが変わることになる。このため、一般的に言えば、後舌母音では共振周波数が低く、前舌母音では共振周波数が高くなることになる。
 以上のことから、被爆の危険があるX線等を使用しないで、音声波形だけを用いて周波数分析することにより、調音器官による共振周波数を測定することができ、その結果から舌の狭めの位置(調音位置)を、間接的に計測する音声分析の基本概念を理解することができる。
fig3
図1.3 管の共鳴モードと周波数

fig4
図1.4 調音器官における狭めの位置と共鳴周波数の関係


 1.2 音の物理的性質
  空気中を伝搬する縦波の音は、マイクロフォンにより電気信号に変換され、図1.5のように、時間軸と振幅軸で表現される。この音は、大きさ、高さ、音色、持続時間で表現される。  このとき、1波長分の時間を周期(単位s、秒)と呼び、周波数(単位Hz、ヘルツ)と周期の関係は次式で表現できる。
      周波数 = 1 / 周期     (1−2)
fig5
図1.5 周波数40Hzと振幅10の時間波形の例

 図1.5の例では、1周期波長が25msであるので、周波数は40Hzとなる。また、位相(phase)が45度遅れた波形との関係は、図1.6のようになる。さらに、図1.5と比較して振幅が10分の1で周波数が10倍(周期が10分の1)の400Hzの波形は、図1.7のようになる。
 実際の音は、異なる周波数の波の合成で表現され、図1.8(a)の例では、図1.5に示した振幅が10の大きさを持つ周波数40Hzの音と、図1.7に示した振幅1の大きさを持つ周波数400Hzの音の合成波形の例である。また、この合成波形を周波数分析すると、図1.8(b)のように、2本の線スペクトルで表現される。このように、時間領域の波形では合成波形の成分を分解することが困難であるが、周波数領域のスペクトルでは、合成波形の成分を分解することができることが容易に理解できる。
fig6
図1.6 45゜位相差のある時間波形の例

fig7
図1.7 周波数400Hzと振幅1の時間波形の例

fig8
図1.8 合成音の(a)時間波形と(b)スペクトルの例


 1.3 音の物理量

 音の大きさは、dB(デシベル)で表せる。このデシは、体積を表すdl(デシリットル)とl(リットル)の関係と同様に、1B=10dBであり、dBを使うことにより、音の大きさを整数の値であらわすことができる。

  音の大きさ(dB)=10log10(音の大きさの比)  (1−3)

音の大きさの比常用対数音の大きさの単位
1倍0dB
10倍10dB
100倍20dB
1000倍30dB
0.1倍−1−10dB

 騒音計により音の大きさを表す場合には、dB(A)、dB(B)、dB(C)の様に、騒音形の周波数特性を表す併せて記述する様になっている。このため、従来の騒音を表す単位のホーン(phone)は現在では用いない。
 音の高さを表す単位には、周波数をあらわすHz(ヘルツ)という物理的尺度の単位が用いられる。また、音の高さを聴覚的尺度では、ピッチ(pitch)と呼び、mel(メル)の単位が用いられる。このメル尺度は、対数尺度のように、低い周波数では間隔が狭く、高い周波数では間隔が広くなる尺度である。
 音声研究者が、声帯の振動周波数である基本周波数の術語を、ピッチ周波数と呼ぶことがあるが、これは狭い意味でのピッチ周波数のことであり、ピッチ周波数には音の高さの聴覚的尺度という本来の意味があるので、注意して使用する必要がある。
物理尺度感覚尺度
音の高さ周波数ピッチ
単位HzMel

Copyright (c) 1993-1997 Jouji Miwa. All rights reserved.
Mailto: www@sp.cis.iwate-u.ac.jp