Language Education System for Japanese Speech Using On-demand and Network(LESSON/J)

Copyright (c) 1997 Jouji Miwa. All rights reserved.

三輪、熊谷、田、今石: オンデマンド・ネットワーク型日本語音声教育システムの構築、 電子情報通信学会・音声研究会技術報告、 Vol.97, No.114, SP97-17, pp.55-62 (June 1997).


オンデマンド・ネットワーク型
日本語音声教育システムの構築







三輪 譲二、熊谷 有香、田 嘉鵬(岩手大学 工学部)


今石 元久(広島女子大学 国際文化学部)






あらまし

マルチメディアパソコンとインターネットを用いて、 いつでもどこでもだれでも日本語音声教育を可能とすることを目指して、 オンデマンド・ネットワーク型日本語音声教育システム (LESSON/J: Language Education System for Japanese Speech using On-demand and Network) を、WWW上に構築した。

システムの特色


1.はじめに

 日本社会では国際化に向けて、貿易障壁をなくすためのに規制緩和が進められているが、 日本語による言語障壁をなくすために、日本語教育の充実も、 これからの国際化において重要な課題となっている。 このような観点から、国立国語研究所水谷修所長を中心に、 「国際社会における日本語についての総合的研究」 (略称:新プロ「日本語」)が平成6年度から開始され、精力的に研究[1]が行われている。

 しかし、日常会話の面からも日本語の音声教育の重要性は認識されているが、 日本における英語教育に類似して、
  1. 外国における日本語教師の母語が日本語でない場合があること、
  2. カリキュラム編成上音声教育の時間的配分が少ないこと、
  3. 音声教育教材が少なくまた高価であることなどの問題点があり、
日本語教育において音声教育が十分に行なわれていないのが実情である。

 ところで、ここ数年マルチメディア技術が進歩し、インターネットの普及に伴って、 パソコンを利用することによって、いつでも、どこでも、だれにでも、 比較的手軽で簡単に、世界中のマルチメディアのコンテンツを アクセスできる環境が整いつつある。  このため、昼夜を問わず「いつでも」、また, インターネットを経由して現地の学校や自宅等の場所を問わず「どこででも」、さらに、 安価で操作の簡単なパソコンを利用することにより、老若男女を問わず「だれにでも」、 日本語音声教育を可能とすることを目指して、 オンデマンド・ネットワーク型日本語音声教育システム (LESSON/J: Language Education System for Japanese Speech using On-demand and Network)を、WWW(Word Wide Web)上に構築し、公開したので報告する。

 本システムでは、ハイパーテキストマークアップ言語(HTML)を基本に構築しているので、 ネットスケープやインターネットエクスプローラ等のブラウザを利用することにより、 単音節、単語、文章の日本語音声を、インターネット上で簡単に何回でもアクセスして、 スピーカやヘッドホーンで直接聞くことができる。 また、Java言語[2]によりキーボード等からのイベント処理をすることにより、 独習向きに単語音声の聴取結果から書取テストをするディクテーション機能も 実現しており、さらに、ハイパーテキストの機能により、音声と音声分析結果を リンクすることによる音響特徴量の画像表示機能を有し、日本語音声の発声に役立てる 工夫をしている。 この他に、インターネットが使用できない利用者環境のために、 CD-ROMを配布媒体としてオフラインで利用することも考慮に入れている。

2.オンデマンド型システムの特徴

 構築したオンデマンド・ネットワーク型日本語音声教育システム (LESSON/J: Language Education System for Japanese Speech using On-demand and Network)では、 学習者のマルチメディアパソコンを、
  • (1)インターネットを経由して日本語音声教育WWWサーバに接続するオンライン利用と、
  • (2)日本語音声教育教材を格納したCD-ROMを挿入してオフライン利用により、
学習者の要求に応じてオンデマンドで効率的に日本語音声学習を実施することができる。

 なお、オンライン利用では、最新の日本語音声教育教材にいつでもアクセスできる利点を 持っているが、回線容量の細いネットワークでは、容量の大きいマルチメディア ファイルのアクセスに多くの時間を必要とする欠点を持っている。 逆に、オフライン利用では、容量の大きいマルチメディアファイルでも、 容易にアクセスできる長所を持っているが、 最新の教材を利用できないという欠点を持っている。 このため、両者を共用し相互の長所を生かした利用が望まれる。

 このように、学習者のパソコンを用いることにより、 図1のように、昼夜を問わず「いつでも」、また, 現地の学校や自宅等の場所を問わず「どこででも」、さらに、 操作の簡単なパソコンを利用することにより、老若男女を問わず「だれにでも」、 日本語音声教育を可能とすることができる。

 また、本システムでは、WWWハイパーテキストマークアップ言語(HTML)に基づいて構築しているので、 ネットスケープやインターネットエクスプローラ等のブラウザを利用することにより、 特定の応用プログラムを必要としないで、 単音節、単語、文章の日本語音声を、簡単に何回でもアクセスして、 スピーカやヘッドホーンで直接聞くことができる。


Fig.1
図1 時間帯に依存しないシステム利用形態の例

 特に、Java言語によりキーボード等からのイベント処理をすることにより、 独習向きに単語音声の聴取結果から書取テストをするディクテーション機能も 実現しており、さらに、ハイパーテキストの機能により、音声と音声分析結果を リンクすることによる音響特徴量の画像表示機能を有し、 日本語音声の発声に役立てる工夫をしている。

3.日本語音声教育教材

3.1 日本語音声教育教材の種類
 日本語音声教育システムでは、 図2の日本語音声教育のトップページに示すように、 以下のような4種類の日本語音声教育用の学習教材を構築した。
  • 50音節(音声、分析図形)
  • 120個の主要単語(音声、分析図形)
  • 30個の基本文型(音声、分析図形)
  • 30単語の書き取り学習(音声、絵画像)
 また、音声分析結果の理解を助けるための実験音声学や、 書き言葉のための日本語文法についても、若干の解説を加えると共に、 システム使用において想定される問題点等の解説も加えた。  この日本語音声教育教材で用いた音声データは、 できるだけ明瞭に聞こえるようにするため、 アナウンサーに依頼して作成した。
図2 日本語音声教育のトップページ


3.2 音節学習教材

 ひらがな、カタカナ、大小のローマ字と 単音節音声の対応を学習するため、 図3の様な「ひらがな文字と音節音声の学習ページ」等を作成した。  また、単母音とその音響分析結果の対応を理解するために、 また、ホルマント周波数の音響特徴を理解するため、 図4の「音節音声のLPC分析結果の例」のように、 INSAS/M[3]を用いて、音声パワースペクトルと共に、 基本周波数やホルマント周波数等の数値を表示できるようにした。

3.3 基本単語学習教材

 基本単語学習教材は、音声調査票で用いられている 120単語の音声を用いた。 ここでも、単語音声の提示の他に、音声分析結果の提示ができるようになっている。

3.4 基本文型学習教材

 文章音声の学習教材として、30個の基本文型の音声を準備した。 また、文章中の音素の時間構造を理解するため、 図5のように、文章音声のソナグラムによる音響分析も準備した。
図5 文章の音響分析例(これは桃です)

 また、図6の「フォーカスのある文章の分析結果例」のように、 「もも」にフォーカスをおいているため、単語音声の持続時間が長くなっていることを、 音響分析から結果から容易に理解することができる。  本システムで用いた日本語の文章音声学習のための 30個の基本文型を以下に示す。


3.5 日本語単語音声の書き取り学習

 日本語音声教育の独習用に、簡単な日本語単語音声の聞き取りによる書き取りテストが できる教材を、Java[2]を用いて作成した。
 Javaを用いて教材を作成した理由としては、以下の利点があげられる。
 書き取り学習教材は、図7に示すように、以下から構成される。
図7 日本語の書き取り学習の例

 日本語単語音声の聞き取りによる書き取りテストの方法について以下に説明する。 テストの実行を開始すると、ランダムな順序で、 日本語単語音声がスピーカから提示され、同時に、 画面にその単語を表す絵が表示されるので、その単語の名称をローマ字で入力フ ォームに入力するすると、それに対し正解か間違いかを判定し、メッセージ が出力フォームに出力され、さらに音でも判定結果を独習者に教える。 図7の例では、 "risu"または"RISU"と入力すれば正解となり、 それ以外が誤答となる。 また、ローマ字のつづりがわからない場合は、ヘルプのところをクリックすると ひらがなとローマ字の対応表を見ることでき、また、実際の音声を聞いて確認 できるようにもなっている。
 なお現在のJavaの仕様では、漢字入力をサポートしていないため、 ローマ字入力となっているが、 日本語教育を考えた場合、やはり、日本語入力が望ましいと思われる。
 ここで、Javaのプログラム(以後アプレットと呼ぶ)をプラウザ内で実行する には、HTMLファイルから < applet >タグを使って、アプレットを呼び出す。 さらに、< param >タグを使うことによって各種のパラメータを指定し、 アプレットに情報を渡すことができる。
 本アプレットには、パラメータは"gifdir"、"audir"、"name"、"correct"、"wrong" がある。"gifdir"は表示する絵のファイルがおいてあるディレクトリ名を値に持ち、 同様に"audir"は音のファイルがおいてあるディレクトリ名を 値に持つ。"name"は表示する絵のファイル名かつ名称を値として持ち、"correct"、 "wrong"はそれぞれ正解した時と間違った時に鳴らす音のファイル名を値として 持つ。 パラメータを変更することで、1つのプログラムで様々なファイルに対応する ことができるので、汎用性が高い特徴を持っている。


4.マルチディアファイルの作成

4.1 マルチメディアファイルのデータ形式

 日本語音声教育用の学習教材として今回作成したマルチメディアファイルには、 ハイパーテキストマークアップ言語のHTMLファイル、画像ファイル、音声ファイルの 3種類あり、現在は動画ファイルを含んでいない。  なお、各ファイルの総個数とその総データサイズを、 表1に示す。この表1から、画像ファイルは平均で約70kB、 音声ファイルは平均で約10kBであることがわかる。 一般に、公衆電話回線で、インターネットに接続する場合、 約3kB/sの転送速度であるので、音声データの転送に約4秒、 画像データの転送に約30秒の時間を要すことになり、音声データに関しては、 十分に許容できる範囲の時間であることが分かる。

表1 作成ファイルの総数とデータ形式
総数 サイズ
HTMLファイル 約200
画像ファイル(GIF) 約600約40MB
音声ファイル(AU) 約200 約2MB

 本システムは、CD-ROMにるオフライン利用と共に、 世界中のどこからでもインターネットを利用してアクセスできる オンライン利用も想定しているため、 ネットワークの転送速度が遅い場所でも、 容易にアクセスできるように、圧縮データ形式を検討する必要がある。  このため、画像データの形式としては、 8ビット、256色のGIF形式、音声データの形式としては、 8kHzサンプリング、対数伸縮8ビット量子化のAU(mu law)形式を用いた。
 GIF形式よりも圧縮アルゴリズムの優れたJPEG形式(24ビット、16万7000色)もあるが、 今回使用した画像の場合、ほとんどのデータは色数が8色前後で、JPEG形式の方が データサイズが大きくなる場合があったため、 今回はGIF形式に統一した。  また、音声のAU形式は、音質をあまり落とさずにデータサイズを小さくすることができ、 ディクテーション学習教材の作成に利用したJava言語が唯一対応した圧縮音声形式のため採用した。


4.2 学習教材の効率的作成

 学習教材を充実するためには、教材を効率よく作成することが重要である。 また、表1に示したように、学習教材として大量の音声データ、 音声分析図形、HTMLファイルが必要となるので、効率的に作成できる ことがますます重要になる。
 そこで、大量のファイルに対して一括して処理を行えるように、 シェルスクリプトを効果的に用いて、学習教材の作成を行った。  音声データは、以下の手順で作成した。 この音声データの変換、音声分析、分析結果切り取りに関して、 シェルスクリプトを用い処理を行った 。 シェルスクリプトを用いたことで大量の音声データに対して、 バッチ型で一括して処理を行うことができ、効率的に学習教材を作成することができた。


5.考察

 構築した日本語音声教育システムのサーバに対して、 公開した直後の1日のアクセス数を表2に示す。
表2 1日のアクセス数
アクセス数
日本国内 16
アメリカ 26
シンガポール 3
不明 24
HTMLファイル 37
画像ファイル(GIF) 13
音声ファイル(AU) 35

 まだ、運用実績のデータが少ないため、十分なことは言えないが、 音声データファイルに対して興味を示されており、 アクセスされていることが分かる。
 今後改良して行かなければならない点をあげれば以下のようになる。
6.まとめ

 いつでもとこでもだれにでも日本語音声教育を可能とすることを目指して、 オンデマンド・ネットワーク型日本語音声教育システム (LESSON/J: Language Education System for Japanese Speech using On-demand and Network)を、WWW(Word Wide Web)上に構築した。
 本システムでは、 50音節、 120個の主要単語、 30個の基本文型、 30単語の書き取り学習(マルチプラットホーム) の4種類の日本語音声教育用の学習教材を構築した。
 今後、学習教材を充実させ、改良を繰り返しながら、 学習意欲が増すような魅力のあるシステムへと、 さらに改良を加えて行く必要がある。

謝辞

 本研究の一部は,文部省科学研究費補助金・基盤研究(A)(今石代表、 08551007、マルチメディア対応の音声分析システム −東大「録聞見」・「INSASM」の改良と普及−)、 および、基盤研究(B)(三輪代表, 09558022, 高精度音声分析と音声CD−ROMを用いた 独習用対話型日本語音声教育システムの開発)によった。
 また、日本語音声教育用基本文型については,東京外国語大学鮎沢孝子教授、および、 国立国語研究所江川清部長に協力いただいた。 さらに、音声教材のアナウンサーデータの作成については、NHK放送研修センター 秋山和平室長にお世話になった。

 なお、本システムは以下のURLで公開している。
http://sp.cis.iwate-u.ac.jp/sp/lesson/j/

参考文献

  1. 鮎沢孝子編:21世紀の日本語音声教育に向けて, 新プロ「日本語」「音声言語の韻律特徴に関する実験的研究」平成8年度研究報告書 (Feb. 1997).

  2. Sun Microsystems, Inc. :Javaプログラミング講座, アスキー出版局,東京 (Oct. 1996)

  3. 三輪 譲二 :"パソコン音声処理",昭晃堂,(1991).

  4. 今石元久:日本語音声の実験的研究、和泉書院,大阪,(1997).

  5. Jouji Miwa: Interactive Visualization and Auralization of Speech Production Using Variable Vocal and Nasal Area Function, ASVA97, pp. 271-278 (Apr. 1997).

この文は、1997年6月19日開催の電子情報通信学会・音声研究会での発表論文を、 WEB用に書き換えたものである。

信学技報、Vol.97, No.114, SP97-17, pp.55-62 (June 1997).
戻る。
Mailto: webmaster