2020年3月16日月曜日

テキストスピーチ(音声合成)の利用

定時放送に使用する音声ファイルを作るには、通常はメッセージを読み上げるアナウンスサーが必要です。しかし身近にアナウンスのできる人が居なかったり、外国語のアナウンスが必要で対応できる人が居ない場合などは、専門の業者に頼まなければなりません。
このようなときに代替の方法とした利用できるのがテキストスピーチです。テキストスピーチとはテキストファイルに書かれた内容をコンピュータによる音声合成を用いて読み上げる機能です。
テキストファイルには日本語の場合は通常の漢字かな混じりの文章を入力すればコンピュータが発音を解析して日本語として話します。またテキストが英語で書かれていれば英語として話します。
最近は技術も発達しコンピュータによるテキストスピーチも抑揚や強弱などが自然な話し方に近くなり、人の話と区別が付けられないようなものも販売されています。ただし、これらの高機能なソフトウェアはとても高価です。
しかしながら、そのような高機能を望まないのであれば、Windowsに標準で備わっているテキストスピーチ機能を利用することができます。Windows標準のテキストスピーチ機能は多少発音に不自然さは残りますが、場合によっては利用価値のあるものです。
とくに英語の場合はほとんど自然に聞こえます。また日本語の場合でも、音声合成マークアップ言語(SSML)を使用して発生を自然に近づけることができるようになっています。

放送小僧によるテキストスピーチ

「0円でできる定時放送の自動化(2)放送小僧編」で利用したソフトウェア「放送アシスト 放送小僧」はテキストスピーチにも対応しています。
「放送アシスト 放送小僧」は株式会社メイプルソフト社が提供するフリーソフトです。メイプルソフト社は本格的な定時放送システムである「日課放送システム 放送名人」を販売する会社ですが、タスクスケジューラを利用した簡単な日課放送のために無償の「放送小僧」も提供しています。「放送小僧」は音楽などのメディアファイルも演奏できますが、テキストファイルを読み上げるテキストスピーチにも対応しています。

テキストスピーチの改善

テキストスピーチはテキストをそのまま読み上げることができますが、発音や抑揚、読み上げ速度、読み上げる声などを指示したい場合があります。そのような場合に利用するのが音声合成マークアップ言語 (SSML) です。
音声合成マークアップ言語 (SSML) は、プレーンなテキストの部分部分にピッチ、読み方、読み上げ速度、音量などをマークアップしXMLファイルとして保存したものです。
XMLファイルもテキストファイルなのでメモ帳などでも編集できるのですが、GUIで編集できるツールを利用するほうが簡単です。
編集ツールとしては株式会社メイプルソフト社が提供するフリーソフト「スピーチエディタ」が便利です。
「スピーチエディタ」が生成する音声合成マークアップファイルは「放送小僧」でも再生できます。

0 件のコメント:

コメントを投稿