この記事は約3分で読めます
音声合成をつくりたい
タイトルの通りです。
突然日本語の合成音声をつくりたいと思った…
これは神が作れと言っています(要出典)
とりあえずやりたいこと決める
- やりたいこと 普通の合成音声ではありきたりでつまらないので、祖国山口の山口弁アクセントでつくりたい
最終目標
- 完成した合成音声を誰でも使えるものにする
- 完成した合成音声をつかった動画をあげる
まず、山口弁で作る前に標準語で試作品を作ろうと思う
ということで日本語の音素について調べていきます。
日本語は5つの母音と16つの子音がある(Wikipedia)
…らしいのですがこれでは自然な合成音声をつくるのには足りません。厳密には下のようなもっと細かい音に分けられます!
母音:/a,i,u,e,o/
基本の子音:/k,g,s,z,t,d,n,h,b,p,m,r,j,w/
規則に従わない偏屈ども:/ts,tɕ,dʑ,ʃ,ç,ɸ,m,n,ŋ,ɲ,ɰ̃,ɴ/
(学説によって変わることがあります)
細かくわけられる音の有名な例を挙げると"ん"の音があります。上の音素群の下の「規則に従わ(ry」のmからɴは全て"ん"なんですよ…これを普段皆さんは意識せずに使い分けているんですね。
このように音は違うんだけど区別をしないことを音声学では同化(assimilation)といいます。
合成音声では、自然な音声にするために、この同化の音を規則に沿って変える必要があります。
で、ここで話が少し変わります(上で話したことも一応関連します。)
英語やフランス語と違って、日本語の読み方は規則的に見えますよね。「日本語と違って規則的に読めない英語なんか嫌いだ!」って人もいるように日本語のひらがなは規則的に見えます(漢字は論外)
これだけ言えば察せると思いますが
日本語にも読みの例外があるんです!
とりあえず「公園」という単語を何も考えず声に出して読んでみてください。
ほとんどの方がこーえんと読んだと思います。
これが日本語の読みの例外です!
いくつか例を挙げてみましょう。
ouが「おー」
王国(おーこく)、連邦(れんぽー)
ooも「おー」
大きい(おーきい)、大分(おーいた)
iiは「いー」
いい(いー)、贔屓(ひーき)
uuは「うー」
有声(ゆーせい)、空気(くーき)
eiが「えー」
映画館(えーがかん)、計算(けーさん)
などです!
基本的には規則に沿うのでわかりやすいですね。
ただこの法則には落とし穴もあって、例えばeiはえーになるというルールがありますが魚のエイはえーと読みません。このように例外の例外もあるのです(めんどくさい)これは合成音声をつくる上で一つの壁になります。
これを解決するには形態素解析(後の記事で解説)するか、割り切って使用者に例外的に直してもらうの2択があります。
今回の試作品は、試作なのでつくりを簡単にするために後者の手を取ります!
ここでいざ試作品をつくろう!と思ったのですが学校の課題が終わっていない(おいこら)のに気づいたのと、日本語のアクセントについて解説できていないため、それは次の記事に回します。
少しでもこの記事があなたの創作に役立てば幸いです。
それではまた次の記事で会いましょう
ĝis revido!
人気順のコメント(0)