【思考実験】日本語full連続音・CVVC構想【机上の空論】

日本語full連続音・CVVC構想


動機・目的・免責

日本語のほとんどのパターンは[-V][-C][CV][VC][VV][V-]の6種類のパターンで表現でき,従来の連続音およびCVVCはこれらを網羅する形で収録する
([V-]については収録しない場合が多く,切り出し式のCVVCの場合[-C]は存在しないが概ねこの形に当てはまる)
しかし無声化など,書き文字で意識しない発声も含めると日本語にも[CC][C-]のパターンが多少なりと存在することがわかる.

本実験では,多国語の録音リストに倣う形で日本における[CC][C-]を網羅するリストの作成を目的とする.

なお本実験で公開するリストでの収録はオススメしない.
fullリストよりstandardリストの方が収録量的等の問題で安定する場合が多いと考えられるからである.

本実験で公開している録音リストに不備があったとしても,筆者はこれを修正する責任を負わない.
また本実験で公開している録音リストを用いた音源の原音設定は原則として請け負わない.


無声化のバリエーション

本実験で参考にしたサイトに基づき,日本語のstandardリストに含まれている子音から無声化する子音を抽出したものが以下の12種類
C=k,ky,s,sh,t,ty,ts,ch,hy,f,p,py

続くCVについては,参考サイトに規則らしきものが載っているものの,調声晒しなどを参考にすると必ずしも上記の規則が正しいとは言い切れないと考えられる.
有意な規則の選定ができないので,不要なものもあることが予想されるがCVについてはstandardリストにあるものすべてを対象にする.


収録例

[CCV]及び[CC]にあたる音については,他の1モーラと同様1拍分の長さで収録する(例の1-3)

[V C-]にあたる音については,他の語尾音と同様に,末尾にごく短い時間発音する(例の2-3)

収録例[tmbox]


連続音音源の仕様

エイリアスのパターンは以下の7種類(太字がstandardリストにないもの)
[- V]…[- あ][- い]など
[V V]…[a い][e お]など
[- CV]…[- た][- にゃ]など
[V CV]…[a か][e さ]など
[V R]…[a R][e R]など
[C CV]…[s か][ky ちゃ]など
[V CR]…[a sR][i pR]など

原音設定の例は以下の通り
[CCV]の設定例(s かの場合)




左ブランク:1つ目のCの上に設定
オーバーラップ:1つ目のCの上に設定(先行発声の1/3程度の値にする)
先行発声:Vの頭に設定
固定範囲:Vの安定部分
右ブランク:Vの安定部分

[V CR]の設定例(u sRの場合)



左ブランク:Vの上
オーバーラップ:Vの上(先行発声の1/3程度にする)
先行発声:Cの頭
固定範囲:Cの後の無音部
右ブランク:Cの後の無音部


CVVCの仕様

エイリアスのパターンは以下の7種類(太字がstandardリストにないもの)
[- V]…[- あ][- い]など
[V V]…[a い][e お]など
[CV]…[た][にゃ]など
[VC]…[a k][e s]など
[V R]…[a R][e R]など
[C C]…[s k][ky ch]など
[V CR]…[a sR][i pR]など

原音設定の例は以下の通り
[CCV]の設定例(k sの場合)

左ブランク:1つ目のCの上に設定
オーバーラップ:1つ目のCの上に設定(先行発声の1/3程度の値にする)
先行発声:2つ目のCの頭に設定
固定範囲:2つ目のCの安定部分
右ブランク:2つ目のCの安定部分


録音リスト

7mora_exリスト[media fire]

最初から録音する場合に用いる7モーラ連続音のfullリスト.
収録量は約740ファイルで通常連続音の4倍程度
ちえPBGMのbpm120を用いた場合理論的な収録時間は160分程度だが,通常のリストに比べて圧倒的に読みにくいので,その倍程度時間がかかると予想する.

7mora_addリスト[media_fire]

既存の連続音リストに音を追加する場合に用いる7モーラリスト.
最適化の関係で6モーラ箇所が多く,exリストと収録量はあまりかわらない.
収録量は約700ファイルで通常連続音の3.8倍程度
あまり作り込んでいないので抜け漏れがある可能性が高い

デルタ式7モーラ母音優先CVVC+CCリスト[Media fire]

最初から録音する場合に用いる7モーラCVVCのfullリスト.
収録量は約170ファイルで通常連続音と同程度.
ちえPBGMのbpm120を用いて収録した場合理論的な収録時間は40分程度.連続音リストに比べると音の並びが単純なので,1.5倍程度の60分で収録が可能だと予想する.


あとがき

録る人がいないというか録れる人がいないと思いますが,万が一録音に成功したら一応興味あるので教えてくれるとうれしいです.