英語CVVCについて勉強してみたからまとめる

とりあえずザクザク書いてあとで体裁調えます.しばらくお待ちください.


まずはこちら.英語CVVCについて解説のあるページ
https://sites.google.com/site/cvvcenglishusts/reclists


ざっくり訳すと
LITEリスト
・録音量が最も少ない
・子音の結合はCCで行う
#UTAUのresamplerのノーマライズの仕様的にこれはイマイチだよね
・ustの分割量が増えるしエンベロープとか調声がエクストラモード

FULLリスト ("Cdra-Style"または "Stringed")
・録音量が多い
・CCV等の採用により子音だけの音が存在しない
・原音設定は一番時間がかかる
・もしかしたら完璧なリストではないかも?

FULLリスト ("Cz-Style" または"Unstringed")
・原音設定の手間を減らす為にCdraさんのFULLリストよりさらに収録量が多い
・使いやすい




操作性の問題はどうせ2年以内ぐらいにpresampでパスしちゃうので,収録量が一番マシなLITEリストをDLしてみた.
https://www.box.com/s/h5cnhain57gvcnp8hsru

まずそもそも読めない.
付属のガイドを見てみたけどピンとこない.
https://app.box.com/s/5lit0pbha1yzdb3pw0em

辞書サイトとwikipediaを行ったり来たりした結果
母音
[ファイル名=X-SAMPA]
a=O ("あ"と"お"の間ぐらいの音)
e=e (日本語とほぼ同じ"え")
i=i (日本語の”い”より口を横に開く感じ)
o=U (日本語よりあいまいな"う")
u=@ (曖昧母音)
A=ei
E=I (日本語より口を開き気味な"い")
I=ai
O=ou
U=ju (jは日本語で言うところの「や行」"ゆ"に近い音)
@={ ("え"と"あ"の間の音)
6=u (口を丸めて日本語よりはっきり発音する"う")
3=3 (birdのir 日本語よりあいまいな"あ")
Q=Oi
8=au
9=au (人によってはauの発音が2種類あるらしいです.無視しました)
&={ (n終わりの前の鼻にかかったようなae)
1=i (ingの時に出てくる鼻にかかったi)

子音
b=b (ば行)
d=d (だ行)
f=f (ふぁ行.日本語のふぁ行は口を横に開くφ.こちらはろうそくの火を消すように息を吹く音)
g=g(が行)
h=h(日本語で言うと"はへほ")
j=Z (じゃ行.舌ははじかない)
k=k (か行)
k'=k' (きゃ行)
l=l (ら行.舌を上歯茎の裏につける)
m=m (ま行.単体では口を閉じる"ん"に近い音.m-)
n=n (な行.こっちは口を閉じない"ん")
ng=N (鼻濁音.gは発音しない)
p=p (ぱ行)
r=r\ (ら行.舌はどこにも当てない.いわゆる巻き舌とは違う音)
s=s (さ行)
t=t  (た行)
t'=t' (てゃ行)
v=v (ヴぁ行.口の形はfと同じ)
w=w (うぁ(わ)行)
y=j (いぁ(や)行)
z=z (ざ行)
zh=dZ (ぢゃ行.日本語で意識せずにじゃ行を言うとこっちになるはず)
ch=tS (ちゃ行)
sh=S (しゃ行)
th=T (さ行. 舌を歯の裏につける)
tth=D (ざ行. 舌を歯の裏につける)
wh=W (whatとかで使う…地方もあるらしい.ほわ行.読めない)
dd=4 (ほぼ日本語のら行. watterを"わら"みたいな発音するときに使うら行の音)



細かい発音は
http://ja.wikipedia.org/wiki/X-SAMPA
でX=SAMPAと発音記号の対応を調べて

http://www.rondely.com/zakkaya/hatu/boin.htm
こっちで学べそう





さて.発音が分かったところで実際に読んでみよう
_39@93U_
_gAgEgIgOgU
_n&n6n3nQn8n

まったく惜しいところまで読める気配さえない.
1つも噛まずに録れないような無理げーが続く続く約230回.



このリストは日本人が録るには以下の3点が難しいと思われる.
・表記になじみが無くてそもそも何を発音すればいいのかわからない.
・気を使わないと発音できないような音が1つのwavの中で連発する.
・子音を優先したリストであるため,慣れない発音の母音が満足にクロスフェードするかわからない.


ここら辺の兼ね合いから
1.表記をなじみ深い物に書き換える(筆者の場合X-SAMPAがわかりやすいのでそれを採用)
2.日本語CVVCのeve式のように同じ発音を連続する2,3モーラ程度の長さにする
3.リストの順番は母音のクロスフェードを考慮して同じ母音を連続して録れるようにする.

加えて言えばこのリストでは二重母音も通常の母音通りすべて録音しているが
[bau][ug]のようなエイリアスの分け方は右側固定範囲がない関係でいまいちだし,
ノートを分割することによる調声上のめんどくささは将来的になんとかすればいいから
[ba][au][ug]みたいな音の並びを採用することでさらに軽量化したい.

このポリシーに従い、ゆ鳥さん(@calli426)作がFULLリストを基に作成してるリスト(http://blog-imgs-66.fc2.com/4/2/6/426calli/yutori-english-eve.txt)を参考にしつつ作成したリストがコチラ

https://www.dropbox.com/s/sbldq5hreguu5jj/eng_list.txt

windowsでは大文字と小文字をファイル名で区別できないので,X=SAMPAで大文字になる部分は+で補っている.

1小節録音,1小節インターバル
bpm120で録音して1度もリテイクしなければ約40分.実際はリテイクが大量に出ると思われるので,この3~5倍ぐらいの時間で収録できると思われる.

4時間以上かかるともっぱら噂のFULLリストの収録を思えばまだましなのではないだろうか.


現時点で謎な点
・Wは録る必要あるの?
wikipediaによると南部アメリカで使われてる発音らしい.TLの英語わかる人達を見てる感じでは,Wはピンとこないらしい.

・日本語ではh音は続く子音によってC等に変化してしまうけど英語的にはどうなの?
日本語ではh(はへほ),C(ひゃ行),φ(ふぁ行)という感じに発音が分かれてるけど,英語の場合は?





今後の展望
・操作性の悪さ的な意味で英語音源が普及するのはまだまだ現実的ではないと思っている.
・日本人が収録するという前提なら,気取ってエイリアスを分けまくってもどうせ発音し分けれないパターンが増えそうなので,ジャパニーズイングリッシュ上等路線で,さらに収録量を減らした妥協点を見つけれたら面白そうだなとか