【UTAU】単独音の原音設定やってみた【原音設定講座】の解説

はじめに

この文章は下記の動画のための解説記事です.あわせてご覧ください.

テロップ速すぎてごめんなさい.

またこの記事には予備知識が必要です.下記の記事を先に読むことをお勧めします.
原音設定関係のあれこれ


事前準備

用意するソフト

・setParam 配布先
#動画で使ってるversionにこだわらず最新版を使うのがいいと思います.
#定期的に更新されてるようなので,原音設定を始める前にまず最新版の確認を

初期設定

1.ウインドウを画面の横一杯まで広げる.
2.「横軸の拡大」から常に「wav全体を表示する」を選択する.
#作業効率の問題です.画面をスクロールさせるとその分スピードが遅くなるので.
#倍率が高い方がより正確に設定できるかもしれませんが,今のところこの精度で充分だと思ってます.



3.少なくとも波形を表示とスペクトルを表示にチェックマークをつける.
#パワーとF0は必須ではありません.PCのスペックと相談で

4.先行発声・左ブランクの扱いを設定





先行発声は"他のパラメータと相対関係を保つ"
左ブランクは"他のパラメータと独立"
です.

5."オーバーラップを負の値にしても良い"のチェックを外す.
#必須ではありませんがこっちの方が作業効率がいいです.
#左ブランクでオーバーラップを押し出して設定できるので1動作減ります.
#1クリック1秒だとして,音素数を考えると約3分の節約です.こだわるかは微妙なラインか

6."発生タイミング補正モード"をチェックする.

7.右ブランク値の表現方法



正の値で設定するとファイル末尾からの時間(他のパラメータに依存しない)
負の値にすると左ブランクからの時間(左ブランクに依存)
となります.
単独音の設定だけならどっちでもいいです.



設定1 自動推定(0:17~)

自動推定の設定の変更方法はよくわかってないのですが,とりあえずデフォルトの設定でもある程度信用できるのは先行発声右ブランクです.
この値にだけチェックをつけて自動推定を掛けます.
自分のPCのスペックでOREMO同梱単独音リストの自動推定が約2分.
#今回はsetParam講座なのでsetParamで推定しましたが,UTAUで推定したら10秒で終わります.
#特にこだわりがないなら,自動推定だけでもUTAUでやったほうが幸せになれると思います.
#UTAUでの自動推定の方法は次の記事で紹介します.



設定2 パラメータ入力(0:44~)

自動推定で入力していないパラメータ(左ブランク,固定範囲,オーバーラップ)の初期値を入力します.
自動推定の代わり,あくまであとで設定しなおすので適当なパラメータで大丈夫です.
目安は

左ブランク:音が始まる前でかつできるだけ音の始まりに近い位置.一括設定できるように50ms~100msぐらい余裕を見て設定する.
オーバーラップ:左ブランクとくっつきすぎると操作しにくいから値をばらすだけ.10ぐらいを入力.
固定範囲:オーバーラップ,左ブランク,先行発声の全てから離した値にすればいい.値は適当
#動画では適当にやりすぎて先行発声より左に来てしまっている.
#これはあんまりうれしくないので200ぐらいに設定したらいいのではないでしょうか.


設定3 先行発声(1:02~)

母音の頭をひたすらクリック.
着眼点はスペクトルです.波形の方ではありません.
着眼点はスペクトルです.波形の方ではありません.

着眼点はスペクトルです.波形の方ではありません.

次の音に移動するときはキーボードの矢印キー↓です.
タイミングに自信がなければF8ボタン.
#いちいち解説する気力は無いので,具体的にどこに合わせればいいのかは動画をご覧ください.
#問題なくUTAってくれる音源の原音設定を眺めるのもおすすめ


設定4 他のパラメータ入力(3:02~)

原音設定で一番かったるい部分です.
手順は
1.固定範囲を先行発声より後の安定してる場所に置く
2.左ブランクをドラッグしてオーバーラップを下記の位置まで移動.
3.そのまま左ブランクを下記の位置まで移動.
4.右ブランクを音の後ろから見て安定してる場所に置く
#マウスの移動距離が伸びると作業効率が下がるのでできるだけ右ブランクは触りたくないです.
#最悪でも,右ブランクが無音部分に来ないようにしましょう.

オーバーラップ

動画ではエイリアスが出てきた順に紹介してるので整理します.
#画像は無い.動画を見てください

・母音タイプ(あいうえおん)
フレーズの頭以外では母音結合するので,0で構わない.

・無声破裂音(か行,きゃ行,くぁ行,た行,ちゃ行,つぁ行,ぱ行,ぴゃ行,ぷぁ行)
左ブランクで子音の前の無音部分を残し,波形の頭から10ms~50ms程度離れたところにオーバーラップを置く(0でもいい)

・有声破裂音(が行,ぎゃ行,ぐぁ行,だ行,ば行,びゃ行,ぶぁ行(ヴぁ行))とら行
左ブランクと先行発声の1/3ぐらいの点
スペクトルの低音しか出ていない部分は切ってもそれっぽく聞こえるけど,切り落とさない

・さ行,しゃ行,すぁ行,ざ行,じゃ行,ずぁ行
左ブランクと先行発声の1/3ぐらいの点が基本
値を大きくしすぎると,フレーズ頭以外で使う時に違う音に聞こえる恐れがあるので,UTAU上で1回確認するとベター

・その他(な行,にゃ行,ぬぁ行,は行,ひゃ行,ふぁ行,ま行,みゃ行,むぁ行,や行(いぇ含む),うぁ行(わ含む))
左ブランクと先行発声の1/2ぐらいの点


設定5 他のパラメータ入力(9:00~)

#基本的にはやらなくても何とかなる設定です.

エイリアスの一括設定

単体の単独音でこの設定を行うメリットはあまりないのですが,後の拡張等を踏まえて設定しておきます.
エイリアスの一括設定から変換規則に「%m」と入力すればオッケーです.
ファイル名から自動でエイリアスが抽出されます.

母音結合用エイリアスの作成

エイリアスがユーザーごとに統一されていなかったり,UTAUデフォルトの母音結合機能で呼び出せなかったりと微妙に使いにくいのですが,N.H.P.の方針に従って設定しておきます.
エイリアスの複製はctrl+iです.

各パラメータは

左ブランク:音の頭から見て安定してる部分(だいたい元の設定値+100ぐらいでなんとかなります)
固定範囲:短め
右ブランク:いじらない
オーバーラップ:70~100ぐらい
先行発声:オーバーラップの半分

です.
値がほとんど決まっているので手打ちでオッケーです.

不足音素の補完

"を","ぢ","づ","ぢ行","づぁ行"の補完です.
これらの音素は収録されてたりされてなかったりするので,とりあえず補完しておきます.
これらの音素を使って調声してるustとの互換性が上昇します.
原音設定前に不足音素の補完をすると設定項目が増えるだけなので最後にしましょう.



おわりに

没テイク4回で収録完了しましたが,本当に普段単独音の原音設定を避けていることが身に染みる結果となりました.
自動推定の方法を見直したり,無駄な動きを減らしたらもう5分ぐらいは縮まる気はします.
今回はsetParam編なので意図的に他のソフトは使っていませんが,次回はUTAU編.
UTAU上だけではめんどくさい動作はテキストエディタなどを使って補ったりもする予定です.
乞うご期待