2014/12/12

ささらはラッパーの夢を見る(1) -Matlab版World使ってみた

【デモ】
ここに女声(Cevio さとうささら)の音声があります。



この声のイントネーションを 別の声(Cevio タカハシ)に近い感じに変換します。



変換後の音声がこれです。

ささらさんの声が、
あ→い→う→え→お→、から、あ↓い↓う↑え↑お↓、という感じになりました。


【はじめに】
女声ラップが圧倒的に不足していると感じる今日このごろ。

ないなら作ってしまえば良いというDIY精神のもとに、
Cevioさんで頑張ることにしました。

Cevioにはしゃべり声合成機能が付いているので、
それを使えばラップが出来そうなのですが、
イントネーションの調節がめんどくさいという問題点があります。

ソングトラックなら、XMLを直接書き換えるという裏技ができるのですが、
トークトラックは、基準の音高に対してどうずらすかということしか、
ファイルに記録されていないのでできません。

さて、どうするか。
Cevioの外側で補正すればよいじゃないか。

ということで、
Cevioで音声合成->どうにかピッチを修正してイントネーションを直す
->うれしい

【シリーズ目標】
・Cevioを使った女声ラップ曲のボーカルトラックを作成する
・Cevioでイントネーションの調節を頑張らない。外側の変換器で頑張る。

 【実装】
山梨大の森勢先生が開発した
WORLDという音声分析変換合成システムを使用しました。
UTAUの合成エンジンや、Cevioの分析エンジンにも使われているそうです。

修正BSDライセンスでmatlab版とC言語版が公開されています。

ちなみに類似のものとして、STRAIGHTというものもあります。
音質やライセンス等を考慮して選ぶと良いと思います。

matlab版が公開されていたり、ライセンスが緩めで好みだという2点の理由から
とりあえず、WORLDと戯れてみようと思います。

で、戯れた結果が最初の音声になります。

コードはこちら。

いと、シンプル。


【次回の課題】
・実際の音声に対して適用するとどうなるか

0 件のコメント:

コメントを投稿