音声読み上げソフトはゲームの会話パートに使えるのか?

  • このエントリーをはてなブックマークに追加

■今回のテーマ

音声読み上げソフトはゲームの会話パートに使えるのか?

ゲーム開発者なら誰しもボイスを付けたい、と思ったことはあると思います。
しかし当然ながら声優さんに頼むとすると
・金銭面の問題
・依頼の仕方がわからない
・台本の用意が大変
など、超えなければいけないハードルは高い。

なので、次に思い浮かぶのがAIによる自動読み上げソフトの利用です。
ただ、今までは読み上げソフトだとどうしても不自然で違和感が目立つものが多い印象でしたが、
「ホントに使えそう」と思えるレベルのモノが出たので思い切って買ってみたので
unity1weekという一週間でゲームを作るイベントで使用してみました。

使ったツール↓

VOICEPEAK

 

■実際の作品

コレです。

unityroom [見習い忍者は脱出したい]

ボス出現前イベントやエンディングなども作っていたのですが、
難易度調整ミスって多分誰もクリアできていないので見れてません(笑)

実は製作期間の3分の2以上が謎のエラーとの戦いだったので、
本編は全然作りこめていないので内容は期待しないでください。

 

■周囲からの反応

読み上げソフトでこんなにも自然に会話できるのか、と驚いてもらえました。
(上記のイベントに出したおかげで色々とリアクションを貰えて助かります)

本来は読み上げのアクセントやイントネーションまで調整できる機能があるのですが、
正直このイベントは一週間しか制作期間がないこともあり、あまり調整しきれていない部分もありました。

調整しきれていない部分については違和感があるという意見もいただいたのですが、
よりパラメータを理解して作りこめばさらに違和感なく使いこなせるようになるかもしれないという可能性も感じました。

 

■ゲーム制作における使い勝手について

使う前に気になっていたのは、
・7種の声を選択できるが、キャラのイメージにあるモノが無かったらどうしよう
・他の人も同じツールを使っていたら、イメージが被ってしまうのでは?

という点でした。
それについてはパラメータの調整次第でかなり改善できることがわかりました。

今回のキャラは二人。
イメージとしては、
「元気いっぱいだけど弱い弟子」を
「クールでテンションが低い師匠」が鍛える話。
なので、それに合わせたキャラの声を作っていきます。

■いじれるパラメータについて

ボイスピは
・声の選択(女性1~3、男性1~3、女の子の七種)
・速さ、ピッチ、ポーズ、音量
・感情(幸せ、楽しみ、怒り、悲しみ)
・アクセント、イントネーション、長さ
などを組み合わせて声の調整を行います。

通常、声の選択で演じる声優さんが変われば別のキャラの声として使えますが、
それだけではなく、同じ声優さんでも感情パラメータの調整次第で別人になりうるパターンもありました。

まずは師匠の設定。
無調整と調整後の声、さらには別パターンの比較動画です↓

この三種類の声、全部同じ声優さんのボイスですが
完成版と別パターン版で別のキャラとして使えるくらいに特徴がわかれていると思います。

■調整内容(1キャラ目)

声のイメージというより、性格から来る喋り方のイメージに合わせた演技をさせるのが最優先でした。
なので、元の無調整版から

・テンションが低いタイプ(暗いトーンのしゃべり方)
→ピッチを下げる
・厳しく鍛えようという感情もある
→怒りパラメータを上げる
・しかし、ただ厳しいだけじゃなく弟子を慮る面もある
→楽しみパラメータ少し上げて柔らかくする
・弟子の態度に対する困りと呆れも入れる
→悲しみパラメータも少し上げる

という調整を入れて、
上記をベースのプリセットとして登録し、
感情を変えた演技をする際には上記パラメータから足し引きすることで
キャラの個性と演技を付けました。

実際の変化については下記tweet参照↓

今回の作品内では、キャラのイメージが壊れる程に声を変えなくても、
プリセットからある程度足し引きするだけで思った通りの演技をしてくれました。

■調整内容(2キャラ目)

次に弟子のボイス設定。
参考までに、無調整と調整後の声の比較動画です↓

素の状態で読み上げさせると子供感が強すぎて、武器を使って敵を倒すようなイメージが湧かないキャラになってしまいました。
なので、感情パラメータをいじる。

大まかに書きの通り↓
・ピッチを限界まで下げて子供っぽさを緩和
・怒りパラメータをMaxまで上げて力強さをプラス
・常に怒っていてもおかしいので「幸せ」と「楽しみ」のパラメータを上げて調整

結果として
ピッチ:-150
幸せ:40
楽しみ:30
怒り:100
をベースとして登録し、
感情を変えた演技をする際には上記パラメータから足し引きすることで
キャラの個性と演技を付けました。

しかし、この「女の子」のプリセットはかなり特徴的で、
ピッチをいじって別人にするのは難しかったです。

■その他の使い方

総合すると、実際には7種類の声だけではなくさらなるキャラ数の声を作れる可能性を秘めていると感じました。
さらには外部のツール(ボイスチェンジャーや波形エディタ)と組み合わせることで、さらにバリエーションを出せました。

動画(Twitter)

この動画の
・電車発車前のアナウンス
・電車内でのアナウンス
の二つ。
ボイスチェンジャーで声の質を変えて、さらにはAdobe Auditionで音響効果を加えて空気感の表現や雰囲気を変えました。

実例はこちら↓

あとは、SFチックな武器の変形をする際の起動音声など。

こういう感情の無い読み上げは物凄く相性が良い。

■まとめ

・シナリオパートの会話劇にもある程度対応できる。(実際の作品参照)
・しかしながら完全に違和感のないイントネーションなどの調整は必須でかなり時間がかかるため、慣れが必要。
・オリジナリティを出そうとすると外部ツールでの調整も必要。
・一番簡単で相性がよいのは、SF系のアナウンス音声に使うのが無難。

以上、使用してみた感想レポートでした。
これからボイスピを使ってみようか迷っている人の助けになれば幸いです。

  • このエントリーをはてなブックマークに追加

コメントを残す

*