ヴォーカルシンセ音源AI革命
コロナ禍渦巻く少し前、NHKの特番でVOCALOID:AI 美空ひばりを目の当たりにした時、ボカロもいよいよ人の代役が務まるレベルに手が届くところまで来たかと感慨深く思ったわけですが、そんなわけで今日はDNN(ディープニューラルネットワーク)音声合成なるAI技術で飛躍的な進化を遂げた新世代ヴォーカルシンセについてざっと触れてみたいと思います。
基本的なことは⇨AI音源技術(ヤマハ)
NEUTRINOの衝撃
2020年、NEUTRINOというフリーソフト(Mac、Windows、オンライン対応)が公開されたことでいよいよ時代が動き出します。
これはあくまで変換ソフトなのですが、音符の一つ一つをニューラルネットワークを介して最適な発声となる音声合成を導き出して歌唱を生成するというもので、これによって従来タイプとはまるで比較にならないかなり人間らしい歌唱データが生成されます。
あらかじめ楽譜作成ソフトなどを使って歌詞付きのメロディデータ(.musicxml等)を用意しなければならず、設定書類を書き換えつつコマンドラインで実行するという一般人にはちょっと取っ付きにくい代物ですが、ボイスも多数用意されてますし、非公認ながらWindows用編集ツールもあるようなので、いろいろ使いこなせれば十分有用なツールだと思います。
これからの主流は...
NEUTRINO登場からしばらくすると市販のCeVIOとSynthesizer VがこのAIに対応し、一般向けの制作編集環境も充実します。
現状CeVIOはWindows専用なのに対し、まだ駆け出しのSynthesizer VはMacやオンラインにも対応しており、またSynthesizer V Studio Basicというフリーの高機能で軽快なエディタと試用限定のLite版ボイスが複数用意されている実にありがたいツール。市販のPro版はスクリプト対応で様々なカスタマイズが可能だったり細かい機能も充実し、音楽制作ソフト上でプラグイン動作可能と使い勝手が断然良いのですが、Basic版でも必要十分な機能が揃っていてとにかく手軽にじっくりと試せるので、興味のある方はぜひとも使ってみてください。
ちなみに性能的にはいずれも概ね同等ですが、自動的に適当な部分にブレス(息継ぎ)音が入るCeVIOの方が手軽には仕上げやすそう。まぁSynthesizer Vも任意にブレスを差し込めるのでむしろ自由度は高いですけどね。
なお、CeVIOも次世代ヴァージョンCeVIO Pro(仮)でMacにも対応予定だそうです。
選択肢はボイス次第
Mac遣いということもあって自然にSynthesizer V Studio Proへと食指が伸びましたが、それ以前にやはり準備されているボイスの質やバリエーションが重要です。
ちなみに従来タイプとAI用とではボイスに互換性がないので注意が必要ですが、その辺のラインナップを見ると、CeVIOはどうもオタ向けのクセの強いアニメ、ロリ系の女声ばかりな現状で、これでは選択の余地もなく。。その点Synthesizer Vの”AI Saki”というそこそこ幅が持てそうな弱ハスキーなナチュラルボイスがあるし、つい先日、希少な男声も日本語の”AI Ryo”と英語の”AI Kevin”が追加されたことでアドバンテージが広がるばかりです。
ともかくこの分野もここまでクオリティ上がってるのだから、本気で人の代わりに使えるようなカッコイイ大人なボイスを充実させて欲しいし、また男声の拡充にも期待したいところです。
コメント
コメントを投稿