AI音声合成ソフトの紹介
後から見返しやすいように、まとめます。
発端のツイート
まえがき
書き物している方で 「自創作の朗読動画を作ってみたい!」って人を誑かす為の情報を勝手に並べ立てるよ (未来の自分の為にも)好きで小説書いたり、漫画書いたり、便箋作ったりしている同人よろずサークル(創作系)活動をしているのですが、一次創作の小説って短時間で紹介しづらいと思ってます。
読んでみなければ良さが分からない、でも読んでもらうのが大変。
考察している方が他にもいるので、多分どこの創作系サークルさんも同じかなぁと(本当の所は分からない)。
そして「朗読をしてもらいたい」「動画を作ってもらいたい」という人が一定数いることが見受けられたので、そんな方々を唆すために呟いたのが上記の「発端のツイート」。
動画ソフトも最近のパソコンだと標準で付属しているし、有名な無償ソフトも幾つかあります。
自分だとAviUtil(公式サイトと、使い方のサイト)使ってます。
動画だと気楽に見てくれる(聞いてくれる)人もいるし、文字だけよりは宣伝という意味での効果があります(自分のツイートで確認しました)。以前は「ホームページは24時間対応の営業」だと言われてたようですが、ホームページまで来てくれない方を誘引するのが動画の立ち位置かと思います。
「でも、動画作るのって大変」「動画を作るのはハードルが高い」
特に自分の創作関連は素材(イラスト、音楽、声など)を集めるのも大変だし、動画に仕上げるのも時間がかかってしまう。
小説を書く方だと「イラストを準備するのが苦手」な方もいると思います。
朗報です、朗読音声だけでも作れますよ。
最近はAI合成音声の界隈が熱く、普通の(パソコンのギークじゃない)方も扱いやすいGUIソフトが無償で公開されていたりします。
これって凄いことですよ!(開発援助の寄付/投げ銭もできる)
パソコンを持っていれば(Windowsでも、Macでも、Linuxでも)合成音声が試せる!
しかも無償から始められる!
敷居が低くなってるんですよー!
有償ソフトであれば、有名な結月ゆかりさん等がいます。こちらも凄いソフトです。
しかし高性能で凄いので、お値段もします(参考)。
買ったは良いけど使えるか分からない、なので敷居がちょいと高い。
もしかしたら宣伝に使えるかもしれないし、朗読してもらったら見直しが出来て引いては小説の品質は上がるかもしれない。
でも、買うお金が印刷費に回ってしまうwwwそんなもんです。
本題
「無償で始められる合成音声ソフトがあるんだな、じゃあ教えろ!」というわけで、自分が知っている情報でご紹介します。
※いずれも個人の方が開発されていますので、「もっと有償ソフトみたいにっ」と思われたら有償ソフトの購入も検討してみて下さい。
「初心者、簡単に始めたい」 「Mac、Linuxパソコン」
→VOICEVOX( voicevox.hiroshiba.jp )
「キャラに声あてして、規約は緩め」
→COEIROINK ( https://coeiroink.com/ )
「色々なキャラを使いたい、調整も細かくしたい」 「UTAUキャラいるかな?」
→TALQu( booth.pm/ja/items/27553 )
「PC古い」「デフォ子、ゆっくりボイスが使いたい」
→SofTalk(https://w.atwiki.jp/softalk/pages/1.html)
VOICEVOX、COEIROINKは公式サイトでサンプルが聞けるので
公式サイトから気になるキャラ、声を探してみて下さい。
TALQuは自分で音源を作れてしまうので(凄いね!)日々増えています。
wiki(配布モデル一覧)も作成されているのですが、UTAU音源のように果てしなく増えていく気がします。むしろ、それを望んでいるのかもしれない。
好きなキャラが見つかれば、そのキャラがいるソフトを使ってみて下さい(好きという動力は色々な課題を飛び越える力になります)。
ツイッターだと文字数の上限や、公開の度合いが違うので、細かい所を書いてみましょう。
パソコンのスペック
「自分のパソコンで使えるか分からない」正直、入れてみないと分からないです。(ソフトは導入できたけど、音声合成に凄く時間がかかるとか)
自分が導入したのはWindows10(ProですがHomeでも大丈夫なはず)
CUP Core id-4590T
メモリ 5GB(VB上なので半端になってます。気にしないで)
ストレージ SSD、256GB(空き容量多め)
古め?のPCにUbuntu入れて、VB(Virtual Box)上でWindows10を動かしています。
普通のWindowsパソコンで動くと思います。
・空き容量が殆ど無い(WindowsだとCドライブが真っ赤になってる)
・凄く古い(Windows7、Vista)
というパソコンでなければ動くんじゃないかな?(Windows7は問題なく動く可能性あり)
ソフトのダウンロード時にCPUとGPUで選ぶ場面が有るかもしれませんが、
わからなければCPUで大丈夫です。
GPUはグラフィックなんちゃら(詳細は分からない)なのでゲーミングPCや高画質PCに搭載されていたりするやつです。
GPU使えたら速いけど、CPUでも問題ないよ。(ノートパソコンには、まず搭載されてないよ)
商用?非商用?
「企業の商用利用」「個人の商用利用」(同人もお金が発生したら商用?と悩む方もコチラ)→VOICEVOX(※キャラクターの利用規約に依存)
公式サイトのトップにも「商用・非商用問わず無料」とのこと(2022/03/04現在)。
特に、東北ずんこさん(公式)系列の四国メタンちゃん、ずんだもん(利用規約)は自由度が凄いので企業の方も利用できます。
特に四国の皆さん、四国メタンちゃんを無料で商用利用できます。
先日2022/03/01にクラウドファンディングで四国での無料化が達成されました。
→COEIROINK(※キャラクターの利用規約に依存)
利用規約に「商用・非商用問わず利用できる」とのこと(2022/03/04現在)。
特に、つくよみちゃん(つくよみちゃんプロジェクト)はフリー素材キャラクターとしての意気込みが凄く、使用して公開すると公式のつくよみちゃんが宣伝してくれます。
そしてエロ、グロ(R指定)への利用も可能です。
(TALQuは商用利用可能と明記されていないので、ここでは記載していません。個人の商用利用なら「禁止されてないからOK」って所でしょうか。)
「個人の非商用利用」(お金が発生しない、無償配布・公開など)
「エロ、グロ(R指定)なしの全年齢」(他人を傷つけない)
→VOICEVOX(※キャラクターの利用規約に依存)
→COEIROINK(※キャラクターの利用規約に依存)
→TALQu(※キャラクターの利用規約に依存)
R指定のない、著作権が自分にあればどのソフト、キャラも問題ないと思います。
※ただし、各キャラクター(声)の方の利用規約も確認の上で。
「個人の非商用利用」(お金が発生しない、無償配布・公開など)
「エロ、グロ(R指定)あり」(R指定が悩ましい方もコチラ)
→COEIROINK つくよみちゃん オススメ
前述していますが、利用可能な範囲が広いのはつくよみちゃんです。(犯罪、他人を傷つけなければ使用可能だと思ってます。)
※エロ、グロ(R指定)はキャラクター(声)の方の利用規約に依存する面が大きいので、「利用可能」と明記されていなければ使用しないことをオススメします。
他のソフトと連携したい
※連携したことないので羅列です→VOICEVOX
OSS(オープンソースソフトウェア)として日々進化しているVOICEVOX。
すでに
・ゆっくりムービーメーカー4(公式)
・棒読みちゃん(連携方法)
・AviUtil(動画 / 連携方法)
・ゆかりねっと(プラグイン)
一括で合成音声ソフトをまとめて使うソフト
ユニコエ(公式)というのもあります。
(実はCOEIROINKも操作画面をVOICEVOXから借りているようです。なのでVOICEVOXで出来ることは、COEIROINKでも出来たりする。)
ソフトの特徴
VOICEVOXは前述の通り、OSSで多数の方から意見も貰いつつ日々進化しているようです。これがオープンの強みですね。
逆に言うと進化が早すぎてついて行けないww(テキストの読み込みまではギリギリ知ってたけど、キャラ指定しなくていいとか、複数セリフの音声を1ファイルで書き出しとか知らなかった)
あと、男性キャラが一気に三人増えましたね。
これからもボイボ寮の住人(提供ボイス)が増えていくと予想されます。
ソフトのダウンロードから、説明まで公式での説明も多く、「とりあえずダウンロードして展開したら使える」ので初心者にオススメしています。(OSとかも気にしなくていいし)
COEIROINKは「オリジナルキャラクターに声をつけたい」「CV(キャラクターボイス)を無償で提供」してくれるソフトです。
作成者の方が当初つくよみちゃんの声を開発・学習に使用していた経緯もあると思いますが、
一次創作(オリジナル)で活動されている方には嬉しいソフトでしょう。
ただし、提供ボイスが今後増えるのかは不明。
Windows環境ですが、一次創作者にはオススメです。
TALQuはUTAUの進化系なのかな? デフォルトの声はHaruqaさん(中性)になります。
音源(ボイス)モデルを配布されている有志のモデルを追加していくことで、使用できる声が増えていきます。
UTAUのキャラも続々と参戦しているようなので、「UTAUに好きなキャラがいた!」という方は探してみて下さい(自分の場合も見つけてビックリして即DLしました)。
VOICEVOX、COEIROINKと大きく違う点はここです。
モデルの作成方法も公開されているので、自分でモデルが作成できちゃいます。公開しなくても良い、自分だけのモデルが。
なので特徴的な音源もあります。(作成者の方が半笑いモデル作ったり、有志が実況モデル作ったり凄いです)
UTAUの音源DLで悩んだ人がいれば、そうです、多すぎて迷う(そして今日も増えるwww)。
色々出来すぎる、良い意味で迷うことが多いので初心者にオススメは出来ませんが、UTAU、HANASUなどのソフトを使ったことがある方にはオススメです。コチラのほうが画面的にも使いやすいかもしれない。
オススメのボイス
デフォ子(ゆっくり)sofTalk / UTAU 、他どのPCでも入るし、なんなら色んなソフトにいるし、芸歴長いし!!
虚音イフ TALQu(公式)UTAUもあるよ
おじさまイケボイス(先日配布が開始されました)。歌って踊れて喋る化物。ペストマスクと帽子の外見、義足や獅子の尻尾など(個体差があります)要素がてんこ盛り。そして声が低音男性ボイスでトーク系ソフトでは他にいないタイプ★(個人の調査です)
有響シロ TALQu(公式)UTAUもあるよ
優しいイケメンボイス(骨董店の店主の背後に幽鬼はデフォですよね)。髪の色が変わったり、隻腕だったり、目の中の月が変わったり(時期によるようです)変幻自在な方。
つくよみちゃん COEIROINK(公式)UTAUもあるよ
キャラクターの理念が凄い、そして運営(作者)さんも凄い。とりあえず利用規約に詰まったら(困ったら)つくよみちゃん。宣伝も手伝ってくれる、可愛いフェアリー。実はボイボ寮の管理人だとか?
四国メタン VOICEVOX(規約 / 公式)UTAUもあるよ
利用規約が自由だったのに、更に四国で無料化しちゃったメタンちゃん。ちょっと落ち着いた女性ボイスなので聞き取りもしやすい。
実はオススメボイスが書きたかっただけだろうwwその通りだ。
COEIROINKの導入をツイッターに公開したので、そちらも一緒に載せる予定だったのですが明らかに長くなったので、それは次回。
PR