YouTubeで機械音声を使ってみたいなと思って機械音声を調べてみましたので結果をご紹介したいと思います。
YouTubeでよく使われているソフトなども紹介していますのでよかったら見ていってください。
あと、ダウンロードソフトだけでなくオンラインで使用できるものなど機械音声・合成音声全般に関して記載しています。
不要なものは読み飛ばしてくださいm(__)m
VOICEVOX
2021年8月1日にリリースされた無料のAI音声合成ソフトです。
以下のヒホさんが作成してくれました。
特徴はイントネーションをパラメータで修正できること。
他の無料音声合成ソフトにない機能です。
音声ライブラリは「四国めたん」と「ずんだもん」の2種類らしく今後追加していく予定とのことです。
出力形式はwavです。
商用利用可能で、使用したライブラリに応じてクレジットを記載することが必要です。
Twitterをみると保存場所に日本語が含まれていると起動できないとかの挙動がおかしくなる現象もあるようです。
以下からダウンロードできます。
https://voicevox.hiroshiba.jp/
※3.5Gちょっとあります。使い方についてもダウンロードファイルと同じ場所にあります。
AquesTalk
音声合成技術の研究開発を行っている株式会社アクエストさんが制作した音声合成ソフトです。
ゆっくり実況などゆっくり系でおなじみの声ですね。
AquesTalkは趣味で音声合成を使う場合など営利を目的としない条件で無料です。
デモページはこちらです。音声を確認することができます。
製品詳細は以下をどうぞ。
https://www.a-quest.com/products/index.html
評価版で実行すると「ナ行、マ行」が、すべて「ヌ」になる制限があります。
初めて見た制限です(笑)。
音声ソフトならではというか。
昔はそんな制限はなかったのに。。
SofTalk
SofTalk (ソフトーク)は内部的に AquesTalkライブラリを使っています。
なので詳細は割愛。
非営利かつ個人に限り無料ですね。
昔のライブラリなので 「ナ行、マ行」が、すべて「ヌ」になる制限 はないはずです。
詳細は以下をどうぞ。
https://w.atwiki.jp/softalk/pages/15.html
棒読みちゃん
内部で AquesTalk を使っています。
旧版のAquesTalk(Win用)は、営利・非営利を問わず無料、商用もOK。
ゆっくり系の音声ならこれを使えばいいと思う。
動画ならYMMかな。YMMについては以下をどうぞ。
画面は以下のような感じ。
テキスト入力欄に文字を入力し、再生ボタンをおすだけでしゃべってくれます。
上記のように入力すると以下のようになります。
VOICEROIDやクリップボードの読み上げ、Twitter読み上げにも対応していますね。
詳細は以下をどうぞ。
http://chi.usamimi.info/Program/Application/BouyomiChan/
テキストーク
日本語で入力されたテキストや任意のテキストファイルを合成音声で読み上げるソフトです。
音声合成エンジンOpen JTalkを使用しています。
音声の利用に制限はないので、商用利用も可能。
出力形式としてMP3、WAVEで保存することも可能です。
ダウンロードはこちらどうぞ。音声サンプルもこちらにあります。
※動作には.NET Framework 4.5が必要です。入ってない場合は上記リンク先にダウンロードリンクがあるのでそこからインストールしてください。
Amazon polly
紹介動画です。
Amazon Polly では、実際に使用した分に対してのみ料金が発生します。
無料利用枠があり、 1 カ月あたり数百万文字まで無料です。
日本語の音声は以下の感じなります。
女性音声( Mizuki )
男性音声( Takumi )
マネジメントコンソールからAmazon Pollyのページにいくと以下のように使えます。
ただし、こちらは難易度が高いので、前述したツールの使用をおすすめします。
興味がある人以外はスルーしてOKです。
詳細は以下をどうぞ
https://aws.amazon.com/jp/polly/
Cloud Text-to-Speech(google)
googleが提供している機械音声です。
100万文字までは無料。以降 100 万文字ごとに課金されます。 APIで使いずらいのでスルーしてOK。
こちらも難易度が高いので、前述したツールの使用をおすすめします。
詳細は以下をどうぞ。
https://cloud.google.com/text-to-speech/?hl=ja
※音声サンプルは上記の中段ぐらいにあります。
Text to Speech(Microsoft)
1 カ月あたり 5 百万文字まで無料です。
APIで使いずらいので、無視していいです。
詳細は以下をどうぞ。
https://azure.microsoft.com/ja-jp/services/cognitive-services/text-to-speech/
※サンプル音声は中段ぐらいにあります。
CMAN
無料で商用利用も可能です。
音声変換にはオープンソースの「Open Jtalk」を使用しています。
ただ制限があり、 10分間に20回までの使用が目安となっています。また、1回に200文字までしか音声変換できません。
以下のページの中段に「音声をテキストに変換する」ボタンがあるので、そのボタンを押すとmp3などでダウンロードできます。
詳細は以下をどうぞ。
https://note.cman.jp/other/voice/
音読さん
音読さんはオンラインで使える音声読み上げソフトです。
音声ライブラリがわからないのでたぶんAPIを使っていると思われます。
商用利用(業務利用)が可能です。
無料での使用はクレジット表記が必要です。
詳細はこちらから。
https://ondoku3.com/ja/about/
その他有料
エーアイ「かんたん!アフレコ」
たまに、YouTubeでも聞く音声ですね。
Amazon商品詳細:かんたん!アフレコ
CeVIO
これもたまにYouTubeで聞きますね。
Amazon 商品詳細 :CeVIO ※試用できるダウンロード版もあります。
VOICEROID2
公式動画でたいした動画がなかったので、とりあえずあったやつを貼りました。
以下は使い方のイメージです。
全部の製品はわかりませんが、特定の製品はYoutubeで聞きますね。
VOICEROID2 は製品が多すぎて書くのが大変(面倒w)なので、個人的に購入した ついなちゃん を紹介します。
Amazon:VOICEROID2 ついなちゃん
ついなちゃんは声がよかったので購入しました。
この音声も結構 YouTube でたまに聞くと思います。
その他
あとは、 ボーカロイドとか。(多いので割愛) VoiceTextとかいうのもあるみたい。
まとめ
YouTubeで機械音声を使おうと審査に通りにくいという話はありますが、結構使っている方は多いように感じます。
今回は機械音声一覧という紹介レベルのまとめ記事ですが、知らないソフトがあったから参考になった!とか思っていただければ幸いです。
たいへん参考になりました!