【Azure】Speech Servicesの機能と料金について

はじめに

皆様は「Siri」や「Googleアシスタント」などを普段から利用するでしょうか。筆者は天気や簡単な調べものをする際によく使いますが、認識精度の高さには感嘆しています。本稿ではそんな音声認識を行うためのサービス「Speech Services」について紹介していきます。

Speech Servicesの機能

Speech ServicesはMicrosoft社が提供していAzureのサービスの一部であり、今回は主な4つの機能について紹介していきます。

Speech to Text

読み上げられた音声を正確に認識し、テキストデータに変換することのできる音声サービス機能になります。40以上の言語に対応しており、モデルをカスタマイズすることで専門分野の固有の用語に対しても精度を高めることができます。以下のSpeech to Textの公式サイトのURLを開いていただければ、デモアプリでSpeech to Textを試すことができます。「https://azure.microsoft.com/ja-jp/services/cognitive-services/speech-to-text/

Text to Speech

Speech to Textとは逆にテキストデータから音声に変換することのできる機能になります。45以上の言語に対応しており、110種類以上の声のバリエーションが用意されています。細かい抑揚もカスタマイズすることで発声することができます。Speech to Textと同様に以下のText to Speechの公式サイトのURLを開いていただければ、デモアプリでText to Speechを試すことができます。「https://azure.microsoft.com/ja-jp/services/cognitive-services/text-to-speech/#features

Speech Translation

音声をリアルタイムで翻訳することのできるサービス機能になります。30以上の言語を翻訳することができます。以下のSpeech Translationの公式サイトのURLを開いていただければ、デモアプリでSpeech Translationを試すことができます。「https://azure.microsoft.com/ja-jp/services/cognitive-services/speech-translation/

Speaker Recognition

話し手を認識して識別するサービス機能になります。グループで会話をしていても音声データから個々を識別することができます。

Speech Servicesの料金一覧

インスタンスカテゴリ機能料金
Free – Web/コンテナー1個の同時要求Speech to Textスタンダード1か月あたり5音声時間は無料
カスタム1か月あたり5音声時間は無料、エンドポイントホスティング:1か月あたり1モデルまで無料
会話の文字起こしのマルチオーディオ1か月あたり5音声時間は無料
Text to Speechスタンダード1か月あたり500万文字まで無料
ニューラル1か月あたり50万文字まで無料
カスタム1か月あたり500万文字まで無料、エンドポイントホスティング:1か月あたり1モデルまで無料
Speech Translationスタンダード1か月あたり5音声時間は無料
Speaker Recognition話者認証1か月あたり10000無料トランザクションまで無料
話者識別1か月あたり10000無料トランザクションまで無料
Standard – Web/コンテナー20個の同時要求Speech to Textスタンダード音声時間あたり112円
カスタム音声時間あたり156.800円、エンドポイントホスティング:1モデル、1か月あたり6.02円
会話の文字起こしのマルチオーディオ音声時間あたり235.20円
Text to Speechスタンダード1000000文字あたり448円
ニューラル1000000文字あたり1,792円、長い音声の作成:1000000文字あたり11,200円
カスタム1000000文字あたり672円、エンドポイントホスティング:1モデル、1か月あたり6.0144円
カスタムニューラルリアルタイムの合成:1000000文字あたり2,688円、エンドポイントホスティング:1モデル、1か月あたり451.59円、長い音声の作成:1000000文字あたり11,200円
Speech Translationスタンダード音声時間あたり280円
Speaker Recognition話者認証利用不可
話者識別利用不可

まとめ

本稿ではSpeech Servicesのサービスと料金について紹介してきました。Speech Servicesを上手く活用すれば簡単に音声を利用したアプリケーションを作成することができます。Speech Servicesのサービスの多くは登録なしで試用することができるので、実際に試してみて機能を体験するのが良いかと思います。

本稿が皆様のお役に立てれば幸いです。最後までお読みいただきありがとうございます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です