Google Home, Amazon Echoと同じ技術を使用

ディープラーニングの出現により、画像認識、音声認識、動画認識の分野においての技術が、飛躍的に向上しました。スマートフォン、Google homeやAmazon Echoなどで用いられている音声認識技術利用し、様々な企業が新しいサービスや商品を開発しています。これらの技術が導入されている領域は、まだ特定分野に限定されており、今だ導入が進んでいない現状があります。弊社は、ディープラーニングの技術を用いて、音声データ・音声ファイルをテキストに変換、または音声データのタイムリーなテキスト化を行うことで、「業務の効率化」「音声データの適切な保存」「サービスのクオリティ向上」「新サービス開発に向けてのデータ分析」を実行・実現したいすべての企業を支援いたします。

Google Cloud Speech API とは

音声認識技術にも様々な種類があります。弊社では大量のデータの収集が可能で、ストリーミングの対応、長時間の音声の認識、言語の幅、認識の精度などからGoogle Cloud PlatformであるGoogle Speech APIの導入の支援をすることにしました。Google検索やGmailなどの大規模サービスからビッグデータを収集し、高度なデータ分析や機械学習等を可能としているため、品質向上も著しく、スピードにも優れています。

●サービスの特徴

Google Cloud Speech APIは具体的に、会議での議事録作成・インタビューの文字起こしからコールセンターの品質管理まで対応

既存音声のテキスト化

すでに保存されている音声データやファイルをテキストに落とし込むことができます。会議での外国語の会話やインタビューなども音声データが存在していれば、テキストに変換が可能です。従業員が時間を割いていた文字起こしの業務を効率化することで、生産性の高い業務に人的リソースを集中することに繋がります。韓国語、中国語、英語、スペイン語、ドイツ語などを含む、全110 以上の言語と方言に対応可能です。また、テキストになった結果から不適切なコンテンツをフィルタリングできます。

110 以上の言語を対応

韓国語、中国語、英語、スペイン語、ドイツ語などを含む、全110 以上の言語と方言に対応可能です。また、テキストになった結果から不適切なコンテンツをフィルタリングできます。不要な語句などを取り除くことが可能な為、テキスト化した後の処理も楽になります。また自動で複数言語の音声を拾うことも可能です。(4言語まで)

ノイズの自動除去

音声を送信する前に、ノイズ除去などを行う必要はありません。雑音の多い環境でも正確に認識が可能です。この機能が他社のサービスと比較しても非常に優秀です。

テキスト化してDB保存/システム連携

テキストへ変換した大量の音声データをデータベースに保存をしたり、システムと連携をさせることが可能です。既存システムとの連携を支援します。Google Cloud StorageなどGoogle関連のサービスとの連携は強く、様々なサービスと連携できます。また事前に拡張モデルが複数用意されていて、ユーザーの用途に応じて音声認識の正確さを上げる事ができます。既存システムとの連携を支援します。

リアルタイムに対応

音声は事前に録音してあるデータやファイルだけではなく、リアルタイムにマイクからストリーミングすることもできます。時間の長さに関わらず、音声からテキストへの変換をスムーズに行うことができるのも特徴の1つです。

複数人でのチャンネル利用

複数人が別々のチャンネルで話している内容を即座に音声変換します。それをチャンネルごとに認識して、実際の会話をしている順でログのように表示させることができます。

音声データの解析サービス

テキスト化した音声データをもとに、情報分析をサポートします。文章の自動分類、言語解析など、サービスの品質向上や、新商品・サービス開発への情報提供を支援します。

音声データ変換実績

●実際の文章
来月の旅行の件だけど、温泉ってのはどう?実は昨日テレビで特集やっててさ、たまにはゆっくり風情のある街並みとかみようぜ!みんなで楽しめるといいな。

●出力後の文章
来月の旅行の件だけど温泉ってのはどう実は昨日テレビで特集やっててさたまにはゆっくり風情のある街並みとか見ようぜみんなで楽しめるといいな

音声ファイル

●実際の文章
ある本を読んで思った。今を全力で生きる。ということに意識を置く者は多くはない。誰もが過去や未来に気を取られてしまうが、刹那の行動でそれらは意味を変える。だからこそ、今ここにいる自分は最善を尽くしていたい。

●出力後の文章
ある本を読んで思った今を全力で生きるということに意識を置くものは 多くはない誰もが過去や未来に気を取られてしまうが刹那の行動でそれらは意味を変えるだからこそ今ここにいる自分は最善を尽くしていたい

音声ファイル

●実際の文章
新しい趣味をお探しのみなさん。ボルダリングという競技はご存知ですか?2020年東京オリンピックの追加種目に正式決定した、今注目の「スポーツクライミング」の中の1つで気軽にできて達成感が味わえるスポーツです。何かを始めるなら、ぜひボルダリングはいかがでしょうか?

●出力後の文章
新しい趣味をお探しのみなさんボルダリングという競技はご存知ですか2020年東京オリンピックの追加種目に正式決定した今注目のスポーツクライミングの中の 一つで気軽にできて達成感が味わえるスポーツです何かを始めるなら是非ボルダリングはいかがでしょうか

音声ファイル

Google Cloud Speech-to-Text を活用している大企業の事例

●背景

数千名の従業員を抱えている大規模の会社では、顧客や取引の情報をいかに効率良く共有するかが課題の一つに挙げられます。特に商談の内容を全体に共有する時には、その商談ごとにシステムに入力して可視化できるような取組をしている企業もございます。そういった業務は、従業員によって差が出るだけでなく、従業員の負担になります。基幹となる業務以外にそれだけの労力をかけることは非効率です。この問題を解決することができれば、1人の従業員当たりの生産性を伸ばすことに繋がります。

●なぜGoogle Cloud Speech-to-Textを採用したのか

先ずは、クラウド型の音声認識エンジンを取り入れることを検討しました。これは実際に導入するまで、社内のどこでこのサービスが有意義に使用できるかが把握できないからです。使用した分だけ請求される従量課金性のクラウドサービスの方がコストを抑えられるからになります。
次に、様々な音声認識ツールの中でも音声認識の精度が非常に重要になります。一般的に使用されない業界用語なども独自の辞書の追加とディープラーニングを用いた学習で文字にすることができます。特徴で記述したノイズの自動除去の機能も含めて、精度の高さが評価されています。

●効果

従業員に対する負担の軽減や以前よりも詳細な商談内容を記録できるなどの効果が期待できます。また他のサービスと連携をすることで、最新のデータを社内全体に共有できるようになることもあります。新サービス開発など軸となる業務の生産性を高めていく為に、Google Cloud Speechの導入を考えてもいいのではないでしょうか。

お問い合わせ

株式会社アクロビジョン

東京都豊島区東池袋1-35-3
池袋センタービル 8階
Tel:03-6661-0912
●対象地域:札幌、仙台、
関東(埼玉、千葉、東京、神奈川)、愛知、
関西(京都、大阪、兵庫)、広島、福岡
リモートであれば場所を問わず対応します。

お名前※

メールアドレス※

メッセージ※

【個人情報取り扱い】WEBお問い合わせに関する個人情報の取り扱いについてをご確認のうえ、同意いただける場合は「同意する」にチェックを入れてください。
同意する