Exit

ディープラーニングの出現により、画像認識、音声認識、動画認識の分野においての技術が、飛躍的に向上しました。「Hey Siri」や「OK Google」という言葉を聞いたことがある方も多いと思います。これらは音声認識技術を用いられたサービスです。スマートフォン、Google homeやAmazon Echoなどで用いられている音声認識技術利用し、様々な企業が新しいサービスや商品を開発しています。音声認識技術を導入しているプロダクトでは言葉で操作することができ、ハンズフリーでの作業が可能となるので、スマホのアプリだけでなく、医療の現場でも活躍が見込まれています。これらの技術が導入されている領域は、B to C向けのサービスや商品に限定されており、我々の働く現場においては、今だ導入が進んでいない現状があります。弊社は、ディープラーニングの技術を用いて、音声データ・音声ファイルをテキストに変換、または音声データのタイムリーなテキスト化を行うことで、「業務の効率化」「音声データの適切な保存」「サービスのクオリティ向上」「新サービス開発に向けてのデータ分析」を実行・実現したいすべての企業、働く人々を支援いたします。

認識精度を上げるディープラーニング

ディープラーニング(深層学習)とは、音声の認識、画像の特定、予測などの人間が自然に行うことをコンピューターに学習させる機械学習の1つです。人工知能(AI)の進化を支える技術であり、これにより様々な分野への実用化が進んでいます。人間の神経細胞(ニューロン)の仕組みを模したニューラルネットワークを多層的にすることで、データに含まれる特徴を捉えることが可能です。多層構造のニューラルネットワークに大量のテキストや音声データを読み込ませることで、データに含まれる特徴を各層で自動的に学習していきます。これにより、ディープラーニングは極めて高い精度を有し、人間の認識精度を超えることもあります。
大量のデータを学習しているので、例えば、「今日はいい天気ですね」という音声を読み込ませたときに、「今日は」に続く文章をコンピューターが推測します。この後の文章が「い…てん…ですね」とだけ聞き取れた場合でも過去のデータを参考に「今日はいい天気ですね」と言葉を補うことができます。
また、サービスで使用された音声もビッグデータとして学習していくので、今後もさらに精度は向上していきます。

GOOGLE SPEECH API

音声認識技術にも様々な種類があります。弊社では大量のデータの収集が可能で、ストリーミングの対応、長時間の音声の認識、言語の幅、認識の精度などからGoogle Cloud PlatformであるGoogle Speech APIの導入の支援をすることにしました。Google検索やGmailなどの大規模サービスからビッグデータを収集し、高度なデータ分析や機械学習等を可能としているため、品質向上も著しく、スピードにも優れています。

議事録作成・インタビューの文字起こしから
コールセンターの品質管理まで対応

既存音声のテキスト化

一般的なWAV、MP3などの大量の既存音声データ・音声ファイルやWMV、MP4などの動画の音声データをテキストへ変換。大量の書き起こし、テープ起こし、文字起こし作業を代行するシステムの導入を支援いたします。コンピューターですので品質が安定し、短時間で対応ができます。

110 以上の言語を対応

韓国語、中国語、英語、スペイン語、ドイツ語などを含む、全110 以上の言語と方言に対応可能です。英語やスペイン語などの地域的な変種も複数含まれていますが、これにより約10億人の言語をサポートしています。また、テキストになった結果から不適切なコンテンツをフィルタリングできます。

タイムリーなテキスト化

アプリケーションのマイクから取得した、音声データをタイムリーにテキストへ変換。認識されたテキストを音声の後ですぐに変換することが可能です。

音声からキーワードの検索

テキスト化された語句の時間オフセット(タイムスタンプ)が分かるため、対象の音声からキーワードの検索や再生時間の検索が可能となります。認識された音声から各単語の開始時点と終了時点を100ミリ秒単位で示すことができ、長時間の音声を分析する際も簡単に位置を特定できます。

オーディオをテキストにマッピング

タイムスタンプによりオーディオをテキストにマッピングできるので書き起こしの校正に要する時間も大幅に短縮可能です。動画ファイルの字幕を生成したり、書き起こされたテキストから実際の発音を知ることもできます。

ノイズの自動除去

音声を送信する前に、ノイズ除去などを行う必要はありません。雑音の多い環境でも正確に認識が可能です。語句のヒントを使用して名前や用語を語彙に追加することで、特定の語句の制度を飛躍的に向上させることができます。

テキスト化してDB保存/システム連携

テキストへ変換した大量の音声データをデータベースに保存をしたり、システムと連携をさせることが可能です。既存システムとの連携を支援します。

文字お越しの種類

データをそのまま起こす素お越しや「えー」「あのー」などの不要な言葉や「ええ」「うん」などの意味のない相槌、重複語を削除するケバ取り起こしにも対応可能です。

音声データの解析サービス

テキスト化した音声データをもとに、情報分析をサポートします。文章の自動分類、言語解析など、サービスの品質向上や、新商品・サービス開発への情報提供を支援します。

音声データ変換実績

●実際の文章
来月の旅行の件だけど、温泉ってのはどう?実は昨日テレビで特集やっててさ、たまにはゆっくり風情のある街並みとかみようぜ!みんなで楽しめるといいな。

●出力後の文章
来月の旅行の件だけど温泉ってのはどう実は昨日テレビで特集やっててさたまにはゆっくり風情のある街並みとか見ようぜみんなで楽しめるといいな

●実際の文章
ある本を読んで思った。今を全力で生きる。ということに意識を置く者は多くはない。誰もが過去や未来に気を取られてしまうが、刹那の行動でそれらは意味を変える。だからこそ、今ここにいる自分は最善を尽くしていたい。

●出力後の文章
ある本を読んで思った今を全力で生きるということに意識を置くものは 多くはない誰もが過去や未来に気を取られてしまうが刹那の行動でそれらは意味を変えるだからこそ今ここにいる自分は最善を尽くしていたい

●実際の文章
新しい趣味をお探しのみなさん。ボルダリングという競技はご存知ですか?2020年東京オリンピックの追加種目に正式決定した、今注目の「スポーツクライミング」の中の1つで気軽にできて達成感が味わえるスポーツです。何かを始めるなら、ぜひボルダリングはいかがでしょうか?

●出力後の文章
新しい趣味をお探しのみなさんボルダリングという競技はご存知ですか2020年東京オリンピックの追加種目に正式決定した今注目のスポーツクライミングの中の 一つで気軽にできて達成感が味わえるスポーツです何かを始めるなら是非ボルダリングはいかがでしょうか

●実施の流れ

まずはお客様の状況やご要望をしっかりとお伺いします。すでにシステムを導入しているようであればどのようなものを導入しているか。現在の課題はどのようなもので、どのような対応が最善の解決方法かなどをご案内します。

1.無料でコンサルティング

しっかりとお客様のご要望をお伺いします。どのようなサービスを提供しているかなどご説明をします。お客様に完成のイメージを持って頂き、この際に、お客様のご要望に応えることができないと判断しましたら無理に開発を勧めることは致しません。お客様にとって必要なシステムになるよう、事前にしっかりとお話を致します。

2.開発

お客様のご要望に従ったシステムの構築を開始します。開発の途中で何度かやり取りをさせて頂き、確認を進めながらイメージとずれることがないよう進めていきます。

3.納品

完成したシステムを確認いただき、問題がなければ完成となり納品をいたします。もし、ご要望と異なるところがあるようでしたらシステムを修正し、再度ご確認を頂きます。

資料請求・
お問い合わせ

CONTACT US

株式会社アクロビジョン
Acrovision Inc. 

東京都豊島区東池袋1-35-3
池袋センタービル 8階
Fax: 03-6661-0913





お名前※

メールアドレス※

メッセージ※

【個人情報取り扱い】WEBお問い合わせに関する個人情報の取り扱いについてをご確認のうえ、同意いただける場合は「同意する」にチェックを入れてください。
同意する

Close
Go top