Amazon Comprehendとは

 

Amazon Comprehendとは?

Amazon Comprehendという言葉を聞きなれない人も多いでしょう。Amazon Comprehendとは機械学習を使って、テキスト内を表面的に理解するのではく、インサイトや関係性を検出することができる自然言語処理サービス(NLP)のことです。こういったサービスは専門的な知識がある人でないと使えないのでは…?と思う方も多いかもしれません。しかし、Amazon Comprehendは機械学習の複雑な知識や経験がなくても利用することができるのが特徴です。

そもそも自然言語処理(NLP)とは?

ひとことで言うと、普段わたしたちが使っている言葉や文章をコンピューターに解析させ、処理することをいいます。わたしたちが普段使う言語を自然言語、コンピューターが使う言語をコンピューター言語といいます。実は、わたしたちが使う自然言語はコンピューター言語と違い、前後の文脈や話し手の感情を加味しながら意志を伝達しています。人間が何気なくしているそのようなことをコンピューターにも学習させようというものがNLPです。
近年は機械学習が発達し、AIのチャットボットや電話対応のAI化などで活用されています。

具体的にどんなことができるのか

Amazon Comprehendは様々な機能を提供していますが、主要なものでいうとキーフレーズ抽出、感情分析、構文分析、エンティティ認識、言語検出APIを提供しています。これらを聞いただけでは具体的にどのように使って、どのように活用できるのかイメージがつきにくいでしょう。以下でこれらの5つのAPIについて解説していきます。

1:キーフレーズ抽出

キーフレーズ抽出APIは、文章の中のキーフレーズやポイント、そしてそれがキーフレーズであることを裏付ける信頼性スコアを表示します。長い文章の中からどのような言葉がよく使われているかなどがわかります。検索キーワードとしても活用できることができるでしょう。

2:感情分析

感情分析APIは、文章の全体的な感情 (肯定的、否定的、中立的、または混在) を表示します。例えば通販サイトのレビューなどの文章で、レビューを書いた人の感情を客観的に数値化してくれます。人間が文章を見て感情を読み取ろうとすると、どうしてもバイアスによって認知がゆがめられたりすることもあるかもしれませんが、そのような時にこの感情分析APIは活用できるでしょう。レビューの他にも、SNSでの活用もよく見受けられます。

3:構文分析

構文分析APIは、文章の単語の境界を定義して、名詞や動詞など関連する品詞で各単語にラベルづけをします。これにより難解な文章などでも単語分けされて、品詞のラベル付けにより読み解きやすくなるでしょう。

4:エンティティ認識

エンティティ認識とは、テキストにある人、組織、場所、位置などを認識し、その回数をカウントしてくれます。また、それらの信頼性スコアも返します。これにより、長い文章などでどの種類のどの単語が何回使われたか、などが一目でわかるようになります。人間が確認するのに比べ、確認する人の知識に左右されずに人、場所、組織、位置を正確にカウントできます。

5つ:言語検出

言語検出APIは、テキストを解析して主要言語とその信頼性スコアを表示します。自動的に認識できる言語は100を越えます。

Amazon Comprehendの利点

世の中には構造化されていない大量のテキストが溢れています。例えばeメールやレビュー、SNSの投稿や広告コピーなどがそれにあたります。そういった構造化されていないデータのインサイトと関係を明らかにすることによって、ドキュメントごとに整理されたトピックを作ることができます。そして、いままで整理されていなかったデータも、多くの場面で役立つデータへと変化することができます。これらの機能を医療に活用するAmazon Comprehend Medicalといったサービスもあります。医療以外にも活用できる現場はまだまだ多くあるでしょう。

まとめ

このようにAmazon Comprehendを使うことによって文章、言語をコンピューターに認識させることができ、人間が行っていた多くの処理が自動化することができます。また、カスタム分類子APIを使うことで、テキスト分類モデルを簡単に構築できます。機械学習の経験を必要しないAmazon Comprehendでは、一行もコードをかかずにカスタムモデルを構築することもできます。
今回の記事では、Amazon Comprehendの様々な機能について説明させていただきましたが、多くの人はまだ自分に機械学習なんて敷居が高いと思っているかもしれません。しかし、Amazon Comprehendのように機械学習の経験を必要としないサービスが今後も出てくるということを留意しておくと自身に活かせるサービスが見つかるでしょう。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です