Amazon Rekognition Imageでできること
はじめに
Amazon Rekognitionとは、機械学習を使用して自動で分析を可能にしてくれるサービスのことです。機械学習の専門知識がいらず、アプリケーションに画像や動画の分析を簡単に追加できます。また、画像と動画内における物体や人物、テキスト、シーン、動作を特定することで、不適切なコンテンツを検出することも可能です。さらに優れている点として、正確な顔分析や顔検索機能があります。この機能を利用することでユーザー認証や人数のカウントなど、出社時や企業に訪問する人の顔を検出、分析、比較することもできます。
Amazon Rekognitionカスタムラベルを使用することで、顔の画像だけではなく、その他の物体やシーンなども特定することが可能です。たとえば、特定の機械部品を分類したり、不健康な植物を検出したりできます。カスタムラベルは、機械学習の知識を必要としないため、画像さえあれば、あとは処理を自動化してくれます。
Rekognition Imageとは?
Rekognition Imageは、物体やシーン、顔の検出や、テキストの抽出、また、有名人の認識や画像内の不適切なコンテンツの識別が可能なサービスです。これらの機能はディープラーニングによる画像認識サービスによって可能にしています。
ディープラーニングとは機械学習の分野の1つであり、人工知能の重要な分野です。ディープラーニングについてもRekognition Imageを使用するには専門知識を必要としないため、知識がなくても安心して使用することができます。
また、顔を検索して比較することもできます。画像認識したものはすべて評価され、信頼スコアとして返され、それに基づき比較を行います。
Rekognition Imageができることとして以下が挙げられます。
- 物体とシーンの検出
- 顔認識
- 顔分析
- 顔の比較
- 危険画像の検出
- 有名人の認識
- テキスト検出
Rekognition Imageの主な特徴
物体とシーンの検出
Rekognition Imageでは車両やペット、家具、食べ物、動物、自然など、何千もの物体を認識しラベルに分類されます。また、夕焼けやビーチ、雨や虹などのシーンも検出可能です。そのため、画像ライブラリを容易に検索やフィルタリングができ、管理も非常に楽にできます。現在サポートされているラベルの一部は以下です。
- 人とイベント
- 結婚式、花嫁、赤ちゃん、バースデーケーキ、ギタリスト
- 食べ物と飲み物
- りんご、サンドイッチ、ワイン、ケーキ、ピザ
- 自然とアウトドア
- ビーチ、山、湖、夕焼け、虹
- 動物とペット
- 犬、猫、馬、虎、亀
- 家と庭
- ベッド、テーブル、裏庭、シャンデリア、寝室
- スポーツと娯楽
- ゴルフ、バスケットボール、ホッケー、テニス、ハイキング
- 植物と花
- バラ、チューリップ、ヤシの木、森、竹
- アートとエンターテインメント
- 彫刻、絵、ギター、バレエ、モザイク
- 交通機関と乗り物
- 飛行機、自動車、自転車、オートバイ、トラック
- 電化製品
- コンピュータ、携帯電話、ビデオカメラ、テレビ、ヘッドフォン
他にも数千ものラベルがサポートされています。
顔認識
非常に多くの画像の中から似ている顔を見つけることが可能で、画像から検出された顔でインデックスの作成もできます。スピーディで正確な検索が可能なため、別人を同一人物と認識する可能性は低くなっています。また、この顔認識を使用することで、銀行の支払いにおける認証や従業員の入館自動化などに導入することが可能です。CreateCollection API、IndexFaces API、DeleteFaces APIを使用します。
顔分析
顔分析とは、画像内の顔を検出し、顔の表情や瞳などの写り方を分析できます。画像を分析すると、検出された顔それぞれの位置と長方形のフレームで返し、以下の顔属性を取得します。
- 性別
- 笑顔
- 感情
- 眼鏡
- サングラス
- 目を開いているか
- 口を開いているか
- 口ひげ
- あごひげ
- 姿勢
- 質
- 顔の特徴
顔の比較
2枚の画像の顔を比較し、同一人物か別人かを測定します。顔の比較では類似性スコアを使用して、ユーザーをほぼリアルタイムで画像と照合することが可能です。CompareFaces APIを使用します。
危険画像の検出
すべての画像を要件に基づきフィルタリングし、危険な画像コンテンツがないか探します。許可する画像を細かく制御し、信頼スコアに基づき危険画像を検出します。露出の多いものや暴力的、不快と感じるものを検出します。この場合、Unsafe Content Detection APIを使用します。
有名人の認識
Rekognition Imageでは、有名人や注目されている人物、またはその分野で著名な人物など、何千もの個人を検出し、認識することが可能です。これにはディープラーニングベースのRecognizeCelebrities APIを利用します。政治やスポーツ、ビジネス、エンターテインメント、メディアなど、さまざまなカテゴリの有名人を認識することができます。
テキスト検出
Rekognition Imageでは、画像中のテキストも容易に見つけることが可能です。たとえば、道路標識や車両のナンバープレート、T シャツなどに書かれた文字、字幕やテレビニュースなどの画面上の文字など、自然なシーンにあるテキストも含みます。Text in Image(テキスト検出)は、DetectText APIを使用し、さまざまなレイアウトやフォント、スタイルで埋め込まれた画像内にあるテキストをさまざまな向きや重ねられたバナー、ポスターなど、ほとんどのラテン文字や数字をサポートしています。しかし、日本語には現在(2020年7月)対応していないので、ご注意ください。
おわりに
Amazon RekognitionのImageでできることや特徴についてご紹介してきましたが、RekognitionはImageだけではなく、Videoにも対応しています。どちらも機械学習を利用した分析サービスですが、機械学習の専門知識が必要なく、比較的難易度が低いためすぐにでも始められます。12ヶ月の無料利用枠もあるので、お試しで利用してみるのも良いでしょう
。