アノテーションツール紹介

近年IT技術の進歩にが進み人工知能が話題です。テレビをつけると人間対AIの勝負をしておりAIの方が優秀じゃないかとまで言われる始末です。

ただやはり複雑なことでは人間の脳の方が優秀でAIが人に勝つまで発展するには、まだ10年以上かかると言われていました。2015年以前のAIはアマチュアの知能レベルに達するのがやっとでした。

その人工知能(AI)の領域には、さまざまな専門用語があります。「よく耳にするけど、実はあまり分かっていない」というキーワードも少なくありません。今回は、そういった用語の中から「アノテーション」を取り上げ、その意味を解説します。

そもそもアノテーションとは?

アノテーションはテキストや音声、画像などあらゆる形態のデータにタグを付ける作業のことです。
機械学習アルゴリズムはタグが付いたデータを取り込むことで、パターンを認識できるようになります。そのためAI開発者は、機械学習アルゴリズムを学習させるために、タグが付いた状態のデータを用意することが必須となります。正確にタグ付けできていないデータを取り込んでも、AIは正しく学習できません。そのため、アノテーションは機械学習における、不可欠な前処理とも言えるのです。

さまざまなアノテーションの種類

アノテーションという言葉には様々な意味が含まれています。なので一概に一つの意味だけで扱えません。例えば意味的アノテーションは、「人」「物」「企業名」などテキスト内のさまざまな単語に意味付けをするタグ付けです。機械学習アルゴリズムがデータを読み込めるようにするのが目的です。意味的アノテーションの活用事例には、検索エンジンの関連性の改良やチャットボットの学習などがあります。他にも画像・映像アノテーション テキスト・コンテンツ分類アノテーションなど様々な種類があり、挙げるとかなりの数になります。

機械学習とは

ネットの記事やテレビでは機械学習、ディープラーニングをあわせて機械学習またはAIと読んでいます。前提として「AI > 機械学習 > ディープラーニング」のイメージは持っておきましょう。

機械学習はデータの中のどの要素が結果に影響を及ぼしているのか(特徴量という)を人間が判断、調整することで予測や認識の精度をあげています。同技術は、開発者があらかじめすべての動作をプログラムするのではなく、データをAI自身が解析し、法則性やルールを見つけ出す特徴を持っています。つまり、「トレーニング」により特定のタスクを実行できるようになるようなAIになります。

例えば画像認識の例ですと、タグという情報が付いてある画像を大量にAIに記憶させます。そのタグの形で種類を識別しなさいと命令をすれば類似する画像が出たときに識別できると言うことです。この機能は迷惑メール対策などに使用されています。

アノテーションツール とは

アノテーションツールは元々あるデータ(画像、音声、文章など)に対して、その説明などの付加情報を設定するためのツールです。主に、機械学習に用いる正解データを設定したい時に使います。機械学習が注目されていることもあり多数のツールが存在します。

Microsoft VoTT

VoTT(Visual Object Tagging Tool)は、Microsoftが提供している無料のアノテーションツールです。動画や画像に対してアノテーションを行うことができ、WindowsやMac、Linuxなどクロスプラットフォームで利用することもできます。

semantic-segmentation-editor

日立の海外研が開発しているアノテーションツールです。
アシスト機能が充実して、使いこなせれば複雑な形状のアノテーションも短時間で設定でます。
主な機能は2次元画像、3次元点群両方に対応

  • 2D:外接矩形・任意形状の領域の設定
  • 3D:指定した範囲内の点群に対してラベルを設定

Lionbridge AI

Lionbridge AIは、AI事業を展開する企業に対してAI学習データを提供しているプラットフォームです。すでに50万人以上のクラウドワーカーが登録しており、何万枚といった画像でも適切なタグによってスピーディーにアノテーションすることができます。

LabelBox

LabelBoxは、年間500ラベルまで無料で使用することができる画像アノテーションツールです。LobelBox上のサーバーに画像データをアップロードして使用したり、AWS(Amazon Web Services)上にある自社のデータに対して使用したりすることができます。物体検出用のBounding Boxだけでなく、Semantic Segmentationで使用できるPolygon、姿勢推定に使用できるPointなどにも対応しているのが特徴です。

おわりに

まだまだ沢山の種類のツールがあります。これからエンジニアとしてスキルアップしていくには機械学習は必要なスキルになっていきます。