AI×ビッグデータとAI×少ないデータ

はじめに

AIと呼ばれる技術は、以下のものがあります。

機械学習、遺伝的アルゴリズム、群知能、ファジイ制御、エキスパートシステム

本記事は機械学習を対象として解説します。

AIとビッグデータ

2000年代から始まった第三次AIブームのきっかけとなった、機械学習とディープラーニングは次のような違いや、メリット・デメリットがあります。

機械学習とディープラーニングの違い

機械学習とディープラーニングは、ビッグデータから法則やルールを見つけ出すという点で共通しています。しかし、機械学習は人が学習するものを定義するのに対して、ディープラーニングは学習するものをAIが自律的に考えて決定します。

機械学習のメリットとデメリット

メリット

  • 計算コストが低い場合が多く、ディープラーニングと比較して早く学習が完了するため、比較的簡単な問題に対して素早い分析ができる
  • 学習の方向性をコントロールすることができる

デメリット

  • 手動で学習するものを定義する必要がある
  • 自動車の自動運転のような複雑な問題には適用しづらい

ディープラーニングのメリットとデメリット

メリット

  • 複雑な問題に対しての適用ができる
  • 学習するものを定義する手間を省くことができる
  • 人には見つけられない特徴を学習できる

デメリット

  • 学習に時間がかかる
  • 学習するものをAIが自律的に考えて学習するため、想定外の方向に学習が進む可能性があり、学習に関わるビッグデータの選択には注意が必要

ビッグデータ

ビッグデータとは、単に大量のデータのことではなく、次の3つのVによって構成されます。

データの量(Volume)、データの種類(Variaty)、データの発生・更新頻度(Velocity)

AI×ビッグデータの活用事例

ここでは、下記の課題解決を目的にAI×ビッグデータを活用した事例について紹介します。

売上の向上、コストの削減、信頼性の担保、監視/管理、人員不足解消

1. 売上の向上

株式会社セブンーイレブン・ジャパン.(需要予測)

2020年1月31日に千葉県内とフランチャイズ加盟店の合計約1100店にAI発注を実験導入しました。ここでのAI発注とは、後述のビッグデータを基に、最適な発注数をAIが提案する仕組みです。最終的な発注数の確定は、店舗の発注担当者が行います。

従来は、各々に設定された基準在庫を下回った商品の発注について発注を促す仕組みでした。また発注担当者のバイアスなどが発注に影響していました。

<AIの導入結果>

  • 基準在庫を店舗で設定する手間がなくなり、発注業務が省力化した
  • 1日当たりの発注時間が以前の80分から45分に短縮できた
  • 適正な在庫の確保によって、AI発注対象商品の売上が平均で前年比2.5%増となった

セブンーイレブン・ジャパン.は、千葉県内での実験を踏まえ、2020年度中にAI発注を全店に導入する予定です。

(ビッグデータ)

販売実績、共通催事、共通キャンペーン、天気予報、実際の天気などの合計13の内部与件と外部与件の要素

2. コストの削減

株式会社データグリッド(実在しない人物の自動生成)

高解像度(1024×1024)の実在しない人物の全身画像を自動生成するAI(全身モデル自動生成AI)を開発しました。実在しない人物の全身を自動で生成することには、以下の利点があります。

  • 広告や資料で使用する素材を探す時間や制作コストを削減できる
  • 著作権や販売権、侵害といった使用に伴うリスクがなくなる

(ビッグデータ)

大量の全身モデル画像

3. 精度の担保

株式会社AIメディカルサービス(がんの検出による診断支援)

内視鏡は日本が世界をリードする先進の医療分野ですが、現場では下記のような問題があります。

  • 病変見落としが医師によって2割以上
  • 大量の2重チェック負担で専門医が疲弊

特に2つ目について、専門医による内視鏡画像の2重チェックを行う読影会が月2回行われていますが、医師1人あたり70症例(1症例当たり40~50枚の画像)を見る必要があります。

これらの問題を解決するために開発された、AIメディカルサービスの内視鏡の画像診断支援AIは、以下のことができます。

  • 6mm以上の胃がんを98%の精度で検出
  • 2296枚の画像を47秒で診断(1枚あたり0.02秒)

AIメディカルサービスは、最終的に食道・胃から小腸・大腸に対する内視鏡検査をAIが支援できるようにすることを目標とされています。

(ビッグデータ)

大量の内視鏡画像、胃がんの画像

4. 監視/管理

三井住友海上火災保険株式会社、アリスマー株式会社(災害状況の把握、保険)

水災が発生した場合、専門の調査員の立会調査を実施する必要があり、保険金を支払うまでに事故の連絡から約1ヶ月程度を要していました。この問題を解決するために、2020年からアリスマー社と、以下の手順で水災損害調査を行います。

  1. 被災後にドローンで上空から浸水地域を撮影
  2. 地表の3Dモデルを作成
  3. AIによる流体シミュレーション技術によるデータ解析
  4. 被災地域における浸水高の算定

これにより、立会調査を行うことなく全損として判断できる地域を正確に特定し、最短で事故の連絡から5日程度で保険金支払いが可能となります。

(ビッグデータ)

ドローンの空撮画像により作成される高精度の3Dマップ

5. 人員不足解消

株式会社オーシャンアイズ(漁獲量・漁場予測)

漁業には、下記の問題があります。

  • 漁獲位置の変化(環境の変化によって獲れていた魚が獲れなくなったなど)
  • 漁師の高齢化
  • 技術伝承がうまくいっていない

これらを解決するために、オーシャンアイズは漁業者の漁場決定を支援する「漁場ナビ」というサービスを提供しています。こちらのサービスでは、次のことが行われています。

  • ひまわりの観測範囲における、海水温の情報を24時間365日配信
  • 日本近海の海表面から海底までの海水温と潮流の現況と予測の提供

「漁場ナビ」の他にも、「SEAoME(しおめ)」という海況情報(水温、塩分、流速、海面高度の変化)を最大14日先まで予測するサービスも提供されています。

これらのサービスを通して、操業の効率化によるサステナビリティの向上を図り、漁業を成長産業にすることを目指されています。

(ビッグデータ)

気象衛星「ひまわり」からの衛星データ

AI×少ないデータ

AI×ビッグデータによって、高いパフォーマンスをAIに発揮させるという方法には、次のような問題があります。

  • プライバシーが問題となる分野でのビッグデータの取得が困難
  • ビッグデータの取得には時間と費用のコストがかかる

しかし、少ないデータで効率的にAIを学習させる研究も進めれらています。

スパースモデリング

スパースモデリングとは

スパース(Sparse)は、「わずかな、すかすか」を意味します。ものごとを決定づける本質的な要素は、わずかであるという仮定から、不要な情報をそぎ落とし、本質的な情報を自動的に見極めて抽出するという技術がスパースモデリングです。本質を見極めるとは、入力したデータ(入力)とAIの判定結果(出力)の関係性を洗い出して特定することです。この抽出により、少ない情報から全体像を的確に復元することができます。

日本では、株式会社HACARUSがこの技術をビジネスに取り入れ、少量データでも産業分野と医療分野に最適なソリューションを提供するサービスを行っています。

スパースモデリングの利点

1. データ不足問題の解決

少量のデータから重要な情報を抽出するため、ディープラーニングのように大量の学習データを必要とせず、少量のデータで動作できます。

2. 結果の説明が可能

ディープラーニングでは、結果や決定のプロセスを説明することができませんでした(ブラックボックス)。一方、スパースモデリングでは、データから不要な情報を排除して本質的な情報に単純化します。その結果、入力したデータ(原因)と出力(結果)の関係性が明瞭となり、その因果関係が人間にとって解釈しやすく、説明可能になります。つまり、異常が生じた場合の原因を特定しやすいという利点があります。

3. 計算コストが低い

ディープラーニングは大量のデータを処理する必要があるため、高価な計算機器が必要です。一方、スパースモデリングは安価な機器やFPGAに容易に組込むことができます。

スパースモデリングの活用事例

ブラックホールの撮影

2019年4月に発表されたブラックホールの世界初の撮影には、スパースモデリングが関わっています。

(観測データの問題点)

ブラックホールの観測に用いられた電波観測計では、全体ではなく、一部分しか観測データとして得ることができず、データを画像化すると不足部分が生じる

上記の観測データ不足という問題を解決するために、日本チームは、スパースモデリングを採用しました。スパースモデリングによって、限られた観測データから重要な要素を抽出することで、全体像を復元し、ブラックホールの画像化に成功しました。

以上のように利点が多く、成果もあげているスパースモデリング技術ですが、自立運転や自然言語処理などのユースケースによっては、制約を受けます。したがって、解決したい課題よってディープラーニングとの使い分けや、両方を組み合わせたアプローチを検討する必要があります。

まとめ

本記事では、AIとビッグデータの基本的な事柄から、それらを活用した事例について解説しました。その一方で、少量のデータから最適解を得るスパースモデリング技術についても解説しました。前半で解説したディープラーニングは、学習するデータが多いほどAIの性能が向上することから、世界の諸外国と比較して日本の優位性が低いのは事実です。しかし、後半で挙げたスパースモデリング技術は、その状態の打破を期待することができます。