データ分析力の基礎

データ分析の力

IT技術の向上に伴い、多くの情報を記録収集することが以前より容易になりました。物事に取組むにあたって、データを分析して、その結果から行動を決定するということが増えているのではないでしょうか。そして、より良い結果を得るためには、データ分析の力が必要となるのではないでしょうか。では、データ分析の力を磨くにはどうしたらよいでしょうか。

データ分析をする時には、まずデータを集めます。集計したデータの使用方法として、データの共通点を探し出すことや、データの平均値を出すことがあげられます。しかし、データには種類があり、それに合った使用方法があります。また、目的を達成するためにデータを分析するのですから、分析するには目的に合ったデータが必要なはずです。データ分析の力をつけるためには、データを正しく知ることから始める必要があります。

データの種類

データにも種類があり、使える計算方法が異なります。実際にどんなデータがあるのか順にみていきましょう。

量的データ

量的データとは、数値で表されるデータのことを指し、いろいろな計算を使って分析することができます。量的データには比率データと間隔データの2種類があります。

比率データ

比率データとは、0を基準として数値の間隔・比率に意味がある尺度で測定されたデータのことを指します。長さや重さ、金額などが比率データにあたり、四足演算すべてに使用することができます。

間隔データ

間隔データとは、便宜的に基準を設けて、それを等分した尺度で測定されたデータのことを指します。摂氏や華氏で測定された温度がこれにあたり、分析に加算・減算は使えますが、乗算・除算は使用することができません。

質的データ

質的データとは、区別・分類のために数値が与えられたデータを指します。質的データには、順位データ・カテゴリーデータがあります。

順位データ

順位データとは、得られたデータの値の間に、大小関係与えられている質的データを指します。アンケート調査の満足度などがこれにあたります。値に大小関係はあるものの、その数値差に意味はありません。データの使用方法には、中央値や累積度数を求める方法があります。

カテゴリーデータ

カテゴリーデータとは、内容を区別するために数値を割振られたデータを指します。アンケート調査の血液型や電話番号などがこれにあたります。数値に大小関係もないので、度数や最頻値の計算にしか使用できません。

データの集め方

データを扱う前に

データ分析に取組むにあたって、分析するデータが目的に合ったデータでなければ意味がありません。どこから何のデータをどんな条件で集めるかをしっかりと考えなければなりません。このデータ集めで失敗すると、どれだけデータ分析を頑張っても、目的に合った分析結果は望めません。

データの集め方

データの集め方には、国や他社が公表したデータを集める方法と、自分で独自に集める方法(アンケート調査など)があります。独自にデータを集める場合は、回答の仕方が統一されるようにしっかりと条件を定めなければなりません。

データ分析とグラフ

グラフの種類

データを視覚的にわかりやすくまとめるために、グラフを利用することがあります。グラフは、いろいろな種類があるので、確認しておきましょう。

折れ線グラフ

時間の経過で値が変化する場合に使用。複数の折れ線を重ねることで、項目間での比較ができます。

棒グラフ

量や大きさを比較するときに有効。1項目の大小を比較するものを単純棒グラフと呼びます。

散布図

データを横軸と縦軸の2つの軸で表現しており、互いの相関関係を示す点グラフの一種です。

レーダーチャート

複数の項目のバランスを見るために用いるグラフです。比較の基準となるデータと重ね書きすることで、値の特徴を把握しやすくなります。

グラフの見え方

グラフは、表示する値の範囲を変えれば、視覚的な印象がガラッと変わることがあります。

例えば視覚情報の中で、0~100の値の中で5の違いは小さな差かもしれませんが、80~90の値の中で5の違いは、大きな差に見えてしまいます。また、3Dグラフを用いた場合も間違った印象を与える可能性があります。3Dグラフは、奥行きがあるため手前に表示されるデータのほうが大きく見えがちです。実際は、奥にあるデータの数値のほうが多きいけれど、人の目には、近くにあるデータのほうが大きく見えてしまうといったことが起こりえます。

特別な理由がない限り、誤解を与えるようなグラフの使い方はしないようにしましょう。

データ分析の力をつけて

データにはいろいろな種類があり、それぞれに適した使い方があることを知ってもらうことはできたでしょうか。データのことをよく知り、目的をはっきりさせること、それが自分の欲しい分析結果を出すための第一歩です。そして、知識があれば必ずしもデータ分析ができるわけではないので、自分の置かれている環境の中で、日々データに触れていくことが何より大切です。