数字と分析

はじめに

普段の生活や仕事をする中で、私たちの身の回りは、たくさんの数字であふれています。物事を数字で表したものをデータと呼び、データを分析して意味付けしたものを情報と呼びます。数字には、数字自体に意味があるものや、意味付けをするために数字があてがわれたものがあり、データとして分析するには、数字の特徴を理解する必要があります。数字の特性を理解し、数字を有効活用するために数字について学んでいきましょう。

数字とデータ

数字をデータとして分析するにあたって、そのデータの特性を理解していなければ、適切な分析はできません。データが、どんな尺度で測定されたかを測定尺度と呼びます。測定尺度によって数字の性質が異なるのです。数字は、測定尺度によってどう分類できるでしょう。

量的データ

量的データは、身長や体重、気温のように、途切れることなく数字が連続する連続データと、個数や人数のように非連続的な、離散データに区別されます。またそれらは、比率尺度と間隔尺度に分類できます。

比率データ

比率データとは、比例尺度で測定されたデータのことです。絶対的な0点が存在する量的データのことを指します。この絶対的な0点とは、原点(0)が一義的に決まっており、それが無の状態を表すことを指します。加減乗除の四則演算すべてを使用できます。具体的には、身長や体重などが比率データにあたります。

間隔データ

間隔データとは、間隔尺度で測定されたデータのことです。原点が便宜的に決まっており、それが無の状態を表すわけではありません。四則演算の中で、加減を使用することができますが、乗除を使用することはできません。具体的には、温度やIQなどが間隔データにあたります。

質的データ

質的データは、分類や種類、内容を区別するためのデータです。足したり引いたりできないデータです。アンケート調査の性別や住所などが質的データにあたり、順序尺度と名義尺度に分類できます。

順位データ

順位データとは、順序尺度で測定されたデータのことです。順序尺度において用いられる数値には、一定の順序性があります。順序尺度は、中央値や累積度数など使用することができます。

カテゴリデータ

カテゴリデータとは、名義尺度で測定されたデータのことです。カテゴリデータは、数字が単にカテゴリの違いを示すために用いられます。アンケート調査でいう、職業や住所がカテゴリデータにあたります。

数字と分析

数字は分析をすることで意味を持ちます。データ全体の特徴を表したものとして、代表値データの散らばりをとらえる方法があります。代表値には、平均値・中央値・最頻値があります。

平均値

平均値とは、データの重心を表す指標として使われます。外れ値があると、平均値が大きく変わってしまう可能性があります。四則演算が使えない質的データでは平均値を求めることはできません。

中央値

中央値とは、データを小さい順または大きい順に並べたときに、真ん中に来る数字のことを指します。平均値と違って、外れ値によって値が大きく変わることはありません。データ数が奇数個の場合は、真ん中の値を、偶数個の場合、真ん中の2つのデータの平均を中央値とします。

最頻値

最頻値とは、データをいくつかのクラスに分けたとき、もっとも度数の多いクラスのことを指します。クラス分けの仕方によって最頻値が変わることがあります。最頻値も外れ値に影響されにくい値となっています。

データの散らばり

データの散らばりをとらえるには、そのデータの範囲・最大値・最小値・標準偏差・分散に着目する方法があります。代表値とデータの散らばりを用いることで、より特徴をとらえやすくなります。

数字から情報へ

数字と情報

情報とは、目的をもってデータに意味付けし価値を与えたものです。数字は、事実として物事を表しているだけなので、分析することで意味ができ情報となります。企業活動の結果を数値で表したとき、ただ数字を眺めるだけでは、それは数字の羅列にすぎません。数字をデータととらえ、データ分析して情報とすることで、企業の意思決定やマーケティングに役立てることができるのです。

数字の信憑性

数字は事実として物事を表しているものです。仮にこの数字が事実と異なることがあれば、その数字を使った分析や情報は、事実とは異なる結果を表すことになります。数字が事実に則しているかに注意を払う必要があります。

まとめ

数字について、理解を深めてもらうことはできたでしょうか。数字には特長があり、数字の使い方も特徴によって異なります。数字は事実を表すものとして存在しますが、ただの数値として扱うだけでは意味を持ちません。目的に応じて数字を活用し、意味を与えることで有効活用できるのです。数字への理解が深まれば、いろいろなことが読み解けるようになるのではないでしょか。

前の記事

データ分析結果と比較

次の記事

データ分析市場の傾向