Winスクールは全国各地に展開しております。

Winスクール
お役立ち情報

今日からはじめる
Excelデータ分析!第1回

~ 平均値・中央値・最頻値って
なに?~

投稿日:

更新日:

今日からはじめるExcelデータ分析!第1回~平均値・中央値・最頻値ってなに?~

普段の仕事の中で目にするさまざまな数字やデータ、、その数字の意味、本当に理解できていますか?

ビジネスの現場ではデータをもとに今後の方向性を決めたり、企画を立てたりすることがよくあります。統計学やデータ分析について専門的な知識がなくても、ふだんの業務で「最近この商品の売り上げが伸びているから追加生産しよう」や、「毎年10月には気温が下がるから冬物を仕入れておこう」など、データや経験則をもとにものごとを決定する機会は多いのではないでしょうか。

「データ分析」と聞くと、「統計学の知識が必要なんでしょ、、」「複雑な計算式や専用のツールができないと分析なんてできないよ」と思われがちですが、実は普段の業務でよく使われているExcelで簡単にデータ分析ができます!難しい計算はExcelがやってくれるので、まずは目の前にあるデータから何を知りたいか、このデータでどんな問題を解決したいか考えてみましょう。

この記事では、専門的な知識がなくてもできる簡単なデータ分析方法を全3回にわたってご紹介します。第1回目は、データの特徴を表す値としてよく用いられる「平均値」「中央値」「最頻値」についてみていきます。
今仕事で扱っているデータを思い浮かべながら「あ、この方法を使えばこんなことが解決できそう」と想像しながら気軽に読んでみてください。

データの特徴を表す3つの代表値

先ほど挙げた3つの値は「代表値」と呼ばれ、データの中心的な値、標準となる値としてみることができます。それぞれどのような値かご存じでしょうか。Excelでの求め方と合わせてみてみましょう。

平均値

全データの平均となる値です。昨年との比較や他のデータとの比較ができます。
合計をデータの個数で割って求めます。Excelでは「AVERAGE(アベレージ)関数」を使用します。

平均値

中央値

全データの中心に位置する値です。データの数値を昇順(または降順)に並び替えて、ちょうど中心にくる値をとります。もしもデータの個数が偶数の場合は中心の2つの値の平均値が中央値になります。
Excelの「MEDIAN(メジアン)関数」を使って求められます。

中央値

最頻値

データの中でもっとも個数が多い(頻繁に現れる)値です。
Excelの「MODE.SNGL(モード・シングル)関数」を使って求められます。

最頻値

これらの3つの値はどれもデータの特徴を表す値ですが、それぞれ定義や求め方が異なり、当然結果も変わってきます。ここで大事なことは「このデータでどんな問題を解決したいか」を考えて代表値を使うことです。

次に、例を挙げて代表値の使い分けを考えてみます。

求める値でデータの印象が
ガラッと変わる?!

ある運送会社のA支店では所有している配達トラックが古くなってきたので新しいトラックに買い換えたいと思っています。そこで、B支店と比較をして古いトラックが多いことをアピールし、上層部に交渉することにしました。データを見るとどちらの支店も10年以上使用しているトラックが6台あり、特にA支店の方が古いトラックを使っているようには見えません。

トラック使用年数

では、このデータをどのような切り口で分析すればA支店は古いトラックが多いことがアピールできるでしょうか。まずはトラックの使用年数の「平均値」を出してみます。

トラックの使用年数の「平均値」

A支店は「8.3」、B支店は「8.5」になりました。これでは、「A支店が所有しているトラックはB支店より使用年数が短い」という印象になってしまいます。これでは交渉のアピールポイントにはなりません。

では、次に「中央値」を求めてみます。

トラックの使用年数の「中央値」

A支店は「9」、B支店は「7」となりました。これは所有しているトラック15台のうち中心に位置する値です。A支店のトラックは半数が9年以上使用しているということがわかります。先ほどの「平均」の数値より古いトラックが多いことがアピールできそうです。

もうひとつ、「最頻値」も求めてみましょう。
これはどの使用年数のトラックを一番所有しているかがわかります。

トラックの使用年数の「最頻値」

A支店は「6」、B支店は「5」となりました。この数値もアピールに使えそうです。

中央値と最頻値では、A支店のトラックの方が使用年数が古いことがわかったのに、なぜ平均値ではB支店の方が古いトラックが多いと出てしまったのでしょうか?実は平均値にはある「落とし穴」があったのです。

平均値の「落とし穴」

もう一度、それぞれのトラックの使用年数をみてみましょう。すると、B支店の一番新しいトラックの使用年数が5年なのに対して、A支店は使用年数1年のトラックを1台持っていました。この「1」という数字が全体の平均値を下げていたのです。

平均値の「落とし穴」

データ上で極端に小さい値や大きい値のことを「外れ値」と呼び、平均値はこの外れ値の影響を受けやすくなっています。平均値も間違った値ではありませんが、今回のケースであれば「トラックの使用年数が古いことをアピールして新しいトラックに買い換える」ことが目的なので、交渉の際には「中央値」と「最頻値」を用いてアピールすればいいことがわかりました。

最後に、、、

いかがでしたか?切り口によってデータの印象が変わっておもしろいですよね。このように、データをどのような目的で使用するかによってさまざまな分析方法を使い分ける必要があります。今回はデータ分析の本当の入り口として3つの代表値についてご紹介しました。この3つを知っているだけでも、自分がデータを使うときだけでなく誰かが作成したデータが本当に正しく分析されているのかを見極めることができるようになります。

Winスクールには、ビジネスの現場で扱うさまざまなデータをExcelを使って分析する手法と、データや数値を正しく理解するための統計に関する知識が学べる「Excelビジネスデータ分析」という講座があります!今回ご紹介した3つの代表値についてもさらに詳しく学ぶことができますので、もし興味を持っていただけたら一度「無料体験・説明会」または「電話・オンライン説明会」にご参加ください。

オンラインセミナーで学ぶ「Excelデータ分析」

オンラインセミナーデータ分析

ビジネスの現場で使える「Excelデータ分析」が学べるオンラインセミナーが開講しました!
今回ご紹介した3つの代表値(平均値・中央値・最頻値)のほか、「偏差値」の意味や使い方について業務レベルで学ぶことができます。

普段、Excelを使っているけれど扱う数字がいまいち理解できずに困っている方、データ分析に興味はあるけれど何から始めればいいかわからない方など、ぜひこのセミナーで仕事の幅を広げてみませんか?

ただ講義を聞くだけではなく実際にExcelを操作しながらデータ分析の基礎を学ぶことができます。
詳しい講座内容や開催日程は下記リンクからご確認ください。

偏差値を知ることから始めよう!Excelデータ分析の仕事活用術
【オンラインセミナー】偏差値を知ることから始めよう!Excelデータ分析の仕事活用術

基本的なデータの把握の仕方を、Excelの使い方とともに学びます…

Excelビジネスデータ分析
が学べるおすすめコース

Excelの基礎からデータ分析のスキル習得まで

Excel 統計マスター
受講概要

Excelの基礎からビジネスの現場で扱うさまざまなデータを
活用するための統計に関する知識と、Excelを用いた具体的な分析手法を習得します。

学習時間

150分×16回(40時間)

受講期限:4ヶ月

学べる講座