皆さま、こんにちは!
さて、前回は平均の問題について、食塩水と同様にてんびん算が利用できるということを紹介しました。
「加重平均」というタイプの問題なら、常にてんびん算が利用できるよ、というお話でしたね。
今回は、それ以外の「加重平均」の問題について説明しようと思っていたのですが、少し横道にそれます。
せっかくなので、もう少しこの「平均」そのものについて考えてみたいと思います。
テストの成績表が返ってきたときに、気になるのが平均点ですね。
偏差値が気になるのはもちろんですが、そもそも偏差値は平均点をもとにして計算されています。
また、この時期の受験生ですと、過去問をやったときに、合格者平均点や受験者平均点が気になります。
「合格者平均点を超えているから、合格は十分に狙えそうだ」とか、
「受験者平均点にも届いていないから、かなり頑張らないと厳しいぞ」とか、
平均点を見ながら一喜一憂したり、今後の勉強の方向性を考え直したりします。
こういった感覚は非常に大切です。
人間には「漠然と頑張る」ということは難しいです。
ですから、データを見ながら自分の立ち位置をチェックし、努力の方向性を明確にする必要があります。
「平均」という数値は、そういったときにとても参考になる有難いものであるわけです。
しかし、いつどんなときでも「平均」が役に立つかというと、そうでないときもあるのです。
気をつけないと、実情を見誤ったり、ときには数字にダマされたりということすらあり得ます。
今回は、そういったことについて、少し考えてみましょう。
「平均値」というのは、なにかについてのデータを集めたときの、統計処理をした値の一種です。
集めた値の合計を、その値の個数でわり算することによって求められます。
たとえば、全員のテストの点数の合計を、受験者の数でわった値が平均点というものですね。
このように、合計÷個数で求められる「平均値」のことを、専門的には「算術平均」といいます。
前回、「加重平均」という言葉を紹介したように、「平均」にも色々あると思ってください。
さて、ここで気をつけたいことは、「平均値」というものが「加工された数字」だということです。
集めたデータそのものではないので、実際のところどんなデータをもとにした値なのかはわかりません。
「どんなデータをもとにした値」なのかが、見えなくなっているというのが、最大のポイントです。
ここに注意しないと、データの意味を解釈しそこねたり、悪い人にダマされたりする可能性があります。
わかりにくいかもしれないので、次のような具体例を考えてみましょう。
たとえば、次のような新聞記事を読んだとします。
「わが国の労働者の平均年齢は41.5歳である。働き盛りの年齢が活躍する非常に健全な社会です!」
さて、この記事は正しいでしょうか?
労働者の平均年齢が41.5歳であることは事実だとします。
それでも、後半の「働き盛りの年齢が活躍する非常に健全な社会です」は間違っている可能性があります。
なぜでしょうか?
それは、実際には40代の労働者が一切いなくても、平均年齢が41.5歳になることはあるからです。
もしその国が戦争中か何かで、働き盛りの年齢の人間の多くが戦争で亡くなっているとします。
国内では、しかたなく15歳くらいの青少年と、65歳くらいの老人がたくさん働いているとします。
するとどうでしょう?
15歳と65歳がほぼ同数いるなら、その平均は(15+65)÷2で概算できるので、ちょうど40歳になります。
ですから、実際には青少年と老人しか働いていない社会でも、労働者の平均年齢は41.5歳になるのです。
こんな歪な社会構造で「健全な社会」とは言えないですよね?
よって、先ほどの新聞記事はデータを使って「ウソ」をついているということになるのです。
これが、単純なデータ解釈のミスであるなら、まだかわいいものです。
しかし、もしこれが悪意を持った人によるミスディレクションなら大変悪質です。
以上のことは、ひとつの例ですが、このようなことはいくらでもありうるので、気をつけた方が良いです。
中学や高校で詳しく学習しますが、統計の世界には「代表値」という言葉があります。
たくさんのデータをあつめたときに、そのデータの様子を代表して表した値ということです。
そして、一般的によく用いられる「代表値」が、今回テーマにしている「平均値」です。
しかし、「平均値」がそのデータを真に「代表」した値なのかということには、注意が必要です。
先ほど例を挙げたように、「平均値」が実情を反映していないというケースは普通にあるからです。
「平均値」がデータ全体に対して「代表」になりうるのは、「正規分布」している場合です。
下のような、「つりがね型」のグラフが「正規分布」です。
このような場合は、「平均値」がそのデータ全体の「代表」といっても問題はないです。
「代表」という言い方がわかりづらいなら、「普通」とか「多数派」とかと言ってもいいでしょう。
「平均」ときくと、「じゃあ普通なのかな?」と感じることが多いですよね?
実際に、山の一番高いところ、つまりデータが一番多いところが「平均値」になるので、これは「普通」です。
しかし、それはデータが「正規分布」に近い場合だけなのです。
先ほどの労働者の平均年齢の例のような場合、データをグラフにすると、下のような形になります。
いわゆる「ふたこぶ型」のグラフですね。
このような場合、「平均」だからといって「じゃあ普通か」とはなりません。
「平均値」の部分には、実際にはほとんどデータはありません。
ですから、あなたがもし「平均値」と同じデータを持っているなら、それは明らかに「少数派」です。
「異常」というのは言い過ぎかもしれませんが、少なくとこのデータにおいては「普通」ではないのです。
わかりますでしょうか?
こうやって考えると、「平均値」という数字の意味が少し違って見えてきませんか?
テストの成績表を見るときも「平均点と同じならまあまあかな?」と単純に考えてはいけないということです。
データを見るときには、そのデータの「分布」や「散らばり」ということを意識しないといけないのです。
統計の授業では、「平均値」とあわせて、「最頻値(モード)」や「中央値(メジアン)」についても教わります。
「最頻値」というのは、データ全体で一番多くあらわれた数字のことです。
「中央値」というのは、データを小さい順に並べたときに、ちょうど真ん中の順番にあらわれる数字です。
これらも「代表値」の一種なのですが、これらを一緒に考えることで、より正確な全体像が見えてきます。
細かいデータまですべて目を通すのは大変ですが、少し頑張ってみると、より正確な情報が手に入ります。
模試の詳しいデータ表は、時間があるときにゆっくりチェックしてみることをお勧めします。
また、中学校でも、親切な学校は受験データの細かい数字を説明会などで見せてくれていたりします。
データをまったく公表していない学校もあるので、発表している学校のデータはとても有難いです。
そういったものは大切にしましょう。
ちなみに、こういった統計処理に関する問題は、中学受験ではほとんどお目にかかりません。
しかし、理科のデータ処理に関する問題では、似たようなことが問われる可能性があります。
また、公立中高一貫校の適性検査などでは、こういったことがテーマになることは十分に考えられます。
余裕があるときに、お子さんと一緒に少し考えてみたりすると、どこかで役に立つ可能性はありますよ。
では、今日はここまでです。
また次回お会いしましょう!