「偏差値」を理解する ◆データサイエンティストが解説!◆
今回は『偏差値』について解説します。聞いたことはあるけれど説明しようとすると言葉に詰まってしまう、そのような用語ではないでしょうか?今回は「わかりやすさ重視」で解説していきます!(そのため、厳密には若干正確ではない部分も含まれるかもしれませんが、概ね正しい解釈ができる表現に努めています。)
偏差値の定義式
この式がなんだかわかるでしょうか?
これは偏差値の定義式です。一言でいうと偏差値とは、「自分の数値が全体の中でどの位置にいるのかを相対的に評価する指標」のことです。意味はわかりやすいですね。しかし、その式の形から誤解を生みやすいのも確かです。なぜ平均を引くだけではなく、標準偏差で割るのか、そのあたりのことが「腑に落ちた」と感じてもらえたら嬉しいです。
平均を引く意味
これはわかりやすいと思います。優秀さを測る時に、平均からどれくらい離れているかで評価しようとするのは自然な発想だと思います。
ばらつき(標準偏差)で割る意味
データのばらつきが小さいということは「平均値付近にデータが集中している」という意味です。
平均から離れた値になるのは稀だということなので、データが平均から少し離れれば偏差値は大きくなってほしいという気持ちになります。
この気持ちを数式に反映するためにばらつきで割るというわけです。なぜなら、小さいばらつきで割れば全体(上の式)は大きくなるからです。「ばらつきが小さい時に平均から離れるのはすごいよ」という式に変換するわけです。
末尾の式「×10+50」
さて、まだ残っている末尾の式。
この部分は直感的に理解できるようにするための補正のようなものです。
もともと偏差値は学校のテストで使われるようになりました。学校のテストは多くの場合100点満点で設計され、平均点が50点程になるように作成されています。これが+50の補正をする理由です。また、最下位層の人が25点程、最上位層の人が75点程を狙って作られます(最近はそうではないこともあるようです)、これが×10の補正をする理由です。
説明が少しごちゃごちゃしてしまったので、一言でまとめると、+50は全体の平均点を50点にするための補正。×10は得点の分布がおおよそ25点~75点に収まるようにするための補正です(98.75%程度の人がこの間に収まります)。
ですから、平均を引くことや標準偏差で割ることは統計理論的にも意義のある変換ですが、この ‟×10+50” という部分には、統計学的な意義はないのです。本質的に大事なのは「平均を引くこと」「ばらつきで割ること」とご理解下さい。
まとめ
『偏差値』のここまでの説明をまとめてみます。
偏差値は
という形で定義されている。
① まず自分の点数から平均を引いて、普通より良いのか悪いのかがわかる。
② さらに標準偏差で割ることで大きさが調整されて、どれくらい良いのか悪いのかの評価ができる。
③ ×10をして+50することで直感的にわかりやすくなっている。
これにて偏差値の説明は終了です!