若者論を研究するブログ

打ち捨てられた知性の墓場

MENU

正規分布おじさんについて

7年前の話題だが「学力」の分布が必ずしも得点の分布と一致するとは限らないことを示す良い例なので取り上げる。

恐らくおじさんは次のような勘違いをしていたと思われる。仮に、ある集団の学力(あるテスト項目に対する正答確率)が正規分布しているとき、

f:id:HaJK334:20210701032247p:plain

学力下位集団・中位集団・上位集団のそれぞれに個別の学力テストを実施したならば、その得点分布もまた

f:id:HaJK334:20210701032220p:plain

このような分布になると思っていたのだろう。つまり得点分布の形=学力分布の形という勘違いである。より正確に表現すれば①世代集団の学力は正規分布しているはず②テスト得点が正規分布している③つまりこのテストは世代の学力分布を正確に反映している、という流れだと思われるが、詳しいことは本人に聞いてほしい。私には良く分からない。

ところで、学力調査の結果というものはそれがどのような調査であれ、概ね正規分布に近い単峰性の分布となることが通常である。たとえば、上掲のグラフのように「あるテスト項目に対する正答確率」によって並べられた各集団(下位・中位・上位)に対して、そのテスト項目と同じ難易度のテスト50問を実施したとき、各集団(50万人)の得点分布は次の様になる。

f:id:HaJK334:20210701032857p:plain

当たり前である。まずは、学力をある一定の値に固定した場合の得点分布を説明しよう。中学レベルの説明をすると、仮に50問で構成されているテストの場合その上限と下限、すなわち50点と0点のパターンはそれぞれ1パターンしか存在しないが、それが49点と1点ならば49パターン、48点と2点ならば{}_{50} C _2、47点ならば{}_{50} C _3…とパターン数は飛躍的に増えるのであり、そのため上限と下限が最頻値とならないことは常識的に考えて明らかである。また、高校レベルの説明をするならば、問題数をn、正答数をr、正答確率をxとして、正答数rの確率P_rと正答数r+1の確率P_{r+1}の比は

\cfrac{P_{r+1}}{P_{r}}=\cfrac{{}_{n} C_{r+1}・x^{r+1}・(1-x)^{n-(r+1)}}{{}_{n} C _r・x^r・(1-x)^{n-r}}=\cfrac{n-r}{r+1}・\cfrac{x}{1-x}

と整理できるため、

P_{r-1}<P_{r}>P_{r+1} \Leftrightarrow\cfrac{n-r}{r+1}・x<1<\cfrac{n-r+1}{r}・x

を満たす整数rを最頻値として単峰性の分布となる事は明らかである。或いは単に個々の受験者の得点分布は二項分布であると説明しても良い。それでは、その重ね合わせであるところの集団の得点分布はどうなっているのか。どうあれ山なりの分布になるであろうことは上記の説明より想像できると思うが、実際にはテストの特性、受験者の特性、見る者の感性等の条件によって変化するため具体的に示すしかない。たとえば、上記の50問・50万人のテストを1000問・50万人(学力下位集団)にするとどうなるか。

f:id:HaJK334:20210701034854p:plain

こうなる。問題数を増やしたことで(受験者特性の)測定の精度が上がったため、左側では重ね合わせの値が小さくなりギザギザが生じている。一方右側ではそもそも重ね合わせ自体が少ないため比較的滑らかな形状となっている。つまりは問題数を増やし、まぎれを少なくすれば、学力分布のヒストグラムに近づくわけである。

それでは逆に50問・1千万人(学力下位集団)にするとどうなるか。受験者を増やしても受験者個人の測定の精度は上がらないため、その分布は以下のように滑らかな正規分布に近い形状となる。ちなみにセンター試験共通一次試験)の得点は正規分布ではなく実際にはワイブル分布となっているそうだ。CiNii 論文 -  共通1次試験総合得点に対する分布のあてはめ

f:id:HaJK334:20210701035110p:plain