HaJK334の日記

打ち捨てられた知性の墓場

川口大司による週休二日制格差拡大説の検証

Daiji, Kawaguchi. (2013) "FEWER SCHOOL DAYS,MORE INEQUALITY", Global COE Hi-Stat Discussion Paper Series 271より。前半は拙訳兼解説。経済学部一年生か公務員試験程度の知識があれば十分に理解できる。


Abstract,Introductionはカット。まずは、家庭環境と子供の勉強時間、及びその生産物としての学業成績との関係をモデル化する。子供のテスト得点yが生産関数f(t,p)によって決定されるとして、効用関数は

u=f(t,p)-t

であらわされる。ただし、tは子供の勉強時間、pは人的資源(遺伝的能力含む)である。勉強の制限費用は親の人的資源に依存せず一様として流動性制約を無視する。加えて、子供に勉強させる唯一のコストはその際に感じる苦痛だけとする。また、f(t,p)t,pいずれについても、単調増加(ないし一定)・逓増(ないし一定)だと考えられるので、それぞれ一階・二階偏微分したときの条件はf_{t}\geq 0,f_{tt}\leq0,f_{p}\geq0,f_{pp}\leq0である。

次に効用関数の最適化について。義務教育によって与えられる最小の勉強時間をt_{c}、効用関数を最大化する勉強時間をt^\astとする。最適化条件は限界便益と限界費用が一致するところなので、t^\astは\cfrac{\partial u}{\partial t}=0 \Leftrightarrow f_{t}(t,p)=1を満たす。ただし、端点解の場合はt^\ast=t_{c}である。最適なテスト得点はy^\ast=f(t^\ast,p)とあらわす。

ここで議論の前提について確認する。そもそも、義務教育によって学習時間が変化するのは端点解にある子供だけである。それでは、どのような子供が、正確にはどうような家庭環境の子供が端点解にあるのか。裕福な家庭か、それとも貧困家庭か、それは勉強時間tと親のリソースpの関係が代替的であるか補完的であるかによって変わる。

 

まずは、両者が完全に補完関係にある場合を考えてみる。この場合、生産は最小の生産要素に制約されるので生産関数は次のようにあらわされる。

f(t,p)=a\min\{t,p\}, a>1

t \leq pのとき、効用関数はpを上限とした単純なtの増加関数u=(a-1)tとなり、t>pのとき、効用関数はpを下限とした単純なtの減少関数u=ap-tとなるため、p\geq t_{c}の場合、最適な勉強時間はt^\ast=pとなる。p<t_{c}の場合も同様に、最適な勉強時間はt^\ast=pとなるが、t \geq t_{c}より端点解をとり、t\ast=t_{c}となる。ただし、後者の場合はテスト得点を増加させるわけではないので、結局テスト得点はどちらもapである。

以上のことを定性的に説明すると、子供の努力は親のリソースが制約(上限)となり、それに一致する程度までしか意味を成さない。この場合のリソースとは遺伝的能力も含む。充分なリソースを持っていない親(p<tc)は、それ(p)を超える子供の学習の限界収益が0になる状況に直面することになり、結果として子供にtc以上の勉強をさせない。したがって、義務教育の削減はそのままpoor familyにおける子供の学習時間を削減することになる。ただし、このときのテスト得点はapのまま変わらない。というかだからこそ勉強させない。

 

次に、両者が完全に代替的な関係にある場合を考えてみる。代替関係であるというのは、すなわち生産がその和であわされるということである。さらに、限界生産は逓減することが当然に想定されるので、その生産関数は次のようにあらわされる。

f(t,p)=\log(t+p)

対数関数なので、当然pが大きければ大きいほど、tの限界収益は低下する。これは次のようなケースを意味していると考えられる。先天的に優秀な子供ほど、既に学んでいる(知っているor理解している)ことが多く、追加の勉強によって得られる収益は少なくなる。それ故、親は(子が優秀であるほど)彼らの子供をより少ない時間しか勉強させない。加えて、ある閾値以上の教育リソースを子供に与えている親は、公教育によって要求される最小の時間しか子供に勉強させない。このことを最適化条件で考えてみる。

f_{t}(t,p)=\cfrac{1}{t+p}-1=0⇔t+p=1が最適化条件なので、t_{c}+p \leq1 \Leftrightarrow p \leq 1-t_{c}の場合、最適化された勉強時間はt^\ast=1-pとなる。他方、t_{c}+p>1 \Leftrightarrow p>1-t_{c}の場合、最適化された(効用の減少を最小限に留める)勉強時間はt^\ast=t_{c}となる。それぞれの最適化されたテスト得点は、前者の場合がy^\ast=\log(1)=0、後者の場合がy^\ast=\log(t_{c}+p)である。

 というわけで、勉強時間と親のリソースが完全に代替的な関係にある場合、最初の例とは逆に、義務教育の削減はそのままaffluent familyにおける子供の学習時間を削減することになる。ところで、この帰結は一見すると意味不明であり、よく考えても意味不明である。定性的に考えると、p>1-t_{c}の親は子供に「(見返りに対して)勉強させすぎている」と感じているわけであり、ゆえにp>1-t_{c}が成り立つ限りにおいて、親は子供に追加的な勉強を課すことがない。

が、あれだけ学習内容の削減が批判されたゆとり教育において「勉強させすぎている」などと考える奴が本当にいたのか。コストtは果たして不変のままでいいのか。期待理論とやらでどうにかならないのか。まあこのモデルは勉強時間と家庭環境の関係を考えるための極端な例なので別に良いのだろう。

 

さて、この二つのモデルは極端な例であって、どちらも非現実的なモデルである。もっとまともなモデルを考えたい。子供の勉強時間と親のリソースが完全に代替的、或いは補完的であることは現実にはあり得ない。しかし、ある程度は代替的だろうし、またある程度は補完的だろう。したがって、生産関数を両者の積と考える。加えて、両者が完全に可換であるとも考えられないので、異なるウェイトを持たせる。というわけで、生産関数(テスト得点)はコブ・ダグラス型生産関数を使って以下のようにあらわされる。

f(t,p)=a\ t^{\theta}p^{1-\theta}

 この式は、定性的には次のように説明できる。pが大きければ大きいほど、tを増加させたときのf(t,p)の増加分、すなわちtの限界生産も大きくなる。したがって、豊富な教育的資源を持った親であるほど子供をより勉強させると考えられる。この場合の最適化条件は、

f_{t}(t,p)=(a\theta)t^{\theta-1}p^{1-\theta}-1=0 \Leftrightarrow t=(a\theta)^{\frac{1}{1-\theta}}p \Leftrightarrow p=(a\theta)^\frac{-1}{1-\theta}t

である。p-(a\theta)^\frac{-1}{1-\theta}tpを定数としてtの単調減少関数となるので、p \geq (a\theta)^{\frac{-1}{1-\theta}}t_{c}の場合は、t=t_{c}では内点解に達しない。したがって、最適化された勉強時間は条件そのままにt^\ast=(a\theta)^{\frac{1}{1-\theta}}pとなる。同様に、p < (a\theta)^{\frac{-1}{1-\theta}}t_{c}の場合、既に内点解を通り過ぎてしまったので端点解となり、その最適な勉強時間はt^\ast=t_{c}となる。というわけで、義務教育の削減は教育資源の少ない家庭における子供の学習時間削減、及びテスト得点の低下につながる。

 

以上の単純なモデル化によって、義務教育の削減は勉強時間と成績について、家庭環境と両者の関係性(代替or補完)によって異なる影響を与えることが分かった。また、義務教育における授業時数の削減は、子供の教育に対する親の裁量権が拡大したことを意味する。すると、次の一連の疑問が生じてくる。すなわち、土曜授業廃止に伴う余分な時間を実際の子供たちはどのように過ごしているのか?親の属性によってその過ごし方に違いはあるのか?あるとすれば、それは学力にどのような影響を与えるのか?といった疑問である。次は実際のデータを使ってそのことを検討していく。

利用するデータは、総務省統計局が昭和51年から5年ごとに実施している社会生活基本調査(以下、社基調と略記)である。この調査は国民の生活時間配分や余暇時間における活動の状況などを調査したものであり、当然に「学業」や「学習・研究」も含まれている*1。加えて、社基調はある週の土日2日間から次の週の7日間、計9日間を調査対象日としているため、段階的週五日制の影響を考慮したデータも手にはいる優れものである。ただし、小・中学生の学習時間を調べるようになったのは平成8年調査からのため、比較に利用するデータは平成8年調査、平成13年調査、平成18年調査のデータとなる。

全てのデータを分析するのは面倒なので、学校外の勉強時間が最も増加するであろう(そして将来の進路選択にも大きな影響を与えるであろう)中学3年生時点の学習時間を比較する。ここでいう中学3年生とは、4月から10月までに生まれた15歳児、及び11月から3月までに生まれた14歳児を意味する。また、それぞれのサンプルサイズは平成8年調査から順に7600人、4900人、4100人である。ただし、平成8年調査のデータには誕生月が記録されていないため、一様分布によってランダムに誕生月を割り当てている。ええ…。中学3年生は中学2年生、高校1年生なぞよりよっぽど勉強するだろうから、この年のデータはちょっと脳内で上方修正しといた方が良いかもしれない。

子供の家庭環境についての変数も用意しておく。ここでは、子供の社会経済的状況を最も要約するであろう「親の学歴」、具体的にはその教育を受けた年数を使う。中学校卒以下ならば9、高校卒ならば12、短大卒で14、四年制大卒で16という具合である。他にも、母子家庭、一人親家庭等のダミー変数を用意しておく。分析の準備が整ったところで、実際に親の学歴別・中学3年生の学習時間を見てみる。川口の示した図が以下である。

f:id:HaJK334:20200521172029p:plain

まずは注意点を示しておく。社基調では連続する9日間を調査するため、段階的週五日制の影響を調べることが出来るのは先述のとおりである。ただし、平成8年調査では調査の日付が記録されておらず、第二土曜日と第三土曜日の区別がつかない。そのため、平成8年調査における土曜日の平均学習時間はそのプールデータを使うことになる。これはしょうがない。また、上のグラフでは社基調における「学業」「学習・研究」の時間に加え、学習の固定費用だと考えられる「通学」の時間も含まれている。平成8年調査から順に47分、38分、34分である。はあ、これはどうなの。まあいいか。

次に一週当たりの平均学習時間を計算する。既に平日と土日の平均学習時間は計算してあるので、加重平均値の計算に使うウェイトはそれぞれ5/7と1/7である。しかし、川口が示したグラフから加重平均値を計算しても、その結果とグラフが一致しない。川口もウェイトについては「約5倍」だとか「平均値はsampling weightを使った」だのと意味不明なことを書いている。というわけで、私は川口がサンプルウェイトを使って平均値を計算してしまったのではないかと推測する。

仮に曜日ごとの(標本の)重みを考慮した場合、その加重平均値は標本の構成要素一人当たりの平均値であり、プールデータにおける平均値であり、サンプルデータにおいては確かに正しい数値だが、サンプルデータは真値ではない。曜日ごとに重みが異なるのは単なる標本誤差である。まさか仮にも経済学者が平均値の計算もろくに出来ないとは考えにくいが、栗原(2010)によれば曜日ごとの重みを1とする平日平均時間の計算は"若干煩雑な作業"と記述されており、代わりに平日の標本をプールした簡便な平日平均の算出が提案されている。

川口も同様の手法を採ったのではないかと思われるが、私の手元に社会生活基本調査のミクロデータは無いため事の真偽は不明である。当然だが推定母人口が曜日によって大きく変動するような場合、プール平均は使えない。「親が中卒の子供」という2006年調査では全体の1割強に過ぎない少数集団の場合、標本誤差の増大は無視できないため、仮に煩雑であっても正しい平均値を使うべきである。

それでは正しい平均値を計算するにはどうすれば良いのか。せめて川口が曜日ごとの平均値を出してくれていれば計算できるのだが、平日の平均学習時間しか示していない。その平均学習時間の計算自体が間違っているのだとすればどうすれば良いのか。おそらく一番適当なのは、やはり日数ごとのウェイトをかけてやることだろう。これは平均学習時間の計算式を二つのウェイトに分解すれば分かりやすい。

(\cfrac{5\tau}{7\tau})(\cfrac{1\tau}{5\tau}) u_{1}+\cdots=(\cfrac{5\tau}{7\tau})(\cfrac{1\tau}{5\tau})\sum_{i=1}^5 u_{i}+\cfrac{1\tau}{7\tau}\sum_{i=1}^2 u_{i+5}

(\cfrac{5\tau}{7\tau})(\cfrac{t_{1}}{t_{1}\cdots+t_{5}})u_{1}+\cdots=(\cfrac{5\tau}{7\tau})\sum_{i=1}^5 (\cfrac{t_{i}}{t_{1}+\cdots+t_{5}})u_{i}+\cfrac{1\tau}{7\tau}\sum_{i=1}^2 u_{i+5}

 (\cfrac{t_{1}+\cdots+t_{5}}{t_{1}+\cdots+t_{7}})(\cfrac{t_{1}}{t_{1}+\cdots+t_{5}})u_{1}+\cdots=(\cfrac{t_{1}+\cdots+t_{5}}{t_{1}+\cdots+t_{7}})\sum_{i=1}^5 (\cfrac{t_{i}}{t_{1}+\cdots+t_{5}})u_{i}+\sum_{i=1}^2 (\cfrac{t_{i+5}}{t_{1}+\cdots+t_{7}}) u_{i+5}

 式がはみ出しているが左辺の第1項だけに注目すれば十分である。1番目と3番目について何をやっているかと言えば、それぞれの平日平均について、その日数(ないし部分母集団人口の真値)、或いは推定母人口の割合によって加重平均値をとり、さらに週全体の平均値について、平日と土日の日数、或いは推定母人口の割合によって加重平均値をとっている。

式を見れば分かると思うが、結局は単なる日数で割るか推定母人口のウェイトで加重平均値をとっているかの違いである。あえて回りくどく書いているのは、それぞれのウェイトの役割を明確にするためだ。たとえば、1番目の左辺第1項であるu_{1}の係数を見てみると、そのウェイトは(\cfrac{5\tau}{7\tau})(\cfrac{1\tau}{5\tau})という二つのウェイトに分解されている。右側が平日に占める各曜日のウェイトであり、左側が週全体に占める平日のウェイトである。二つのウェイトをかけることで、結局は週全体に占める各曜日のウェイトになっている。3番目も同様に、右側のウェイトが平日の推定母人口に占める各曜日の推定母人口のウェイト、左側が週全体の推定母人口に占める平日の推定母人口のウェイトになっている。

私が適当であろうというのが2番目の平均値である。川口は平日の平均学習時間の計算からして既に推定母人口のウェイトを使っているはずであり、すなわち右側のウェイトは変えられない。ならばせめて左側だけでも正しいウェイトをかけてやろうということだ。もちろん、これはより適当な方法であろうというだけであり、必ずしもこの方法で真値に近づくことが保証されるわけではない。というわけで、2番目の方法により再計算した週全体の平均学習時間のグラフが以下である。

 

f:id:HaJK334:20200521174718p:plain

川口が示していたグラフでは大卒の親を持つ子供の学習時間が微増、中卒の親を持つ子供の学習時間が30分程度低下していた。一方、上のグラフでは大卒がほぼ変わらず、中卒の親をもつ子供の学習時間は18分の減少に留まっている。通学時間の減少を考慮すれば14分の減少である。平成8年調査のデータと比較すると、むしろ学習時間の多寡は逆転している。ただし、先にも述べた通り平成8年調査のデータはあてにはならない。

この程度だったら何を細かいことをという話になるかもしれないが、やはり高卒のデータを抜いているのは酷い。抜いているというか示していないのは。ちなみに「高卒+短大卒」の数字は川口が示している中学3年生全体の平均学習時間と、親の学歴の割合から逆算したものである。したがって、高卒と短大卒は区別されていない。また、補正前のデータでも高卒(短大)の学業時間が最も伸びているのは変わらない。中卒と大卒を比較すれば格差が増大したと言いうるが、高卒と大卒を比較すればむしろ格差は縮まっているといえる。

 

※上の平均値の計算についてより簡単な説明をしてみる。今、「中卒の親を持つ子供」の学業時間について、月曜日から日曜日まで各曜日ごとに異なるサンプルを抽出したとする。サンプルサイズはそれぞれ100, 100, 200, 100, 100, 100, 300である。このとき、1週間全体の1日当たり平均学業時間を計算するには、それぞれの曜日ごとの平均時間をまず計算し、それを合計したものを7で割ればよい。サンプルサイズのウェイト、正確にはサンプルから推定される母人口のウェイトを使う必要性はどこにもない。中卒の親を持つ子供が水曜日に倍になったり日曜日では3倍になったりするわけがないからである。勿論、サンプルサイズが十分に確保されていればこのことは問題にならない。むしろ栗原が指摘するように平均値の簡便な計算手法として利用できる。

川口論文については同じ経済学者による(絶賛)レビューがいくつかあるので流石に私の思い違いである、と思いたいがラインハート=ロゴフ論文でも初等的な平均値の計算ミス(こちらは逆に加重平均値を計算するべきところ均等に平均している)があったそうなので、経済学者の数学能力を過度に信頼するのはやめた方が良いのかもしれない。それにしても川口の分析はただの二次分析なのに何故誰も2011年調査以降のデータで同様の分析をしないのか不思議だ。私は一般人だから社基調のデータを利用することができない。こういう時こそ学者先生に頑張ってほしい。

 

参考文献

川口大司 (2013).  “Fewer School Days, More Inequality,” Hitotsubashi University Global COE Hi-Stat Discussion Paper Series No. 271

栗原由紀子 (2010). 「社会生活基本調査ミクロデータにおける平日平均統計量と標本誤差の計測」. 統計学 99号 pp.20-35

*1:社基調における「学業」の定義は「学校の授業や予習・復習・宿題,校内清掃 ホームルーム。また学習塾での勉強はここに含める」、「学習・研究(学業以外)」の定義は「学級・講座・教室(?) 社会通信教育 テレビ・ラジオによる学習・研究 クラブ活動・部活動で行うパソコン学習など 自動車教習」。備考や内容例示一覧等は平成18年社会生活基本調査別表2及び別表3を参照のこと。また、以上より川口論文における学習時間は通勤・通学、土曜学校におけるホームルームや校内清掃等の時間も含むため、一般に想起されうる学習時間と同一でないことに注意が必要である。なお、(必修科目として行うものでない)クラブ活動・部活動は平成13年調査では「学習・研究」に含みうるが、平成18年調査では含まれない。ただし分析対象が中学生3年生であり、調査時期が10月であることから、定義変更による影響は小さいものと考えられる