若者論を研究するブログ

打ち捨てられた知性の墓場

MENU

ゆとり教育によって格差は拡大したのか【未完】

これまで、このブログでは「ゆとり教育による学力格差の拡大」という仮説に対して、折に触れてその検討を試みてきた。個人的には一区切りがついたのだが、何分各記事に分散しており統一性に欠ける。そこで、稿を改めて各検討の略述をここにまとめることにした。

煩を厭うて簡を尊ぶ世相であるから、冒頭から結論を言ってしまうと、ゆとり教育は格差拡大を意図した、或いは容認する政策ではなく、また、ゆとり教育によって学力格差が拡大したという証拠は殆ど無い。以下、順を追って説明していこう。

ゆとり教育はエリート教育だったのか

詰め込み教育

さらに悪いことに、中学校からかなりの部分を高校に先送りするにもかかわらず、高校卒業時の水準は落とさないと明言したため、高校での内容が極端に過密なものになっている。これでは、詰め込み・未消化による一層の落ちこぼれを生むだけである。

その一方で、能力のある生徒にとっては、小学校・中学校の、すぐ終わってしまう学習は全くつまらないものでしかなく、こちらも学習意欲を失う。「落ちこぼれ」の反対で、「浮きこぼれ」現象と呼ばれるものである。今の方向でこのまま進めば、さらに学力低下がひどくなるばかりなのはもう目に見えている。

西村和雄編, 2001, 「学力低下が国を滅ぼす」, 日本経済新聞社, p.167

ゆとり教育(1998年改訂学習指導要領)が実施される直前、一部の論者が危惧していたのは、学習内容の削減による"浮きこぼれ*1"の存在であった。今では意外に思えるかもしれないが、これは当時としては自然な発想である。というのも、大量の落ちこぼれを生んだとされる70年代の「詰込み教育」への反動こそ、80年代以降にゆとり教育路線を推し進めた原動力だったからである。詰込み教育が落ちこぼれを生んだのであれば、ゆとり教育浮きこぼれを生むであろうというわけだ

補足しておくと、落ちこぼれという言葉は今でこそ一般に使われるようになったが、元々は70年代の詰込み教育バッシングの際に流行した言葉である。当時の学校教育は、膨大な学習内容を消化することだけを目的にした「新幹線授業」とも揶揄され(毎日新聞1976年10月7日付)、全国教育研究所連盟の調査では、教育課程についていける児童・生徒が小学校で7割、中学校で5割、高校では3割という結果が出た事から、「七五三教育」という造語も生まれた(「戦後日本教育史料集成」編集委員会 pp.256-257)。

ここで注意しなければならないのは、批判の過程が異なるとしても、結局のところ詰込み教育とゆとり教育は同じ批判に晒されていたということである。たとえば、1975年に日教組と国民教育研究所が共同で実施した学力調査を例に引いてみよう。この調査はその衝撃的な結果から各紙に一面で取り上げられ、結果として詰込みからゆとりへと方針が転換された契機ともなった調査なのだが、これに対して当時の日教組と文部省の代表はそれぞれ次のような談話を残している。

【基礎学力の低下明白】
日教組の今村彰教育政策部長の話「この調査で、子どもたちの読み、書き、計算といった基礎的な学力が低下、あるいは停滞し、子どもたちの学力の格差が拡大していることが明らかになった。現行の教育課程、教科書の内容について抜本的な検討が必要であることを示すものだ」

【意外な結果ではない】
文部省・沢田道也小学校教育課長の話「日教組の調査結果は意外なことではない。どこが調査してもこんな結果になるだろう。現在、教育課程の改訂に取り組んでいる文部省の教育課程審議会でも問題にしているところであり、秋の中間答申もこの方向で作業が進められているところだ」

批判する側、批判される側ともに、学力の低下、及び学力格差の拡大を共通の認識としていたことが分かる。勿論、これは日教組と文部省だけの見解ではなく、広く世間一般に膾炙していた認識である。そのことを示すために、当時の国会議事録をいくつか引用してみよう。ただし、長いので読み飛ばしてもらっても構わない。

これによりますと、小学校の五、六年の子供の約五七%は、学校での勉強全体が「わからない」と答えています。半分以上がわからないと答えています。この数字は決してこれだけの問題だけではなしに、昭和四十五年に発表された全国教育研究所連盟の調査においても、ほぼこれは一致しております。私はこの小中学校の半数以上の子供が日々の授業にはついていけないで、置いてきぼりにされておるという事柄について、これはきわめて重大な問題だと、こう思いますけれども、このような事実について、大臣、どうお考えになるでしょうか。

69 - 参 - 文教委員会 - 閉1号 昭和47年09月29日

まず、最初の一つの問題ですけれども、これは行き届いた教育を保障するという点です。いま母親たちにとって一番ショッキングな問題として語られている一つが、いま義務教育でクラスの半分以上の子供たちが授業についていけないという調査報告の結果なんです。これは文部大臣も御存じだと思いますけれども、一昨年全国教育研究所連盟が出した調査の報告ですけれども、義務教育においてすら半分以上の子供が授業についていけない。自分の子供も、そのついていけないほうに、もしや入っているのではないだろうか、そういうことがあったのではたいへんだし、大切な基礎学力を身につけさせるためには、何としてでもこういう子供が落とされていく状態を改善しなければならないというのが親の熱心な願いになっております。

71 - 衆 - 文教委員会 - 3号 昭和48年02月23日

これはもうすでに御承知でございますけれども、教育内容の理解程度について全国教育研究所連盟の調査が出されておるわけであります。(中略)これは学校の先生方の判断の場合ですが、指導主事の判断によりましても、約二分の一の子供が理解をしておるというのが五〇・五%、すなわち逆にいたしますと、約半分の子供がわからない状態に置かれている、こういうきわめてショッキングな数字が出てまいったわけです。(中略)「学習のわからない子がふえてきた」という声は、全国のどこからでも出ています。現場の教師は勿論のこと、子どもたちも、父母たちもみんな困ってしまっています。」というふうなこの説明がつくわけですね。こういう事態をどうするかということ、これはほんとうに重要なことだと思います。

71 - 衆 - 文教委員会 - 16号 昭和48年05月09日

かくて、わが国の文教予算の総予算に占める比率は、本年に至ってついに一割を割ったではありませんか。このような貧弱な教育諸条件の上に、財界の要求する労働力養成のための差別と選別教育の強引な推進は、いま何を生み出しているでしょうか。全国教育研究所連盟の調査が示すとおり、半数以上の子供が教科を理解できないでいるという衝撃的な報告となってあらわれております。また、ことしは児童生徒の自殺件数は、戦後最高を記録しているではありませんか。かかる教育の荒廃をもたらした文教行政上の失政の責任もまた、のがれることはできないのであります。

71 - 衆 - 本会議 - 61号 昭和48年09月21日

この調査を見ますと、学力の落ちこぼれといいますか、私はこれは落ちこぼしと言った方がいいのじゃないかと思うのですけれども、いずれにしても、その落ちこぼれが物すごく多い、学力の質というものが停滞しておる、あるいは低下をしておる、さらに、学力の格差が増大しておる、こういうことがこの調査ではっきり出ておるわけでございます(中略)巷間教育課程についていける子供のことを、七五三教育だ、こういうことも言われたことがあるわけでございますけれども、この調査は大体そういうことをあらわしているような気がするのです。

77 - 衆 - 文教委員会 - 7号 昭和51年05月19日

以上の記述を読んで察しが付いているかもしれないが、落ちこぼれと学力格差の拡大が問題視されたということは、必然的に詰込み教育もまたエリート選別教育の誹りを免れなかったということである。たとえば、東京地学教師グループは1968・69年改訂指導要領に対し、次のように直截な言葉で批判している。

しかしその内容は,われわれ民間教育運動のなかで追及されてきた『自然科学をすべての国民のものに』という,教育内容を科学的に,大衆的にというものとはいちじるしく異なる。具体的には少数(年令人口の約3%)の『ハイタレント』と多数の『非タレント』を『選別』しようという教育政策にうかがうことができる。少数の『ハイタレント』には『英才教育』を,多数の『非タレント』には『能力』・『適性』に欠けるとして,それらにみあった低い教育を与えようとしているのである(東京地学教師グループ 1969 p.25)。

三浦発言

ここまで、詰込み教育において落ちこぼれや学力格差の拡大が問題視され、更には意図的なエリート選別教育と批判された経緯について説明してきた。しかし、これは詰込み教育を批判するためではない。ここで示したかったのは、実証を伴わない主張には価値が無いということである。なんとなれば、詰込み教育とゆとり教育という正反対(とされる)教育政策が、全く同一の批判を受けているからである。理屈と膏薬は何処へでも付くということだ。

ところで、98年の学習指導要領の改訂に際し、作家で教育課程審議会会長であった三浦朱門は「戦後五十年間の教育は落ちこぼれの救済に血道を上げてきた。それに代わってゆとり教育ではエリート教育をすすめる。落ちこぼれには道徳性だけを養ってもらえばよい」という趣旨の発言を行い話題となった。この発言は、ゆとり教育が格差拡大を齎すエリート選別教育と誤認された最大の原因かもしれない。

ただし、先にも述べたように、そもそも「落ちこぼれ」という言葉自体が詰込み教育の産物である。それ以前に学校教育の文脈でこの言葉が使われた事例は、寡聞にして知らない。三浦の認識はあくまでも三浦の認識であり、文部省の統一された見解ではない。そして、詰込み教育もまた"政府・財界の要求する労働力養成のための差別と選別教育の強引な推進"と批判されたことは、先の議事録の引用に示した通りである。

また、こうした関係者の発言から学校教育の真実が分かるというのであれば、反対の事例を出すことも容易である。たとえば、元文科省次官である小野元之は、2006年に行われた講演の中で、ゆとり教育には三つの誤解があると言い、その三つ目について次のように述べている。ただし、小野は三浦とは違い、これは個人の見解であるときちんと断っている。

それから三つめには、このような教育内容の大幅削減*2を決定したということで、文部科学省は学力向上をあきらめたのか、学力向上政策を放棄したのかと、世の中に思われてしまったことがあります。十八歳人口が減ってきて、大学さえ選ばなければ全員が進学できるような全入時代に入るのだから競争しなくてもいい、学校ではそんなに一生懸命勉強しなくていい、こういう間違ったメッセージを与えてしまったのではないかということです。

「基調講演:日本の子どもに求められる読解リテラシー東京大学大学院教育学研究科 教育測定・カリキュラム開発<ベネッセコーポレーション>講座国際研究会 2006年8月6日

結論

ここで「ゆとり教育はエリート選別教育だったのか」についてひとまず結論を出しておこう。結論は不明である。というより、そうであるとも言えるし、そうでないとも言える。当たり前だが、一国の教育政策が決定するまでの過程には、様々な利害関係者の思惑が複雑に絡み合っており、一個人の思想や信条で決定されることはない。

たとえば、90年代の公教育を方向づけた87年の臨教審について、宇野(2015)は、臨教審において使われる「個性」という言葉は、画一的な教育が愛国心を喪失させたと主張する「国家派」と、硬直化した日本の行財政に改革を求める「自由化派」という、対立する二つの派閥を統一するためのシンボルであったと説明している。

ゆとり教育も同様に、国家・社会の立場からゆとり教育に肯定的なもの、否定的なものがいれば、児童・生徒の立場からゆとり教育に肯定的なもの、否定的なものがいたのであり(山内他 2005)、一国の政策とはそれぞれの論者がそれぞれの立場で主張を繰り返した結果として生じた、歴史的・社会的産物なのである。

補足

念のため補足しておくと、ゆとり教育がエリート教育であったとするならば、その制度的裏付けは「選択教科」の拡充を措いて他にない。授業時数の削減は社会経済的地位による格差を拡大する可能性はあるが、能力による選別機能はむしろ弱まってしまう。学習内容の削減も同様であり、加えてゆとり教育では授業時数の削減以上に学習内容が削減されたため、格差の拡大や固定化を意図していたとも考えにくい。学習の効果は一般的に(そして実証的にも)逓減するため、学習内容を削減すると追加の学習による便益が減少するからである。

ゆとり教育によって格差は拡大したのか

律儀に読んでいただいた方には本当に申し訳ないのだが、以上の記述は全くの無意味である。先にも少し触れた通り、実証を伴わない主張は無価値であり、重要なのは実際に格差が拡大したのかどうか、していたとすればその原因は何か、ということである。上の記述は、あたかも一国の教育政策がまるで統一された意思や目的を持っているかのように思いなす人*3に向けた記述であり、そうでなければ読む必要はない。

というわけで、早速「ゆとり教育による学力格差の拡大」を検討していこう。とは言っても、冒頭に述べた通り、既に別の記事において検討は済ませてしまっているので、ここでは簡単にその結果を紹介するに留める。

PISA

良く知られているように、1956年から開始され、その後10年程実施された全国学力テストが日教組の反発によって終了して以来、日本には全国的な学力調査の蓄積が殆ど存在しない(袰岩 2016; 川口 2020)。加えて、日本の学校現場では子どもの家庭環境を訊ねることがタブーの一つとされていることもあり、教育格差に関するデータを入手することは、研究者でも困難となっている(志水他 2019)。

他方、2000年前後から開始されたPISA・TIMSSのような大規模国際学力調査は学力の経年比較が可能となるように設計されており、加えて(生徒質問紙であるため精度には欠けるものの)、生徒の家庭環境に関するデータも収集していることから、親の社会経済的地位(SES)による子供の学力格差を経年比較することができる。PISAでは、これらSES設問の各得点を合成したESCSという変数を用意している。

というわけで、ESCSと各領域(読解力,数学的リテラシー,科学的リテラシー)の得点(PVs)を回帰分析した結果が以下である。分析に当たってはRのintsvyパッケージを利用した。なお、PISA2000の結果が含まれていないのは、当該調査ではSESに関る設問に日本の生徒が回答していないからである。詳細については後述する。

f:id:HaJK334:20210505051006p:plain

普通に読めば、この15年間ESCSが学力に与える影響はほぼ一定であり、少なくとも特定の教育制度の変更と係数の変化を結びつけることはできない。付言すると、ゆとり教育が実施されたのは2002年(小・中学校で一斉実施)であり、脱ゆとり教育が実施されたのは小学校で2011年、中学校では2012年からである。

以下は、各年度のPISA受験者が「ゆとり教育」を受けた年数を表にしたものである。網掛けの部分がその年数となっているが、2009年から実施された移行措置については新指導要領(08年改訂)の前倒しという性格が強かったためグレーにしている。

f:id:HaJK334:20191204041809j:plain

仮に、PISA2003においてESCSの影響力が強まっていたとして、続くPISA2006-2012の結果はゆとり教育との因果関係を否定している。98年改訂では年間70コマ削減されているため、当然にPISA2006-2012の受験者の方が削減された授業時数が大きくなるからである。

むしろ、敢えて係数の変化と指導要領の変更を結び付けたいのであれば、PISA2003-2015までの結果は「ゆとり教育による格差縮小」「脱ゆとり教育による格差拡大」と解釈する方がまだ合理的である。ただし、PISA2018では再び格差が縮小していることから、結局指導要領の変更が学力格差に与える影響は、それほど大きくないのかもしれない。

補足―川口大司による格差拡大説

Daiji, Kawaguchi. (2013) "FEWER SCHOOL DAYS,MORE INEQUALITY", Global COE Hi-Stat Discussion Paper Series 271

ゆとり教育による格差拡大」を実証するものとして頻繁に引用される川口論文だが、この論文には(というかこの論文を軽々に引用するには)いくつかの問題がある。第一に、川口が二次分析に利用した社会生活基本調査が示しているのは(親の学歴が)中卒の子供と大卒の子供の学習時間差拡大であり、実際には論文に示されていない「親の学歴が高卒」の子供の学習時間が最も伸びている。したがって、中卒と大卒の格差は拡大したと言い得るが、高卒と大卒の格差はむしろ縮まっていると言える。詳細については以下の記事を参照してほしい。

第二に、川口論文ではPISA調査のデータを利用してSESと学力の関係がゆとり教育の前後でどのように変化したのかを調べているのだが、そもそもPISA2000では日本の生徒は家庭の社会的・経済的地位に関る設問に回答していない。そこで、川口は家庭の蔵書数や自室の有無等の変数を用いて親の学歴を予測し、その予測された親の学歴を利用して学力との関係を調べている。

ただし、PISA2003以降は日本も(親の学歴含む)SESに関わる設問に回答しており、それらの結果を合成したESCS(Economic Social Cultural Status)という変数が用意されている。そのため、川口の利用した手法を採用する必要はなく、より直接的に学力とSESの関係を調べることができるようになっている。

社会生活基本調査のデータと違い、PISAデータは万人に公開されているため誰でも容易に検証することが可能である。そして、検証した結果が上記である。

TIMSS

次にTIMSSについて検討していきたのだが、残念ながらTIMSSではPISAほどSESに関するまとまった情報は得られない。保護者に対する調査が実施されるようになったのはTIMSS2011からであり、それ以前の結果については「家庭にある本の冊数」がSESの代理指標としてしばしば利用されている(同上 https://a.co/8NryTdE)。

ここでは『日本と世界の学力格差――国内・国際学力調査の統計分析(以下、「世界の学力格差)』から、川口の分析を引用しよう。以下はTIMSS2003-2015を対象に、蔵書数が「0-10冊」のグループと「201冊以上」のグループの得点差を分析した結果である。特に学力格差に関する部分を抜粋した。なお、TIMSS2003以降の比較となっている理由はPISAと同様である。

はじめに、表5-3の日本のデータを確認しておこう。2000年以降、日本では学力の低下が騒がれたが、TIMSS2003から2015までの数値を見る限り、この間の学力の低下は確認できない。むしろTIMSS2011や2015で見られるのは、学力の向上である。得点差を見ても、TIMSS2007で得点差が拡大する傾向が見られたものの、その後のTIMSSではやや縮小傾向にある。また「0-10冊」のグループの成績のみ、TIMSS2003から2007で低下したものの、それ以外の箇所は回を重ねるごとに得点が上昇している。要するに、日本のTIMSS第4学年の数学の成績については、この間、全体的に向上する傾向を示しており、明らかな学力低下や学力格差の拡大は認められないということになる。

(中略)

表5-13をみるとわかるが、TIMSS2003からTIMSS2012まで日本の第8学年の得点差は、第4学年のそれと同じか、やや大きい程度の数値である。ただここで注意したいことは、TIMSS2003から2007にかけて得点差が拡大しているという点である。この得点差は2015年にさらに拡大し、90点を超えるまでになっている。この傾向がたまたま生じた一過性のものなのか、それとも今後続くのかは、今後のデータの蓄積を待つ他ないが、一貫して得点差が拡大傾向にあるというのは気なる点である。

(中略)

ここまでの分析を総括すると、日本についてはTIMSSから明らかな学力低下の傾向は見られなかった。日本の平均点は、今回分析対象とした10の地域・地方の中ではむしろ高い方である。第4学年に関して言えば、得点差も比較的小さく、理想的な状況に近いとすら言える。日本より得点差の小さな国・地域は、香港(HKG)やオランダ(NLD)くらいである。

一方、第8学年においては、この間に得点差が拡大していく傾向が見られた。この拡大傾向が今後も続くのかどうかは定かではないが、TIMSSの日本の成績を読む際は、平均点の高低のみならず、格差についても引き続き注視していく必要があるといえるだろう。

TIMSSでは、第4学年数学においては学力格差の拡大が確認されず、第8学年数学において格差の拡大傾向が確認されている。ただし、川口が指摘する通り、格差はTIMSS2015において一層拡大している(2003-70.9点,2007-78.4点,2011-77.0点,2015-90.5点)。TIMSS2015では第8学年数学で過去最高の得点を記録しており、それが「脱ゆとり教育の成果」と喧伝されたことは周知の通りである。ちなみに、この後は川口もPISAデータのESCS変数を用いた回帰分析を行っている。結果は筆者と変わらないのでここでは省略する。

刈谷・志水調査

「世界の学力格差」の冒頭で、監修者である志水宏吉は次のように述べている。

学力低下の実体は学力格差の拡大である」という主張を、監修者らのグループが行ってから15年あまりが経過した。小中学生の「学力の2こぶラクダ化」という言葉で表現したが、そうした見方は今日では日本の学校現場の常識となっている。

志水の自負も故無しとはしない。市川(2002)が指摘するように、苅谷・志水らが行った調査は学力低下論の源流の一つでもあり、その白眉はそれまで学校現場においてタブーとされてきた学力格差の実態を明らかにしたことにあるからだ。

ただ、ここで注意しておかなければならないのは、志水が明らかにした学力格差の実態はゆとり教育が実施される前のものであり、2013年に志水自らが実施した後継調査では、学力格差は縮小しているのである。

これがまた何ともややこしいのであるが、志水は80年代を前ゆとり教育の時代、90年代をゆとり教育の時代、そして一般にゆとり教育が行われていたとされる2000年代を脱ゆとり教育の時代と考えているのである。事の詳細についてはいくつかの記事に書いているので、参照していただければ幸いである。

ちなみに、(学力低下や学力格差の拡大はゆとり教育が原因であるという)この志水の認識は「世界の学力格差」にもそのまま引き継がれているのだが、川口が執筆した章では、ゆとり教育による学力格差拡大の懸念を紹介した後、「一方で、こうした学力格差の拡大を懸念する声とは、逆の現象を指摘する研究も存在する」として志水の研究を紹介している。読者が混乱するので志水先生はそろそろ何らかの注釈を付けてほしい。

 

色々と加筆修正予定

引用・参考文献

市川伸一(2002).「学力低下論争」. ちくま新書

宇野由紀子(2015).「臨教審答申における『個性』の意味: 学校教育を通じて養成しようとする人間像」. 『教育論叢』58 巻pp.55-64

川口俊明(2020). 「全国学力テストはなぜ失敗したのか――学力調査を科学する」. 岩波書店

志水宏吉(監修)・川口俊明(編著).「日本と世界の学力格差――国内・国際学力調査の統計分析」. 明石書店

東京地学教師グループ(1969)「地学教育の諸問題と今後の方向」地球科学 23(1) 

袰岩晶・篠原真子・篠原康正(2019).「PISA調査の解剖 能力評価・調査のモデル」. 東信堂

山内乾史 ・原清治(2005).「学力論争とはなんだったのか」. ミネルヴァ書房

 

*1:山内他(2005)では、ゆとり教育に批判的な言説の一類型として"吹きこぼれ論"としている。

*2:一般には三割削減と言われているが、これも小野によれば一割の削減に留まるという。ゆとり教育における学習内容の削減はこちらを参照のこと

*3:一例 https://twitter.com/fsansn/status/1476534516533858311

それでゆとり教育ってのはどこのどいつだよ

Wikipedia

今日、何の気なしにWikipediaの「学力低下」の項を眺めていると、とんでもない記述が目に入ってきた(既に修正済み)。

苅谷他が行った学力調査では、89年と01年の同一問題との比較では、小学国語で78.9%→70.9%(-8.0%)、小学算数で80.6%→68.3%(-12.3%)、中学国語で71.4%→67.0%(-4.4%)、中学数学で69.6%→63.9%(-5.7%)へと下がっていることがわかっている(調査報告「学力低下」の実態(岩波ブックレット))。

01年と13年の同一問題との比較では、小学国語で70.9%→56.3%(-14.3%)、小学算数で68.3%→68.0%(-0.3%)、中学国語で67.0%→72.4%(+5.4%)、中学数学で63.9%→53.3%(-10.6%)と学力が低下傾向にある。

苅谷剛彦らは2002年に『「学力低下」の実態』で、1989年と2001年とで同じ問題を小中学生に答えさせる学力に関する調査を比較し、基礎学力の低下を指摘した(学習指導要領は、1991年に「知識詰め込み型」から「自ら学び、主体的に考える型」に改訂されている)。

同調査では

* 1989年と2001年では、小中学生の学力は明らかに低下している

* 2001年と2013年では、小中学生の学力は更に低下している

何がとんでもないのか、大方の人は良く分からないだろうから、ここで簡単に説明しよう。苅谷剛彦が行った調査(以下、苅谷調査)というのは、01年に大阪を対象として実施した学力調査であり、1989年に大阪大学の池田らが行った『学力・生活総合実態調査』(以下、池田調査)と同様の問題・アンケートを利用することで学力の経年比較を行っている。

そして、13年に行われた調査というのは(Wikipediaには一切記述されていないが)苅谷調査のメンバーでもあった志水宏吉が実施した後継調査(以下、志水調査)であり、池田調査・苅谷調査に続く3回目の調査として、過去の調査と同一の問題を使うことで経年比較を可能としている。

簡単にまとめると、次のようになる。1989年実施:池田調査, 2001年実施:苅谷調査, 2013年実施:志水調査。それぞれ12年の間隔で実施されていることから、学習指導要領の影響を測定するには格好の学力調査となっている。それ故、Wikipediaではこの調査が「ゆとり教育による学力低下」を示す証拠だとされていたわけである。

で、何がとんでもないのかという話だが、実は13年に実施された志水調査の報告書ではWikipediaとは正反対のことが書かれている。つまり、志水調査においては明らかな学力向上傾向が確認されているのである。誤読したという可能性はあり得ない。当該報告書では13年調査の学力向上傾向は一貫して分析のテーマとなっているからだ。そもそも、Wikipediaに記述されている数字は報告書のどこにも現れない謎の数字である*1

志水調査

で、まあこれだけならばWikipediaはやっぱりカスだなという話で終わるのだが、事はそう単純ではない。この志水調査で確認された学力向上傾向、当の報告書でどのように分析されているのかと言えば、何と03年から始まった脱ゆとり教育の成果とされているのである。具体的に該当する箇所をいくつか引用してみよう。

文部科学省が『ゆとり教育路線』から『確かな学力向上路線』にかじを切ったのは,二〇〇三年のことであった(中略)そして今回の調査である。二〇〇一年から二〇一三年へといたるこの一二年間は,間違いなく『確かな学力向上路線』の期間であった(志水他, 2014, pp.2-5)。

本書の最大の特徴は、三時点での学力調査の結果を比較したことにある。その三時点は、「ゆとり以前」(一九八九年)→「ゆとり時代」(二〇〇一年)→「ポストゆとり」(二〇十三年)のそれぞれの時期に小・中学校生活を送った子どもたちを対象にしていると、大まかに見積もることができる。つまり、第一回調査はゆとり教育の前の状況を、第二回調査はゆとり教育の影響を、そして今回(第三回)の調査はゆとり教育以降の「確かな学力向上路線」の影響をそれぞれ反映していると見ることができる(同上, p.64)。

また、以下の引用にも示すように、報告書ではゆとり教育からの脱却こそが学力を向上させた要因であると何度も力説されている

まず、指摘しなければならないのは、政策の重要性である。私たちの調査結果が示しているのは、「ゆとり教育路線」から「確かな学力向上路線」への政策転換が、子どもたちの学力形成に大きな影響を与えたという事実である。(同上, p.66)

のだが、肝心の「脱ゆとり」や「確かな学力向上路線」の具体的内実には一切触れておらず、当然ながら、苅谷調査にあったような「伝統的学力観」「新しい学力観」を軸とした分析なども皆無である。ついでに言うと槍玉に挙げられている「ゆとり教育」や「新しい学力観」についての記述も無い。ちなみに、志水自身はその実施前からの強硬な反ゆとり教育派である。

このように、本来「ゆとり教育による学力低下」説の反証となってもおかしくはない結果(01-13年間における学力向上傾向)が、二重にその説を支える証拠として扱われているわけである。

ベネッセ教育調査

で、まあこれだけならばそういうこともあるでしょ、と終わらせてもいいのだが、実のところこの論法、つまり論者の都合によってゆとり教育の時期が(事後的に)変わってしまうというのは、ゆとり教育言説に広く見られる問題点なのである。

たとえば、ベネッセがゆとり教育の前後に実施した学習基本調査・学習指導基本調査がそれだ。この調査では(2002年から実施された)ゆとり教育の後に、学習時間の増加、学習習慣の定着などが確認され、教員の指導観も個性尊重から画一性重視へ、自主性尊重から強制重視へ移行したことが分かっている(いずれも2006・2007年の結果である)。

この結果を調査者達がどのように解釈したかと言えば、「ゆとり」から「脱ゆとり」への変化と解釈したのである。その理屈は志水と同じである。曰く、我々教育学界の強烈な批判により*2が、文科省はその実施前にゆとり教育路線を放棄したのであり、我々の調査結果に表れたのは「脱ゆとり」の結果であり「確かな学力向上路線」の成果である、というわけだ。

PISA

研究者をしてこの様であるのだから、況や我々一般人においてをやである。この手のいつの間にか始まる謎の事後的脱ゆとり教育実例*3は挙げればキリ*4が無いが、中でもやはりPISAに関する報道は抜きん出てカスである。あるのだがもう疲れたし別のページにこれ以上なく詳細に記しているのでリンクだけを貼っておこう。

PIAACを含む、PISA2006以降の全ての調査で「ゆとり教育による学力低下」に反する結果となっている。それが如何にして学力低下の揺ぎ無き証拠となったのか、興味がある方はご一読いただきたい。

以下はその簡易版である。

 

結語

ゆとり教育とはいつの時期を指すのか」

この問いに自信を持って即答できる人はそう多くはないだろうが、それも無理からぬことである。これほど(恐らく日本人の9割以上に)知られている教育制度が、その定義すらもイマイチ判然としない原因の一つは、論者によってその定義が都合よくコロコロと変えられてしまうからであり、何故変える必要があるのかと言えば、一般に思われているほどゆとり教育による学力低下を示す証拠は存在しないからである。

志水にしろ、耳塚*5にしろ、もし学力低下や学習離れを示す結果が出てきていれば、喜んでゆとり教育と結びつけたはずだ。PISAの報道にしたところで、ゆとり教育の実施時期と得点が低下した時期が綺麗に重なっていれば、意味不明な主張を紙面に展開する必要は無かったのである。これらは全て望んだ結果を出せないゆとり教育が原因なのであり、ともあれゆとり教育は滅ぶべきである。

関連記事

以下のページではベネッセ調査・志水調査についてもう少し詳細に説明している。

参考文献

苅谷剛彦・志水宏吉・清水睦美・諸田裕子 (2002). 「調査報告―『学力低下』の実態」. 岩波ブックレットNo.578

志水宏吉・伊佐夏実・知念渉・芝野淳一 (2014). 「調査報告―『学力格差』の実態」岩波ブックレットNo.900

ベネッセ教育研究開発センター (2007a). 「第4 回学習基本調査・小学生版」. http://berd.benesse.jp/shotouchutou/research/detail1.php?id=3228
ベネッセ教育研究開発センター (2007b). 「第4 回学習基本調査・中学生版」. http://berd.benesse.jp/shotouchutou/research/detail1.php?id=3227
ベネッセ教育研究開発センター (2008). 「第4 回学習指導基本調査」. http://berd.benesse.jp/shotouchutou/research/detail1.php?id=3247

*1:刈谷(2001)と志水(2014)では使われた共通問題数が異なることから、後者の報告書では89,01年の結果を改めて100点換算した上で13年調査の結果と比較しており、当然にその数値は前者とは異なっている。

にもかかわらず、Wikipediaの記述では89,01年の数値として苅谷調査時点の数値がそのまま使われていることから、少なくとも志水(2014)を参照していないことは間違いない。

恐らく、志水調査で新設されたB問題(いわゆるPISA型問題)を含む正答率と勘違いしたのではないかと思われるが、あいにく報告書ではB問題について詳細な数値は記載されておらず、Wikipediaの記述にも出典が全く示されていなかったため、真相は藪の中である。

*2:ちなみに志水も「我々の前回調査(苅谷調査)が文科省をしてその方針を撤回させたのだ」と全く同じことを言っている。

*3:07年度から始まったのは文字通りただの見直しであり、指導要領が改訂されたのは08年、それが実施されたのは小学校で11年、中学校で12年である。また、小学校では移行措置により授業時数が増えているが、中学校での変化は無い。

以上のことを本川先生にも教えて差し上げたのが返信は無かった。ちなみにこのページについても返信は無かった。理由は不明である。

*4:江見氏からの返信も無い。

*5:学習基本調査・学習指導基本調査の代表者

p値に関するASA声明とその解説

以前書いた「ゆとり教育とは何だったのか―俗説に対する批判的検討」という私的な論説に、補遺として付けていた「p値に関するASA声明(The ASA’s statement on p-values)」の拙訳と解説です。本文を参照する形で書かれているため、一部要領を得ない記述がありますが、特に問題は無いと判断しそのまま載せています。何分、素人の書いた文章ですから、誤った記述も多々あると思われます。お気づきになられた方はコメントにてご教授いただけますと幸いです。

1. p値は,あるデータと特定の統計的モデルがどれだけ「不一致」しているかを示すことができる

p値は,ある特定のデータとそのデータについて提案された特定のモデルの間にみられる不一致性を要約する一つのアプローチを提供する。p値が使われる最も一般的な状況は,帰無仮説と呼ばれるものと,その仮定に基づいたモデルが存在する場合である。多くの場合,帰無仮説は「2 群の間に差がない」というように効果が存在しないこと,或いは,要因と結果の間に(因果的な) 関係性がないことを前提する。p値を計算するときの仮定が真であるという前提の下では,p値が小さくなるほど帰無仮説と(観測された) データとの統計的不一致性は大きくなる。この不一致性は,帰無仮説,或いは前提された仮定に対して,疑問を投げかけているか,反証を提供していると解釈することができる(Wasserstein and Lazar 2016 p.8)。

解説

これはp値についての過不足ない説明である。ここでいう「特定のデータ」と「特定のモデル」というのは,観測されたデータと,帰無仮説に従うと仮定した場合にそのデータが従う確率分布を意味している。たとえば,6.4 節でみたように,大標本調査における「2群の平均の差」という現実に観測されたデータは,帰無仮説が正しいと仮定した場合には特定の正規分布に従うことを説明した。或いは小標本の場合にはt分布と呼ばれるものに従うし,平均ではなく分散を検定する場合には,その統計量は\chi^2分布と呼ばれるものに従う。このように,p値というのは,現実に観測されたデータと,帰無仮説が真という仮定に基づいてつくられた統計モデルがどれだけ「一致していないのか」を示すものであり,それ以外の何物でもない。

ここで注意しなければならないのは,p値,或いは検定と呼ばれるものは,帰無仮説を棄却する判断材料を提供するのであって,帰無仮説が真であること,或いは対立仮説が偽であることについての積極的な判断材料は提供しないということだ。帰無仮説が棄却されなかったということは,単に観測されたデータと帰無仮説は矛盾しないということが示されただけである。帰無仮説が真であることを証明したいならば,他の全ての対立仮説を否定しなければならない。しかし,先にも少し触れたように対立仮説というものは無数に存在するため,検定ではもっぱら帰無仮説を棄却するかしないかが問題となる。従って,帰無仮説が棄却されなかった場合には,判断は保留される。帰無仮説は正しいとも正しくないとも言えない。

2. p値は対立仮説(studied hypothesis) が真である確率,或いはデータが偶然に生成されたものである確率を測定しない

研究者はしばしばp値を,帰無仮説が真であるかについて,或いはデータが偶然に生成されたものであるかについての指標として利用したがる。しかし,p値はどちらにも使えない。p値はあくまでも,特定の仮説的説明に関するデータについての言及であり,説明それ自体についての言及ではない(同上p.9)。

解説

おそらくこれは,p値についての最も一般的な誤解だろう。たとえば,あるデータについてp=0.01という結果を得たとき,この結果はしばしば「対立仮説が真である確率が99%である」,或いは「その結果が偶然によるものである確率は1%である」のように誤って解釈される。こうした解釈はデータの「基準率」を無視している。基準率とは簡単に言えば,ある事象が起きることについての,何らの条件も加えない「素の」確率である。ベイズ統計でいうところの事前確率だ。

たとえば,1000種類の「癌に効果がある」とされる薬の効果を検定したいとしよう。このとき,1000種類の薬のうち,本当に効果がある薬が1種類しか含まれていないなら,基準率は1/1000であり,つまり0.1%となる。この基準率と有意水準0.05の下で検定を行うとどうなるだろうか。999種類の薬には癌について何の効果も発揮しない。しかし,有意水準は0.05と設定されたので,約50種類の薬は棄却域に入ることになる。では,この50種類の薬の一つ一つが本当に癌に効く薬は何%になるだろうか。もし,本当に効果がある薬が正しく棄却域に入っているとしても,それぞれの薬の効果が偶然ではない確率はたったの,1/50 =0.02,つまり2%しかないのである。

仮説検定はあくまでも,帰無仮説が真であると仮定した場合に,ある特定の統計モデル(正規分布t分布や\chi^2分布など) と観測されたデータがどれだけ一致しないか,或いは驚くべきかを示すのであって,その仮説自体が真であるのか,偽であるのかについての確率を提供するわけではない。今見たように,基準率が低くなればなるほど,「まぐれ当たり」の可能性は高くなる。「95%の確率で正しい」と「2%の確率で正しい」では余りにも懸隔がある。

3. 科学的な結論やビジネス,政策上の決定は,p値が特定の閾値を超えたかどうかのみに基づいて判断されるべきではない

科学的主張や結論を正当化するために,「bright-lineルール(p < 0.05 のような)」を機械的に適用することは,データ分析や科学的推論を縮小させる慣習を生み出している。こうした慣習は誤った信念や,浅薄な意思決定につながる。ある結論は,特定の閾値を超えた時点で直ちに真となるわけではないし,逆に特定の閾値を超えなかった時点で直ちに偽となるわけでもない。

研究者は科学的な推論を引き出すために,調査のデザイン,測定方法の質,研究で示された現象についての外部的な証拠,データ分析の前提となる仮定の妥当性などの,多くの背景的な要素を利用すべきである。

現実の検討事項はしばしば「はい―いいえ」という二分法的決断を要求する。しかしこのことは,p値が(それ単体で) ある決定が正しいのかどうかを保証できることを意味しない。「統計的有意差(一般的にp < 0.05 と解釈される)」というものは,ある科学的発見(或いは示唆される真理) を主張するライセンスとして広く使われてしまっている。このことは,科学的プロセスに深刻な歪みをもたらすことになる(同上p.9)。

解説

基準率の無視がp値についての最も一般的な誤解であるなら,こちらはp値についての最も問題のある誤解である。p値が二分法的に使われることの問題点は,第一にそれが二分法的な思考をもたらすこと,或いは,それ自体が二分法的な思考の結果であることだ。現実には二分法的な判断が要求されることはいくらでもあるだろう。その判断の基準としてp値が使われることもあるかもしれない。しかし,二分法的な判断は,容易に二分法的な思考をもたらす。つまり有意差があれば「正しく」,有意差がなければ「正しくない」という誤った断定へと陥ってしまう。

第二に,p値それだけでは仮説の正しさについては何も判断できない。「有意差がある」という主張だけでは何も言っていないに等しい。先にも少しだけ触れたが,有意差というのは,どんなに小さなものであっても,標本サイズを大きくすればいずれは検出される。そのため,「A とB の間に有意差がある」という主張は,それだけでは「A とB は違う」と言っているだけである。この世に全く同一の存在は(殆ど) 存在しないという当たり前の主張を繰り返しているに過ぎない。そのため,p値を利用するのであれば,その効果がどれほど大きなものであるのかという情報も必要になる。或いは,事前に望ましい効果の大きさを想定して,その効果を検出できる確率から標本サイズを決定することもできる。

第三に,科学的な主張をするためにはp < 0.05が必要とする強迫観念は,科学的手続きに深刻な歪みをもたらす。たとえば,Head et al. (2015) は次のように指摘している。

今,(論文や雑誌で) 刊行された結果の多くで偽陽性が見つかることに関心が集まっている。現在の科学的慣行が,統計的に有意な結果をだすことの強烈なインセンティブとなっていることは多くの人間が主張している。そして,ジャーナル,特にインパクトファクターの高い名門では,不自然なほどに多くの統計的に有意な結果が掲載されている。研究者を雇用しようとする人間や研究のスポンサーは,しばしば研究者の論文数やそのインパクトファクターによって研究者の能力を評価しようとする。これらの要因によって研究者は,何とか統計的に有意な結果を出そうと,選択的に特定の問題を追及するか止めるかを決定し(selectively pusue),また選択的に研究アプローチを決定する(selectively attempt) のである。

p < 0.05なら正しく有用な結果であり,p ≧ 0.05ならば誤った無用な結果であるという二分法的判断は,研究者が「pハッキング」に手を染める誘因となる。p値という判断の手段それ自体が,求めるべき目的になってしまうのである。

4. 適切な推論は完全な報告と透明性を要求する

p値とそれに関連した分析は選択的に報告されてはならない。データについて複数の分析を行い,その分析の中から特定のp値(典型的にはある閾値を超えたp値) のみを報告することは,そのp値についての解釈を本質的に不可能なものにする。有望な結果だけを「つまみ食い」する行為は,「データのさらいあげ(data dredging)」「有意性の追求(signi cance chasing)」「有意性の探求(signi cance questing)」「選択的な推論(selective inference)」,或いはまた「p ハッキング」とも呼ばれる。これらの行為は公刊された文献における統計的に有意な結果の氾濫をもたらす。

それゆえ,これらの行為は厳に慎まなければならない。しかし,正式な手続きに則って行われる複数の統計的検定が必ずしもこうした問題を起こすわけではない。問題は,研究者がそれらの統計的結果に応じて,提示する結果を選択する点にある。もし,読者がそうした選択とその根拠を知ることができなければ,調査結果に対する解釈の妥当性は著しく損なわれてしまうのである。

そのため調査者は,研究において検討した帰無仮説の数,全てのデータセットについての決定,実施された全ての統計的分析,計算された全てのp値を公開しなければならない。p値とそれに関連した統計に基づいて科学的に妥当な結論を引き出すためには,少なくとも,どれだけ多くのどのような分析が実施されたのか,それらの分析(p値を含む)が報告の際にどのように選択されたのかを知らなければならない(同上pp.9-10)。

解説

統計的に有意な結果を出すのは難しい事ではない。統計学的分析は複雑ないくつもの手続きを経ているため,一つの問題に対して,複数の分析手法が存在しうる。もし,ある手法で有意差が検出されないならば,別の手法を使えばいい。それでも望む結果が出ないならば,別のアプローチをとることもできる。しかし,有意な結果を生み出すためのもっとも原始的で,かつ「有用な」方法は帰無仮説の数を増やしてやることだ。

たとえば,血液型が人のパーソナリティに与える影響を調べたいとしよう。そうすると帰無仮説はA,B,O,AB のそれぞれの血液型について四つの帰無仮説が存在することになる。このとき,偽陽性が得られる確率は何%になるだろうか。もし,有意水準が0.05ならばその確率は1-(0.95)^4*100 ≒ 18.5%,2割弱は有意な結果が出てしまうのである。しかし,不幸にも有意な結果が出なかった場合はどうしようか。条件を追加してみよう。幸い人の血液型にはRh因子というものがある。したがって,A ±,B ±,O ±,AB±の血液型に対応して,八つの帰無仮説が存在する。そうすると,偽陽性が得られる確率は1-(0.95)^8*100 ≒ 33.7%になる。3 回に1回は望む結果が得られる。

「血液型診断を信じるのはバカだけだ」と信じている人間も,この手の誤謬には鈍感である。たとえば4章でみた,「分数のできない大学生」などもこの応用例の一つだ。一つ一つの事象が起こる確率が極めて高いものであったとしても,それを何度か繰り返せば「例外」が生じる確率は案外高いのである。もし,ガンの原因を統計学的に調べたいのならば,原因と思われるのものを50種類ほどリストアップしてやればいい。そのうち1つ以上が「統計的に有意である」と言える確率は(片側検定の場合)9割を超える。

それゆえ,ある研究においてどれだけの帰無仮説が検討されたのか,その仮説がどのようなものであったのかを知ることが重要になってくる。また,このことは帰無仮説の数の問題だけではなく,調査の数の問題にも拡張できるはずだ。もし,何らかの事実を知りたい(証明したい) という,強い個人的・社会的欲求が存在すれば,それはそのまま,多くの調査を生み出す心理的・社会的インセンティブになりうる。また,こうして生み出される膨大な調査について,調査者の望むような結果の出なかった研究の公開が差し控えられるようになると,もはやこれらの調査群から何か有意味な推論を引き出すのは不可能となる。

5. p値,或いは有意差は,効果の大きさや結果の重要性を測定するものではない

統計的有意差は,科学的,人間的,或いは経済的重要性と同じではない。より小さいp値がより重要な,或いは大きな効果の存在を示唆するわけではないし,より大きなp値が重要性や効果の欠落を示唆するわけでもない。どんなに小さな効果であっても,十分な大きさのサンプルサイズを確保しするか,測定の精度を高めてやれば小さいp値を得ることができる。逆に,大きな効果であってもサンプルサイズが小さかったり,測定の精度が低ければ,それほど小さなp値は得られない。同様に同一の推定値であっても推定の精度が異なれば,p値の値は異なる(同上p.10)

解説

これまでにも何度か言及してきたがp値の大きさは,効果の大きさと標本の大きさに依存している。どちらが大きくなってもp値は小さくなる。p=0.0001 だとしても,それが「実質的」な違いを意味しているのかはp値だけでは判断できない。そこで,そうした違いの大きさを表現する指標が必要になることがわかる。この指標のことを「効果量」と呼ぶ。効果量は大別すれば,変数間の差の大きさを表現するものと,変数間の関連の強さを表現するものに分けることができるが,ここでは,一般にイメージされやすい変数間の差の大きさについての効果量を説明しよう。たとえば,あるテストにおける二つの集団の平均点の差といったものである。

今,二つの集団に対して同一のテストを実施したとき,その平均点の差が10点だったとしよう。下の図はその得点分布を示している。さて,この10点という差は大きいのだろうか,小さいのだろうか。そもそも基準がなければ判断はできないと思うかもしれないが、基準ならばある。それは元の集団の得点のバラつきである。たとえば,日本人成人男性の平均身長は170cm ほどである。これに対し,身長が150cmの人,或いは190cm の人というのは,一般に「小さい」或いは「大きい」と判断されないだろうか。それは,標準的な身長のバラつきに対して20cmという差があまりにも大きな差であるからだ。成人男性の場合,その身長の標準偏差は6cmほどである。20cmというのは標準偏差の3 倍以上にもなる。

img358

この図 の場合,さらに極端な分布となっている。それぞれの集団の標準偏差が1であるのに対し,平均点の差は10点にもなっている。一方の集団の最上位が,他方の集団の最下位程度の水準にも達していないのである。分かりやすいように,もう一つのパターンも示してみよう。

img359

こちらも平均点の差は10点となっている。しかし先ほどの図とは違い,二つの集団が重なり合っている部分が大きくなっていることがわかる。それぞれの集団の標準偏差は10 である。つまり,10点の平均の差というのは標準偏差1個分に収まるわけである。平均点の差は同じでも,明らかにその効果の大きさは違っている。

今まで見てきたように,異なる二つのテストの得点は,仮に同一の受験者集団のものであっても,そのままでは比較ができなかった。異なるテストではその平均点も標準偏差も異なるからである。同じことが効果の大きさについても言えるのである。

それでは,効果量を計算するにはどうすればいいのだろうか。これもテスト得点の意味付けの場合と同様である。つまり,平均点の差を標準化すればいい。異なる二つのテストの得点は,そのテストの標準偏差を利用して標準化した。二つの集団の平均点の差の場合は,それぞれの集団のデータをプールしたものから標準偏差を計算する。つまり,以下のような式になる。ただし, \bar{X}は標本平均,\sigma^2は標本分散,nは標本サイズである。

Cohen's\ d=\cfrac{\bar{X}_A-\bar{X}_B}{\sqrt{(n_{A}\sigma_{A}^2+n_{B}\sigma_{B}^2)/(n_{A}+n_{B})}}

分散の定義は,偏差平方和をデータの数で割ったものだった。ということは,分散にデータの数をかければそのデータセットの偏差平方和に戻すことができる。(n_{A}\sigma_{A}^2+n_{B}\sigma_{B}^2)/(n_{A}+n_{B})は,AとBという二つのデータセットの偏差平方和を全てのデータ数で割っている。これがプールされた標準偏差であり,効果量はこの標準偏差の何倍という数値で表される。上式のように,不偏分散ではなくそのまま標本分散を使った式を特にCohenのd などと呼ぶ*1。実際には不偏分散を使うことの方が多いだろう。その際は分母の自由度が-2になることに注意すれば後は同じである。

6. p値それ自体は仮説やモデルに関する良い尺度とはならない

研究者は,文脈や他の証拠が存在しないp値は限定された情報しか提供しないことを認識しなければならない。たとえば,0.05に近いp値それ自体は帰無仮説に対する弱い反証にしかならない。同様に,比較的大きいp値は帰無仮説を支持する証拠を示唆するわけではない。他の多くの仮説の方が,観測されたデータと同じか,或いはより一致したものであるかもしれない。したがって,他のアプローチの方がより有望そうであるならば,データ分析をp値の計算だけで終わらせてはならない。

p値に関する誤解や誤用の流行を鑑みて,何人かの統計学者は他のアプローチによってp値を補完したり,代替しようとしている。これらのアプローチにはたとえば次のようなものがる。信頼区間や信用区間,予測区間といった検定よりも推定を強調する手法。ベイズ統計学。尤度比やベイズファクターといった代替的な証拠の測定法。決定理論モデリングや偽発見率(FDR)などである。これら全ての測定法やアプローチは,より多くの仮定に依存している。しかし,これらの手法は,効果の大きさ(加えてそれに関連する不確実性)や,仮説が正しいかどうかについて,より直接的に検証できる(同上 p.11)。

解説

こうした代替的な手法については,一部の研究者や統計学者のみが考えていればいいわけではない。確かに,上記で挙げられた手法で統計学の入門書に出てくるものは少ない(というか私もよく知らない)。しかし,全く存在しないわけではない。たとえば,信頼区間などの母数の「推定」は,「検定」と並んでほとんどの統計学の教科書に出てくる手法だ。

信頼区間とは,真の平均点が含まれる範囲を,一定の確率を基準として計算したものである。たとえば,あるテストの真の平均\muについて,信頼係数95%の信頼区間50 \leqq \mu \leqq 60だったとしよう。これは,95%の確率で真の平均点\muが50~60点の中に入ることを意味している。より正確に言えば,95%区間推定とは,(ランダムに得られた観測値を使って)何度も区間推定を行ったとき,そのうちの95%の区間が真の平均点を含んでいるということだ。

信頼区間の利用を勧めているのは,単にそれが簡単だからという理由だけではない。区間推定のいいところは,検定と違って二分法的な判断に比較的陥りにくいことだ*2。テストAとテストBの平均点はこれこれで,その差は有意差がありますと言っただけでは,そこで思考が止まってしまう。とかく,教育を巡る議論は二分法的な判断に陥りがちだ。区間推定のように確率的な幅をもった議論ならば,思考にもゆとりが生まれるというものだろう。

信頼区間の推定

もう忘れてしまったと思うが,有意性検定の節で,「対立仮説は無数に存在するため,直接の検定対象にはできないが,棄却されない対立仮説の『範囲』を表現することはできる」と述べた。それが信頼区間である。

たとえば,ある母集団から抽出した100人に学力テストを実施したところ,その平均点が60点,標準偏差が15点だったとしよう。それでは,この母集団の「真の」平均得点は何点だろうか。ここで,「真の平均点は61点である」という控えめな仮説を立ててみよう。この仮説の検定は,帰無仮説の検定と全く同じようにできる。つまり,真の平均点が61点という仮定の下での分布に,60点という現実のデータが一致するかしないかを調べればいいのである。仮説を棄却する基準としては検定と同じように0.05としておこう。

それでは実際に計算してみよう。既に説明したように,標本平均の標準偏差は標準誤差とも呼ばれ,その値は母標準偏差を標本サイズの平方根で割ったものだった。また,標本平均は母平均の不偏推定量である。したがって仮説が正しいとき,その得点の分布は,平均が61点,標準偏差15/\sqrt{100}=1.5正規分布になるはずだ*3。それでは,この分布において得点が棄却域に入ってしまう境界はどこになるだろうか。正規分布において,有意水準0.05の境界点となるのは,\mu±1.96\sigmaであることが分かっている。今問題にしている正規分布は平均が61,標準偏差が1.5なのだから,境界点は58.1,64.0となる。以下の図は,「平均が61,標準偏差が1.5」のときの正規分布である。

img363

つまり,この分布において「60点」という現実の結果は十分にありうる結果だということだ。したがって,「平均が61点」という帰無仮説は棄却されないことになる。では次に,もう少し欲張って「真の平均は62点である」という仮説を検定してみよう。この場合,境界点は59.1,65.0となり,この範囲にも60点は含まれている。したがって「平均点が62点」という仮説も棄却されない。ではさらに,「63点が真の平均である」と主張してみよう。そうすると境界点は60.1,66.0となり,60点という現実のデータは棄却域に入るため,残念ながらこの仮説は棄却せざるを得ない。

このように棄却されない仮説(平均が61点,平均が62点,......)を残していくと,一つの不等式が出来上がるはずである。これを一般化してみよう。現実に観測された60点に対し,真の平均を\mu,標本平均の(母)標準偏差\sigmaとすると,その標準化量は=\cfrac{60-\mu}{\sigma}になる。この標準化量は標準正規分布に従っているので,次の不等式を満たす\muが棄却されない仮説ということになる。

-1.96 \leqq \cfrac{60-\mu}{\sigma} \leqq1.96 \Leftrightarrow60-1.96\sigma \leqq \mu \leqq 60+1.96\sigma  \Leftrightarrow58.04 \leqq \mu \leqq 61.96

これが「95%信頼区間」と呼ばれるものだ。この区間に含まれる母平均の推定値はそれぞれが,有意水準0.05の検定に生き残ることができる。たとえば,真の平均が61点であれば,60点という現実のテスト結果は,棄却域には含まれず,したがって「真の平均が61点」という仮説は無事生き残ることができる。しかし,真の平均がもし,65点であれば,現実の平均点が60点というのは,5%以下の確率で起こったまれな事象ということになり,したがって,「真の平均が65点」という仮説は残念ながら(真であるにも関わらず)棄却され,信頼区間の範囲には含まれないことになる。つまり,95%信頼区間とは,95%の確率で「当たる(真の平均が信頼区間の中に含まれる)」ような区間なのである。

参考文献

[1] Wasserstein, R., & Lazar, N. 2016. The ASA's statement on p-values: context, process, and purpose, The American Statistician Volume 70, Issue 2, 2016
[2] Head, M.L., Holman, L., Lanfer, R., Kahn, A.T., Jennions, M.D. 2015. The Extent and Consequences of P-Hacking in Science. PLoS Biol 13, e1002106
[3] Belia, S., Fidler, F., Williams, J., & Cummin, G. 2005. Researchers misun-derstand condence intervals and standard error bars., Psychol Methods. 2005 Dec;10(4):389-96.
[4] Cumming, G., & Finch, S. 2005. Inference by Eye Condence Intervals and How to Read Pictures of Data, American Psychologist, Vol. 60, No. 2, 170 180
[5] Cumming, G., Fidler, F., & Vaux, L.D. 2007. Error bars in experimental biology, The Journal of Cell Biology. 2007 Apr 9; 177(1): 711.

*1:不偏分散を使ったものをCohen′s dと呼ぶこともある。どっちが正しいのか分からないので教えてほしい。

*2:ただし,区間推定(というよりもエラーバーの読み方)にも誤解・誤用はつきものである。詳細はBelia.S et al(2005); Cumming et al(2007); Cumming and Finch(2005)等を参照のこと。

*3:ここではn=100が十分に大きいとして,(標本平均の)標本標準偏差を母標準偏差としている。

江見圭司 『ゆとり教育で不足した学力はどこで補完するのか』

10年くらい前にどこかで話題になっていたような気がするんですが、確かなことは忘れました。ともかく、今回はこの論説を検討していこうと思います。思ったより大部になってしまったので、長すぎる、面倒臭い、という方はせめて「4. 学力の国際比較」だけでも読んでもらえると有難いです。また、今回もいつものように筆者の江見圭司氏との対話を追記しようと思います(反応があれば)。

1. ゆとり教育

1.1. ゆとり教育以前に何がおこったのか

1.2. 学習指導要領

特に問題の無い正確な記述だと思います。

2. ゆとり教育

2.1. ゆとり教育のはじまり。

私が中学校に入学した1981年に中学校のゆとりが始まった[5]。英語が週4時間だったのが週3時間になり,英語学力の低下はだれの目にも明らかになった。このことが,補習塾が繁栄する要因を作ったのである。

学力が低下しているか否かは誤りの多い人間の直観によってではなく、適切な手続きを経た上で科学的に検証されるべきものです(後述)。筆者に限らず科学研究に携わる人間の多くが「だれの目にも明らか」「周知の通り」「ひしひしと感じる」といった情緒的な表現で学力低下を論じていた(いる)現実こそ、日本の科学教育の敗北を示唆しているのかもしれません。

英語の授業時数の変遷については別のページにまとめてありますが、ここでも簡単に説明しておきます。77年改訂では英語が週3コマとなったのは筆者の指摘する通りですが、89年改訂では再び週4コマ実施することが可能となりました。ただし、77年改訂と89年改訂の総授業時数が同じであることから分かる通り、英語を週4コマ実施するためには別の教科時数を削減する必要があります。

具体的には、第一学年では「特別活動」、第二学年では「音楽」「美術」「特別活動」、第三学年では「社会」「理科」「保健体育」「技術・家庭科」「特別活動」のいずれかの時数を削減する必要があります。(00年代の)ゆとり教育を批判する文脈においては無前提的に「(89 年改訂の)週4時間から(98 年改訂の)週3時間に減った」とされることもあるのですが、実際にどれだけの学校が英語の時数を増やしたかは定かではありません。

また、98年改訂では必修教科となった英語の授業時数は315コマ(週3コマ)に設定されていますが、これに加え小学校の総合的な学習の時間では年間10コマ程、中学校の選択教科で30コマ程実施されているため*1、実質的には週3+αと表現するのが妥当でしょう。

 

それでも,1974年度生まれまでは第2次ベビーブームだったので,高校入試や大学入試が厳しく,塾のおかげで学力低下はそれほど問題にならなかったのである。(中略)大学入試では一流大学になると浪人は当たり前だった。また,大学・短大への合格が難しかったというのは,合格率からもわかる。合格率が最も低いのは1990年で,1971年度生まれが18歳のときである。

念のために補足しておくと、競争の激しさ(不合格率)と学業時間の相関は2000年代半ば以降に正負が反転しています。なお、ここで「不合格率」としたものは、「1-(過年度高卒者含む四年制大学入学者数)/(過年度高卒者含む四年制大学志願者数)」の値です。

f:id:HaJK334:20211209134829p:plain

ちなみに高校だけではなく、他の学校種においても同様の傾向となっていますが、特に大学生の学業時間が著しく伸びています。進学率の上昇と少子化により、必然的に各大学・大学生全体のレベルが低下することを考えると、驚くべきことと言えるかもしれません。少なくとも、統計を参照せずに噂話と実感だけをものを語る人間には生涯辿り着けない知見だと思われます。

f:id:HaJK334:20211209194604p:plain

2.2. 第二次ゆとり教育

このような観点から,またもや理数の時間は必然的に減るしかなかったのである。英語(外国語)は1981年以来,時間数は減っていたので,これ以上減ることはなかったようだ。

何を言っているのか良く分からないのですが、以下は小中学校における各教科の授業時数の変遷です。

f:id:HaJK334:20211209135344p:plain

89年改訂では小学校低学年の理科が生活科に統合されたため、見た目の時数はその分減少していますが、小学校3年以降の理数科の授業時数は77年改訂と89年改訂で変わりません。もしかすると、中学校理科の時数に幅があることをもって「減った」としているのかもしれませんが、これは先ほど説明した通り英語とトレードオフの関係にあるためです。

つまり、理科の時数が減少すれば英語の時数が増えるのですが、わざわざ「英語はこれ以上減ることは無かった」と書かれていますので、ひょっとすると授業時数の変遷について良く理解されていなかったのかもしれません。

 

1997年の大学入学者あたりから,本格的に学力低下が見られ始めた。教育の情報化や隔週土曜日の休日化をはかるために,1992年小学校,1993年中学校,1994年高等学校で第二次ゆとり教育が断行されたのである。1978年度生まれが中3(1993年)から第二次ゆとり教育で1997年に大学に入学して来ることになるが,大学で「学力低下」が叫ばれたのはこのときからである。その後,年々学力は低下していく。そして,1999年には「分数ができない大学生」という本[7]まで出版されるに至る。

学力低下の根拠が一切提示されていません。また、「分数ができない大学生」は市川(2002)や後藤(2012)、その他論者が指摘しているように、同書の中で分数が理解できないとされる2割の学生は、実際には分数問題5問を全問正答できなかった者の割合です。この5問の全問正答率は78.3%だったため、各問が均等で独立であると仮定すると、1問あたりの正答率は約94%と計算できます。この程度の計算が出来ずに調査結果に衝撃を受けた理系の研究者は数知れません。正に日本人の学力低下を象徴する出来事でした。

また、戸瀬・西村の調査は経年比較調査ではありません。比較対象が設定されていないということは、学力の変化を論じることはできないということです。仮にも理数系の研究者である筆者に科学調査のイロハを教え諭すのは心苦しいのですが、指摘せざるを得ません。実際、国際大規模学力調査であるPISAでは正にこのようなリテラシーを問う問題が頻出します。

 

こで冷静になってほしい。1980年にゆとり教育が始まって以来,一貫して学習した内容は減っているのであるから,経年的な学力低下は,本来は予測できたはずである。しかし,だれも小・中・高と一貫して学習指導要領や教科書を検討した者はいなかったので,いつどのようにどのくらい学力が低下するのかを予想することを怠ってきたともいえる。

その通りです。できれば学力調査の蓄積が無いということは、学力の変動を確認する手段も無いということに、冷静になって気づいて頂ければ幸いでした。

 

2.3. 第三次ゆとり教育

とにかく,数学・算数と理科の内容の削減はすさまじかった。よく知られるのは,小学校で円周率が3.14ではなく3と教えるというものである。これはマスコミがたたきすぎたために,教科書の方では3.14で教えても検定合格になった。

よく知られるようにデマです。詳細についてはこちらのページを参照してください。デマを信じてしまった人があの手この手で自尊心を守ろうとするのは自然なことなのですが、寡聞にしてマスコミが叩いたから検定合格になったという珍説は初めてお目にかかりました。

単純な疑問なのですが、恐らく理数系の人にも円周率3がデマであることを承知している方はそれなりにいるはずです。そうした方達は多くのお仲間が未だこのデマを信じ込んでいることをどのように感じているのでしょうか。20年以上経っても反省の機運が見られれないのですが、自浄作用を期待しては駄目なんでしょうか。

 

また,中学校の理科ではイオンがなくなったため,高等学校「理科」の生物ではイオンという概念を一切用いて説明できないことになった。このことは科学の歪曲と捉えられた。 

指導要領は一言一句守らなければならないものではないので、教えたければ教えても結構です。指導要領の法的拘束力についてはこちらのページを参照してください。

 

1987年度生まれの方が第三次ゆとり教育の始まりであり,高等学校を卒業する2006年までの4年間が第三次ゆとり教育なのである。以下,1988年度生まれの方は第三次ゆとり教育が5年間であるが,1989年度生まれの方は第三次ゆとり教育が7年間になる。

確かに小中学校で指導要領の実施時期がずれることはあるのですが、98年改訂は2002年に小中で一斉実施されたため、89年度生まれは単純に6年間だと思うのですが…移行措置を含めても意味不明な記述なので、詳細を教えて頂けると助かります。また、ゆとり教育における学習内容の削減はもっぱら義務教育期間に限定されていますので、その点も補足しておいた方が良いでしょう。

 

世間では「ゆとり教育」は危ないと騒いでいるが,壊滅的なまでに系統的な知識教育は崩壊した。彼らの一期生が2006年に大学や専門学校に入学してきた。さすがに,あれほど騒がれているので,2006年に入ってきた学生はそれほど問題視されていない。だが,ここで安心してはいけない。2008年から徐々にボディーブローのように低学力効果が現れてくるはずであると筆者は2006年頃に予想していた。事実,2008年頃から急激に学力低下はひどくなっている。

最後まで読んだのですが、結局2008年頃からの急激な学力低下の根拠は提示されていませんでした。

3. 第三次ゆとり教育世代は何を勉強していないのか?

3.1. 小学校算数で排除された反比例

先に挙げたページでも説明しているのですが、ゆとり教育では多くの教育内容が従来よりも上の学年・学校に移行・統合されています。そのため、89年改訂では小学校第6学年に配置されていた反比例が、98年改訂では中学校第1学年に移行されています。この変化がどのような結果をもたらすか浅学な私には分からないのですが、少なくとも筆者は問題だと感じているようです。

 

3.2. 定着しない素因数分解

根拠となるべき事実、統計、調査が提示されていないため詳細は不明です。

 

3.3. 濃度を知らない高卒者

ちょくちょく良く分からない記述が出てくるのですが、89年改訂・98年改訂ともに小学校で「濃度」は基本的に扱いません。勿論、いずれの指導要領においても第5学年でパーセントを、第6学年において水溶液を取り扱うため、その際に濃度を指導することは可能です。また、98年改訂に係る移行措置解説書では、中学校におけるパーセント濃度の指導について、"現行及び新課程の小学校第5学年で百分率を学ぶため、既習事項とみなす"と記述されています(徳久 2000)。実際、百分率を学んだ人が質量分率の計算は出来ないと考える合理的理由が私には分かりません。

 

3.4. 四則演算の順番がわからない高卒者

3.2と同じく根拠が示されていないため何とも言えません。

 

3.5. 大小関係がわからない高卒者

2001年から小学校から不等号が消えた。不等号の記号を見るのは中学生になってからである。いやいや,これは顔文字の記号なのである。(中略)さて,小学校2年生から中学1年生(7年生)に5学年だけ上がるので,6年後にその影響が出てくるのである。2001年から小学校から不等号が消えたので,2007年度の中学校でその影響が本格的になるはずである。

以下は1992年に入学した大学新入生を対象に、不等号の読み方を尋ねるという、ある意味侮辱的とも言える調査の結果です。筆者の指摘する通り、この時期の大学受験は熾烈を極めており、塾産業などからは振り返って「ゴールデンセブン」と呼ばれる時代でもありました。

非理系大学生370名への問題と解答率

問. 2mm<

上記アンダーライン部をどのように読むか
2mmより大 47.0%
2mm以上  4.9
2mm未満  12.7
2mmより小 30.3
2mm以下  5.1

鈴木他, 1992,『教科間における「以上」(≦)・「以下」(≧)の指導上の問題点』

また、2001年に小学校2年生だった世代は、PISA2009を受験した世代に相当します。この点も後で振り返りましょう。

 

3.6. 漢字を読めない高卒者

2006年現在の中学校の教科書にはかなりの割合で「ルビ」が振られている。現場の教員の話によると,とにかく漢字がよめないので授業にならないそうである。実は,東大や京大に進学するための塾講師によると,ハイレベルな学生でさえ小学生レベルの漢字が書けないとのことである。

逆です。戦後の学校教育において恐らく唯一増え続けているのが教育漢字です。1948年に「義務教育の期間に読み書きともにできるように指導するべき漢字の範囲(内閣告示)として881字が示されたのが最初であり、これが小学校の6学年の教育漢字として振り分けられたのが1958年、これに115字が追加され996字となったのが1968年、さらに10字が追加され1006字となったのが1989年、現行ではさらに20字が追加され1026字となっています。

ルビについてはそもそも事実か分からないのですが、仮に事実だったとして何故そこから漢字能力の低下が結論されるのか不明です。一般常識的に言って中学校は基礎的な学習をする場であり、ルビは読み方の分からない漢字の読み方を知るためのものです。この方は一般的な常識に欠けているのでしょうか。

また、以下は毎日新聞と全国学図書館協議会が実施している「学校読書調査」の結果です。

f:id:HaJK334:20191126005333p:plain

注目すべきは、筆者が言うところの「第三次ゆとり教育」の前後です。第三次ゆとり教育実施の5年前(1997年)はいわゆる読書離れのピークであり、中高生の不読率は調査開始以来の最高値となっています。一方、実施の5年後(2007年)と比較すると、小学校10ポイント、高校で20ポイント、中学校に至っては40ポイントの低下となっており、中学生の不読率は調査開始以来の最低値となっています*2

 

しかし,ここまでレベルが落ちると識字率100%の前提が崩れるが,漢字ドリルのeラーニングはまじめに取り組まないとどうしようもないだろう。近い将来,大学・短大・専修学校では朝のショートホームルームが実現してその時間に漢字の書き取りまたは計算ドリルを行うこともありうるだろう。

実際には筆者の世代において識字率100%が崩壊しています。詰込み教育からゆとり教育への変化は、筆者の指摘する通り「落ちこぼれ」が問題視されたことにあるのですが、当時濫発された「詰込み教育の弊害」を指摘する調査のうち、最も有名なのが日教組と国民教育研究所が共同で実施した学力調査です。結果が余りにも衝撃的であったため、各全国紙が一面で報じ、国会でも取り上げられました。以下は読売新聞の記事の一部引用です。

 

【国語】
 中学校一年生には小学校で習った九百九十一の漢字、小学校五年生は四年生までに習った漢字の中から主として「読み」「書き」について調査が行われた。その結果、女子が男子を平均点で十点以上上回った。(中学校一年)が、全体としてみると、習得すべき漢字の数が増えているのに、児童、生徒の漢字能力は皮肉にも停滞していることが明らかになった。

<読み>
 中学校一年生。百語の読みの平均点は七七・二点とかなりの成績。といっても七〇点以下が二十六%、つまり四人に一人が教科書をスムーズに読めない状況。男女別にみると女子が八一・七点で男子の七三・七点を一〇点近く上回っている。正答率が低かったのは「勧める」「朗らか」の一〇%台で、このほか「討論」「是非」「休息」なども四〇%台と不成績。
 小学校五年生。平均得点は八四・五点と好成績。ただ、半分以下しか読めなかった子どもが六・七%も。正答率の低かったのは「改める」の二〇%台、「帯」の三〇%。

<書き>
 中学校一年生。五十字の出題で平均正答率は六〇・四%。半分以下しかできなかった生徒は三三・二%で、得点のばらつきが大きい。ここでも男女差が大きく、女子が六九・六%なのに男は一五%も低く五三・四%。できの悪かったのは善の一〇%台を筆頭に、「救」「招」「屈」「己」の二〇%台。
 小学校五年生。平均正答率は五二%。半分以下しか書けなかった子どもが全体の四四・二%。正答率三〇%以下は、五人に一人の二二%。「孫」「燈」「清」「治」の四字が最も不成績で、正答率は一〇%台にとどまっている。

<過去との比較>
 文部省がさる二十五年から二十六年にかけて行った「教育漢字百字テスト(書き)」調査と同一内容について、小学校四、六年生、中学校一、二、三年生を対象に実施。その結果、二十五年前の方が全般的に平均点が高く、学年が進むとともに正答率が上昇しているのに対し、今回は学年が進んでも停滞気味となっている。例えば「底」という字。二十五年前では小学校六年生で正答率が四一%なのが中学校三年生では八四%にはね上がっているのに、今回調査では小学校六年生で五三%、中学校三年生になっても、ほぼ同じの五二%にとどまっている。日教組では、「一九七一年の新教科書から小学校で百十五字漢字が増やされたが、これがかえって児童、生徒に消化不良を起こさせた」と指摘している。

 

基礎学力の低下明白
 日教組の今村彰教育政策部長の話「この調査で、子どもたちの読み、書き、計算といった基礎的な学力が低下、あるいは停滞し、子どもたちの学力の格差が拡大していることが明らかになった。現行の教育課程、教科書の内容について抜本的な検討が必要であることを示すものだ」

意外な結果ではない
 文部省・沢田道也小学校教育課長の話「日教組の調査結果は意外なことではない。どこが調査してもこんな結果になるだろう。現在、教育課程の改訂に取り組んでいる文部省の教育課程審議会でも問題にしているところであり、秋の中間答申もこの方向で作業が進められているところだ」

 

小、中学生“落ちこぼれ”深刻 日教組が実態調査 分数計算、特に弱い中1 小5書き取り、半分間違う 読売新聞, 1976.05.12, 朝刊, 教育, 1(5)

教育政策へ与えた影響としてはPISAに比肩しうる調査なのですが、筆者は1968年度生まれとのことなので、当時のことは良く覚えていないのかもしれません。ちなみに比較対象となっている昭和25-26年はいわゆる戦後新教育が行われていた時期であり、学力低下論が教育界のみならず国民にまで広がっていた時期でもあります。

4. 学力の国際比較

4.1. PISA

まだ PISA2003の結果は発表されていなかったころに,筆者は恐らく PISA2000よりも平均得点は下がるだろうと予測していた。やはりその通りの結果になり, PISA2006の結果はさらに低下すると予測した。なぜなら,2006年に受験する生徒は小学校5年より第三次ゆとり教育を受けているからである。またまた,その通りの結果である。

嘆かわしいことに、PISAについては理系の研究者でも9割9分が基礎の基礎すら理解していないので、ここで私が少しく説明してあげようと思う。

まず、PISA調査において経年比較が可能となるのは、当該分野が主要分野(main domain)となった後のことである。つまり、読解力についてはPISA2003以降、数学的リテラシーについてはPISA2006以降、科学的リテラシーについてはPISA2009以降のことである。つまり、PISA2003やPISA2006の結果から数学的リテラシーや科学的リテラシーを論じている筆者は見えてはいけないものが見えてしまっているわけである。

一応、スケールが確立する前のLink Errorも報告されているので、やろうと思えば検定も出来るのだが、いずれにせよゆとり教育後に数学的リテラシーや科学的リテラシーの有意な得点低下は確認されていない。以上のことはPISA調査を見る上で基礎中の基礎、最低限中の最低限であり、この程度のことも了解していない人間がそれなりの肩書の下に妄言を公にしているのは我が国の知性の敗北である。

何も筆者に限った話ではなく、この程度のことすら理解していない我が国の理系研究者は余りにも多い。PISA調査の調査設計についてはまた改めて詳細を書こうと思っているので、ひとまず以下のまとめを参照して各分野の得点変動、ゆとり教育との関連について確認してほしい。

 

PISA2006の結果発表を知ったマスメディアが学力低下を問題にし,騒ぎだしたので2008年,ようやく文科省ゆとり教育廃止の方向に転換した。その結果学習指導要領が変更されていないのに学校現場では教科書に掲載されていない内容などを教え始めた。どっぷりと第三次ゆとり教育を受けた生徒が受験するはずのPISA2009では若干成績は向上した。しかし依然として成績は悪いのである。

お花畑ご都合脳である。意に沿わない結果が出ると、いきなり脱ゆとり教育が始まるのは様々な論者に共通している。この馬鹿どもに論理的思考というものを叩き込んでやりたい。学習指導要領の最低基準性はその実施前から周知されているし、何よりPISA2009世代はPISA2006世代より3年、PISA2003世代より6年長くゆとり教育を受けているのである。もし教師が多少指導要領外のことを教えた程度で数年間の不足が補われるのであれば、既にタイトルは回収されている。どこでも補完できるという結論になる。そもそも、PISAは国際学力調査という性質上、各国のカリキュラムの違いによって顕著な差が出ないよう問題が設計されているのだ。調査報告書とTechnical Reportを100回読んでこい。

追記

もしかしてお花畑やご都合なのではなく、理系の先生は本当に時系列を考えるのが苦手なのではないか…?というわけで、以下のまとめは「学習指導要領が大規模国際学力調査の結果に大きな影響を与えると仮定した場合、暫定的に採択(棄却)すべき仮説」について、どんな馬鹿でも分かるようにこれ以上は削り様が無いほどに削った時系列である。

…のはずだったのだが、理系の先生にはこれほど簡潔にしても読めなかったという嘘みたいなマジの話なんだなこれが(ジョンたか先生のまとめを参照してください)。

5. ゆとり教育で不足した学力はどこで補完するのか?

大雑把な予想としては,2016年度の大学や専門学校の入学者から第三次ゆとり教育の色が徐々に消えていくことになる。ということは2016年に高校卒業する方まではこのまま単純に学力は下がり続けるしかない。

PISA2009の学力向上傾向はPISA2012でも引き続き確認され、読解力、数学的リテラシー、科学的リテラシーの全分野において、経年比較が可能な年度の内では過去最高の得点を記録しています。PISA2012世代は義務教育期間中を全てゆとり教育の内に過ごしているため、この結果はPISAの報告書ではむしろ「ゆとり教育」と結びつけられていたのですが(OECD 2013 pp.124-125)、文科省はこれを「脱ゆとり」の成果と喧伝し、マスメディアもこれに追従しました。

実際、PISA2012世代は脱ゆとりの性格が強い移行措置を3年間受けているわけですから、この時点ではゆとり教育の成果なのか、それとも脱ゆとり教育の成果なのか、いずれの解釈も可能です。というわけでPISA2015以降の結果を確認しましょう。PISA2015では全分野において得点が低下し、読解力については有意な低下となりました。続くPISA2018においても再び全分野で得点が低下し、読解力、科学的リテラシーについては有意な低下となりました。以上です。

追記

氏のFacebookにメッセージを送った上で、最新の投稿にもコメントを付けたのですが今のところ特に反応はありません。一応友達リクエストも送信したのですが、今日(12/17)確認したところ、送信済みリクエストに表示されておらず、氏のページにアクセスしても「友達になる」ボタンが表示されていませんでした。これはリクエストが拒否された上で、友達リクエストの設定を変更されたということなんでしょうか。いまいちFacebookの仕様を理解していないので誰か教えていただけると助かります。

2022/04/18

ようやく先生から返事がきました。

鈴木正一 さん、ご存知ないので、返信してあるいませんでした。特にわたしの考えと異論を唱えるような話でないんですが、何が不満なんでしょうか?

はいでました。何の反論もできないので具体的なことは何も言わずとにかく否定だけしておくパターン。無駄だっつーの。いちいち手間をかけさせんな馬鹿が。

鈴木正一
理系の先生は馬鹿のくせにプライドだけは高いんだから…そうですねぇ…一例を挙げるとPISAはどうですか?
PISAの得点が比較可能となるのはその分野が主要分野となった後です。にもかかわらず先生はご丁寧にも数学的リテラシー、科学的リテラシーの2003年、2006年調査の結果を何の注釈もなくグラフにしています。常識的に考えれば先生はPISAの基本的な設計すら理解していなかったと解釈すべきです。
異論はありまちゅかあ?

鈴木正一
つーか第三者が見て私と先生の相違点が分からないはずないでしょ…馬鹿扱いされて熱くなるのは分かりますけど仮にも学究なら批判には誠実に答えましょうや。今の先生は駄々をこねてるだけですよ。

ブロックしやがったよこのゴミ。本邦の理系研究者はバカandクズしかいねーな。お笑い芸人じゃねぇんだぞ。

Facebookの仕様が良く分からないのですがもしかしてブロックされました?無能のくせにプライドだけは一丁前だな。愚にも付かない感想文を恥ずかしげもなく開陳していざ反論されると耳を塞いで聞こえないふりをする幼児の如き無様な振る舞いを自覚してくださいというのは先生の知能程度からすれば高度過ぎる要求でしょうから要求しません。感謝してくださいね。

おらおら理系のゴミども誰か江見先生の仇をとってやれよ。いつでも待ってるぞ。

参考文献

後藤和智 (2012). 「現代学力調査概論 平成日本若者論史」.

市川伸一 (2002). 「学力低下論争」. ちくま新書

徳久治彦 (2000). 「新中学校教育課程移行措置の解説」. ぎょうせい

OECD (2013). PISA 2012 Results:Creative Problem Solving Students’ skills in tackling real-life problems Volume V. 

*1:https://hajk334.hatenablog.jp/entry/2021/03/20/122608#133%E8%8B%B1%E8%AA%9E%E6%B4%BB%E5%8B%95%E3%81%AE%E4%BE%8B

https://hajk334.hatenablog.jp/entry/2021/03/20/122608#132-%E9%81%B8%E6%8A%9E%E6%95%99%E7%A7%91%E3%81%A8%E3%81%AF%E3%81%AA%E3%81%AB%E3%81%8B

*2:正確には1963年調査の方が低い数値となっているが、調査手法を一新した後の初回調査のためか、前後の結果と比較して連続性に欠けるため除外した。63年調査では小学生の不読率がほぼ0、中学生が1割程度であるのに対し、翌64年の調査ではそれぞれ1割弱、3割程度と跳ね上がっている。

【メモ】日本人の幸福度について

年代別だとどうなんですかねえ。

2021/11/30 14:17

確かに、調査対象の年齢が全く分けられてないな。

2021/11/30 14:01

年齢別はたしかに欲しかったりするかも

2021/11/30 13:57

治安の良さは空気みたいなもの。寄与しているか不明。私の観測範囲と偏見では若い女性は給料を全額使ってる人が多く、そりゃ買い物で浪費したら楽しくて幸せなのでは。/年齢別、平均結婚年齢の前後の比較がほしい。

2021/11/30 15:06

疑問に思ったら自分で調べればいいんじゃないですかね。以下は性別・年齢・婚姻状況をクロスさせた幸福度の集計スクリプト(R)です。こちらのページから"Japan 2019"を選択して"WVS Wave 7 Japan Excel v2.0"をクリックしてください。"F00010946-WVS_Wave_7_Japan_Excel_v2.0.xlsx"がダウンロード出来るので、それを任意のディレクトリに置き、以下のコードを実行すれば各属性ごとの幸福度が分かります。

 

library('openxlsx')
WVS7_JP <- read.xlsx("F00010946-WVS_Wave_7_Japan_Excel_v2.0.xlsx")

#性別(男=1, 女=2), 年齢, 婚姻状況(結婚=1, 独身=6)を指定
WVS7_JP1 <- WVS7_JP[WVS7_JP$"Q260:.Sex" == 1 & WVS7_JP$"Q262:.Age" < 36 & WVS7_JP$"Q273:.Marital.status" == 6,]
FOH <-  WVS7_JP1$"Q46:.Feeling.of.happiness"
#回答を幸福度指数に変換(1:Very → 2, 2:Quite → 1 3:Not Very → -1, 4:Not at all → -2) -1:DK, -2:NAは除外
(length(FOH[FOH == 1])*2+length(FOH[FOH == 2])*1+length(FOH[FOH == 3])*(-1)+length(FOH[FOH == 4])*(-2))/(length(FOH)-length(FOH[FOH < 0]))

ところで、まとめ先のTogetterコメント欄では

dronesubscriber @dronesubscriber
面倒くさいと思いましたが調べました。興味深いことに結婚している女性は35歳以下だと一番幸福度が低く(平均1.28)、独身で35歳以上だと飛び抜けて幸福度が高かったです(2.35)。 男性の既婚者は年齢によってあまり変わらず、未婚者は35歳以下で低い(1.46)という結果になりました。 女性は子育てに忙殺されていると幸福度が上がらず、それ以外は高い幸福度である、ということでしょうか。 https://www.worldvaluessurvey.org/WVSContents.jsp

こんなコメントがあったんですけど恐らく間違いです。実際には35歳以下の既婚女性の幸福度は1.29, 35歳以上の独身女性は1.23, 男性既婚者は1.06, 35歳以下の未婚男性は0.86です。というかグラフを見ても未婚男性全体の幸福度は0.6を切っているんですから、35歳以下未婚男性の幸福度が1.46で"低い"というのは明らかにおかしいでしょう。恐らく回答を幸福度指数に変換する過程でミスが生じたのではないかと思われますが、真相は不明です。

一応2×2×2の結果を置いときます。括弧内はサンプルサイズです。全年齢の数値とグラフの目測がほぼ一致しているので計算に間違いは無いと思うんですが、ウェイティングとかはしていないみたいですね。

f:id:HaJK334:20211130194810p:plain

 

【メモ】FROGMAN 秘密結社鷹の爪団 独立愚連広報部 『ゆとり教育』

あらすじ

「亜呆」と大書されている白地のTシャツを着たヤンキー風の男と紫のアイシャドーが目立つガングロ風の女性が会話している。女性が便意を訴えると、どこからともなく「ゆとりもん」が登場し「どこでもトイレ」と言っておまるを取り出す。

ゆとりもんは二人に仕事をするよう促すが男性は「だりぃよぉ」とこれを拒否する。ゆとりもんは「そうしたゆとり教育の害」を矯正するよう未来の男性から命令されたと説明する。男性は「明日からやる」と渋々承諾した後、何か食べるものを出してくれと頼む。

ゆとりもんは「テラ豚丼」と「フライドゴキブリ」を取り出すが、二人はそれに怒りを見せる。ゆとりもんは「自分もゆとりプログラムで作られたためしょうがない」と開き直る。男性は日本の将来を心配し、自分の未来がどうなっているかゆとりもんに訊ねる。ゆとりもんは「ゆとり介護を受けている」と答え、女性が「放置されてんじゃん」とツッコむ。

ラストは「偽装」「虚偽」「捏造」といったネガティブなワードの羅列と頭を下げるスーツ姿の中年男性の画像をバックに「大人たちも言うほど大したことない!心配するな、ゆとり教育世代!」というナレーターの語りによって終了する。

 

本作の意義

ゆとり言説は2010年前後を境に大きく転換している。90年代若者論の衣鉢を継いだ00年代のゆとり言説は内藤(2006)が言うところの「凶悪系言説」がその中核的信念であり、一言で言えば傍若無人で我儘勝手な消費社会の申し子である。一転して、10年代以降のゆとり言説では「草食系」といった言葉で表されるように「情けな系言説」が主流となった。一言で言えば虫も殺せない右に倣えの嫌消費世代である。本作はこの00年代ゆとり言説の貴重な資料であり、二人の外見的描写が典型的な00年前後のそれであることは注目すべき点だ。

2010年前後のゆとり言説の質的転換について、言説を担った当人たちは気付いていないのか、それとも気付いた上で何らかの合理的説明を自らに施しているのか、或いは全く別の思惑があるのか興味はあったが確かめていなかったので、これを機にFROGMAN氏に聞いてみようと思う。返信があればここに追記する予定である。

 

人の属性で判断すること

その通りだ。たとえば、ネット右翼と俗称される人々は時に在日朝鮮人と犯罪率の高さを結びつけるのだが、これは明確に誤りである。第一に、在日朝鮮人が日本人と比較して犯罪率が高かったとしても、その規定要因が国籍であるとは限らない。規定要因は一般に多変量解析を用いて探索されるが、国籍という属性は変量の一つでしかない。「在日朝鮮人」という属性が犯罪率に対して負の効果を持つ一方で、在日朝鮮人の犯罪率が高くなるという事態は当然にあり得る。

また、当然のことながら大多数の在日朝鮮人は犯罪を犯さない。この種の誤りは「在日朝鮮人」という一つの人格的実体が存在するという直観を原因としている。これはその他の差別的偏見にも通底する要因であり、属性で判断せず個別に対応すべきという氏の主張は至当である。「ゆとり教育世代」という特定の属性を侮蔑する動画を作成した事実とどのように整合性をとっているのか、これも氏に聞いてみようと思う。ちなみに、世代論では一般にAge(年齢), Period(時代), Cohort(世代)の三つの変量を用いて分析されることが多い。これはAPC分析と呼ばれている。

 

参考として

本記事の主旨はゆとり言説の収集にあるため、動画内に見られるゆとり言説について詳細な検討はしない。差し当たって、ニートと若者論の関連については上に挙げた本田・内藤・後藤(2006)を、ゆとり世代の学力ないし知性の低下については以下の記事を参考として挙げるに留める。

追記

最新のツイートにリプライを送ったのですが、何故かログアウトしてから確認すると「攻撃的な内容を含む可能性のある返信も表示する」に分類されていたため、念のため一週間後にも@ツイートを送信したのですが特に反応はありませんでした。

理由は良く分からないのですが、私の紹介文は笑ってもらえなかったようです。余談ですが、私が氏にリプライを送った数日後に「【吉田勝子のヤバイわ!SDGs】第10話 SDGsのジェネレーションギャップ」というショートアニメが投稿されていました。内容の要約は以下です。

"SDGsは日本にそぐわない"と主張する中年男性・苔田に対し、主人公である吉田勝子は「今の子供たちは小中高の12年間でしっかりとした環境教育を受けている(背景に環境教育に係る08年改訂学習指導要領の文言が流れる)。その世代が社会の中核となった時に笑われてもいいのか」と批判する。「笑いたければ笑えばいい」と返す男性に対し、勝子は即座にそれを否定する。SDGsは"誰ひとり取り残さないことが命題"であり、"どんな世代の誰だろうとも幸せにならなければならない"と喝破する。

勝子の話が終わると、別の男性が苔田に対し「あなたも先月孫が生まれたばかりではないか。その孫が苦しむ社会を許容できるのか。我々がすべきことはつまらない意地を張って若者を従わせることではない」と教え諭す。話を聞いた苔田は納得し「分かった。取り組んだらいい」とぶっきらぼうに言い放つ。軽快なBGMと共に勝子が「それでは我が社は何をしましょうか」と問うと、若い女性社員が困ったように「何しましょうか…」と返し、物語は終了する。

氏の本心や自己認識が奈辺にあるのか興味津々ではあるのですが、たかが数分のアニメーションで忖度するのも憚られますから、野暮な分析はやめて氏からの返信を粛々と待ちたいと思います。