若者論を研究するブログ

打ち捨てられた知性の墓場

MENU

ゆとり世代の知能指数について

或いは知能指数の世界ランキングについて。実は、あの手のランキングはほぼ全てRichard Lynn*1とTatu Vanhanenが行った一連の研究に基づいている。中でも直接の元ネタであろうと思われるのが、書籍として公刊された"IQ and the Wealth of Nations (2002)", "Race Differences in Intelligence (2006)", "IQ and Global Inequality (2006)" である。まぁタイトルから察しはつくだろうが、相当の物議を醸した本でもある。英語版Wikipediaの該当ページを眺めれば何となく分かるだろう。

また、この世界知能指数ランキングは「ゆとり世代の知能低下」に説得力を与えている材料の一つでもある。やや回りくどく書いたのは、たとえ冗談でも根拠やエビデンスと書くわけにはいかないからだ。というのも、あのランキングをどう解釈しようと「ゆとり世代の知能低下」という結論は導けないからである。にも関わらず、そう読み取ってしまう人間が一定数存在しているというのは不思議と言うほかはない。

たとえば、以下のページとそのコメント欄を見てほしい。日本の結果をゆとり教育と関連付けている人間が少なからずいることが分かるだろう。ところで、日本のIQは105であり、日本の学生のものとされているIQも105なのだが、一体彼らの頭の中ではどのような論理が展開されているのだろうか…ちなみに「学生のIQ」というのは誤りであって、日本についてはどちらもほぼ同じデータに基づいている。恐らく"who analysed IQ studies from 113 countries"を誤訳したのだと思われる。

日本は3位。IQが高い国ベスト10 カラパイア
http://karapaia.com/archives/52192998.html


ゆとり世代は日本人の知能を下げたのか
さて、それではこのランキングについて、ゆとり言説との関連において少しだけ詳しく説明しよう。まず言っておかねばならないのは、このランキングは「現在の知能指数」を示しているわけではないということだ。恐らくコメント欄で意味不明な妄言を垂れ流している方々は、2015年の調査なのだからその年代の調査結果なのだろうとか、或いはリンさんとヴァンハネンさんが頑張って世界中で知能検査を実施したんだな、とか思っているのだろうがこれはメタ分析である。二人が測定したわけではない。

このランキングにはいくつかの版が存在しているのだが、私が確認した限りで最新のものは以下である。これはRichard Lynnが2015年時点のデータを基に更新した"Race Differences in Intelligence"の第二版であり、日本の平均IQの計算には2014年までに発表された計25本の論文のデータが使われている。

"Race Differences in Intelligence: An Evolutionary Analysis"
https://www.intelligence-humaine.com/wp-content/uploads/2019/03/Race-Differences-in-Intelligence-second-edition-2015-1.pdf

この中で「ゆとり世代」が含まれる知能検査は3つだけである。それぞれ102, 104.4, 110という結果になっている。使われた知能検査の種類や被験者の年齢、出典等についてはリンク先を参照してほしい。なお、102という結果が出たCox et alの調査は2001年に、つまりゆとり教育開始前に実施された調査である。というわけで、これら3つの結果を平均した値は105であり、ゆとり世代の結果は日本人の結果に全く影響を与えていないことが分かる。

ちなみに、この25本という数は他国と比較して抜きん出て多い。これは注にも示した通り、Richard Lynnの経歴も関係しているのだろう*2。たとえば、ランキングで日本を上回っている国の論文の数を示すと、香港が11本、韓国が6本、シンガポールが4本である。1本の論文に示された数値がそのまま代表値となっている国も複数ある。また、各国の平均値を計算するにあたって、サンプルサイズやサンプリングの違いは全く考慮されていない。ただ各論文のデータをそのまま平均しているだけである。


ゆとり世代の知能は他世代よりも低いのか
この節のタイトルを見て疑問に思うかもしれない。ゆとり世代のIQが日本人全体のIQと変わらないのは先述した通りである。それでは何故またゆとり世代と他世代の知能差を検討する必要があるのだろうか。その答えは簡単だ。ゆとり世代と他世代の知能は現に違うからである。具体的に言えばゆとり世代のIQはそれ以前の世代と比較して高いのである。

ゆとり世代のIQは105、ゆとり世代のIQも105となっているが、同じ数値であることは同じIQであることを意味してはいない。何故ならLynnの研究結果にはフリン効果による補正が含まれており、さらには各世代が受検した知能検査の基準IQもフリン効果によって上がり続けているからである。

それではフリン効果を説明…する前にまずは標準化という作業について簡単に説明しよう。知能検査というのは皆さんもご存知の通り「平均が100」のテストである。ところで、日本で一般的に使用されているWAISもWISCも日本で開発された知能テストではない。従って、単純に翻訳したテストを受けさせるとその平均は100にはならない。ここでは日本人に受けさせた結果が平均102点だったとしよう。どうしようか。2点引けばいいだけである。これが標準化だ。要はある知能検査の得点を平均100(標準偏差15)に調整する作業だと思っておけば良い。

フリン効果については正直言って詳細に説明する必要も無いだろう。年々人類の知能指数が向上しているというアレである。フリン効果の解釈については諸説あるが、事実としては極めて頑健な現象であり、定期的に知能検査が再標準化されているのもこれが理由の一つである(放っておくと得点が上がり続けるため)。一般的にはフリン効果によって10年で3ポイント、即ち年あたり0.3ポイントIQが向上するとされている。Lynnが補正に使っているのもこの数字である。

一例を挙げよう。Lynnの研究に含まれる日本の最初のデータは1951年に実施(標準化)されたWISCのデータであり、その平均得点は103点であった。これがまずフリン効果によって1点減点される。WISCがアメリカで開発(標準化)されたのは1947年であり、1951年時点のアメリカ人の平均得点は101点となっているはずだからである(従って日本とアメリカの本当の差は2点だ)。次に、アメリカの得点は白人のみの検査結果に基づいているため(黒人等を含めるともっと低くなるはずなので)日本に2点が加点される。104点である。最後に、イギリスを基準とした尺度に調整される。イギリスの平均IQを100とした時、アメリカの平均IQは98であるため2点減点である。最終的な結果は102点となる。

これが具体的なIQの補正方法である。Lynnは手を変え品を変え様々な補正を行っているが、フリン効果は全ての補正に共通して使われている。以上のことから注意してほしいのは、仮にゆとり世代のIQが以前の世代より数字上低くなっていたとしても、直ちにゆとり世代のIQが低いとは言えないということだ*3。加えて、(こちらが本題である)Lynnはフリン効果を単に開発時点と実施時点のギャップを補正するために使っているが、フリン効果の影響はさらに広範なものである。たとえば次のような架空の事態を考えてみよう。

まずある知能検査Aが開発されたとする。その10年後に開発された知能検査をB、以下同様に10年毎に開発された知能検査をC、Dとする*4。これを日本人が(開発から間を置かず)受けた結果はそれぞれ103,103,103,100であった。100がゆとり世代の結果である。単純平均を四捨五入して日本人の平均知能は102となる。ゆとりのせいで下がってしまった。

これはLynnとVanhanenの計算方法と同じである。彼らもフリン効果による補正はしているが、それはあくまで「ある知能検査」について、その結果を実施年度を問わずに同一尺度上の数値に変換するためであり、全ての知能検査を単一のスケールで表現するためではない。つまり、知能検査Aが数年後に日本で実施されたならば、その得点をA’としてフリン効果による補正はするが、知能検査Bについてはしないということだ。平均値の計算に使われるのは、あくまでその知能検査が開発された時点を基準としたIQなのである。

さらに具体的に説明しよう。たとえば、"IQ and the Wealth of Nations"では日本のIQを10本の論文から計算しているが、そのうち3つだけを抜き出すと次のようになる。

1. WISC 1947年にアメリカで開発(当然平均は100)1951年に日本で実施(平均103点/1点減点)
2.WPPSI 1964年にアメリカで開発(当然平均は100)1967年に日本で実施(平均108点/1点減点)
2.CMMS 1972年にアメリカで開発(当然平均は100)1980年に日本で実施(平均113点/2点減点)

右側括弧内はそれぞれ日本の平均得点(当たり前だがそれぞれの知能検査を日本で運用する時は平均100に調整される。あくまで初めて実施した時の得点である)とフリン効果による補正値を示している。他の要因でも補正されているので、その最終的な結果はそれぞれ102点、105点、109点である。LynnとVanhanenはこの数字を平均して日本の平均IQは105と言っていたわけだ。

つまり、同じ知能検査についてはフリン効果による補正をしているが、別の知能検査についてはフリン効果を考慮していないのである。言っておくが当たり前である。もし最初のテストに基準を置くと、最近テストを受けた国の方が得点が高くなってしまうからだ(たとえば中国や韓国のデータは全て80年代以降のものである)。そして世界の平均IQは115くらいになってしまう。

知能検査A,B,C,Dの話に戻ろう。仮にフリン効果を年あたり0.3として、知能検査Aを基準とした数値でそれぞれの検査を受検した世代の知能指数を確認すると、知能検査A世代:103、知能検査B世代:106、知能検査C世代:109、ゆとり世代:109になる。ゆとり以前の全ての世代がゆとり世代以下の知能指数となっている。数字の上では低下しているように見えても、実際はフリン効果によって基準となるIQが上がり続けていたためである。


まとめ
以上、ゆとり世代と他世代のIQの数値は変わらないこと、そして変わらないということは実際には上がっていることを示した。おしまい。

 

 

 

*1:日本におけるフリン効果を初めて確認したのはRichard Lynnである。

*2:実際25本の内9本がLynnの研究である

*3:フリン効果による一律0.3ポイントの補正は、特に近年の先進国のIQを過小評価するおそれがある。一部の西欧・北欧諸国では既にフリン効果が打ち止め、或いは「逆フリン効果」が生じている可能性が示唆されているからである。なお日本ではWAIS・WISCともに未だにフリン効果は確認されている。

*4:話を分かりやすくするため別の知能検査としているが、同種の知能検査についても同様である。たとえば、WAIS, WAIS-R, WAIS-Ⅲ, WAIS-ⅣをそれぞれA, B, C, Dに置き換えると良い。また、本稿で「開発」「実施」としているものは、正確には全て「標準化(standardization)」と呼ばれる。