氷河期世代の不遇について
「氷河期世代」という人格的な実体が存在するとは思いませんが「自分は氷河期世代だ」と宣う人は実在するのでその意を汲んで彼らを氷河期世代と称することにします(面倒くさい前置き)。
大学受験が熾烈を極めた氷河期世代
同世代の人数がとにかく多い。つまり競争相手が多すぎて大学受験が熾烈を極めたのだ。
極めていません。より正確に言えば、受験倍率の高さは増田の想定するほど学生の行動には影響を与えませんでした。以下のグラフは不合格率と学業時間*1の相関を見たものですが、不合格率が右肩下がりを続ける一方で、学生の学業時間は90年代後半から2000年代初頭を底としてその後大きく回復しています。なお、ここで「不合格率」としたものは、「1-(過年度高卒者含む四年制大学入学者数)/(過年度高卒者含む四年制大学志願者数)」の値です
つまり、増田の主張には「必死に頑張ってきたのに…」的な含意があるわけですが、別にそうした事実はありません。特に大学生の学業時間については、大学のレジャーランド化と言われていた時期の学生と今の学生を比較すると隔世の感があります。これは大学生のレベルが必然的に下がっていることを考慮すれば、いっそう驚くべきことです。
国に見捨てられる氷河期世代
人数が多い世代だからといって、大学のキャパを急に増やしてくれるわけではない。
増やしてくれました。いわゆる「臨時的定員」の増員がこの時期に実施されています。まあ臨定の受け皿は殆どが私立だったと言われているので、国公立は余り関係ありませんが…ちなみにこの臨定が後に5割恒常化することで大学全入時代の到来を早めたとも言われています。
おまけ
断片的な情報をつなぎ合わせれば如何様にも物語をつくれるという実例です。
学校行ってもちゃんと勉強しないとダメよねー、というお話
で、この研究者たちは、就学年数とかじゃなくて、実際に能力テストをやってそれとの相関を見てみたらどうだろうか、というのをやった。それが以下の図。
正確に言うとこのグラフは相関ではなく偏回帰プロット(added-value plot)です。グラフAは"一人当たり実質GDP成長率(1960-2000)"を従属変数として、"1960年時点の就学年数", "1960年時点の一人当たり実質GDP"の2変数で重回帰分析したときの"1960年の就学年数"の偏回帰プロット、グラフBも従属変数は同様に、テスト得点変数を追加して重回帰分析したときの"テスト得点"の偏回帰プロットです。
正確に説明するとややこしいですがRならavPlotsで簡単にグラフが出力できます(データの出所については後述)。
"Years of schooling 1960" , "GDP per capita 1960"の偏回帰プロット。左の図がグラフAに相当します。
"Test score" , "Years of schooling 1960" , "GDP per capita 1960"の偏回帰プロット。左上の図がグラフBに相当します。
で、そもそも偏回帰プロットとは何ぞやという話ですが、まあ名前の通りです。説明変数について、他の説明変数を統制した場合の目的変数
との関係をプロットしたもので、
軸は目的変数
を
を除く変数で回帰分析したときの残差、
軸は説明変数
を
を除く変数で回帰分析したときの残差になります。
したがって、グラフBの横軸は実際に記録されたテスト得点ではないわけです。まあ初期GDPと就学年数の影響を除いているわけですから、それを「教育の質」と解釈できないこともないですし、一般向けに分かりやすく「相関」と表現したのかもしれませんが、山形大先生は
(ここでのテストは、数学と科学のテストだそうな。具体的なデータ出所は、この論文著者たちの本に載っている模様で不詳。この論文の分析ベースらしい。はてブの id:cider_kondo にTNX!!)
cider_kondo id:nankichi<同じメンバーの過去論文でPIAACを使って22カ国分比較したのが見付かったので、それ踏まえた研究っぽいですね。http://ftp.iza.org/dp7850.pdf
と中々に寝ぼけたことを仰っていますからね、良く分かってなかったんじゃないでしょうか。具体的なデータの出所についてはグラフの注釈にも本文中にも"1964-2003に実施された国際学力調査"と書かれているんですがねぇ…まあ大先生ですからたった2ページのペーパーを読む時間すら惜しいのでしょう。ちなみに第1回PIAACが実施されたのは2011年です。
1964年から2003年までと言えばFIMS(First International Mathematics Study ,1964)からPISA2003までだろうなって私はピンと来るんですけど、どうも大先生は国際学力調査について余りお詳しくないようで、まあ大先生ですから(ry ただし、得点の正確な算出方法は不明です。単に標準化しただけ…ではないでしょうが具体的な処理については先生も仰っている通り著者たちの本を参照する必要がありそうです。
最後にSupplementary Materialsに記載されているデータを貼っておきます。テスト得点については抜けているのが台湾、それに韓国・シンガポール・日本が団子状態で続くと、まあ近年の国際学力調査と変わらない結果という感じです。
日本行動嗜癖学会の学会声明についてのメモ
(※末尾にブコメへの返信を追記しました)
「日本行動嗜癖学会(JSSBA)」の学会声明についてのメモです。「日本嗜癖行動学会(JSSAB)」は関係ありません。ちなみに、後者は1990年に精神科医の斎藤学氏を中心として設立された学会だそうで*1、年2回刊の会誌発行と年1回の学術大会を開催しています。
他方、日本行動嗜癖学会は昨年設立されたばかりの学会であり、社会学者の井出草平氏が設立したという事実*2以外は謎に包まれた学会です。まあぶっちゃけ井出さんの個人HPですよねこれ…
先日、文科省が、ゲーム、ネット、スマホで発達障害「的」な子どもが増えると主張している件について、日本行動嗜癖・依存症学会から声明が出ました。 https://t.co/VcdlXOqGkT
— 井出草平 Sohei IDE (@Sohei_IDE) 2023年1月20日
↑「出ました」っていうか「出しました」っていうか…この学会声明文が出る3日前にも井出さんのHPで問題の文科省調査がとりあげられているのですが(ブックマーク3件)、その中で氏は
と、学会声明文とほぼ同じ文言で当該調査を痛烈に批判しています。「言うまでもなく」「周知のとおり」といった表現は絶対に使うなと大学初年次に教わった身としては独立した複数の研究者が同じ文言に辿り着いたとは考えにくく、まあそういうことだろうなぁと。
井出さんが「ゲーム脳」や「スマホ脳」的言説に向ける憎悪を知っているので驚きはしませんし理解もできるのですが*3、科学がどうのエビデンスがどうのと言ってるブコメの連中がこの文言をスルーしているのは何なのでしょうかね、頭にマルコメでも詰まっているのでしょうか。
というわけで以下、後学のためにアホなブコメを晒しておきます。やりたくないですが私がやらないと誰もやりませんからね、ということはつまり反省の契機が失われるということです。科学文明を支える市民社会の一員として心ならずも晒します、お許しを。
ベストイレブン
①id:sisyaさん
まず「発達障害的」という表現がうさんくさいし、潜在的な差別意識を感じる。発達障害は後天的になるものではないので、そこから学び直してきてくれという気持ちになる。
このブコメが全てを変えましたね。何をどう誤読したんだという感じですが、以下「発達障害的」というむしろ学会側しか使用していない言葉が槍玉に挙げられることになります。ちなみに現時点で252個の星が付いてトップコメに鎮座しているのですが本人は修正する気がないようです。
②id:iddduさん
なんなんでしょうね、井出さんに聞いてみてください。まあギリ好意的に解釈できないこともないか…?
返信
ご指摘ありがとうございます。仰る通り元のPDFに"発達障害的"という記述はありませんでしたので、該当ブコメ修正しました。
ウザ絡みしてしまい申し訳ございません…こんな救いようのない失礼な馬鹿にお付き合いいただき有難い限りです。
③id:MIT_triさん
"的"とは?
なんなんでしょうね(2回目)マジもんなのかsisyaさんの犠牲者なのか聞いてみたいところです。
④mahinatanさん
結論ありきの暴論。発達障害が増えているのは少しのミスも許さない社会が今まで障害だと認定されなかった人たちまで障害認定しているから。教師にとって扱いづらい子供はみんな障害ってことになっちゃう。
アホなブコメではありませんが、調査報告書では「今まで見過ごされていた子供たちに目を向けるようになったこと」が"発達障害的"な児童が増加した理由として第一に挙げられています。
元の調査見てみた。趣旨や目的の価値は理解できるけど、ちょっと調査としては大学生レベルかなと思った。学会が声明出してくれるのはありがたいね。ちゃんと論文レベルで調査してほしい。
マジ?大学生のレベル高すぎるだろ。標本調査法は泣きながら勉強したので人並程度の知識はあるつもりですが、当該調査は(解釈はともかく)国が実施する調査として十分な水準にあると思うので、皮肉ではなくどこら辺に問題を感じたのかお聞きしたいです。教員が回答しているからダメとかそんな理由なんでしょうか。
⑥id:bnckmnjさん
的って…。個人の感覚じゃん…。
そうですね…
⑦id:deltasさん
言ってないんだよなぁ…むしろ再三注意を促してるんだよなぁ…まあADHDの評価スケールを使っている以上は「発達障害的」な児童を「発見」しようしているという批判は妥当だと思いますが、これは何か勘違いしてるでしょう。あとこの手の人って因果推論とかちゃんと勉強してるんですかね?エビデンスを理解するのってそれなりに大変ですよ。
⑧id:kuzumajiさん
因果関係が逆だし新聞社の露骨な誘導にしか見えなくあまつさえ発達障害「的」などと誠に恥ずかしい発表であるが、普段からスマホなどその方面を叩きたい人には相当なお墨付きを与えてしまった感。
これは誠に恥ずかしいブコメ。
返信
ご指摘ありがとうございます。資料拝見したところ的のような内容はありませんでしたのでコメント削除いたします
一方的かつ大変失礼な物言いにかかわらず誠実に対応していただき罪悪感で死にそうです。申し訳ございませんでした。
⑨id:harutenさん
これはひどい。とにかくひどい。極め付けは発達障害「的」って何。発達障害は悪いものだから近づいてはならない、みたいな?この資料を出すことでメリットがある人達って誰なんだろうと考えてしまう
こ れ は ひ ど い
返信
先に書き込まれていたブコメの「発達障害的」という言葉に反応して冷静に内容を読むことができないまま書き込んでしまいました。ご迷惑をおかけし申し訳ありませんでした。コメントは削除しお詫びいたします。
とんでもありません。人類の大半は自分の誤りを認めると死ぬ病気を患っているのですからharutenさんの行いは大袈裟に言えば人類社会の未来に対する貢献です。胸を張って誇ってもいいくらいです。
⑩id:hatepyさん
学会に否定されるとか、これは草案件。
学会っていうか井出さん案件ですねたぶん。まあ背景とか知らない方が普通なのでアホなブコメではないのですが。日本行動嗜癖学会はともかく世の中しょうもない学会って一杯あるんですよ。
⑪id:t-oblateさん
発達障害って言葉に「的」をつければ嘘を言ったことにならない(なぜなら定義がなくなるから)テクニック、「環境型セクハラしてるようなもの」と同じやつで、賢い人が印象操作したいときに便利なんやろね。
お、おう……
ブコメへの返信
preciar ん?エビデンスが不在であると言う事実は引用等で補強しようがないので、「言うまでもなく」だろうが「論を待たず」だろうが問題ないでしょ?反例一つ上げれば否定できるんだから、そこは問題ではない
コメントありがとうございます。「エビデンスがない」という言葉は、単に調査が存在しないという意味と、調査した上で関連が否定されているという二つの意味にとれますが、どちらであるのかは説明しなければ第三者には伝わりません。そして、後者であればエビデンスの不在という事実自体を補強することができます。
たとえば、アメリカ心理学会が「体罰反対決議」を採択した際の声明文では、「体罰が有用であるという一貫した科学的エビデンスはない」としてメタ分析を含む数多の先行研究を列挙しています(https://www.apa.org/about/policy/physical-discipline.pdf)。
私の誤読や勘違いでしたら申し訳ありません。その際はお手数ですがコメント欄の方でご指摘いただけると助かります。
「片親パン」の流行について
TikTokのAPIはよくわからないのでTwitterにおける「片親パン」のツイート数(RT除く)の推移を調べました。以下は泥縄式プログラミング法によって書かれた半人力コードです。万一利用する場合はBearer Tokenとstart_time, end_timeの部分を任意に置き換えてください。
import urllib3 import json def get_tweet_by_text(http, key, search_feild): url = 'https://api.twitter.com/2/tweets/search/recent' req = http.request('GET', url, headers= {'Authorization': 'Bearer ' + key}, fields = search_feild) result = json.loads(req.data) return result http = urllib3.PoolManager() KEY = 'Bearer Token' params = {'query' : '片親パン -is:retweet', 'max_results' : 100, 'start_time': '2023-01-05T15:00:00Z', 'end_time': '2023-01-06T14:59:59Z' } get_tweet_by_text(http, KEY, params) has_next = True while has_next: result = get_tweet_by_text(http, KEY, params) print(result) # 取得制限対策 if not 'meta' in result: break # flag has_next = 'next_token' in result['meta'] if has_next: params['next_token'] = result['meta']['next_token']
考察
いわばまさに無能な働き者であります。
近世の成人年齢について
十五歳になった途端に大人になる?
近世では(数え)十五歳で元服を迎え一人前の大人として扱われるようになる、というのが通俗的な近世の成人年齢に対するイメージだと思われる。確かに、当時は階級・地域を問わず概ね十五歳で元服(或いはそれに準ずる儀式)が行われていたのは事実だが、その内実は一般にイメージされるように、立ちどころに一人前の成人としての扱いを受けられるものでは無かった。
ところで、社会的に統一された「若者」が生み出されたのは、もちろん明治期の青年団に遡ることができるわけだが、その源流は近世の各村落に自然発生した「若者連*1」である。十五歳というのは元服を迎える年齢であると同時に、多くの村落においてはこの若者連への加入資格を得る年齢でもあった。
若者論へ加入することによる責務・権利はその自然発生的経緯からして当然にその土地や村落の状況により異なるのだが、概ね次の三つの要素①祭祀の執行②公共的労働への従事③性交・妻帯の許可はいずれの若者連にも共通していたと考えられている。而して、若者連へ加入することで直ちにこれらの責務・権利が十分に与えられたわけではない。
長幼の序を教えるための若者連
むしろ、若者連へ入ること(或いは元服)は、大人としての階段を上り始める、その第一歩として位置付けた方が適切である。若者連は単に若者の集合体を指すのみならず、長幼の序を教えるための教育制度でもあり、それを証するように若者連には年齢によってその役柄・名称を異にする事例が多数確認されている。
たとえば、福島県石城郡草野村大字北神谷では、十五歳となった男子は酒一升を携えて若者組に加入する。而して二十歳までは「小若衆」と称して使い走りの用を命じられ、二十五歳で「中若衆」となり、三十歳で「世話人」となり、三十五歳で脱退する定めとなっていた(中山太郎, 1925, 『日本若者史』, p.31)。
また、同郡の他村落では年齢によって十五歳を世話人、十六歳を若水、十七歳を大将、十八歳を後見と称して区別しており、最も勢力のある大将が世話人・若水を使役する関係にあったという(同上, pp.31-32)。同様の事例は他の地域でも確認されており、若者連へ加入してからの数年間において、村落共同体への忠誠とそのしきたりを教え込むのが若者連共通の機能であったことが窺える。
案外現代と変わらない
以上の事例は中山太郎の『日本若者史』から引用したわけだが、同書に数多記載されている若者連の事例を通覧すると、当時の「若者」概念は案外現代と変わらないのではないかと思えてくる。若者連への加入・脱退の年齢が、現代日本における「若者」の定義としてそのまま通用するからだ。
先述したように、若者連は各村落の実情に合わせて自然発生的に形成されたものであり、当然の如く若者連への加入と脱退の年齢は各村落毎に異なっていた。ただし、敢えてそこから平均像を描出するならば、加入の年齢は概ね元服を迎える十五歳、脱退の年齢は三十歳から四十歳が平均的な事例となっている。
この加入・脱退の年齢は、不思議なことに現代日本における「若年無業者」の定義とよく似ている。内閣府及び厚生労働省が定義する若年無業者とは十五歳から三十五歳の無業者を指しており、(色々と批判はあれど)これが現代日本における「若者」の一つの定義となっている。この定義は若者連の平均的な在籍年数と一致している。
また、これも先述したように、若者連へ加入して初めの数年間は一歳刻みで役柄を異にする事例が多数確認されており、これも中学・高校における先輩後輩の関係を思わせるものだ。或いは、労働基準法における年齢制限と若者連加入の年齢の一致(満年齢と数え年の違いはあるが)など、近世日本の「若者」概念は現代日本にも連綿と受け継がれているのかもしれない。
結語
斯界の末席として考察の一端を披瀝し敢て江湖の淸鑒を仰がんとかなんとか。
*1:地域によって若ィ衆、若モン、若連中、若手、ワカゼ、二才、ニセイ等と称するが本稿では若者連で統一する。
濫用され得る薬物の有害性を評価するための合理的な尺度の開発 〈私訳〉
大麻がどーたらの議論でよく見るコレ↓ 一体いかなる理屈でこの画像が生み出されたのか、後学のため出典の拙訳を載せておきます。
Nutt, David, Leslie A King, William Saulsbury, Colin Blakemore. "Development of a rational scale to assess the harm of drugs of potential misuse" The Lancet 2007; 369:1047-1053.
要旨
薬物の不適切な使用や乱用は重大な健康問題である。現在、有害な薬物はそのリスクや有害性に基づくとされる分類システムによって規制されているが、その分類システム構築に係る方法論や手続きは概して曖昧であり透明性に欠けている。したがって、その規制やシステムの正確性は保証されておらず、それによって薬物の啓蒙活動も説得力が低下している。
我々は、エビデンスに基づき様々な違法薬物の有害性を評価するため、デルファイ法により九つのカテゴリを持つ有害性評価マトリクスを開発し、その実用可能性を調べた。参考のため、我々の調査には五つの合法的な薬物(アルコール、カート、有機溶剤、亜硝酸エステル、タバコ)及び調査後に違法薬物に指定されたケタミンを含めた。
この評価プロセスは実用可能であることが証明され、二つの独立した専門家グループによる得点と順位の評価は概ね一致していた。また、我々が順位付けした薬物の有害性と現行の法規制による違法薬物の分類には差異が見られた。我々の方法論は、各国の規制当局が、現在及び将来の薬物乱用の有害性を評価するための体系的なフレームワークと手続きを提供する。
序論
薬物乱用は、現代社会における社会的、法的、及び公衆衛生上の主要な課題の一つである。イギリスでは、薬物乱用による健康問題や社会問題、犯罪への対処にかかる総負担額は年間で10億ポンドから16億ポンドと試算されており、世界規模での負担はこれに比例して莫大なものとなっている。
薬物乱用に対する現在の主要な対策は、(警察と税関による)供給の禁止、教育、そして治療の三つである。これら三つのアプローチ全てが、それぞれの薬物の相対的有害性について明確な基準を必要としている。
現在イギリスでは、違法薬物の取締りや刑罰は1971年薬物乱用法の規定に基づいており、教育や医療の提供は、名目上、特定の薬物の既知の作用とその有害性に合わせたものとなっている。殆どの国や国際機関(国連やWHO)がそれぞれの違法薬物の分類システムを持っているが、その基準は多くの場合公開されていないか、公開された場合でも曖昧かつ不透明であり、一見恣意的に見えるものも多い。
この明確性の欠如は、有害性の推定について考慮しなければならない要素の膨大さと複雑さ、及び科学的根拠が多くの関連分野で制限されているだけでなく、漸進的かつ予測不可能な方法で発展していることを原因の一部としている。
現在のイギリスの薬物乱用法も同様であり、違法薬物はその危険度の順にクラスA、クラスB、クラスCに分類されている。また、この分類に基づき違法薬物の輸入・使用・所持に対する刑罰の軽重や取締りの厳しさが決定されているが、現在の分類は非体系的かつ恣意的であり、その科学的根拠は殆ど無いように見える。
そこで我々は、事実と科学的知見に基づいた、個々の薬物の潜在的有害性を評価するための新しいシステムを提案する。このシステムは、既存の薬物の有害性について、その研究の発展に対応することができ、新たに登場するストリートドラッグの危険性なども評価することができる。
有害性のカテゴリ
いずれの薬物にも共通して決定できる有害性の要因が三つある。:薬物使用によって引き起こされる身体的有害性:薬物の依存を引き起こす力の強さ:家族や社会に与える影響の大きさの三つである。
身体的有害性
薬物の身体的有害性、すなわち、臓器や身体組織に対する有害性の評価は、その安全域だけでなく、長期の継続的摂取によって生じる健康問題も考慮しなければならない。生理学的機能(たとえば心臓や呼吸器官)に対する薬物の影響は、身体的な有害性を判断する上で主要な評価基準である。
薬物の投与経路もまた有害性の評価に関連している。静注可能な薬物(たとえばヘロイン)は、呼吸抑制によって突然死を引き起こす危険性があり、それ故、これ等の薬物は急性の有害性を表すいずれの指標でも高得点を示す。
他方、タバコとアルコールの常習的な摂取は将来の疾患や死亡を引き起こす高い危険性を持っており、近年提出されたエビデンスによれば、紙巻きたばこの長期摂取は平均して寿命を10年縮めることが示されている。また、イギリスでは薬物関連の死亡原因の90%をタバコとアルコールが占めている。
医薬品・医療製品規制庁(MHRA)及びそれに類するヨーロッパ、アメリカ、その他地域の各機関は医薬品の安全性を評価する確立された手法を持っており、これを危険性評価の基礎とすることができる。実際、乱用薬物のいくつかは医薬品としての認可を受けており、その安全性も既に評価されているが、殆どのケースにおいてそれは何年も前のことである。
ここで、身体的有害性の三つの側面を定義することが出来る。第一に、急性の身体的有害性(即効性のものであり、たとえば、オピオイドによる呼吸抑制やコカインによる急性心臓発作、中毒死)である。薬物の急性毒性はしばしば致死量に対する治療量の比率(安全域)で測定される。我々が調査した殆どの薬物でこのデータを利用することができた。第二に、慢性の身体的有害性(常習的使用の結果であり、たとえば覚醒剤による精神病、大麻による肺疾患)である。そして最後に、静脈注射に関連する特定の問題がある。
薬物の投与経路は、急性毒性だけでなく所謂"secondary harms"にも関連している、たとえば、静脈注射による薬物使用は肝炎ウイルスやHIVの感染を拡大させる可能性があり、これは使用者個人だけではなく社会全体の健康問題となりうる。静脈注射の問題は現在の薬物乱用法でも考慮されており、我々の調査においてもこれを個別のパラメータとして取り扱っている。
依存性
この有害性には相互依存的な要素、すなわち、その薬物の快楽の強さとその薬物自身の依存形成力が含まれる。一般に、オピオイドやコカインのように強い快楽をもたらす薬物は乱用されるのが常であり、薬物の市場価格はこの快楽の強さによって決定されている。
快楽を引き起こす薬物の作用には二つのものがある。一つは、薬物投与後に急速に生じる効果(通称"ラッシュ")であり、もう一つが、これに続いてしばしば数時間持続する多幸感(通称"ハイ")である。薬物の成分が脳に届く時間が早いほどラッシュの効果も強くなり、これがストリートドラッグの摂取において喫煙、静注が好まれる理由でもある。どちらの摂取方法も投与から30秒以内に脳に届く。
ヘロイン、クラックコカイン、タバコ(ニコチン)、大麻(テトラヒドロカンナビノール)といった薬物はこれらの迅速な経路によって投与されている。粉末状のコカインを鼻粘膜から吸収する場合も同様である。経口投与は唯一効果の発現を遅らせる摂取方法であり、一般に効果は弱くなるが、その持続時間が長くなる。
薬物乱用の本質的特質は、その常習性にある。この性質には様々な要因とメカニズムが関わっており、薬物による特別な体験は確かにその理由の一つである。たとえば、幻覚剤(リゼルグ酸、LSD、メスカリン等)の場合、おそらく幻覚体験がその使用の唯一の理由であり、これらの薬物はそれほど頻繁に摂取されることはない。
その対極にあるのがクラックコカインやニコチン等の薬物であり、これらの薬物は殆どの使用者に極めて強い依存をもたらす。身体的な依存には耐性の増加(すなわち、同じ効果を得るために必要とする摂取量が徐々に増える)、激しい渇望、薬物使用を中止した際の離脱症状(たとえば、振戦、下痢、発汗、不眠症)が含まれる。
これらの作用は薬物使用によって脳の器質的、適応的な変化が生じたことを示している。依存性の高い薬物は頻繁に、繰り返し使用される傾向にあるが、それは部分的には薬物に対する渇望のためであり、部分的には離脱症状を避けるためである。
精神的依存も同様に、薬物の繰り返しの使用によって特徴づけられるが、身体的依存とは異なり直接の身体症状や耐性の増加は見られない。実際に、長年の大麻使用を中止してもその離脱症状は数日間しか持続しない。いくつかの薬物、たとえばベンゾジアゼピンは耐性が増加することなく精神的依存を生じ、投与が中止されるという恐怖だけで身体的な離脱症状が生じる。
この種の依存は中毒症状よりも十分に研究されておらず、理解もされていない。しかし、投与する薬物の量を一定に保ったうえで、使用者に投与量を減らしていると説明するだけで身体的な離脱症状が生じることが確認されており、その意味で使用者にとっては本当の体験と変わりがない。
依存と離脱症状を引き起こす薬物の性質は合理的に定義することができる。半減期の短い薬物ほど激しい離脱症状が生じ、また、薬力学的効果の強い薬物ほど強い依存が生じる。そして、耐性の増加が大きくなるほど離脱症状も大きくなる。
多くの薬物において、動物実験で観察された結果と人間に生じる症状には良好な相関がある。また、同じ分子特異性を持つ(すなわち、脳内の同じ標的分子に結合、または相互作用する)薬物は類似した薬力学的効果を持つ傾向にある。したがって、新しい化合物の作用について、それを人間に投与する前にある程度合理的な予測をすることが可能である。
薬物の依存性は、それが古いものであれ新しいものであれ、既に使用している人にしか実験的研究が行えないため、一般に使用される薬物については人口ベースの推定が行われてきた。これらの推定は喫煙が最も依存性の高い一般的薬物であることを示しており、ヘロインとアルコールがそれに続く。他方で幻覚剤の依存性は低い。
社会的有害性
薬物は様々な経路で社会に悪影響を与える。たとえば、その毒性の様々な態様、家族や社会生活への損害、医療費や取り締りに係る費用等である。特に、激しい中毒作用を持つ薬物は使用者や周りの人、財産等に甚大な損害をもたらすことがある。
たとえば、アルコールの酩酊作用はしばしば暴力的なふるまいを引き起こし、車両事故やその他事故の一般的原因でもある。多くの薬物は使用者の家族にも影響を与える。乱用薬物は使用者の生活の動機を歪め、家族を遠ざけ、犯罪を含む薬物に関連した行動に従事させるようになる。
いくつかの薬物は計り知れないほどの社会的損失を生み出す。タバコは病院の疾患原因の最大40%を、薬物関連疾患については最大で60%を説明するとされる。アルコールによる何らかの事故、救急部門、整形外科への入院は全ての受診者の過半数を占めている。ただし、これらの合法的な薬物は税収によってその損失を幾ばくかは補填することができる。
静注可能な薬物にはまた別の問題がある。これらの薬物は針の使いまわしや性交渉によってHIVや肝炎の感染を拡大させることがある。最近になって普及した薬物、たとえば"エクスタシー"やMDMAとして知られる3,4-メチレンジオキシ-N-ヒドロキシ-N-メチルアンフェタミンの長期的な健康・社会的リスクは現在のところ動物実験によってしか推定できない。もちろん、全ての薬物使用は社会的有害性をもたらしうる。
有害性の評価
Table1は我々が作成した評価マトリクスである。これには上述の通り、三つのカテゴリが設定されており、各カテゴリが三つのサブカテゴリを持つことで計九つのリスクパラメータが設定されている。評価者はそれぞれの薬物について、九つのパラメータを4件法(0=no risk, 1=some, 2=moderate, and 3=extreme risk)で評定することが求められる。いくつかの分析では、それぞれのメインカテゴリについて、サブカテゴリの単純な平均を使っている。また、考察のためには、九つのパラメータの全体の平均を使っている。
パイロット版の試行はRunciman Reportのメンバーによって行われた。このパイロットテストにより一度リファインされ後、追加のガイダンスノートを添えて、Table1に基づいた質問票が使われた。評定は二つの独立した専門家グループによって行われた。
最初のグループは英国王立精神科医学に薬物嗜癖の専門家として登録されている精神科医のグループである。評定を求めた77人の登録医師の内29人から返信を受け取り、14の薬物(ヘロイン、コカイン、アルコール、バルビツール酸系、アンフェタミン、メサドン、ベンゾジアゼピン、有機溶剤、ブプレノルフィン、タバコ、エクスタシー、大麻、LSD、ステロイド)の評定及び分析が実施された。
タバコとアルコールを含めたのは、その過剰摂取のリスクについての信頼できるデータが既に蓄積されており、他の薬物の絶対的有害性を判断することができるためである。ただし、タバコとアルコールを他の薬物と直接比較することはできない。合法の薬物は様々な点で、特にその入手が容易であるという点において有害性の評価に影響を与えているからである。
この評価マトリクスが十分に機能することを確認した後、より幅広い専門性を持つ専門家によって構成された第二のグループによる会議を開催した。これらの専門家には化学、薬理学、法科学、精神医学、疫学を含むその他専門家、及び法律・警察関係者が含まれ、評価はデルファイ法に基づく一連の会議によって行われた。
このアプローチは、問題とその影響が極めて広範であり、正確な測定や実験が困難な分野において、知識を最適化するために広く使用されている方法である。これは医療問題においてコンセンサスを形成するための標準的な方法となりつつある。デルファイ法による分析には、様々な分野の専門家による高度な知識が組み込まれているため、薬物乱用や依存症のように複雑な問題を分析するには理想的な方法である。
最初の評定は各参加者が独立して行った後、会議の場で全員に提示され、外れ値の理由を解明することに特に重点が置かれた。個々の参加者はこの会議の結果に照らしてスコアを修正し、その後、最終的な平均スコアが計算された。このプロセスの複雑さは、1回の会議では僅かな薬物しか評価できないことを意味しており、最終的には4回の会議によって全体の評価が完了した。会議に参加したメンバーの数は各回8人から16人であったが、専門家の多様性は維持している。
この第二セットでは最初の十四の薬物に加えて、完全性を期すため六つの薬物(カート、4-MTA、GHB、ケタミン、メチルフェニデート、亜硝酸エステル)が追加された(Table2)。いくつかの薬物は違法ではないが、乱用の報告があったために追加している。参加者は知識を更新し、自らの意見を熟考できるよう、各会議では事前に対象となる薬物が伝えられ、最新のレビュー記事が提供された。
特定の薬物の特定のパラメータについて、スコアを付けることができない参加者もいたが、この欠損値は分析では無視している。すなわち、ゼロとして扱っているわけではなく補間もしていない。データはMicrosoft Excelの統計機能とS-plusによって分析された。
結果
このリスク評価システムは、アンケート及び議論の両面で簡便かつ実用的なことが示された。Figure1は20の化合物について、全てのカテゴリスコアを平均したものをランク順に並べたものである。薬物乱用法による分類も同時に表示している。
最も有害性の高い二つの薬物(ヘロイン、コカイン)は薬物乱用法でもクラスAに分類されているが、他の薬物については同法の分類との間に驚くほど相関が無い。我々の評価で上位八つの薬物と下位八つの薬物は、いずれも三つがクラスA薬物であり、二つは未分類の薬物である。
アルコール、ケタミン、タバコ、有機溶剤(いずれも調査時点では未分類の薬物)はLSD、エクスタシー、4-MTAよりも有害性が高いと評価された。実際、薬物乱用法による分類と我々の有害性ランクとの相関に有意差は無い(Kendallの順位相関 -0.18; p=0.25; Spearmanの順位相関 -0.26, p=0.26)。
未分類の薬物では特にアルコールとケタミンに高いスコアが与えられた。興味深いことに、つい最近、薬物乱用諮問委員会(ACMD)がケタミンを薬物乱用法の指定薬物にするべきと勧告し、これが承認されている。
我々は、両方のグループで評価された14の薬物について、その平均スコア(九つのパラメータの平均スコア)を比較した(Figure2)。二つのグループの評価は概ね一致しており、スコアの妥当性と堅牢性が示された。
Table3に示したのは第二グループの評価の結果である。それぞれのサブカテゴリの平均スコアとカテゴリの平均スコアが示されており、各薬物は全体の平均スコア順に並べられている。多くの薬物は三つのカテゴリそれぞれの順位が一致していた。
たとえば、ヘロイン、コカイン、バルビツール酸系、ストリート・メスはいずれのカテゴリにおいても上位5位を占めている。他方で、カート、亜硝酸エステル、エクスタシーはいずれのカテゴリにおいても下位5位の評価しか与えられていない。
いくつかの薬物はカテゴリ間の順位に明らかな違いがある。たとえば、大麻は身体的有害性については低いスコアとなっているが、依存性と他者に対する有害性はいくらか高くなっている。アナボリックステロイドは身体的有害性が高いが依存性は低い。タバコは高い依存性を示すものの、それに比して社会的有害性は明らかに低くなっている。これはタバコの中毒性スコアが低いためである。
また、タバコの身体的有害性の平均スコアは中程度となっているが、これは急性毒性、静注の有害性が低い一方で、驚くことではないが、長期的使用の有害性が極めて高いためである。
静注可能な薬物は概して高い順位となった。これは、単にカテゴリ3(すなわち、静注のされやすさ)とカテゴリ9(医療費)において極めて高い得点が与えられたことだけが原因ではない。仮に、この二つのスコアを分析から除いたとしても、これらの薬物はなお高い順位のままである。したがって、静注可能な薬物は、その他多くの面で極めて有害性の高い薬物であると判断することができる。
考察
我々の研究の結果は、現在の薬物乱用法におけるA,B,Cクラスというはっきりした分類を正当化しない。もちろん、明確なカテゴライズは取締り、教育、社会的支援における優先順位の設定、違法薬物の所持や取引の量刑を決定する上では有用である。
しかし、我々がここで示したより完全な有害性評価は、薬物のランク付けも、それに基づく薬物乱用法の分類も、どちらも支持しない。いかなるランキングにおいても、明確に定義されたカテゴライズは、明らかな不連続性が確認されていない限り本質的に恣意的なものである。
Figure1はそのような不連続性を僅かに示唆しているだけであり、分布のほぼ真ん中、ブプレノルフィンと大麻の間に小さな段差がある。興味深いことに、アルコールとタバコはどちらも上位10位内に入っている。また、アルコール以降の薬物で有害性スコアが加速度的に増加している。
したがって、敢えて従来の区分と同じく三つのカテゴリによって分類するならば、アルコール以上の薬物をクラスA、大麻以下の薬物をクラスC、その中間の薬物をクラスBとすることが考えられる。これは、最も広く使用されている合法薬物であるアルコールとタバコが、それぞれクラスA、クラスBの薬物に匹敵する有害性を持っていることを確認できる点で有益である。
参加者は薬物の有害性を評価するにあたり、その薬物が通常使用される形態での評価を求められた。しかし、いくつかのケースでは、特定の薬物の有害性をその使用方法の干渉要因から完全に分離することはできなかった。
たとえば、大麻は一般にタバコと混ぜた上で喫煙されるが、これが身体的有害性と依存性のスコアを引き上げた可能性がある。多剤併用に係る不確実性はさらに大きく、特に、混合物として一般に使われるGHB、ケタミン、エクスタシー、アルコールを含むいわゆる"recreational group"が主としてその副作用を引き起こしている可能性がある。
クラックコカインは一般に粉末状のコカインよりも危険性が高いと考えられているが、この研究では両者を分けて評価することはしなかった。同様に、ベンゾジアゼピンの評価は、最も乱用されているテマゼパムの使用に偏っていた可能性がある。我々の、或いは別の評価システムにおいても、公式に使用される場合はベンゾジアゼピン系の薬物は個々に評価し、他の薬物についてもその使用形態を考慮することがより適切であると思われる。
独立したスコアが少数であることを鑑みて、九つのパラメータ間の相関は推定しなかった。冗長性が存在する可能性が非常に高い――すなわち、九つのパラメータの値が、九つの独立した測定値を表していないということである。
同様に、パラメータの主成分分析も行わなかった。一つは不十分なデータしか存在しないことが理由であり、もう一つは、さらなる調査によって評価システム全体の妥当性が検証されるまでは、パラメータの数を減らすことは適当ではないと考えたからである。
我々の分析では各パラメータに同等の重みが与えられ、個々のスコアは単純に平均された。このような手順においては突出した急性毒性を持つ薬物の有害性を適切に評価できない可能性がある。たとえば、MPTP(1-メチル-4-フェニル-1,2,3,6-テトラヒドロピリジン)を含むデザイナーズドラッグは、単回投与で大脳基底核の黒質を著しく損傷し、重度のパーキンソン病を引き起こす。
実際、この単純なスコア算出方法では、一つの側面だけが著しい有害性を持つ薬物を適切に評価できない可能性がある。タバコを例に挙げると、30歳以上での喫煙は平均余命を最大で10年縮めることが示されている。喫煙は薬物関連の死亡の最も一般的な原因であり、医療サービスに大きな負担を与えている。しかし、タバコの短期的な有害性と社会的な影響はこれに比して大きなものではない。
もちろん、特定のリスクを強調するために、その重要度に応じてスコアの重み付けを変更することもできる。多基準意思決定分析など他の分析方法を使うと、異なるパラメータ間の順位の違いを説明することができるようになる。これらの解釈についての留保、及びパラメータの重みづけについての考慮の必要性にも関わらず、各スコアラー間でパラメータの値が概ね一貫していたことは特筆すべきである。
我々の調査結果は、薬物乱用法の分類が名目上は使用者と社会に対する危険性から決定されているという事実に疑問を投げかける。特に、幻覚剤の評価についてその食い違いは顕著なものとなっている。また、我々の調査結果は、アルコールとタバコが薬物乱用法から除外されていることは科学的観点から恣意的であることも強調している。
我々は、社会的に許容されている薬物と違法な薬物の間に明確な区別を見出すことはできなかった。この二つの最も一般的に使用されている合法的な薬物が、我々の評価では上位半分に位置しているという事実は、違法薬物についての公開討論でも考慮されるべき重要な情報である。先入観や仮定ではなく正式な評価に基づいた議論は、社会が薬物の相対的な危険性についてより合理的な議論を行う上での助けとなる。
我々は、専門家の評価による科学的根拠に基づいた分類システムが推奨されるべきであると考える。我々のアプローチは、薬物の危険性について包括的かつ透明性の高い評価システムを提供している。また、このアプローチはこれまでの研究の蓄積の上に構築されているが、デルファイ法を通じて幅広い分野の専門家による知見を利用することで、より多くの薬物の様々な危険性を考慮することができている。
このシステムは厳格かつ透明であり、薬物の有害性について正式かつ定量的な評価を含んでいる。また、研究の進展によって得られた結果を再適用して評価を更新することも容易である。MacDonaldらも薬物の有害性評価システムを考案しており、彼らのシステムは我々のスキームを補完するものとなっているが、まだ特定の薬物に適用されたことは無い。
その他の組織(たとえば、欧州薬物・薬物依存監視センター、オランダ政府のCAM委員会)は現在、それぞれのリスク評価システムを開発中であり、そのいくつかは数値ベースのものである。他にもデルファイ法を利用しているシステムはあるが、我々ほど幅広い薬物について、包括的なリスクパラメータを使っているものは無い。我々のシステムは、薬物乱用諮問委員会や欧州医薬品庁などの規制当局が、薬物の分類についてエビデンスベーストな決定を行うのを助けることができると考える。
全国学力テストの事前対策はなぜ許されないのか?
先日、全国学力・学習状況調査(以下単に「全国学力テスト」と呼ぶ)において、石川県で「行き過ぎた事前対策」が行われていたことがNHKで報じられた。これに対するブコメの反応は二分されており、少なくない人がこの事前対策を肯定的に捉えたようである。以下にその一例を示す。
全国学力テスト 行き過ぎた事前対策 トップクラス石川県で何が | NHK私は「別に構わない」派。学校より学習塾の授業の方がよいと小学生の時からずっと思っている。多くの場合、学科はまず「苦手でなくなる」ことが「好き」への道だ、とも確信しているし。テストで点を取る訓練を支持。
2022/10/14 12:47
全国学力テスト 行き過ぎた事前対策 トップクラス石川県で何が | NHKこれ中等教育の学生が学習をするモチベーションをテストによって確保されているという当たり前の話では?これではだめだという人は自分の学生時代を振り返ってみたら。
2022/10/15 08:16
全国学力テスト 行き過ぎた事前対策 トップクラス石川県で何が | NHK過去問を解くのは、むしろ学力を上げるための鉄則だと思うが。過去問を解くと目的意識がハッキリする。その後の学習の集中力が上がる。自分に何が足らないかが明確になる。
2022/10/14 18:18
結論から先に言えば、こうした素朴な学習論は大規模学力調査と著しく相性が悪い。個人に対するフィードバックを大きくすることと、正確な集団統計量を計算することは基本的に両立せず(信頼性の問題)、また、学力の経年比較も不可能になるからである(比較可能性の問題)。加えて、「テストをすれば学力が上がる」という素朴な言明は、往々にして「何を測定しているのか」という問題を覆い隠す(妥当性の問題)。
もちろん、現行の制度設計において、各自治体が最善を尽くすことが否定されるわけではない。制度が糞であることに彼らの責任は無いからである。問題は、彼らの努力を肯定する論理が、正に糞みたいな現行制度が肯定される論理となっている点である。この点、以下順を追って詳しく説明していこう。
信頼性の問題
"PISA Data Analysis Manual"では、教育評価(Education assessments)には大きく分けて二つの目的があるとされている。一つは、個々人のパフォーマンスを測定することであり、この場合は各個人に関連する測定誤差を最小化することが重要となる。もう一つは、各集団のパフォーマンスを測定することであり、この場合は個々人の測定誤差を縮小することよりも、調査の対象集団の誤差を最小化することが目指される。基本的に、国が実施する、或いは国際的な教育調査は後者に属する。
つまり、各個人を評価することと、各集団を評価することはトレードオフの関係にある。その原因の一つは、このマニュアルでも説明されている通り、集団の統計量を計算する場合、個々人の単純な平均を用いるよりも、個々人の得点を何らかの分布を持つ連続変数として捉えたほうが正確な計算が可能になるからである。
ただし、この場合は個々人の得点自体は記録されているので、(測定誤差が配慮されていないとしても)その結果を個々人のパフォーマンスとして利用すること自体は可能である*1。各個人と各集団がトレードオフの関係となる、より実際的な原因は、前者を優先する場合、予備調査の実施が困難になるという点にある。
この点を説明する前に、まずは、テストを個々人の学習に利用する場合、必然的に全数調査が要請されるということを確認しておかなければならない。第一に、テストが個々人の学力に影響を及ぼすならば、一部の生徒しか利用できないのは公平性の観点から問題がある(フィードバックの問題)。第二に、抽出調査の場合、各学校の規模や地域を考慮しても対象母集団の1%も必要ではないため、テストの成績向上を目的として指導するインセンティブに欠ける(事前対策の問題)。
したがって、冒頭に引用した学習論が正しいとしても、その場合は全数調査が要件となるのである。実際に、平成22年の「全国的な学力調査の在り方等の検討に関する専門家会議」では次のような意見が出されている。
○調査の視点なら抽出調査がよいが、指導の視点なら悉皆調査がよいというコンフリクトがあるが、後者は自治体に委ね、必要があれば国が支援をする形がよいと思う。
○抽出調査では大きな政策は変えられるが、悉皆調査による支援をしないと、個々の先生は関心を持たない。
○抽出に変わり、調査に関係ない学校は、雰囲気がだれている。学力向上が盛り上がらなくなっているという厳しい現状を考えると、4年に1回は悉皆にして、しかも教科を増やすべき。
○教育学的には悉皆が望ましいと考えている。全国および県別の状況把握では抽出調査でもよいが、悉皆調査では、個々の子どもの症状が把握できる。全体としての傾向ではなく、個人レベルで把握できる。それにより、義務感、使命感を醸成することが極めて重要である。教材研究も切実感をもって指導改善することが必要。
会議では抽出調査の方が望ましいという意見も少なくなかったが、その後に実施された全国学力テストは結局全数調査となった。全数調査の場合、各テスト項目の性質を把握するための予備調査は殆ど不可能となる。皮肉なことに、個々人のテスト成績の向上に対するインセンティブが高ければ高いほど、問題が漏洩する可能性が高まり、したがって予備調査の実施が困難になる。
実際に、全国学力テストではこのような予備調査は行われていない。2006年に実施された予備調査では本調査とは全く異なる問題が出題されており、2018年に実施された英語予備調査に至っては中学校3年の全生徒がその対象となっている(当然本調査では異なるテスト項目が用いられた)。
結果として、全国学力テストの信頼性は低い。不適切なテスト項目は(発見できるとしても)本調査によって発見するしかなく、しかもその知見は次の調査に引き継がれることもないからである。これが「学力テストを指導に生かす」ことの必然的帰結である。
比較可能性の問題
テストの結果を経年的に比較することは、殆どの大規模学力調査の主要な目的の一つだが、全国学力テストではこの目的を達成することができない。複数の異なるテスト結果を同一の尺度で評価するには、古典的テスト理論に基づいたテストならば各年度で同一のテストが、項目反応理論に基づいたテストならば各年度で共通するテスト項目が必要となるが、全国学力テストは異なる年度で異なる問題しか出題されないからである。
ここで古典的テスト理論と項目反応理論について簡単に説明しておこう*2。古典的テスト理論によって運用されているテストを一言で言えば、われわれが日常的に受けているテストそのものである。つまり、全ての受験者が同一の問題を一斉に解き、その結果として得られたテスト得点から平均値や偏差値、識別力といったものが計算される。
また、それらの統計量から、テストの性質や受験者の能力、テスト項目の特性などが分析される。多くの人にとってはお馴染みのテスト形式であり、教室で行われる小テストから高校・大学の入学試験まで、日本においては基本的に古典的テスト理論によってテストが運用されている。
しかし、古典的テスト理論によるテスト得点、或いはテスト項目に対する意味付けには理論的な限界が存在する。それは受験者の性質とテストの性質が分離できないことだ。素点や偏差値、或いは通過率や識別力といった古典的テスト理論による分析は、受験者集団の特性分布と項目の特性の双方に依存している。
これを学力の比較という観点から考えるならば、二つの集団に異なるテストを与えた場合、テスト得点の変化が受験者集団の変化に起因しているのか、テスト項目の変化に起因しているのかが原理的に区別できないということだ。
したがって、古典的テスト理論において得点の意味付けが可能となるのは、同一の受験者集団が異なるテストを解いた場合、異なる受験者集団が同一のテストを解いた場合、同一の受験者が同一のテストを解いた場合に限られてしまうのである。
これが、通常のテストにおいて経年比較が難しくなってしまう大きな理由である。異なる年度で異なる受験者が解いたテストの結果を比較可能なものにするには、テストを同一の問題にしなければならない。そのためにはテスト問題を秘匿する必要がある。しかし、テスト問題を完全に秘匿するのは現実的には難しい。
第一に、受験者は当然にそのテスト項目を知っているのだから、彼らの口をふさぐ何らかの手段を用意しなければならない。少数の集団であれば口頭での注意で足りるかもしれないが、大規模な学力調査ではまず不可能である。
第二に、一部の問題が漏えいしても、出題者側にどの問題が流出したか知られていなければ対策をとることも難しい。また、漏えいした問題を特定してテストから除外しても、それを繰り返せばテストの項目プールは早々に尽きてしまう。
第三に、日本ではテスト(特に学生を対象とするテスト) は、学習のフィードバックのために利用されることが多い。たとえば、センター試験の問題は毎年新聞にも掲載され、受験生はその公開されたテストを利用して学習を進めている。いわゆる「過去問」の利用である。そのため、テスト項目を秘匿することは教育目的から反発されることもある。
他方、項目反応理論によってテストを運用する場合、各年度のテスト結果を比較するには、テスト間で共通する問題が含まれていればよい。これは単にテスト項目の秘匿が容易になるというだけでなく、測定対象である能力の幅広い領域を調査することを可能にする。たとえば、以下に示したのはPISA調査におけるブックレットデザインの一例である。
PISA2003では、全ての領域を合わせて167問が出題されているが、それらの問題は分野ごとにいくつかのクラスターにまとめられている。上の表のM,S,R,PS はそれぞれ、数学的リテラシー(Mathmatics literacy)、科学的リテラシー(Science literacy)、読解力(Reading literacy)、問題解決能力(Ploblem Solving) の四つの分野を意味している。
それぞれのブックレットには他のブックレットと共通する問題が含まれており、各受験者はこの13冊のブックレットの内、いずれか1冊のみを選択し受験することになる。こうすることで、生徒・学校側の負担を少なくしたうえで、より多くの項目を実施することが可能になるのである。
ただし、この実施形態からわかるように、重複テスト分冊法を用いたテストは集団の能力を推定することに重点を置いている。個々の受験者はテスト全体の半分も解いていないか、場合によっては全く解いていない。これは「テストの結果を指導に生かす」目的からすれば、公平性に欠けるように見えるのか、全国学力テストにおいては項目反応理論も重複テスト分冊法も導入される気配はない(議論はある)。
妥当性の問題
最後に妥当性の問題を取り上げる。が、この点に関して全国学力テストは論外の一言で済ませても良いかもしれない。何故ならば、全国学力テストの調査報告書をどれだけ見回しても測定しようとする学力の定義がなされていないからである。
本来、学力の定義というものは単にテストが測定しようとしている能力を意味するだけでなく、学力という曖昧模糊とした概念を現実に測定することを可能たらしめている、テストの根幹である。学力を定義せずに学力調査を実施することは不可能であり、とりもなおさず、学力の定義を抜きにして学力調査の結果を語ることもできない。
学力は人の身長や体重などと違い、目に見えるものであったり直接測定することができるものではない。こうした「確かに存在していると思われるが、直接的に触れることができないもの」を構成概念と呼ぶ。学力の存在は多くの人が肯定するだろうが、それは目に見える形で実体を伴うものではない。
しかし、構成概念がもたらすと思われる実体的な行動を測定し、数値化することで構成概念を間接的に測定することはできる。たとえば、学力というものは目に見えず、何らかの実体に還元することは(現時点では) 難しいが、学力テストの「点数の違い」の背景には、「学力」という潜在的な概念が存在することは多くの人に想定されているはずだ。この場合、現実のテスト得点が「学力」という構成概念を数値化したものとなる。
ただし、一概に学力といっても、その言葉が意味するところは一意ではない。たとえば、「国語の学力」といっても漢字の習熟度や文章読解能力、表現能力など様々な学力が考えられる。通常のテストでは、測定したい能力をこうしたいくつかの下位概念に分けて、その下位概念を測定する項目に対する得点から学力の分析が行われる。
たとえば、数学の学力を測定したい場合、それをいくつかの領域、「量」「空間と図形」「変化と関係」「不確実性」などに分け、それらを測定する問題項目の集合としてテストは作成される。そして、テストの結果は平均点や偏差値などによって代表されることになる。
しかし、構成概念を下位領域に分解しただけでは、学力の定義は十分ではない。学力には知識量であったり、応用能力といったように、異なる次元の学力が考えられるはずだ。或いは、問題が出題される文脈や状況に応じた学力というものも考えられるだろう。
こうした学力の様々な側面を考慮して、測定したい学力が定義される。逆に、単に「学力を測定します」としか言っていない学力調査は、まずまともなものではない。それはつまり、測定する構成概念についての妥当性を検討する作業を行っていないということを意味しているからだ。
たとえば、先述のPISAやTIMSSのような大規模学力調査では、下の図 のように学力の定義が、或いはその構造が示されている。
TIMSS2003では「数学能力」が測定されているが、「数学能力」はその内容によって「代数」「測定」「数」「幾何」「データ」というさらに小さな領域に分けられている。さらに、それらの内容領域、たとえば「数」という内容領域は、それに関連する領域として「自然数」「分数・小数」「整数」「比率・割合・百分率」といったさらなる下位領域に細分することができる。
したがって、これらの下位領域について問題を作成し、その結果から「数学能力」が数値化されることになるが、TIMSSではさらに、認知的領域として「事実と手順についての知識」「概念の利用」「ルーティン的問題解決」「推論」という4 つの能力も設定している*3。たとえば、「事実と手順についての知識」ならば、単純な四則計算ができるかどうか、数学記号の定義を覚えているかどうか、といったことが問われている。
また、PISA2003で測定されている「数学的リテラシー」は、TIMSSのそれよりも複合的なものとなっている。図では説明の便宜上、「内容領域」「プロセス」「状況」の順に矢印が伸びているが、実際にこの順番で学力が定義されているわけではない。
PISAにおける数学的リテラシーは、特定の内容領域、問題解決のプロセス、問題が出題される状況という三つの側面から学力を定義し、測定している。たとえば、「科学的な状況で出題される不確実性についての熟考」を測定するような問題が、実際のテスト項目として具体化されることになる。
長々とPISAやTIMSSにおける学力の定義を説明したが、全国学力テストにおいてはこのような定義は一切示されておらず、それに対する一般の反応も薄い。その原因の一端を担っているのは、われわれの「学力」という言葉に対する素朴な自明視だろう。
「学力テストをすれば学力が上がる」という素朴な言明はこの自明視に拍車をかける。勉強をすれば学力が上がるという因果関係は確かなように思えるからだ(実際に確かである)。それによって「学力」の内実は棚上げされ、莫大な予算と教員や生徒の労力を空費して全国学力テストは今年も元気に実施されるのである。
*1:PISAの場合はPVsを利用しているため個々人の実際の得点は不明である。
*2:より詳細な説明は次の記事を参照してほしい。https://hajk334.hatenablog.jp/entry/2022/02/21/094657
*3:作図の都合上、関連領域の下に認知的領域を置いているが、実際にはそれぞれの内容領域について、各認知的領域を測定する問題が出題される。そのため、各関連領域についてすべての認知的領域に対応した問題が出題されるわけではない。