どーも!がこないのクボタです。
4回にわたって東京大学2021年度英語の全文の中から、今手元にある4冊の2次試験向け単語帳(ターゲット1900/システム英単語/単語王2202/鉄壁)の見出し語がいくつ出てきたかを、プログラミングを使用して割り出しました。
-
【東京大学英語】ターゲット1900の的中単語全リスト【2021〜2022】【プログラミング】
東京大学2021〜2022年度の英語に、ターゲット1900収録単語は何個出てきたのか?
-
【東京大学英語】システム英単語の的中単語全リスト【2021〜2022】【プログラミング】
東京大学2021〜2022年度の英語に、システム英単語収録の単語は何個出てきたのか?
-
【東京大学英語】単語王2202の的中単語全リスト【2021〜2022】【プログラミング】
東京大学2021〜2022年度の英語に、単語王2202収録単語は何個出てきたのか?
-
【東京大学英語】鉄壁の的中単語全リスト【2021〜2022】【プログラミング】
東京大学2021〜2022年度の英語に、鉄壁収録単語は何個出てきたのか?
検証してみて分かったこと
4つの記事を見ていただければ分かるのですが、
結構単語被ってるの多いじゃん
って思いますよね。
単語王や鉄壁のパーセントが高くなったのは、基本レベル(ターゲットなら1200〜1400、シス単ならベーシックに入るもの)の単語も多く含まれているため、そこで数字を伸ばすことになったんだと思います。それ以外の2次試験レベル、例えばcollapse(崩壊する)なんて、全ての単語帳で出てきましたよね。
つまり2次試験レベルに作られた単語帳なので、ある程度同じレベルの単語が被るのは当然なのです。だからよく私は生徒に、
「1冊これと決めたら、他の単語帳の誘惑に負けずに信じ抜け!」
と言っています。
はっきり言って、どの2次試験レベルの単語帳も、その派生語やイディオムまで完璧に覚えたら難関大学も十分戦えます。あとはその本のレイアウトや質感、単語の並び順がその人に合うものを選べばよいでしょう。
難単語は、どの単語帳が一番当てたのか
そうはいってもやはり、各単語帳のレベルは気になりますよね?
その単語帳が、簡単な単語で数を稼いでいるのか、もしくはマニアックな単語を載せていて、かつ的中させたのか。後者だったら、やっぱりその単語帳は評価されるべきです。
闇雲に難しい単語ばかりを追い求めるのでしたら、英検準1級や1級の単語帳を買えばいいだけですが、大学入試2次試験用というテーマのもとでその点を頑張っている単語帳をプログラミングで割り出してみましょう。
大まかな流れ
今回使用する言語はPython、自然言語処理ライブラリとしてSpacyになります。各単語帳の的中単語を割り出すところまでの説明は、それぞれの回で大雑把に触れているので省略、今回も実際のコードを詳しく解説すると長くなるので大まかな図で説明します。
はい、この図を見ていただければすぐ分かりますが、今回はプログラミングといっても配列同士の比較をするだけです。
鉄壁の独自単語(鉄壁だけが当てた単語)を割り出す例で説明しますね。
以前プログラミングで割り出した、鉄壁が的中させた全単語の配列をまず用意します。
真ん中がミソなんですが、その配列に対して、ターゲット1900、システム英単語、単語王2202の単語が収録されている配列を比較し、被らなかったものだけを新たな配列(最終結果)に入れていく、これだけです。つまりふるいにかけるイメージですね。
一点だけ注意点で、このままだと「簡単だからその単語帳にしか載っていなかった」単語も含まれてしまいます。例えば鉄壁に載っているwill(意思)という単語は、ターゲット1900やシステム英単語には載っていないのですが、実はより簡単なターゲット1200/1400やシステム英単語ベーシック版に載っている可能性もあります(確かめたわけではありません)。
これは単語王や鉄壁が、下位バージョンを持っていないために起こる現象で、簡単に言えばそのような基礎単語は今回ふるいにかけられて、残って欲しくないわけです。
ということでその解決方法として、ふるいの部分(図の真ん中)に、ターゲット1400/1200とシステム英単語のベーシック版の配列も用意し、これらと被っている単語も取り除く作業をしてあげます。これで本当の意味で難単語だけが残りやすくなるわけです。
それでは結果をどんどんリストで発表していきます。コピペで貼るだけなので訳は各自調べてください。
ターゲット1900のみが当てた単語リスト
2. swing
3. drill
4. neighborhood
5. gallery
6. infrastructure
7. artistic
8. file
9. stack
10. skull
11. highlight
12. crack
システム英単語のみが当てた単語リスト
単語王2202のみが当てた単語リスト
2. want
3. hand
4. fur
5. school
6. credible
7. undo
8. warfare
9. picture
10. study
11. park
鉄壁のみが当てた単語リスト
2. monologue
3. test
4. self
5. irregular
はい、このような結果になりました。"school"や"test"などの超基本の単語もやはりゼロにはできなかったので残ってしまいましたが、どの単語帳も、、、
大差ないでしょ?
ちなみに他の品詞なら載ってるパターンもあるので、純粋な独自単語はもう少し減ると思います。
収録単語であれこれ単語帳を迷うのは、時間の無駄というのが分かりますね(その他の要素は別ですよ)。
本当に難単語だけを増やしたいなら、これらのレベルを買い足すよりも英検1級や専門の単語帳(医学部用だとか)を追加する方が目的に合っています。
どの単語帳にも載っていなかった難単語
それでは最後におまけとして、問題の全文中から、今回使用したどの単語帳にも載っていなかった難単語をいくつか紹介します。
なお大学によっては注釈で訳が与えられているものもあるので、その点はご了承ください。
くどいようですが品詞違いなら載っている可能性もあるので、あくまでもプログラミングの配列比較の結果から割り出した単語だと思ってください。
2. domesticate (動)を家畜化する
3. grotesque (形)異様な、グロテスクな
4. rigorous (形)厳格な
5. Mediterranean (形)地中海の
6. wormhole (名)虫の食った穴
7. aspirin (名)アスピリン
8. disclosure (動)公開、暴露
9. rebellion (名)反乱
10. dialogical (形)対話の
11. Neanderthal (名)ネアンデルタール人
はい、こんな感じです。ここだけは辞書で意味を引いておきました。
今後も有名どころの大学の各年度で調査していきますが、この部分の単語だけを拾っていくだけでも単語力強化につながりますよ!
なお、他にも2次試験レベルの単語帳はいくつもありますが、キリがなくなるので、今回のような総合比較シリーズではこの4冊でやらせてください。
単発シリーズでは、単語帳が増え次第調査にかけていくつもりなのでよろしくお願いします。
最後にこの調査シリーズは私のプログラミングのレベル、精度の関係で100パーセントこの数字と言い切れるものではありませんが、おおよその目安になるとは思います。万が一私のスペルミスなどがあった場合は数も修正しておきます。それではまた!