こんにちは、がこないのクボタです。今回はプログラミングを使って、2021〜2022年度の京都大学英語問題の中で、鉄壁の収録単語がいくつ出てきたかを調べたいと思います。
自然言語処理を行なった検証の手順は、こちらの記事を参照してください。
-
-
自然言語処理とは?【問題カバー率の検証の流れを説明】
各大学の的中率はどのような基準で調べているのか、興味のある人は読んでください。
実際の結果【2021】
2021年度京都大学の英語の問題の中に、鉄壁の収録単語(今回は番号付き見出し語のみ使用)がいくつ出てきたか、その総数と的中率を発表したいと思います。
鉄壁の収録単語1981個(番号付き見出し語で単語のみカウント)中、的中させた単語は、、、
157個
的中率は157/1981なので
約7.9%
になります!
なお、的中率が高ければ高いほど、その単語帳が優秀とは言い切れません。例えば中学生用の単語帳なら"I"や"you"のような超基本単語も収録されていて、当然問題文と一致する確率は高くなります。後から的中させた全単語のリストを表示しますので、当てた中身で判断してください。
出てきた回数トップ10の単語【2021】
それではウェブブラウザ上に、回数順に並び替えてみます。今回はPythonのフレームワークであるDjangoを使用しました。トップ10の単語はこちら。
ナンバーワンはwill(意思)になります。ただし助動詞のwillも同じ綴りなので、それもカウントされていると考えてください。それ以外はhypothesisとnarrariveがここでは大事な単語です。これらの単語は何回も出てきているので、知らないと今回の長文はきついんじゃないでしょうか。
ちなみに出てきた回数を全てカウントして、重複込みの的中数はこちら。
的中単語の全リスト【2021】
それでは的中させた全ての単語を表記します。まあブラウザ上のものをコピー、ペーストしただけですが。一応著作権も気にして、単語帳の訳をそのまま載せることはやめておきます。
リスト表示はこちら
1. will
2. say
3. hypothesis
4. story
5. general
6. narrative
7. influence
8. deal
9. do
10. history
11. origin
12. mean
13. point
14. life
15. matter
16. particular
17. ground
18. grasp
19. offer
20. ability
21. epoch
22. triumph
23. research
24. theory
25. rule
26. knowledge
27. empathy
28. act
29. article
30. clash
31. novel
32. still
33. indeed
34. significance
35. common
36. character
37. evident
38. detail
39. subject
40. complex
41. spread
42. absorb
43. force
44. allow
45. prevent
46. cease
47. encourage
48. attempt
49. purpose
50. ideal
51. real
52. fantasy
53. struggle
54. former
55. previous
56. ancient
57. purchase
58. explore
59. exclude
60. apart
61. emerge
62. derive
63. survive
64. regard
65. due
66. term
67. state
68. bear
69. case
70. observe
71. exist
72. propose
73. doubt
74. result
75. lead
76. lie
77. comfort
78. oppose
79. accord
80. literary
81. biology
82. psychology
83. critical
84. opinion
85. poetry
86. pronounce
87. experiment
88. conclude
89. scholar
90. claim
91. debate
92. right
93. succeed
94. author
95. win
96. defeat
97. express
98. surpass
99. instinct
100. passion
101. trial
102. vast
103. major
104. reduce
105. reason
106. view
107. recognize
108. bright
109. background
110. inevitable
111. community
112. scorn
113. appreciate
114. test
115. adopt
116. decide
117. determine
118. situation
119. behave
120. attitude
121. republic
122. cultivate
123. culture
124. publish
125. cartoon
126. consume
127. evolve
128. phenomenon
129. dawn
130. keen
131. nurture
132. extent
133. ultimate
134. lack
135. trace
136. modify
137. false
138. serial
139. puzzle
140. illuminate
141. leave
142. meet
143. sound
144. order
145. practice
146. modern
147. hence
148. nevertheless
149. somewhat
150. otherwise
151. reportedly
152. thereby
153. articulate
154. contend
155. skeptical
156. ponder
157. immerse
単語帳との照合
これでやっと、下地処理を全て済ませた本文の単語の配列を用意することができました。この配列に対して、もともと用意していた単語帳の配列(全単語をあらかじめ手打ちで入れておきました)を照合させます。具体的にはプログラミングのfor文などの「繰り返し構文」を使い、本文の単語を一つずつ取り出します。
そこでif文などの条件文で「もしその単語が対象の単語帳の配列内の単語と一致すれば、それを新しい配列(最終結果)に入れていく、一致しなければ無視して次の単語を回す」という内容のコードを書けば完成です。
ちなみに一致する単語が複数回出てくる場合はその回数もカウントできるようにもしておきました。
実際の結果【2022】
2022年度京都大学の英語の問題の中に、鉄壁の収録単語(今回は番号付き見出し語のみ使用)がいくつ出てきたか、その総数と的中率を発表したいと思います。
鉄壁の収録単語1981個(番号付き見出し語で単語のみカウント)中、的中させた単語は、、、
103個
的中率は103/1981なので
約5.2%
になります!
出てきた回数トップ10の単語
それではウェブブラウザ上に、回数順に並び替えてみます。トップ10の単語はこちら。
ナンバーワンは"cotrol"(をコントロールする)になります。その他の単語を見ても情報系のテーマだと多くなりそうな単語ばかりですね。
ちなみに出てきた回数を全てカウントして、重複込みの的中数はこちら。
的中単語の全リスト【2022】
それでは的中させた全ての単語を表記します。まあブラウザ上のものをコピー、ペーストしただけですが。
リスト表示はこちら
1. control - 8回
2. knowledge - 8回
3. major - 5回
4. do - 4回
5. technology - 4回
6. search - 3回
7. term - 3回
8. company - 3回
9. exist - 3回
10. impact - 3回
11. society - 3回
12. internet - 3回
13. nature - 3回
14. stable - 2回
15. available - 2回
16. include - 2回
17. mean - 2回
18. require - 2回
19. exercise - 2回
20. combine - 2回
21. personal - 2回
22. scale - 2回
23. ratio - 2回
24. point - 2回
25. story - 2回
26. history - 2回
27. strategy - 2回
28. neglect - 1回
29. character - 1回
30. obvious - 1回
31. aspect - 1回
32. destroy - 1回
33. emit - 1回
34. free - 1回
35. provide - 1回
36. imagine - 1回
37. effort - 1回
38. gain - 1回
39. age - 1回
40. epoch - 1回
41. outcome - 1回
42. global - 1回
43. approach - 1回
44. apart - 1回
45. bear - 1回
46. observe - 1回
47. improve - 1回
48. risk - 1回
49. rise - 1回
50. text - 1回
51. right - 1回
52. transform - 1回
53. lose - 1回
54. devise - 1回
55. stare - 1回
56. amount - 1回
57. vast - 1回
58. huge - 1回
59. reduce - 1回
60. add - 1回
61. comprehend - 1回
62. consider - 1回
63. individual - 1回
64. value - 1回
65. event - 1回
66. act - 1回
67. reign - 1回
68. crop - 1回
69. mass - 1回
70. produce - 1回
71. create - 1回
72. manage - 1回
73. swear - 1回
74. evolve - 1回
75. preserve - 1回
76. develop - 1回
77. climate - 1回
78. temperature - 1回
79. fix - 1回
80. weight - 1回
81. starve - 1回
82. divert - 1回
83. creep - 1回
84. sheer - 1回
85. sophisticated - 1回
86. vulnerable - 1回
87. deliberate - 1回
88. prudent - 1回
89. label - 1回
90. image - 1回
91. novel - 1回
92. coin - 1回
93. change - 1回
94. still - 1回
95. life - 1回
96. service - 1回
97. dinosaur - 1回
98. mammal - 1回
99. say - 1回
100. index - 1回
101. manipulate - 1回
102. asteroid - 1回
103. advent - 1回
リンク
この単語帳で勉強している人は、これらの単語の訳がパッと出てきますか? 腕試しに使って、意味が出てこないものだけ調べておいてください。
このリストに載っていなくても、例えば品詞違いの派生語が試験に出ている場合もあるので、できれば単語帳のそういう部分まで極めましょう。
また他の単語帳でも同様の調査をしているので、下にリンクを貼っておきます。
-
-
【京都大学英語】ターゲット1900の的中単語全リスト【2021〜2022】【プログラミング】
京都大学2021〜2022年度の英語に、ターゲット1900収録単語は何個出てきたのか?
-
-
【京都大学英語】システム英単語の的中単語全リスト【2021〜2022】【プログラミング】
京都大学2021〜2022年度の英語に、システム英単語収録の単語は何個出てきたのか?
-
-
【京都大学英語】単語王2202の的中単語全リスト【2021〜2022】【プログラミング】
京都大学2021〜2022年度の英語に、単語王2202収録単語は何個出てきたのか?
-
-
【京都大学英語】LEAPの的中単語全リスト【2022】【プログラミング】
京都大学2022年度の英語に、LEAP収録単語は何個出てきたのか?
-
-
【京都大学英語】Stock4500の的中単語全リスト【2022】【プログラミング】
京都大学2022年度の英語に、Stock4500収録単語は何個出てきたのか?
-
-
【京都大学英語】逆転英単語2000の的中単語全リスト【2022】【プログラミング】
京都大学2022年度の英語に、逆転英単語2000収録単語は何個出てきたのか?
この調査シリーズは私のプログラミングのレベル、精度の関係で100パーセントこの数字と言い切れるものではありませんが、おおよその目安になるとは思います。万が一私のスペルミスなどがあった場合は数も修正しておきます。それではまた!