英文学を読むのに必要な語彙水準の考察
一般に、英文を「何とか読む」には 最低で出現語数の95%を知っている必要があり、
「楽に読む」には98%を認識できる必要がある、とされています。
そこで いくつかの作家の作品をProject Gutenbergからダウンロードして
先に作成したBNCツールを用いて、95%、98%捕捉するのに必要な
語彙水準を調べてみました。
|
作品群 |
95%捕捉語彙 |
98%捕捉語彙 |
対象作品 |
グラフ |
|
BNC本体 |
10千語 |
25千語 |
|
|
|
Holmes |
10千語 |
40千語 |
短編集すべて |
|
|
赤毛のアン |
16千語 |
60千語 |
登録分ほぼ全て |
|
|
Tarzan |
20千語 |
100千語超 |
登録分ほぼ全て |
|
|
Shakespeare |
100千語 |
不可能 |
全作品 |
|
|
|
|
|
|
|
BNC本体だけを見ていると平均で98%捕捉するには25千語も知っていればいいのですが、
現実の作品を読むには全く足りなくて、40〜60千語は必要なことがわかります。
(全く「アンチ・バベルの塔」さんのご指摘の通りです。)
特に児童文学である「赤毛のアン」が60千語必要なのにはショック!
シャーロックホームズが読みやすい、とはよく言われることですが、
これでもわかりますね。