英文学を読むのに必要な語彙水準の考察

 

一般に、英文を「何とか読む」には 最低で出現語数の95%を知っている必要があり、

「楽に読む」には98%を認識できる必要がある、とされています。

 

そこで いくつかの作家の作品をProject Gutenbergからダウンロードして

先に作成したBNCツールを用いて、95%、98%捕捉するのに必要な

語彙水準を調べてみました。

 

作品群

95%捕捉語彙

98%捕捉語彙

対象作品

グラフ

BNC本体

10千語

25千語

 

BNC_rank.png

Holmes

10千語

40千語

短編集すべて

holmes_series_rank.png

赤毛のアン

16千語

60千語

登録分ほぼ全て

anne_series_rank.png

Tarzan

20千語

100千語超

登録分ほぼ全て

tarzan_series_rank.png

Shakespeare

100千語

不可能

全作品

shakespeare_series_rank.png

 

 

 

 

 

 

BNC本体だけを見ていると平均で98%捕捉するには25千語も知っていればいいのですが、

現実の作品を読むには全く足りなくて、40〜60千語は必要なことがわかります。

(全く「アンチ・バベルの塔」さんのご指摘の通りです。)

 

特に児童文学である「赤毛のアン」が60千語必要なのにはショック!

シャーロックホームズが読みやすい、とはよく言われることですが、

これでもわかりますね。