GSLの初版(West/1953年)と改訂版(Baumann&Culligan/1995年)の違い

英語学習者のための基礎英単語のリストとして編纂された
GSL(General Service List)には、
主に二つのバージョンがあることで知られています。

一つは、Westが1920~30年代に多数の言語学者などにより行われた
GSLの研究の成果を1953年にまとめあげた初版。
もう一つは、その初版のGSLが持つ不備を改善するために、
BaumannとCulliganが1995年に発表した改訂版のGSLです。

この二つのバージョンの主な違いは以下の3点です。

それぞれについて詳しく説明していきます。

Sponsored Links

改訂版では「単語」の範囲の定義がより明確

どちらのバージョンも見出し語の単位はword family(派生語も含む)ですが、
オリジナル版では、どのような派生語を
同じword familyとみなすかという定義を明確にせず、
また適用の仕方も単語間で整合性が取れないものもありました。

このため、少し遠目の派生語も同じ見出し語の元に属することもあり、
ある見出し語を知っていたらその派生語が全ては分かる
というような関係にはなっていませんでした。
(例えばeffectの関連語にefficientが含まれていたりなど。)

それゆえに、どれだけの数のword family、
言いかえれば根っことなるような単語の意味を覚えたら、
GSLの内容を覚えたことになるのかが分かりにくく、
また見出し語を頻度順に並べる際にも
派生語が特別に多いものが過剰評価されるなど
非合理な部分も残っていました。

それを解決するために、
改訂版ではBauerとNationによる1995年の”Word Families”
という論文
に書かれた派生語のレベルの定義を元にして、
レベル4までの関連度の派生語を一つのword familyにまとめ、
それより遠い派生語は新たな独立した見出し語にして、
リストを作り直しました。

ちなみに、レベル2は同じ単語の活用形の変化のみ。
レベル3は、「-able, -er, -ish, -less -ly,
-ness -th, -y, non-, un-」などの接辞による派生語。
レベル4は、「-al, -ation, -ess, -ful, -ism, -ist,
-ity, -ize, -ment, -ous, in-」などの接辞による派生語。

これにより、見出し語の数は2000から2284に増えましたが、
覚えるべきword familyの数がより明確になり、
学習者にとっては目標が据えやすいものとなりました。

改訂版ではより新しいBrownコーパスを頻度の判断に使用

GSLの初版の作成の際に使われたコーパスは
1920-30年代に集められた文献や書籍などを基にしたものでした。

そのためGSL初版の収録単語には
shilling(=シリング。昔のイギリスの通貨単位の一つ)などの
時代遅れでほとんど使われなくなったような単語や
carriage(馬車)、cultivate(耕す)などのように
使われる頻度がだいぶ減って基礎単語とは
言えないようなものも含まれています。

この古いコーパスによる頻度によって
学習の優先順位が付けられたのでは、
学習者にとっては使いにくいリストとなってしまいますので、
より新しいコーパスでGSL収録単語の
学習優先度の順位付けをやり直す必要がありました。

GSLの改訂版では、この問題をBrownコーパスを使うことにより、
ある程度解消することができました。

ちなみにBrownコーパスとは、1961年にアメリカで刊行された
新聞・雑誌・宗教・趣味・文化・手紙・政府書類・科学・小説など
15のジャンルにわたる文献から、
それぞれを代表する約2000語のテキストを500個集めて、
合計100万語にのぼる初の電子コーパスです。

コーパスの収録語数はオリジナルの1/5程度になってしまい、
1961年という年代も、現在はもちろん1995年当時から見ても
新しいとは十分に言えないものではありますが、
オリジナルがベースにした文献の年代から比べれば、
大幅(30年以上)に新しくなっていますので、
この改訂に大きな意味があったということは間違いありません。

初版の書籍には単語の意味ごとの頻度の情報があった

これまで挙げた二つの違いは、改訂版が初版に施した改善点でしたが、
初版が改訂版より優れている部分もあります。
それが単語の意味・用法ごとの頻度の情報です。
この情報があれば、その単語の中のどの意味が主に使われているかが
手に取るように分かるようになります。

ただし、残念ながらこれは書籍版にのみ記載されている情報で、
しかもその書籍は既に絶版されています。

NGSLなどの新世代の単語リストにもこのようなデータは付属していないので、
今後の研究成果に期待したいところです。


以上が、二つのGSLのバージョンの主な3つの違いの解説でした。
それでは、また!

参考リンク


「GSL (General Service List) の概要と収録単語」に戻る

記事公開日: