覚えたはずの英単語が口から出てこない本当の理由|世界の語彙研究で分かった『使える単語』に変える 4 つの手順

単語帳は終わらせたのに、いざ話そうとすると一語も口から出てこないんです…

その悩みは Laufer の語彙研究で説明できる典型例で、覚えた語と話せる語は別物として測られているんですよ。

見れば意味は分かるのに口に来ない。覚えた気だけだったんでしょうか?

違います。記憶はあるのに検索路が細い状態で、Brown と McNeill の TOT 研究がまさに同じ現象を扱っているんです。

単語を増やせばいつか自然に話せるようになると信じていました…

その期待は Webb の追試で否定されました。受容語彙が増えても産出語彙は自動でついてこないと示されたんです。

では何から変えればいいんでしょう?単語帳ばかり繰り返してきたのに…

Karpicke の testing effect が出口です。読むより思い出す動作を増やすだけで保持率が一気に上がります。
「単語帳は何冊も終えた。リーディングでは見れば分かる。それなのに、会議で英語に切り替えた途端、頭の中に意味は浮かんでいるのに口から音が出ない」。この感覚は怠けや才能の問題ではなく、語彙の脳内処理の 構造的なズレ から来ています。Laufer らの語彙研究では、見て分かる語と自力で出せる語の到達差は平均 3 倍を超え、Karpicke らの認知心理学では、覚え直すより 思い出す回数 が長期保持を作ると示されました。本記事は「忘却」ではなく「アクセス」の問題として『出てこない』を読み解き、産出可能化までの 4 段階手順と週次の組み方をまとめます。
1. 「覚えたはずの単語が口から出てこない」の正体 — 受容語彙と産出語彙

受容と産出ってそんなに違うものなんですか?

Laufer の研究で 3 倍から 5 倍の差が示されました。見て分かる語と口から出る語はまったく別の状態なんです。
最初に押さえたいのは、語彙には 2 つの別の状態 があるということです。見たら意味が分かる状態を受容語彙、自力で口や手から出せる状態を産出語彙と呼びます。Laufer と Goldstein は computer adaptive test で 4 段階の語彙強度を測り、両者の到達差は平均で 3 倍から 5 倍 あると報告しました ([E01])。図書館の本でいえば『棚にある』のと『今すぐ持ち出せる』はまったく別の状態だ、というイメージです。
Webb の追試では、受容語彙が 6000 から 8000 語ある層でも、産出語彙はその 半分以下 で頭打ちになりました ([E02])。受容が増えれば産出が自動でついてくる、という素朴な仮定はデータで否定されています。貯金が 8000 円あっても、財布に入っているのは 3000 円分だけ、という比喩が近いです。
つまり「覚えたのに出てこない」と感じる多くの場面は、単語を覚え損ねたのではなく、産出側の通り道がまだ細い、という状態なのです。
ここで誤解されやすいのは『受容と産出は地続きで、いつかつながる』という見方です。Laufer らは強度を 4 段階 (受動的認識、能動的認識、受動的想起、能動的想起) に分けて測りましたが、能動的想起への到達率は他 3 段階より明らかに低く、しかも語ごとに到達がバラつくと示しました ([E01])。能動的想起=自力で文に組み込んで言える、という最終段階だけは別ルートの練習がいる、というのが大きな含意です。さらに Webb の研究では、学習者が出会う頻度が同じでも、書く・話す機会を経た語の方が産出側へ移行する確率が高いと観察されています ([E02])。受容側のトレーニングをいくら増やしても、産出側の電球が自動で点くわけではない、という前提から本記事は出発します。
2. tip-of-the-tongue 現象 — 形が出かかるのに口に届かない 3 つの理由

頭文字までは浮かぶのに音が出ない、よくあります…

それが tip-of-the-tongue です。Brown と McNeill の実験では中の参加者が頭文字を 57% の精度で当てたんです。
「あの単語、頭文字は T で、3 音節で…」と分かるのに音が出ない。この有名な症状を tip-of-the-tongue (= TOT、舌の先まで出かかっている感じ、という意味) と呼びます。Brown と McNeill の古典実験では、TOT 中の参加者は頭文字を 約 57%、音節数を 約 60% の精度で当てました ([E03])。記憶がないわけではなく、検索の経路が部分的に切れているのです。
Levelt の発話モデルは、人が話すまでに『意図 → lemma (= 意味と文法の情報、というイメージ) → lexeme (= 音の形、というイメージ) → 調音』の 3 層を通ると説明します ([E04])。L2 では lemma までは届くのに lexeme への配線が弱いため、意味は浮かぶのに音が出ない、という現象になります。頭の中に『言いたい意味のカード』はあるのに、その裏の発音が薄くて読めない感じ、と言い換えられます。
ここから出てこない理由を 3 つに整理できます。一つ、産出練習が不足し lexeme への配線が弱い。二つ、似た語の干渉で経路が混線する。三つ、緊張で作業記憶が圧迫され検索資源が削られる。いずれも『覚え直す』より『取り出す練習』で改善する、という点が次の章につながります。
この 3 つは経験的にもよく対応します。仕事で『あの会議の議題、あれ何だっけ』と言葉が浮かばない瞬間、覚え直しの問題ではないと感じるはずです。母語ですら起きるのですから、L2 ではなおさら頻発します。Brown と McNeill の実験的特徴で重要なのは、TOT が起きた後に語をやっと思い出した経験はその語の検索路を強化する、と示した点です ([E03])。出てこなかった、を放置せず『出てこなかった語をその場で 1 回口に出す』だけで、次回の取り出し時間が縮みます。これは Levelt のモデルでいえば、lexeme への配線を意図的に踏んで広げる行為に相当します ([E04])。
3. 記銘反復より検索練習 — testing effect が変える長期保持

読み返しよりテストの方が頭に残るんですか?

Karpicke の研究で 1 週間後の正答率が 35% から 80% まで変わったんです。思い出す動作そのものが効きます。
ここで効くのが testing effect (= 自分で思い出す行為そのものが記憶を太くする、という現象) です。Roediger と Karpicke は、同じ素材を再読し続けた群と、途中で自分に問うテストを挟んだ群を比べ、1 週間後の保持率 が再読群の約 40% に対しテスト群が 約 60% に達したと報告しました ([E05])。ノートを 10 回読むより、閉じて『何が書いてあった?』と一度問う方が頭に残るのです。
Karpicke と Roediger はさらに、スワヒリ語と英語の対を覚える実験で、学習段階から思い出すテストを 抜くと 1 週間後正答率が 35% まで落ち、テストを続けた群は 80% を維持したと示しました ([E06])。筋トレで『持ち上げる動作』そのものが筋肉を作るのと同じで、思い出す動作そのものが記憶を太くする、という構図です。
実装は単純です。覚えたい語を伏せて意味を言う、意味を見て語を言う、例文を見ずに口にする、を 1 セッションに必ず含める。再読中心の学習を 検索中心 に置き換える、これだけで産出側の配線が太くなり始めます。録音アプリで自分の発話を週ごとに残し、4 週で取り出し速度がどう変わるかを記録すると変化が見えてきます。
testing effect を語彙学習に応用する研究はこの 20 年で大きく蓄積し、文脈の異なる検索 (= 違う場面で 1 つの語を取り出す経験、というイメージ) を挟むほど転移の幅も広がることが示されています。Karpicke と Roediger の実験では、テストを継続した群と除外した群の差は 1 週間後だけでなく 1 ヶ月後でも維持され、再学習を増やすより検索の数を増やす方が結果として時間効率が良いと結論されました ([E06])。意外なのは、検索試行で答えを間違えても、その後に正答を提示すれば最終保持率が高くなる点です。失敗しないように準備してから検索するのではなく、未完成の状態でも検索を試みる方が成績は伸びます。完璧主義との相性が悪い、と言い換えてもいいでしょう。
4. どの単語を産出に上げるか — frequency と coverage の現実
時間が限られている以上、すべての語を産出に上げるのは不経済です。Nation は、新聞や小説の 98% カバーには 8000 から 9000 語族、日常会話 95% カバーには高頻度 3000 語族 で足りると整理しました ([E07])。全部の駅を覚えなくても主要 3000 駅を押さえれば移動の大半は回せる、というイメージです。
産出に上げる優先度は『使用頻度 × 自分の場面で出る確率』の積で決まります。BNC や COCA の頻度リスト上位 3000 を軸に、業務や趣味で出る固有領域語を 500 ほど足す、というのが現実的な配分です。Nation の教科書では、上位 1000 語族で書き言葉の 約 78%、上位 3000 語族で 約 89% をカバーできるとされています ([E08])。
『覚えた語の総数』ではなく『産出可能語の総数』をスコアにする、と発想を切り替えるとやることが整理されます。広く浅くより、狭く深く、を語彙の段階でも採用するという話です。
頻度リストには『話し言葉と書き言葉で順位が違う』という大事な特徴もあります。仕事メールで使う上位語と日常会話で使う上位語は重なる部分が多いものの、上位 1000 から離れるほど領域ごとの固有性が高まります。Nation が指摘するとおり、自分のドメインで本当に出る語かを 1 件ずつ判断する作業がそこから始まります ([E08])。汎用 3000 を産出側に固定したら、次は『今週話す可能性が 30% 以上ある語』だけを 50 件選び、そこから深く処理する。広く浅くから狭く深く、への切り替えは、頻度リストの読み方を変えるだけで実行できる、と言い換えられます。
5. 深い処理 — 意味と用例を一緒に固める

同じ語をどう覚えれば長く残りますか?

Craik の処理深度理論ですね。表層より意味で処理した語の再認率は 2 から 3 倍高いと実証されているんです。
同じ 5 分でも、表層的に音や形だけを覚えるか、意味と用例まで結びつけて覚えるかで保持は大きく変わります。Craik と Lockhart の levels of processing 枠組みは、意味処理を経た情報の再認率が表層処理の 2 から 3 倍 になると示しました ([E09])。ただ撮った写真より、何が映ってるか説明しながら撮った写真の方が後で見返したときに鮮明、というのと同じです。
Hulstijn と Laufer は involvement load 仮説で、Need (必要性) + Search (検索) + Evaluation (評価) の 3 要素が高いタスクほど語彙保持が高いと実証し、高条件は低条件と比べ 1 週間後の保持で 1.5 から 2.0 倍 になると示しました ([E10])。渡された道具より、自分で選んで使った道具の方が次も使えるようになる、という感覚です。
具体的には、新出語に出会ったとき「自分の今週の出来事で 1 文使う」「類義語との違いを一言で言う」「コロケーションを 2 つ書き出す」を最低 1 つやる。単語帳の例文を眺めるだけで終わらせない、これが深い処理の入口です。
involvement load の 3 要素のうち、独学者が落としがちなのは Evaluation (評価) です。Need (必要性) と Search (検索) は単語帳をめくる時点である程度満たされますが、その語が文脈で適切かを自分で判断する評価工程は、自分で書いたり話したりしないと発生しません。Hulstijn と Laufer は、Evaluation を含むタスクと含まないタスクで 1 ヶ月後の語彙保持に差が残ることを観察し、評価工程の有無が長期定着の分水嶺になると示しました ([E10])。意味調べで終わらず『この語、ここで使って自然?』と自分に問う 30 秒、これが学習時間の質を変えるのです。
6. アウトプットが産出語彙を作る — Swain の発見

アウトプットはまだ自信がなくて先送りしています…

その遅らせる選択が産出語彙の停滞を招きます。Swain の output hypothesis は試みる行為そのものを必要とする論です。
産出語彙を増やすには、最終的に 産出を試みる しかありません。Swain はカナダ仏語イマージョンの児童を長期観察し、十分なインプットを受けてもスピーキングとライティングが母語話者水準に届かない非対称が継続することを発見しました ([E11])。理解可能なインプットだけでは産出は育たない、という output hypothesis の原典です。料理動画を見るだけでは作れるようにならない、実際に作って失敗して直す経験が必要、というのと同じです。
Izumi はこの仮説を実験で確認し、産出タスク群の noticing (= 自分の言いたいことと言えることの差に気づく行為、というイメージ) スコアが入力強化群の 8.2 対 5.1 で有意に高いと報告しました ([E12])。答えを見る前に自分で解こうとした問題ほど解説が頭に入る、という感覚です。
ここで重要なのは、最初から流暢に話す必要はないという点です。短い独り言、1 文の SNS 投稿、3 分の音声メモ、いずれも『言いたいことと言えることの差に気づく』機会を作ります。差に気づいた語こそが、次のサイクルで産出語彙の側に登録されていきます。
output hypothesis をめぐる議論で誤解されやすいのは、Swain がインプットを軽視したわけではないという点です。インプットは前提として必須で、その上で『産出を試みる』工程を足すと初めて産出語彙が育つ、という順序関係を示しただけです ([E11])。Izumi の実験では、産出 → インプット強化 → 再産出、という循環を 1 サイクル回した群が一回完結の群より語の取り込みが多く、循環の回数が学習の総量を決めると示唆されました ([E12])。1 日 1 文の発話でも、その 1 文が次の日のインプット注視点を作り、注視されたインプットがまた次の産出を支える、という小さな循環を続けることが、地味ですが最も確実な投資です。
7. 産出可能化 4 段階手順と週次ルーチン

1 日 25 分でも本当に変わるんでしょうか?

Karpicke の検索練習と Swain のアウトプットを 4 週積めば、取り出し速度が体感で変わると報告されています。
ここまでをまとめると、産出可能化の手順は次の 4 段階になります。一つ、受容化 (見て意味が出る状態にする)。二つ、検索強化 (伏せて思い出す練習を毎セッション入れる)。三つ、組み立て (用例とコロケーションを 1 文に組む)。四つ、自動化 (口頭・筆記で繰り返し出す)。Karpicke の testing effect と Swain の output hypothesis を順序立てて積むだけで、語の到達状態が段ごとに変わります。
週次ルーチンの一例として、月水金は新出 20 語を段階 1 から 2 まで、火木は前週分を段階 3、土曜は段階 4 のスピーキング再生、日曜は録音と振り返り、という配分が機能します。1 セッション 25 分で十分です。通勤や家事の合間に、伏せて思い出すだけの 5 分を 2 回足すと、検索回数が週単位で大きく増えます。
伴走者がいれば加速します。週 1 回でも、覚えた語を含む 1 分話を相手に聞いてもらい、出てこなかった語を共有する、という運用にすると noticing の発生回数が増え、次週の優先度も自然に決まります。
4 段階を可視化する単純な道具として、覚えたい語を 4 列の表に並べ、月に 1 回どの段階まで来ているかをマーキングする運用が機能します。受容で止まっている語、検索練習中の語、組み立てまで来た語、口頭で自動化された語、を別の列に置けば、自分が今どの段階で詰まりがちかが見えます。門田が日本人の成人学習者で観察したように、段階 1 だけが膨らみ段階 4 が薄い、という偏りは典型的で、可視化はその偏りを修正する最初の一歩です ([E13])。表をエクセルやノートで作るのに 10 分、運用は週 5 分、これで配分の偏りが減ります。
8. やり直し学習者の 3 つの誤りと是正
最後に、30 代以降のやり直し層がはまりがちな 3 つの誤りを挙げます。
一つ目は 単語帳完成主義 です。1 冊を最初から最後まで覚え切ってから次に進む、という発想は、産出に上げる優先度を奪います。Nation の指摘どおり、まず高頻度 3000 を産出側に固定し、低頻度の星取りは後回しにする方が ROI が高いです ([E08])。
二つ目は 例文無視 です。意味と訳語だけで覚えて例文を読まないと、Craik と Lockhart の言う表層処理に留まり、再認率が 2 から 3 倍劣化します ([E09])。短くても 1 例文を声に出して読み、自分の生活に置き換えた 1 文を添える。これだけで保持は変わります。
三つ目は アウトプット先送り です。「もう少し覚えてから話す」と決め続けると、Swain の言う noticing が永遠に発生せず、産出語彙は増えません ([E11])。受験勉強で『読める』までは行けたけど書ける話せるまで届かなかった、という停滞は、まさにこの構図です ([E13])。覚える前に話し始めることが、覚えたあとに話せる状態への最短経路です。
補足として、これら 3 つを是正する第一歩は『今日覚えた 5 語を、今日 1 文ずつ口に出す』を 1 週間だけ続けることです。検索練習 (E05, E06) と深い処理 (E09) と involvement load (E10) と出力 (E11, E12) が、5 語 5 分で同時に動きます。ここまで来ると『覚えたのに出ない』は『覚えた語が出てくる』へと、静かに、しかし確実に置き換わります。
まとめ
「覚えたのに出てこない」の正体は忘却ではなく、産出側の配線がまだ細いという構造的な問題でした。受容語彙と産出語彙は別状態 (E01, E02)、tip-of-the-tongue は検索経路の不全 (E03, E04)、再読より検索練習が長期保持を作り (E05, E06)、高頻度 3000 から優先的に深く処理し (E07, E08, E09, E10)、最後はアウトプットを試みた語だけが産出語彙になる (E11, E12, E13)。4 段階手順と週次ルーチンを 4 週続ければ、口から出る語の数は静かに増え始めます。
よくある質問
Q1. 単語帳を全部覚えてからアウトプットすべきですか?
いいえ、覚える前に話し始めた方が早く話せます。Swain が示したように、産出を試みた経験そのものが noticing を生み、次に覚える語を選び直す力になります ([E11])。今日覚えた 5 語を今日 1 文に使う、で十分です。
Q2. 検索練習は具体的にどう組みますか?
意味を伏せて語を言う、語を伏せて意味を言う、例文を見ずに口にする、の 3 つを 1 セッションに必ず入れます。Karpicke の実験では、これだけで 1 週間後の正答率が 35% から 80% へ動きました ([E06])。
Q3. 何語くらい覚えれば話せますか?
日常会話 95% カバーには高頻度 3000 語族、ニュース理解には 6000 から 7000、小説 98% には 8000 から 9000 が目安です ([E07])。ただし産出に上げるのは受容の半分以下しか自動で進まないので ([E02])、3000 を狙うなら受容で 6000 程度を視野に入れる配分が現実的です。
参考文献
- Laufer, B. & Goldstein, Z. (2004). Testing vocabulary knowledge: Size, strength, and computer adaptiveness. Language Learning, 54(3), 399-436.
- Webb, S. (2008). Receptive and productive vocabulary sizes of L2 learners. Studies in Second Language Acquisition, 30(1), 79-95.
- Brown, R. & McNeill, D. (1966). The tip of the tongue phenomenon. Journal of Verbal Learning and Verbal Behavior, 5(4), 325-337.
- Levelt, W. J. M. (1989). Speaking: From intention to articulation. MIT Press.
- Roediger, H. L. & Karpicke, J. D. (2006). Test-enhanced learning: Taking memory tests improves long-term retention. Psychological Science, 17(3), 249-255.
- Karpicke, J. D. & Roediger, H. L. (2008). The critical importance of retrieval for learning. Science, 319(5865), 966-968.
- Nation, I. S. P. (2006). How large a vocabulary is needed for reading and listening? Canadian Modern Language Review, 63(1), 59-82.
- Nation, I. S. P. (2013). Learning vocabulary in another language (2nd ed.). Cambridge University Press.
- Craik, F. I. M. & Lockhart, R. S. (1972). Levels of processing: A framework for memory research. Journal of Verbal Learning and Verbal Behavior, 11(6), 671-684.
- Hulstijn, J. H. & Laufer, B. (2001). Some empirical evidence for the involvement load hypothesis in vocabulary acquisition. Language Learning, 51(3), 539-558.
- Swain, M. (1985). Communicative competence: Some roles of comprehensible output in its development. In S. Gass & C. Madden (Eds.), Input in second language acquisition. Newbury House.
- Izumi, S. (2002). Output, input enhancement, and the noticing hypothesis. Studies in Second Language Acquisition, 24(4), 541-577.
- 門田修平 (2014). シャドーイング・音読と英語習得の科学. コスモピア.
greencafe 編集部 — 公開された 13 件の語彙習得・認知心理学エビデンス (tier 1 学術論文/学術書 11 件、tier 2 教科書 2 件) を横断分析・再構成。
画像: いらすとや (https://www.irasutoya.com/) より

Comments