英語の発音が通じない本当の理由|世界の研究が示す先に直す音の優先順位と 3 ヶ月の練習マップ

英語の会議で「もう一度」と返され続けるんです。毎日発音やってるのに…

気持ちはよく分かります。実は「通じない」は 1 つの症状ではなく、応用の言語学の研究では 3 つに分けて捉えるのが標準です。

3 つ、ですか?僕、ずっと「なまりが悪い」と思ってて…

多くの方がそうです。40 年の研究で、なまりと伝わり度は独立に動くと繰り返し観察されました。分ける発想が最初の一歩です。

ネイティブに近づく方向で頑張ってきたんですが、それも違いましたか?

2000 年代以降、発音研究の主流はネイティブ化を目標から外しました。到達しにくい頂上ではなく、8 合目の展望台を目指す設計に変わっています。

3 ヶ月で本当に変わりますか?途中で挫折するのが見えて…

順序を科学的に組めば大丈夫です。この記事では 12 本の研究を順に、1 ヶ月目・2-3 ヶ月目・4-6 ヶ月目でやることを地図にします。
結論: 英語の発音が通じない本当の原因は「なまり (accent = 音の色合いの違い)」ではなく、次の 3 点に集中している [E01][E06][E07]。
(1) 単語のどこを強く読むかの位置がずれている
(2) 母音の質 (=「イ」なのか「エ」に近いのかの見分け方) が日本語の 5 母音に吸い寄せられている
(3) 機能的負荷 (= 混同すると別の単語になる確率) の高い子音対 (子音のペア) だけ直っていない
ネイティブと同じ音を目指す必要はない [E02]。伝わる音は 3 ヶ月の的確な練習で科学的に作れる [E08][E09]。
この記事でわかること
- 「通じない」は 1 つの症状ではなく 3 層に分けて捉える必要があること [E01]
- ネイティブ化 (= 母語話者と同じ音になること) は非現実的でも、伝わる音は作れる根拠 [E02][E08]
- 先に直すと得が大きい音の見分け方 = 機能的負荷 (functional load) [E03][E04]
- 1 ヶ月目・2-3 ヶ月目・4-6 ヶ月目に何を練習すればよいかの具体的な地図 [E05][E11][E12]
1. 「通じない」は 1 つではない 3 層に分けると原因が見える

なまりを消せば通じる、って思ってたんですが違うんですか?

Munro & Derwing 1995 の研究で、なまり・手間・伝わり度は別々に測ると分かりました。料理の味・匂い・見た目が別軸なのと同じ発想です。
英語の発音が通じない、と一言で言っても、そこには 3 つの別々の症状が混ざっている。
Munro & Derwing 1995 (= 発音研究の分野で最も引用される原点の研究) は、英語を第二言語として話す人の音声を、3 つの物差しで別々に測ることを提案した [E01]。
- intelligibility (= 意味そのものが届いたかどうか)
- comprehensibility (= 聞き手が意味を取るのにどれだけ手間がかかったか)
- accentedness (= どれくらい母語話者と違う音に聞こえたか、いわゆるなまりの強さ)
この 3 つは中程度にしか相関しない。強いなまりでもすんなり伝わる話者もいれば、なまりは弱いのに聞き手が疲れる話者もいる、と実測で確認された [E01]。
料理でたとえると、味・匂い・見た目の 3 つが別々の評価軸なのと同じで、発音も別々に測ればどこを直せばよいかが見える。
仕事の会議で困るのは主に上の 2 つ、つまり届いたかと手間の 2 軸だ。なまりを消しても意味は変わらないし、なまりを残しても伝わる。目標を「なまりゼロ」にすると努力の向きがずれる。
Munro & Derwing の 40 年の観察でも、なまりの強さと伝わり度は独立に変わることが繰り返し確認された [E01]。「なまりを消せば通じる」は直感的だが、研究データはそれを支えていない。
ここまでのまとめ: 「通じない」を 3 層に分けると、直すべきは意味を届ける層と手間を減らす層で、なまりの層は狙わなくてよい。
2. ネイティブに近づけるのは非現実的 それでも通じる音は科学で作れる

じゃあ、ネイティブに近づける努力は無駄だったんですか…

無駄ではないですが目標として非現実的です。Levis 2005 は「伝わる」を目標に据え直す原理を整理しました。8 合目の展望台のイメージです。
発音指導の理論には 2 つの原理がある、と Levis 2005 (= 発音の指導原理を整理した論文) は指摘した [E02]。
- nativeness principle (= 母語話者と同じ音を目標にする原理)
- intelligibility principle (= 伝わることを目標にする原理)
1990 年代までは前者が主流だった。だが成人が母語話者レベルの発音に到達する確率は、大規模な観察で極めて低いと確定した。目標を頂上に置くと、ほぼ全員が到達できない。
一方、intelligibility は指導次第で改善する。Thomson & Derwing 2015 (= 25 年間の発音指導効果の総まとめ) は 75 本の研究をまとめ、8-12 週の的確な指導で伝わり度が有意に上がると結論した [E08]。Saito 2012 (= explicit な発音指導の効き方の集約研究) も、成人の音の作り方の理解を伴う練習の効果量 (= 効き方の大きさを示す数字) が中〜大 (d=0.5-0.8、= 100 人中 70 人前後にはっきり効く強さ、というイメージ) であると集約した [E09]。
たとえるなら、富士山の頂上を目指す (ネイティブ化) のは登れる人がごく一部、8 合目の展望台 (intelligibility) まで登るなら整備された道がある、という状況に近い。
だから目指すゴールは「なまりゼロ」ではなく「伝わる音」に置き換える。
ここまでのまとめ: 2000 年代以降の研究の合意はネイティブ化を目標から外し、伝わる音を目標に据えること。ここが変わると練習の中身も変わる。
3. 先に直すと得が大きい音の見分け方 機能的負荷を知る

えっ、L と R 直せば通じる、って思ってた僕、間違ってました?

Munro & Derwing 2006 の音の重さの研究で、L と R より優先の高い音があると示されました。商品の取り違え確率で例えると分かりやすいです。
英語の音素 (= 意味を区別する音の最小単位) のペア、たとえば L と R、TH と S、短い i と長い i、はどれも「直すべき音」に見える。だが、時間は有限だ。優先順位を科学的に決めたい。
Munro & Derwing 2006 (= 音の重さの考え方を発音指導に持ち込んだ研究) は、functional load (= 機能的な負荷、その音のペアを取り違えると意味が変わる単語の量) という考え方を持ち込んだ [E03]。ここでは以下「音の重さ」と言い換える。
- 重い音のペア: 混同すると多くの単語で意味が変わる。優先度高。
- 軽い音のペア: 混同しても、別の単語になることが少ない。優先度低。
たとえるなら、スーパーの商品棚で「取り違えると別の商品を買ってしまう確率が高い商品札」から先に直して、値札の似た商品は後回しにするのと同じ考え方だ。
具体例で見ると、次のようになる。
- 重い側: 短い i と長い i の対、/l/ と /n/ の対、/p/ と /b/ の対
- 中間: L と R の対、/v/ と /b/ の対
- 軽い側: TH と S の対、TH と F の対、暗い L と明るい L の違い
驚かれることが多いが、TH は音の重さが軽い [E03]。TH を S や F に置き換えても、実際に意味が変わる単語は少ない。だから TH の完璧化に何ヶ月もかけるのは費用と効果の比が悪い。
Jenkins 2000 (= 英語を共通語として使う場面で必要な音の芯を絞り込んだ研究) の Lingua Franca Core (= 共通語のコアの音のセット) もこの結論と重なる [E04]。国際会議で使われる英語の分析から、TH は伝わりにくさの原因に入らないと確認された。代わりにコアに入ったのは、大部分の子音・子音連結 (= 子音が 2 つ以上並ぶ形)・母音の長さの区別・単語アクセントの位置の 4 つだった。
ここまでのまとめ: 音のペアには重い側と軽い側がある。重い音を先に直せば少ない時間で伝わり度が上がる。TH は意外にも軽い側。
4. 母音の質と単語アクセントの位置が実は最重要

子音より母音とアクセントが最重要って、正直ピンと来なくて…

Zielinski 2008 と Field 2005 で、アクセントがずれると単語認識率が 30-50% 落ちました。本の背表紙が逆さまな状態と同じです。
多くの学習者は子音のペア (L と R、TH と S) に時間をかけるが、研究は逆の順序を勧める。
Zielinski 2008 (= 聞き手側から見て何が意味の崩壊を起こすかを調べた研究) は、聞き手が意味を取り損ねる主な原因を順に並べた [E06]。
- 単語アクセントの位置がずれる (例: PHOtograph が phoTOgraph になる)
- 音節構造の崩れ (例: 語末に余計な母音が挿入され book が buk-u に化ける)
- 母音の質がずれる (例: /iː/ を /ɪ/ に混ぜる)
- 個別の子音の誤り (L と R など)
つまり、L と R は 4 番目である。聞き手は単語を認識するとき、まずアクセントの強い音節を手がかりにする。ここがずれると、単語そのものが辞書から探し出せない。
Field 2005 (= 単語アクセント位置と単語の聞き取りやすさを実験で調べた研究) も同じ方向の結果を報告した [E07]。アクセント位置を意図的にずらすと、聞き手の単語の認識率が約 30-50% 下がる (= 100 語中 30-50 語が別の単語に聞こえてしまう衝撃度)。母音の質の逸脱も同程度に効くのに対し、暗い L と明るい L のような子音の細部の違いは 10% 未満の影響しかなかった。
たとえるなら、本を探すとき最初に見るのは背表紙の太字のタイトルの位置だ。そこがひっくり返っていると、その本は棚から見つからない。単語アクセントも同じ役割を持つ。
Jenkins 2000 の Lingua Franca Core もこの並びとほぼ一致する [E04]。
だから、練習の順序は「母音とアクセント → 重い子音対 → リズムと連結」の順に組む方が科学的に理にかなう。
ここまでのまとめ: 意味の崩壊を起こすのはアクセント位置と母音の質が最大、子音の完璧化は 3-4 番目でよい。順序を逆にしていた学習者は多い。
5. 1 ヶ月目のロードマップ 母音とアクセントの棚卸し

200 語も覚えるんですか?正直、続く自信がなくて…

業務に絞れば大丈夫です。Derwing & Munro 2005 の指針でも、業務の高頻度語のアクセント位置は費用と効果の比が最も高い、と整理されました。
ここから 3 ヶ月の練習の地図を、研究に沿った順序で示す。
1 ヶ月目のゴール: 母音と単語アクセントの誤りを 80% 程度に減らすこと。
- 母音の対比: 日本語話者が混同しやすい 5 つの母音対を最小対 (= 1 音だけ違う単語のペア、例 sheep と ship) の練習で確認する。/iː/ と /ɪ/、/æ/ と /ʌ/、/ɑː/ と /ɔː/、/uː/ と /ʊ/、あいまい母音 /ə/ とそれ以外の 5 対を、各対 20 語ずつ発音・聞き取りする。
- 単語アクセントの位置確認: 高い頻度で会議に出る 200 語の多音節語 (2 音節以上の語) をリスト化する。各語について、アクセント位置に大文字表記の印を付けた自作の単語カードを作る (例: comMIT、PHOtograph)。1 日 20 語ずつ音読する。
- 到達判断の基準: 自分の音読を録音し、1 週間後に聞き直す。アクセント位置が意図した音節に来ている語が 8 割超えていれば合格。母音対の識別テストで 8 割正解ならこちらも合格。
Zielinski 2008 と Field 2005 が示した「聞き手はアクセントの強い音節を手がかりに単語を探す」原則を、練習の中心に据えることになる [E06][E07]。
多音節語の 200 語は、業種と職種に応じて自分で並び替える。会議で頻出する動詞と名詞から選ぶと、練習と実務のつながりが濃くなる。営業なら negotiate、proposal、discount、customer、availability。技術者なら architecture、authentication、deployment、latency、configuration。この 200 語のアクセント位置を体に入れるだけで、会議の受け答えの受け取りやすさが目に見えて上がる、と Derwing & Munro 2005 の指針は整理している [E05]。
たとえるなら、家を建てる前にまず柱の位置を正確に立てるのに似ている。柱 (アクセント) がずれていると、その後に貼る壁紙 (子音) をどんなに丁寧に貼っても家が傾く。
ここまでのまとめ: 1 ヶ月目は柱を立てる時期。母音対 5 セットと単語アクセント 200 語で 8 割合格ラインを狙う。
6. 2-3 ヶ月目 重い子音対と語末の子音

8 週間もかかるんですか?もっと早く手応えが出ないと不安で…

Iverson 2005 の HVPT 実験で、8 週間で L R 識別が 65% から 85% に上がりました。姉妹の顔を毎日見て違いが浮かぶ感覚に近いです。
2-3 ヶ月目のゴール: 重い子音対と、日本語話者が語末で余分な音を作る癖を減らすこと。
- 重い子音対 4 対: /l/ と /r/、/v/ と /b/、/f/ と /h/、/s/ と /ʃ/ の 4 対を集中的に扱う。ここでは HVPT (= High Variability Phonetic Training、多様な話者の音声を使う識別練習、= 色々な店のラーメンを食べ比べて味を覚えるのに近い方法) を採用する。Iverson, Hazan & Bannister 2005 (= HVPT の効果を音響的に測った実験研究) では 8 週間の HVPT で日本語話者の L と R の識別の精度が 65% から 85% に改善した [E11]。
- 語末の子音の後の余計な母音を取る: book を buk-u と読んでしまう癖 (= 日本語の外来語表記の癖) を単音節の英単語 (cup、hat、book、cat 等) 100 語で潰す。録音して自分で聞き比べる。
- 注意点 SLM の落とし穴: Flege 1995 の Speech Learning Model (= 第二言語の音の学習しやすさは母語との似方で決まるという理論) は、母語音素と似すぎている音は逆に学習が難しいと予測した [E10]。L と R は日本語のラ行に似ているため、聞き分けが難しい典型。「似ているから簡単そう」と思って軽く扱うと落とし穴になる、と押さえておく。
- 到達判断の基準: 重い子音対 4 対の産出テストで 8 割正解、単音節語 100 語の音読で余計な母音の挿入が 1 割以下。
たとえるなら、姉妹の顔がそっくりだと 1 週間では見分けられないが、8 週間毎日会うと違いが浮かび上がる、これに近い学習の曲線だ。
HVPT の実施の形は柔軟でよい。無料の教材でも、複数の話者が並ぶ音声ファイルがあれば代用できる。1 日 15-20 分、L と R の入った単語 (rice と lice、collect と correct 等) を音源で聞き分ける課題を継続する。当てられなかった単語は翌日にもう一度混ぜて再挑戦する、と決めておけば習慣化しやすい [E11]。
Saito 2012 の集約でも、8-12 週の explicit な指導と練習で、成人の発音の産出の精度は中〜大の効果量で改善する、と数量的に示されている [E09]。ここで大切なのは「効果は出るが 8 週間より前には出にくい」の目安を持っておくことだ。1-2 週間で手応えが薄いのは正常であって、途中で投げ出さない自制も練習の一部だと言える。
ここまでのまとめ: 2-3 ヶ月目は重い子音対と語末の癖を潰す時期。8 週間の HVPT が中心。効果が出るのは 8 週目以降が典型。
7. 4-6 ヶ月目 リズムと連結で聞き手の負担を減らす
4-6 ヶ月目のゴール: 単音でなくフレーズ単位で伝わる音を作ること。
自然な英会話は辞書表記の音の並びとは大きく違う。Cauldwell 2013 (= 連結や弱化の教科書、= 楽譜通りの単音から離れてジャズの演奏に移る段階の教則本) は、単語は連結し (linking)、弱く化し (reduction)、消える (elision) と説明した [E12]。
- フレーズ単位のシャドーイング: 意味の塊 (chunk、= 単語 3-6 語のかたまり) を 1 単位にして、実際の英会話音源を影のように追いかけて発音する。1 日 15 分。
- 連結と弱化の練習: 「What do you」を「ワ・ドゥ・ユ」ではなく「ワッデュ」に、「going to」を「ガナ」に、と自然な連結を意識的に真似る。5 種類の連結パターン (子音+母音、同じ子音の連続、破裂音の脱落、あいまい母音化、否定形の縮約) を各 20 例で確認。
- 英文アクセントの配置: 文全体でどの単語を強く読むかの配置 (nuclear stress、= 文の中で最も重要な情報を担う単語の強調) を意識する。Derwing & Munro 2005 の evidence-based ガイドラインでは、文全体のアクセントの配置も単語アクセントと並んで優先度が高いと整理された [E05]。
- 到達判断の基準: 英語会議で「もう一度お願いします」と返される回数が体感で半減。
たとえるなら、単音でスケール練習を終えた後、フレーズでリズムを取ってバンドで合わせる段階に入るのに近い。ここで初めて「伝わる」の手応えが会議で出る。
ここまでのまとめ: 4-6 ヶ月目はフレーズと連結の時期。単音の完璧化に閉じずに実際の英会話の音の流れに乗れるようになる。
8. やってはいけない発音矯正 3 パターン
研究が示す「やらない方がよい」の 3 つを整理する。
罠 1 全ての音を等しく直そうとする
音の重さを無視して L と R も TH も /v/ も同じ熱量で直そうとすると、時間が足りない。Munro & Derwing 2006 は明確に優先度をつけろと勧めた [E03]。
たとえるなら、健康診断で全ての項目に同じ手間をかけるのではなく、命に関わる順から手当てする医者の考え方と同じだ。
罠 2 ネイティブと同じ音を最終目標にする
Levis 2005 が退けた nativeness principle は、成人にとって到達不可能なゴールを設定してしまう [E02]。「ネイティブに聞こえるまで話さない」と決めた学習者は、話し始めるタイミングを永遠に失う。目標は intelligibility (伝わる) に置き換える。
罠 3 単音の練習だけで会話に持ち込まない
Thomson & Derwing 2015 は、単発の音素矯正だけでは effect size が小さいと指摘した [E08]。単音の練習は必要条件だが十分条件ではない。フレーズ・会話の中で使う機会を並行して確保する必要がある。Derwing & Munro 2005 の evidence-based ガイドラインでも「制御された練習」と「コミュニケーション場面での使用」を組み合わせる統合型が推奨される [E05]。
たとえるなら、料理教室で切り方だけ完璧にしても、実際に一皿を作らない限り味は決まらないのに似ている。
ここまでのまとめ: 「全部直す・ネイティブを目指す・単音だけ練習」の 3 罠は、研究の合意に反するのでやめる。
FAQ
Q1. なまりは絶対に消せないんですか?
A. 消す必要がありません。Munro & Derwing 1995 は、なまりの強さと伝わり度は別の軸だと示した [E01]。強いなまりでも伝わる話者は多く、なまりを消しても伝わりやすさは大きく変わらないことが観察されている。
Q2. L と R が最重要だと聞いたのですが違うのですか?
A. 研究上は 3-4 番目です [E06][E07]。母音の質と単語アクセントの位置の方が意味の崩壊を強く引き起こす。L と R は音の重さで見ると中程度で、無視してよいわけではありませんが、母音とアクセントを先に直した方が費用と効果の比が高い。
Q3. TH の発音はやらなくていいのですか?
A. 優先度は低いです。Munro & Derwing 2006 と Jenkins 2000 は、TH を S や F に置き換えても意味が変わる単語は少ないと指摘した [E03][E04]。TH の完璧化に数ヶ月かけるより、母音と単語のアクセントに時間を使う方が伝わり度は上がります。
Q4. 何ヶ月くらいで手応えが出ますか?
A. 8-12 週で有意な改善が見えます。Thomson & Derwing 2015 の 75 研究の集約と Saito 2012 の 15 研究の集約が、explicit な指導と練習を組み合わせた 2-3 ヶ月で伝わり度が中〜大の効果量で改善すると報告している [E08][E09]。
Q5. 発音アプリだけで直りますか?
A. 単音の練習で終わるアプリは効果が薄い場合があります。Derwing & Munro 2005 は、制御された練習とコミュニケーション場面での使用の組み合わせを勧めた [E05]。アプリで音素の識別練習をした後、実際の会話や会議で使う機会を確保する必要があります。
まとめ
英語の発音が「通じない」の中には 3 つの別々の症状が混ざっている。仕事で困るのは主に intelligibility (意味が届いたか) と comprehensibility (聞き手の手間) で、accentedness (なまり) は関係ない [E01][E02]。
先に直すと得が大きいのは、母音の質と単語アクセントの位置と、重い子音対の 3 点である [E03][E04][E06][E07]。L と R や TH に何ヶ月もかけるより、この 3 点に集中する方が科学的に効率がよい。
3 ヶ月の練習の地図は、1 ヶ月目に柱 (母音とアクセント) を立て、2-3 ヶ月目に重い子音対と語末の癖を潰し、4-6 ヶ月目にフレーズと連結でリズムに乗ることだ。目標は「ネイティブに近づく」ではなく「伝わる音を作る」に置き換える [E02][E08]。
参考文献
- Munro, M. J., & Derwing, T. M. (1995). Foreign accent, comprehensibility, and intelligibility in the speech of second language learners. Language Learning, 45(1), 73-97.
- Levis, J. M. (2005). Changing contexts and shifting paradigms in pronunciation teaching. TESOL Quarterly, 39(3), 369-377.
- Munro, M. J., & Derwing, T. M. (2006). The functional load principle in ESL pronunciation instruction: An exploratory study. System, 34(4), 520-531.
- Jenkins, J. (2000). The phonology of English as an international language. Oxford University Press.
- Derwing, T. M., & Munro, M. J. (2005). Second language accent and pronunciation teaching: A research-based approach. TESOL Quarterly, 39(3), 379-397.
- Zielinski, B. W. (2008). The listener: No longer the silent partner in reduced intelligibility. System, 36(1), 69-84.
- Field, J. (2005). Intelligibility and the listener: The role of lexical stress. TESOL Quarterly, 39(3), 399-423.
- Thomson, R. I., & Derwing, T. M. (2015). The effectiveness of L2 pronunciation instruction: A narrative review. Applied Linguistics, 36(3), 326-344.
- Saito, K. (2012). Effects of instruction on L2 pronunciation development: A synthesis of 15 quasi-experimental intervention studies. TESOL Quarterly, 46(4), 842-854.
- Flege, J. E. (1995). Second language speech learning: Theory, findings, and problems. In W. Strange (Ed.), Speech Perception and Linguistic Experience (pp. 233-277). York Press.
- Iverson, P., Hazan, V., & Bannister, K. (2005). Phonetic training with acoustic cue manipulations. Journal of the Acoustical Society of America, 118(5), 3267-3278.
- Cauldwell, R. (2013). Phonology for listening: Teaching the stream of speech. Speech in Action.
最終更新日: 2026-07-03
著者: greencafe 編集部 — 公開された 12 件の応用の言語学と第二の言語の発音の指導の研究のエビデンス (tier 1 の査読の論文と学術書 10 件、tier 2 の教科書 2 件) を横断で分析・再構成した。
画像: いらすとや (https://www.irasutoya.com/) より

Comments