
「今日は暑い」という文章を理解するには、「今日」という単語の前に何が来たか(あるいは、この文の後に続く単語)の文脈を理解する必要があります。このように、順序や時系列が重要なデータを扱うために開発されたのが、**RNN(Recurrent Neural Network:再帰型ニューラルネットワーク)**です。
RNNは、過去の情報を「記憶」(再帰)して次の予測に活かすという画期的な仕組みで、自然言語処理や時系列予測の分野を約10年にわたって支配しました。しかし、基本RNNには**「勾配消失」という致命的な弱点があり、これを克服するためにLSTMやGRU**といった改良版が誕生しました。
- 自然言語処理(文章生成、機械翻訳、感情分析)
- 音声認識
- 株価・気温などの時系列予測
- 動画のフレーム間解析
- 音楽生成 など
1. RNNが普通のNNと決定的に違う点
| 普通のNN(MLP/CNN) | RNN |
|---|---|
| 入力→出力が独立 | 過去の情報を「記憶」して次の予測に使う |
| 入力長が固定 | 任意の長さのシーケンスに対応可能 |
| 順番を無視できる | 順番が命(順序が変わると意味が全く変わる) |
2. RNNの基本構造と仕組み
t=1時点 t=2時点 t=3時点
x₁ ──► h₁ ───► h₂ ───► h₃ ──► ...
│ │ │
└─────►┘ └►出力 y₃
同じ重み共有!
- hₜ = tanh(Wₕₕ × hₜ₋₁ + Wₓₕ × xₜ + b) ← これが「再帰」の正体
- 同じ重み(W)をすべての時刻で共有 → どんな長さの文章でも対応可能
3. でも基本RNNには致命的な弱点が2つあった…
| 問題 | 何が起きるか | 対策として生まれた改良版 |
|---|---|---|
| 勾配消失(Vanishing) | 長いシーケンスで過去の情報がどんどん消えてしまう | LSTM / GRU |
| 勾配爆発(Exploding) | 逆に勾配が爆発して学習が不安定に | 勾配クリッピング |
| 基本的に順方向しか見れない | 将来の情報(文の後ろの単語)を使えない → 翻訳などで致命的 | Bi-directional RNN / LSTM |
| 並列化がまったくできない | 時刻tの計算がt-1を待つ必要があり、GPUで遅い | Transformer(Attention)登場 |
4. 現在ほぼ100%使われている改良版2大巨頭
| モデル | 特徴・仕組み | 現在も使われている場面 |
|---|---|---|
| LSTM | 「ゲート」(忘却ゲート・入力ゲート・出力ゲート)で重要な情報を選択的に記憶・忘却 | 音声認識、昔の翻訳モデル、時系列予測 |
| GRU | LSTMを簡略化(ゲートが2つだけ)→ ほぼ同性能でパラメータ20%減、高速 | モバイル向け、リアルタイム処理 |
→ 2025年現在でも「純粋なRNN」はほぼ使われず、LSTMかGRUが標準
5. RNN系の代表アーキテクチャの歴史
| 年 | モデル・手法 | ポイント |
|---|---|---|
| 2014 | Seq2Seq(Encoder-Decoder) | 翻訳の革命!入力文を一度ベクトルに圧縮→出力文を生成 |
| 2015 | Attention仕組みの登場 | 「すべての過去を均等に見る」のではなく「重要な部分に集中」 |
| 2017 | Transformer(Attention is All You Need) | RNNを完全に排除!並列化可能で爆速 → 現在ほぼ全ての最先端モデルがこれ |
6. 2025年現在のリアルな立ち位置
| タスク | 今何が主流か |
|---|---|
| 機械翻訳・チャットGPT系 | Transformer(100%) |
| 音声認識 | TransformerまたはConformer(CNN+Transformer) |
| 株価・センサーデータ予測 | LSTM/GRUがまだ現役(短いシーケンスなら) |
| 音楽・動画生成 | TransformerまたはDiffusion系 |
結論:RNN自体はほぼ「過去の技術」になりましたが、
- LSTM/GRUの考え方(ゲート機構)は今でも研究で参照される
- シーケンシャルデータの基礎理解には必須!
簡単なイメージ図
入力単語: 今日 は 天気 が 良い ね
↓ ↓ ↓ ↓ ↓ ↓
RNN/LSTM → h₁ → h₂ → h₃ → h₄ → h₅ → h₆ ← ここに「文脈」が蓄積
↓
出力: そうだね!(次の単語予測)
RNNは「記憶を持つニューラルネットワーク」の最初の成功例であり、 Transformer登場までの10年間(2010〜2017年)を完全に支配したアーキテクチャです!
