RAG(Retrieval-Augmented Generation)ってなに?— はじめてでもスッと分かる超入門
目安時間9分
RAGと聞くと、難しく聞こえますが、簡単に言うと
「まず情報を探してから、その内容をもとにAIが答えを書く」
というやり方です。
目次
RAGをひとことで
- 質問が来る → 関連資料を探す → 見つけた内容をもとにAIが答える
- 「どこに書いてあったか」を示しやすいので根拠がハッキリ
- 社内マニュアル・FAQ・議事録など自分たちの資料を活用できる
RAGは「AIを学習し直す」わけではありません。あくまで検索して文脈を渡すという発想です。
なぜRAGがあるといいのか?
- AIは最新の社内事情を知らないことが多い → 手元の資料を参照できると安心
- 答えの根拠を求められる場面(お客さま対応・監査など)で出典を示せる
- 間違い(思い込み)をへらせる:資料ベースで答えるから
RAGはどう動くのか?(全体像)
- ① 準備:よく使う資料をきれいにして小分け
- ② 検索:質問に合いそうな小分け文書をパッと集める
- ③ 生成:集めた文をそえてAIが回答を書く(引用つき)
- ④ 確認:人がサッと見てOKにする/修正を戻す
RAGを作る4つの部品
1) 資料の用意(前処理)
- 長い文書は段落ごとに小分け(「チャンク」と呼ぶことがあります)
- タイトル・日付・部署などのタグをつけておくと後で便利
- PDFは改行や表が崩れやすいので、できればWordやテキスト化
2) 探しやすくする仕組み
- 似た意味の文を見つけやすくするための数値化(「埋め込み」)
- 検索用の箱に入れておき、上位の候補をサッと取り出せるようにする
- 必要なら通常のキーワード検索も併用(ハイブリッド)
3) 取り出し役(リトリーバ)
- 質問に合いそうな小分け文書を上から数件まとめて引っ張る
- 部署・機密区分・日付などで絞り込みできると安全
- 並び替えの工夫で的外れを減らす
4) 答えを書く役(生成)
- 見つかった文を材料にして、AIが分かりやすく回答
- 「出典リンクを必ず出す」「分からない時は“不明”と答える」などルールを入れる
- 書き方(箇条書き→短い要約など)を型にして固定
RAG活用でつまずきやすいポイントとコツ
- 小分けが雑:文の途中で切ると意味が途切れる → 段落や見出し単位で分ける
- 取り出す数が多すぎ/少なすぎ:ノイズや取りこぼしの原因 → 実測しながら調整
- 根拠が出ない:回答だけだと不安 → 引用を必須に(出典・ページ等)
- 権限ミス:見せてはいけない資料が混ざる → タグで絞り込み&ログ
RAGの書き方(プロンプト)のミニ型
# あなたの役割:資料の内容だけで答えてください(推測しない)
# 入力:質問、資料抜粋(タイトル・出典・本文)
# ルール:箇条書き→最後に2行の要約/出典を列挙/不明は「不明」と回答
- 「推測しない」「出典を書く」を先に約束しておく
- 仕上がりフォーマット(箇条書き→要約)を固定
- 分からない時のふるまいも決めておく
RAGの活用はまずはここから(小さく試す手順)
- ① 資料を選ぶ:まずはよく参照する10〜20ファイル
- ② きれいにする:段落ごとに小分け、タイトル・日付のタグ付け
- ③ ためしてみる:3〜5個の代表質問で検索→回答→出典確認
- ④ 改善:小分けの粒度/取り出す数/書き方ルールを調整
- ⑤ 本番化:権限フィルタとログ(誰が何を見たか)を用意
RAGに関するよくある質問
Q1. 「学習し直し(微調整)」とRAG、どっちが良い?
- 最新情報や社内資料を使いたい → RAGが向く
- 文体のクセや定型パターンを覚えさせたい → 学習し直しが向く
- 実務は併用が多い(RAG+軽い学習)
Q2. RAGにすれば間違いはゼロ?
- ゼロではありません。検索の質と出典必須の運用でグッと減らす
- 最後は人の目で確認(重要な回答ほど)
AIの解答は完璧ではありません。
Q3. PDFの表や図はどうする?
- 表はCSV化、図はキャプション(説明文)を付けると検索に引っかかりやすい
- むずかしい所は要点だけ別メモにしておくと便利
まとめ
- RAGは「探してから書く」方式。根拠を示せて安心
- コツは小分け・出典・権限の3点セット
- まずは少数の資料+代表質問で小さく試す
次の一歩:よく見る資料を10本集めて小分け→ 代表質問で動かす→ 引用つき回答にする
の順で試してみましょう。

