ガイド

RAG・AIエージェント・MCPとは

LLM単体では「最新情報を知らない」「社内データを参照できない」「複雑なタスクを自律実行できない」という限界があります。RAG・AIエージェント・MCPはこれらの限界を突破するための主要アーキテクチャです。

RAG（Retrieval-Augmented Generation）

RAGとは「検索（Retrieval）」と「生成（Generation）」を組み合わせた手法です。LLMが回答を生成する前に、外部のナレッジベースから関連情報を検索して取得し、その情報をコンテキストとして与えることで、精度と信頼性を高めます。

RAGのアーキテクチャ

ユーザーの質問

テキスト入力

クエリ変換・埋め込み

Embedding モデルでベクトル化

ベクトル検索

pgvector / Pinecone / OpenSearch でコサイン類似度検索

RAGの主要コンポーネント

Embeddingモデル

テキストを数値ベクトルに変換。意味的な類似度を計算するために使う。text-embedding-3-small（OpenAI）・multilingual-e5（多言語対応）が代表例。

ベクトルDB

高次元ベクトルの高速検索に特化したデータベース。pgvector（PostgreSQL拡張）・Pinecone・Weaviate・OpenSearch が代表。

チャンキング戦略

ドキュメントをどの単位で分割するかが検索精度に影響。固定長・文単位・セクション単位など目的に応じて設計する。

ハイブリッド検索

ベクトル検索（意味的類似度）とキーワード検索（BM25）を組み合わせ、RRF（Reciprocal Rank Fusion）で統合。どちらかだけより精度が高い。

AIエージェントとは

AIエージェントとは、LLMが「ツール（検索・コード実行・APIコール・ファイル操作等）」を自律的に選択・実行しながら、複数ステップのタスクを達成するシステムです。単発の質問応答（Chatbot）とは異なり、目標に向けて自律的に計画・実行・修正を繰り返します。

エージェントのループ（ReAct パターン）

Reason

現状を分析し次のアクションを計画

Act

ツールを呼び出す（検索・コード実行・API）

Observe

ツールの実行結果を受け取る

Repeat/Done

目標未達なら繰り返す完了なら回答を返す

代表的なエージェントフレームワーク

LangGraphLangChain製のグラフベースエージェント。複雑なマルチエージェントワークフローを状態機械として定義できる。本番採用実績が多い。

AutoGen（Microsoft）複数のAIエージェントが協調して問題を解くマルチエージェントフレームワーク。コードの自律生成・実行・デバッグが得意。

Claude Computer UseAnthropicが提供する、PCの画面・キーボード・マウスを自律操作するエージェント機能。GUI操作の自動化が可能。

Devin / Cursor Agentコードベースを自律的に探索・編集・テスト実行するソフトウェアエンジニアリング特化エージェント。

MCP（Model Context Protocol）とは

MCP（Model Context Protocol）はAnthropicが2024年11月に公開したオープン標準プロトコルです。LLMアプリケーション（ホスト）と外部データソース・ツール（サーバー）を標準化されたインターフェースで接続します。

MCPが登場する前は、各AIアプリが独自のプラグイン・API連携を実装していました。MCPはこれを標準化し、「一度MCPサーバーを作れば、どのMCP対応クライアントからでも使える」エコシステムを実現します。いわばAI向けの「USB」規格です。

MCPホスト

LLMを使うアプリケーション（Claude Desktop / Cursor / Cline など）。MCPサーバーに接続する側。

MCPクライアント

ホスト内でMCPサーバーとの通信を担うコンポーネント。プロトコルの実装部分。

MCPサーバー

特定のツール・データソースを公開するサービス（ファイルシステム / DB / GitHub / Slack 等）。

MCPが提供する3つの機能

Resources（リソース）ファイル・DBレコード・URL等の静的データをLLMのコンテキストに提供する。

Tools（ツール）LLMが呼び出せる関数（検索・API実行・ファイル書き込み等）を定義する。AIエージェントのアクション実行に使われる。

Prompts（プロンプト）よく使うプロンプトテンプレートをサーバー側で管理し、クライアントから再利用できるようにする。

RAG・エージェント・MCPの使い分け

ユースケース:社内ドキュメントへの質問応答RAG

大量ドキュメントから関連情報を検索して回答。ハルシネーションを抑制しながら最新情報を参照できる。

ユースケース:コード生成・デバッグの自動化AIエージェント

複数ファイルを参照→コード生成→テスト実行→修正のループを自律実行する。

ユースケース:IDEとLLMの連携MCP

エディタ（Cursor等）からDBスキーマ・ファイルシステム・GitHub等に標準的にアクセスできるようにする。

ユースケース:複雑なリサーチタスクRAG + エージェント

検索で情報収集（RAG）→分析・要約（LLM）→追加検索が必要なら再実行（エージェントループ）を組み合わせる。

ArchitectAI はRAGアーキテクチャを内部活用

AWS・Azure・GCPの公式アーキテクチャパターンをRAGで検索し、要件に最適な設計を自動生成します。

無料で始める（10クレジット）