AIの基礎 — 機械学習・LLM・生成AIをわかりやすく解説
AIという言葉は広義に使われますが、「機械学習」「深層学習」「生成AI」「LLM」はそれぞれ異なる概念です。エンジニア・PM・ビジネス担当者が最低限知っておくべき基礎を整理します。
AI・機械学習・深層学習・生成AIの関係
これらは入れ子の関係にあります。
人間の知的活動(認識・推論・学習・言語理解)をコンピューターで実現する技術の総称。ルールベースの従来AIから機械学習まで含む。
明示的なルールを人間がプログラムするのではなく、データからパターンをコンピューターが自動的に学習する手法。回帰・分類・クラスタリング・強化学習など。
多層のニューラルネットワーク(人間の神経回路を模した構造)を使った機械学習。画像認識・音声認識・自然言語処理で人間を超える精度を達成。大量データとGPUが必要。
学習データを元に、新しいテキスト・画像・音声・コードを生成する深層学習モデル。GPT・Claude・Gemini(テキスト)、Stable Diffusion・DALL-E(画像)が代表例。
LLM(大規模言語モデル)とは
LLM(Large Language Model)は、大量のテキストデータで訓練されたTransformerベースのニューラルネットワークです。GPT・Claude・Gemini・Llama などが代表的な LLM です。
LLMはテキストを「トークン」(単語やサブワード)の単位で処理します。「コンテキスト長(context window)」が会話の記憶範囲を決め、長いほど複雑なタスクを扱えます。Claude 3.5 Sonnetは200Kトークン(約15万語)のコンテキストを持ちます。
LLMへの指示(プロンプト)の書き方でアウトプットの質が大きく変わります。「役割を与える(System Prompt)」「例を示す(Few-shot)」「思考手順を示す(Chain-of-Thought)」などのテクニックがあります。
LLMは「もっともらしい嘘」を生成することがあります。特に数値・固有名詞・最新情報で発生しやすい。RAG(検索拡張生成)によりファクトベースの回答精度を高めることができます。
ファインチューニングはモデルの重みを特定ドメインデータで更新する手法。コストと時間がかかる代わりに専門性が高まります。プロンプトエンジニアリングはモデルを変えずに指示で制御する低コストなアプローチ。多くのケースでプロンプト最適化が先行して試みられます。
主要なAIモデル比較(2025年現在)
| モデル | 提供元 | 強み | 主な用途 |
|---|---|---|---|
| GPT | OpenAI | バランス・マルチモーダル・広いエコシステム | チャット・コード生成・画像理解 |
| Claude | Anthropic | 長文処理・安全性・指示追従精度 | 長文分析・設計書生成・コード |
| Gemini | マルチモーダル・長コンテキスト・Google統合 | 文書分析・コード・データ処理 | |
| Llama 3 | Meta | オープンソース・商用利用可・オンプレ展開 | セルフホスト・RAG・社内AI |
| Nova Pro / Lite | Amazon | Bedrock統合・AWSネイティブ・低コスト | AWS環境でのLLM利用 |
エンタープライズでのAI活用 — 注意すべき3つの観点
- •社内機密情報・個人情報をクラウドAIに送信する前にポリシーを確認する
- •商用クラウドAI(OpenAI/Anthropic)のAPI利用規約ではデータのモデル学習利用を原則無効化できる
- •高機密データ(医療・金融)はオンプレミスLLMまたはVPC内のBedrock/Azure OpenAI経由を検討する
- •LLMのコストはトークン数に比例する。長いシステムプロンプト・大量のRAGドキュメント送信はコストを押し上げる
- •プロダクション用途では「入力トークン単価 × 月次リクエスト数」で事前に試算する
- •用途に応じてモデルを使い分ける(重要タスクはGPT/Claude、軽微なタスクはより小さいモデル等)
- •APIがダウンした場合のフォールバック設計を事前に検討する(モデル切り替え・キャッシュ等)
- •LLMの出力は決定論的でない。同じ入力でも毎回異なる出力になりうる(temperature設定で制御可能)
- •重要な判断はAIの出力を参考にしつつ人間が最終確認するHuman-in-the-loopの設計が推奨
ArchitectAI は Claude・GPT・Gemini の3社AIを並列活用してアーキテクチャ設計書を自動生成します。
無料で始める(10クレジット)