AWS

Data Lake & Analytics (S3 + Athena)

S3 + AWS Glue + Athena + Redshift のデータレイク構成。S3をデータレイクの中心に置き、Glueのサーバーレスなデータカタログ管理とAthenaのS3直接クエリで低コストな分析基盤を実現します。

アーキテクチャ構成図

データソース
RDS / DynamoDB / アプリログ
AWS Glue ETL
スキーマ変換・クレンジング
S3
データレイク・Parquet形式
AWS Glue データカタログ
メタデータ管理
Amazon Athena
サーバーレスSQL分析
Amazon QuickSight
BIダッシュボード

↑ リクエスト / データの流れ(上から下)

採用サービス構成

データレイク
S3 (Parquet / ORC)
ETL
AWS Glue
クエリ
Amazon Athena
DWH
Amazon Redshift Serverless

代表的なユースケース

  • ログ分析・セキュリティ監査
  • BI向けデータマート構築
  • マーケティング分析基盤
  • コスト分析・FinOpsダッシュボード

このパターンを選ぶ判断基準

大量の非構造化データを低コストで保管・分析したい場合に最適。Athenaのサーバーレスクエリによりクラスター管理不要で即座にアドホック分析が可能です。

このパターンで設計書を自動生成

要件を入力するだけで構成図・設計書・コスト見積もりを自動生成します。

無料で試す