AWS
Data Lake & Analytics (S3 + Athena)
S3 + AWS Glue + Athena + Redshift のデータレイク構成。S3をデータレイクの中心に置き、Glueのサーバーレスなデータカタログ管理とAthenaのS3直接クエリで低コストな分析基盤を実現します。
アーキテクチャ構成図
データソース
RDS / DynamoDB / アプリログ
AWS Glue ETL
スキーマ変換・クレンジング
S3
データレイク・Parquet形式
AWS Glue データカタログ
メタデータ管理
Amazon Athena
サーバーレスSQL分析
Amazon QuickSight
BIダッシュボード
↑ リクエスト / データの流れ(上から下)
採用サービス構成
- データレイク
- S3 (Parquet / ORC)
- ETL
- AWS Glue
- クエリ
- Amazon Athena
- DWH
- Amazon Redshift Serverless
代表的なユースケース
- ✓ログ分析・セキュリティ監査
- ✓BI向けデータマート構築
- ✓マーケティング分析基盤
- ✓コスト分析・FinOpsダッシュボード
このパターンを選ぶ判断基準
大量の非構造化データを低コストで保管・分析したい場合に最適。Athenaのサーバーレスクエリによりクラスター管理不要で即座にアドホック分析が可能です。