Google Cloud
Data Platform (BigQuery + Looker)
Pub/Sub + Cloud Storage + Dataflow + BigQuery のデータ基盤構成。BigQueryのサーバーレスなスケーラビリティとLookerとの統合により、大規模データ分析を低コストで実現できます。
アーキテクチャ構成図
イベントソース
アプリ / GA4 / Firebase
Pub/Sub
ストリーム取り込み・デカップリング
Dataflow
Apache Beam / ウィンドウ集計
Cloud Storage
データレイク・コールドデータ
BigQuery
サーバーレスDWH・ML内包
Looker / Looker Studio
可視化
↑ リクエスト / データの流れ(上から下)
採用サービス構成
- ストリーミング
- Pub/Sub
- ストレージ
- Cloud Storage (データレイク)
- ETL
- Dataflow
- DWH
- BigQuery (サーバーレス)
代表的なユースケース
- ✓ペタバイト規模のビッグデータ分析
- ✓Looker Studio経営ダッシュボード
- ✓Google Analytics / Firebase連携分析
- ✓ML特徴量エンジニアリング基盤
このパターンを選ぶ判断基準
ペタバイト規模のデータ分析やLooker / Looker Studioでのデータ可視化を検討している場合。BigQueryのストレージとコンピュートの分離により使った分だけの課金が実現できます。