[B! aws-glue][gihyo] nabinnoのブックマーク

nabinno id:nabinno

aws-glueとgihyoに関するnabinnoのブックマーク (1)

データパイプラインの管理～ワークフロー管理に利用できる、さまざまなAWSサービス | gihyo.jp
はじめに本連載の第2回では様々なデータソースからの収集について、第3回では収集されたデータの管理についてそれぞれ解説してきました。今回は、それぞれのデータの収集から分析するまでの処理の流れを管理するデータパイプライン管理に着目し、求められる要素や関連するサービスとその使い分けについて解説します。データパイプラインとETL 分析するためのデータを様々なデータソースから収集してデータレイクのような基盤で実際に分析できる状態にするまでには、一般的にいくつかのサービスや機能、処理を組み合わせて実現します。このようにデータの抽出（Extract⁠）⁠、変換（Transf orm⁠）⁠、ロード（Load）の一連のフロー（流れ）をETLと呼び、データソースやデータの種類ごとに異なるフロー（パイプライン）を構成する必要があります。さらにこの処理は当然ながら自動化することが一般的です。なお、データウェア
nabinno 2024/04/24
gihyo

hiroyuki-suzuki

amazon-mwaa

aws-step-functions

aws-glue

workflow-engine

pipeline

data-engineering
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx