概要

1. Ingestion

image.png

データ取り込みとはソースシステムからストレージへのデータ移動。

image.png

データ取り込み

データ統合

内部取り込みとはまた少し違う。内部取り込みはデータ変換プロセスで行われる一部(ソースシステムからの移動ではない)

データパイプラインとは?

データパイプインとは、データライフエンジニアリングサイクルのステージを経てデータを移動させるアーキテクチャ、システム、プロセスの組み合わせ。これはわざとあいまいに定義している。データパイプランはどのようなニーズにも対応できる柔軟性を持つべきである。(オンプレかクラウドか?モノリシックかどうかは本質的でない)

2. Ingestionにおける検討事項

2.1 区切りあり or 区切りなし

image.png