読書会共有シート

https://docs.google.com/spreadsheets/d/1Qf-pNPrIGUqREizwzLhoeLTCqX2tgDpRgd0rBBYp8-0/edit#gid=1978790095

Data Mesh

データメッシュは中央集権型のデータレイクとデータウェアハウスなどの、乱雑なモノリシックなデータプラットフォームや、運用のデータと分析のデータにで二つに分けるThe great divide of dataに対する最近の対案である。(greatは皮肉っている?)

データメッシュでは中央集権型のデータアーキテクチャにあった課題を反転させようとした。ドメイン駆動型開発の考え方をデータアーキテクチャに持ち込むことで、それを可能にした。データメッシュは最近はやっており知っておいたほうが良い技術の一つになっている。

モノリシックなデータプラットフォームを分散化するために、データそのもの、データの場所、データの所有者についての考え方を逆流させる必要がある。つまり、それぞれのドメインから一箇所の(中心の)データレイクやプラットフォームにデータを流すのではなく、それぞれのドメインでデータセットを管理し、分析しやすい形で提供する必要がある。

Dehghani氏はData Meshを構成する要素として以下を定義した。(特に説明はないので参照文献を読む必要があり)

Untitled

Other Data Architecture Examples

データアーキテクチャには他にも様々なパターンがある