原文:https://clauswilke.com/dataviz/multi-panel-figures.html
これまでは単一のグラフのVisualizationについて議論してきた。ただデータセットが大きく複雑になってくると一枚の画像で表現できる以上の情報をデータセットが持つことがある。
そのような場合は
データセットを部分ごとにわけてグリッドにならべて表示するような方法。visualizationの方法は同一。
複数の図を違う可視化の方法で任意の規則でならべたもの。データセットが異なっていても良い。
を検討するのが良い。
マルチパネル図は直感的で解釈も容易だがスケールや配置、一貫性に注意しないといけない部分もあります。
スモールマルチプルという表現を広めたのは Tufte であり、また trellis plot とも呼ばれている。
スモールマルチプルはデータをいくつかのディメンジョンで分割して、分割した各データをグリッドに並び替える…というのがキーとなるアイデアである。グリッドの行や列に対してはそれぞれのディメンジョンがラベルされる。最近では faceting とも呼ばれている。(ggplot由来)
例を見ていこう。ここではタイタニックの乗客のデータセットを利用する。このデータセットを乗客の生死と、搭乗していた客室のクラスで6つに分割しよう。それらのデータには男女がいて、わけて棒グラフで可視化しよう。カラムと行を生死とクラスでわべるすることで6つの図がとの対応関係が明らかになる。
図から男性の多くがなくなり女性が生き残ったこと、なくなった女性は3rdの客室だったことがわかります。(コメント: カウントではなく割合で出すべきだと思う)
この例では6つの図を対象としているがもっと多くの図を描くこともできる。
21-2は映画の平均評点と、評価数の関係を表すグラフである。多くの評価数がある映画は評価も高くなる傾向があることがわかります。しかしこれは年によって影響の差が大きく、2000年初頭には相関が無い、さらには負の相関があることも言える。(コメント: 年によってサンプル数が違うように見えるので古いデータはあんまり参考にならなさそう。細かいスモールマルチプルにすればするほどボラティリティが大きくなるのはそれはそう)
この21-2のようなグラフが容易に理解できるのは、グラフ間で同じ描画範囲で同じスケールでとういつしていることである。そうなっていることを人類は求めている。そうなっていない悪い例を見よう。