本質をつかむ先月に続き、「私がこれまでの仕事のやり方として大切にしてきたこと」の第二弾である。
私はこれまで役柄上、数多くの統計を扱ってきた。視覚化のため、グラフ化することも多い。このとき私がいつも意識するのは、この統計から何が読み取れるか。あるいは、読み取れるようにするにはどのような統計にすれば良いか、である。私が主に扱うのは、患者数や算定点数(=売り上げ)のデータだが、これらは日次変動にせよ月次変動にせよ、一定のゆらぎやばらつきを持っている。それゆえ、ただ漫然と対前月比較や対前年同月比較を行っても意味がない場合が多い。たまたま良い数字が出れば「良かった」といい、悪ければ「がんばれ」という。だが、なぜ良かったか、悪かったかが分からなければ、どう頑張れば良いかが分からない。肝腎なのは、これらゆらぎやばらつきを持ったデータのかたまりから傾向やパターンを見つけ出すこと。さらに、その傾向やパターンから因果関係を見いだすこと。「こうだから、こうなった」ということが分かれば、「では、こうすれば、こうなる」といったように、解決策や改善策が見つかる可能性が出てくる。
ゆらぎやばらつきを持つデータから傾向性を見いだす手法のひとつとして、私が良く使うのは、移動合計(または移動平均)である。最近の例でいえば、COVID-19新規感染者の日々の発生数のデータ。このデータには曜日特性があり、日々の発生数をそのままプロットしてグラフに描いてもガタガタになり、分かりづらい。そこで日々毎日直近1週間の発生数の合計値(または平均値)をとり、それを日々の値としてグラフを作成する。すると曜日変動が補正され、COVID-19新規感染発生数の本当の増減傾向を表すことができる。この手法には、いま例示した移動週計(平均)以外にも、季節変動補正のための移動年計(平均)など、色々なバリエーションがある。
あと、データのばらつき、すなわち分布そのものに着目することも、時に必要だ。たとえば在院日数。平均在院日数という指標は病院にとって昔から重要な指標である。だが、例えば平均在院日数が18日であるということは、ほとんどの患者の在院日数が18日前後に集中しているということを表すものではない。3日という患者も、30日という患者も大勢いる。データの分布を視覚的に表現する手法としては、ヒストグラム(度数分布図)や箱ひげ図がよく使われる。これらを参照すれば、例えば「平均在院日数を短縮化したい」というテーマを考えたとき、有効なアプローチ方法が見えてくる、ないしは改善策の結果検証を行うことができる。最頻値を短縮化する(例:パスを改定する)、退院調整プロセスの改善により退院困難・長期入院事例減少をはかる、などである。
以上、ようするに、データ活用の大きな目的のひとつは「本質をつかむ」ということである。これを実事求是という。
【参考】
1)新谷 歩:今日から使える医療統計、医学書院、2015年
2)西内啓:統計学が最強の学問である、ダイヤモンド社、2013年
3)西内啓:統計学が最強の学問である[実践編]、ダイヤモンド社、2014年
mailto:agrito@mb.pikara.ne.jp