診療放射線の分野において関連するデータを解釈するためには,様々な統計学の知識を必要とする.
本講座では,その統計学に関連する基礎知識から研究に役立つ実践的な知識までを解説する.
2013 年に「統計学が最強の学問である」という書籍が異例のベストセラーとなって10 年近くたつが,近年のビックデータのブームや2019 年にまとめられた政府の「AI 戦略」で,データサイエンスに対する注目度は高まっている1).
小中学校のICT 教育に始まり,高等学校におけるリテラシー教育,大学や社会人における数理・データサイエンス・AI 教育に至るまで,様々な段階を経ることで実践的活用スキルの習得を目指す.
そのデータサイエンスに必要不可欠な学問が統計学であり,巷にあふれかえっているデータや研究を対象としたデータを処理するという観点で最強であるといえる.
しかし,決して万能ではないので,取扱いに注意しながら,統計学を用いることが肝要である.
統計学が生まれた背景には,計測によって取得したデータの取扱いがある.
計測によって取得したデータには,ばらつきが出ることが一般的に知られている.これを詳しく見ていくと,平均的な値を中心にばらつきが広がっていることが確認される.
その分布がある一定の法則に従うことをガウスが指摘している.
その法則は,確率がガウス関数の形をした正規分布に従っているが,ガウスが指摘する以前に,その発見はフランスの数学者であるド・モアブルの功績が大きいと言われている.
放射線の分野では,放射線自体が確率的なものであるので,統計的な取扱いが重要になる.
放射線の計測にはポアソン分布,一般的なデータの雑音にはガウス分布,MRI 画像の雑音にはライス分布と様々な確率分布が計測データや画像に付加されていることが知られている.
それらの確率分布を理解することは重要であり,さらに研究の分野においては統計的有意差検定なるものが幅をきかせてくる.
とかく研究においては,2 つや多数のデータ群を比較する場面が多々あり,それらの平均値などに差が出るのかを調べることになる.
計測データにはばらつきが入るので,それを考慮した検討が必要となる.
そこで重要となるのが有意差という概念である.
統計的に(ばらつきを考慮して)差があるのかを科学的根拠に基づいた判断をする.
これらには統計学的な手順が必要となる.この有意差検定についても具体的な例を見ながら解説する.
本講座がみなさんの統計学におけるスキルアップに少しでも貢献できれば幸いである.
1) AI 戦略2019 ~人・産業・地域・政府すべてにAI ~.統合イノベーション戦略推進会議 2019.