連載コラム

薬学部ホームページを制作するにあたって、薬学に関係する皆さまに向けた連載コラムをお届けすることにいたしました。今後、本学教員が定期的に連載をしてまいります。

膨大なデータの山から宝を見付け出す!
探索的データ解析の心得

濃沼政美教授

薬学部教授
濃沼 政美

「データ解析は、“学問”ではなく“術”である」
これは私の統計学の師匠である故 芳賀 俊郎 先生(元 東京理科大学)に授けていただいた考え方です。昨今、医学薬学的研究においては介入・観察など様々なデータを比較的容易に得ることが出来るようになりました。しかし主観を交えず物事を冷静に観察し、データの中から本質を見極めるためには、以下に挙げる三つの要素を兼ね備えていなければなりません。

一つ目は疫学分野も含めた統計学に対する正しい知識です。薬学部4年生の医薬品情報学の授業で学生に統計について意識を訊ねてみたことがあります(5点法:設問に当てはまるほど点数が高い)。これによると、回答の中央値は、統計は面白そうである:2点、統計は難しそうである:5点、統計に興味がある:3点となっていました。徐々に、統計に興味がある学生が増えてきている傾向はありますが、まだ統計は面白そうと回答する学生は少ないのが実情です。
ではなぜ、学生は統計に対して苦手意識があるのでしょう?これは、きっとバスケットボールの練習のようなものであると考えます。例えば、ミスをしないでドリブルできる回数を増やすためには、時間をかけた分だけ比例して効果が現れますが、シュートを5回連続して成功させるには、ある程度の練習時間をつぎ込み、かなりの技術水準に辿り着かない限り、成功させることは叶いません。すなわち統計学の勉強は後者のパターンといえ、学部4年までにその領域に達する学生はなかなかいないのが実情と思われます。薬学領域から私のようなデータ解析技術者を育てていくためにも大学での統計教育の方法についてまだまだ議論する必要がありそうです。

二つ目は、固有技術です。固有技術とは品質管理分野の用語として用いられることが多いですが、一般的に、ものを作ったり、サービスを提供したりするときに必要な技術、たとえば設計開発や製品加工などの技術を指します。これを医学薬学領域に置き換えれば、臨床現場での医師や薬剤師の長年の経験や勘そのものが貴重な固有技術といえます。それ以外にも医療情報学や、薬理学また有機化学などの知識もこれに当てはまるといえます。即ち、データ解析によって本質を見極めるためには、解析技術者は当該分野に対する深い造詣が不可欠であるということです。

三つ目は、統計ソフトウェアのハンドリング技術です。統計ソフトウェアは無償のものから、何十万円もするデータマイニング専用のソフトまで、解析内容に応じてかなりの種類から選択する事が出来るようになりました。データ解析という、「埋蔵金探し」からすれば統計ソフトウェアは、まさにショベルカーそのものであり、解析技術者の手足として繊細かつ、時には大パワーで動かすことが出来るものでなくてはなりません。特に大規模医療データベース解析などでは、データテーブルの変換機能が優れたものや、PCの性能以上にソフト自体のメモリ消費が少ないものが望ましいといえるでしょう。

今回、「統計学」・「固有技術」・「統計ソフト」というデータ解析技術者に不可欠な三つの要素の重要性を述べました。AIの自動学習機能が、もてはやされていますが、データの山から真の宝を探すという作業については、熟練したデータ解析技術者に敵うものは、しばし出てこないものと考えています。そのためにも我々は、これからも宝探しのために、“術”を磨き続ける必要があるでしょう。

こちらもチェック

  • 入試情報
  • キャンパスライフ
  • 進路・就職

ページのトップへ戻る