tokyowebmining36th 国立病院機構における診療情報分析

39
国立病院機構における診療情報分析 川島 直美 1

Upload: naomi-kawashima

Post on 05-Dec-2014

4.495 views

Category:

Healthcare


2 download

DESCRIPTION

データマイニング+WEB第36回 国立病院機構における診療情報分析

TRANSCRIPT

Page 1: tokyowebmining36th 国立病院機構における診療情報分析

国立病院機構における診療情報分析

川島 直美

1

Page 2: tokyowebmining36th 国立病院機構における診療情報分析

自己紹介 • 川島直美です

– (独)国立病院機構 本部 総合研究センター 診療情報分析部 システム開発専門職

• 情報処理学会誌 デジタルプラクティス

特集「ヘルスケアの現場を支えるIT」 『国立病院機構における診療情報分析 システムについて ―構築と運用に関する現状と課題―』

2

プレゼンター
プレゼンテーションのノート
国立病院機構: http://www.hosp.go.jp/ 情報処理学会 デジタルプラクティス: http://www.ipsj.or.jp/dp/dp-index.html 国立病院機構における診療情報分析システムについて―構築と運用に関する現状と課題―(閲覧無料・要アカウント登録): https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=94255&item_no=1&page_id=13&block_id=8
Page 3: tokyowebmining36th 国立病院機構における診療情報分析

今日のお話 1. 診療情報分析部について

2. 収集データの処理

3. 処理によって得られた効果

4. 時間があれば… 個人情報の取り扱いについて

3

Page 4: tokyowebmining36th 国立病院機構における診療情報分析

1. 診療情報分析部

4

Page 5: tokyowebmining36th 国立病院機構における診療情報分析

診療情報分析部 since 2010

• 機構143病院の診療データを収集・分析 –医療の可視化・比較 –医療の質の向上・均てん化への貢献

5

Page 6: tokyowebmining36th 国立病院機構における診療情報分析

MIA Medical Information Analysis databank

• データ収集基盤 –テキストファイル収集・RDB化 – SQLで自由分析

6

Oracle

Page 7: tokyowebmining36th 国立病院機構における診療情報分析

MIA収集データ • 業務で作成するデータを二次利用

1. DPC調査データ

Diagnosis Procedure Combination

2. レセプトデータ

7

Page 8: tokyowebmining36th 国立病院機構における診療情報分析

MIA収集データ 1.DPC調査データ

• DPC/PDPS参加病院に提出義務 Diagnosis Procedure Combination/Per-Diem Payment System

–タブ区切り行列 –体系的なコードの記載 –曖昧なデータにはペナルティ

\リッチで正確、分析しやすいデータ/

でも作成病院が少ない 機構57/全国1500+

8

プレゼンター
プレゼンテーションのノート
DPC/PDPSの概要と基本的な考え方: http://www.mhlw.go.jp/stf/shingi/2r985200000105vx-att/2r98520000010612.pdf 平成26年度「DPC導入の影響評価に係る調査」実施説明資料: http://www.prrism.com/dpc/setsumei_20140501.pdf
Page 9: tokyowebmining36th 国立病院機構における診療情報分析

• の前に日本の健康保険制度のおさらい 治療

一部支払い

2.レセプトデータ (診療報酬明細書)

9

被保険者 (みなさんのこと) 医療機関

審査支払機関 保険者 (健康保険組合等)

治療明細提出 審査・残額支払 保険料納付

請求

残額支払

プレゼンター
プレゼンテーションのノート
我が国の医療保険について: http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/iryouhoken/iryouhoken01/index.html
Page 10: tokyowebmining36th 国立病院機構における診療情報分析

MIA収集データ 2.レセプトデータ(診療報酬明細書)

• 保険診療をする全医療機関が月一作成

二次利用は念頭にない仕様 orz...

– 請求用の一意なだけのコード – 行列ではないCSV – 審査の都合で… でも作成病院が多い 機構143/全国8万+

10

プレゼンター
プレゼンテーションのノート
レセプト電算処理システム: http://www.ssk.or.jp/rezept/index.html 電子レセプト作成の手引き、記録条件仕様及び標準仕様等: http://www.ssk.or.jp/rezept/iryokikan/iryokikan_02.html オンライン又は光ディスク等による 請求に係る記録条件仕様(医科用): http://www.ssk.or.jp/rezept/iryokikan/download/files/iryokikan_in_01.pdf
Page 11: tokyowebmining36th 国立病院機構における診療情報分析

2. 収集データの処理 レセプトデータとの戦い

11

Page 12: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータとの戦い 1. 請求用コード

–体系的なコードに変換しよう!

2. 行列ではないCSV –成形しよう!

3. 審査の都合で…

–どうしよう!

12

Page 13: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータとの戦い 1. 請求用コード

–体系的なコードに変換しよう!

2. 行列ではないCSV –成形しよう!

3. 審査の都合で… –どうしよう!

13

Page 14: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータって 2011年度から原則電子運用

こころの目で見ると…

14

社会保険診療報酬支払基金WEBサイトより抜粋

IR,1,13,1,9999905,,サンプル医科病院,42405,00,03-9999-9999 RE,61,1119,42404,サンプル 61,1,3160927,,4240124,,,,,sample-ika-061,,,,,,,,14,,,,,,,,,,,,,, HO,06132013,1234567,61,7,16794,,20,13150,,,44400,,, SY,4319018,4240124,1,,,01, SY,8839792,4240124,1,,,, SY,8120005,4240124,1,8002,,, … IY,21,1,613330003,3,,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,,, IY,,1,620002332,1,4,3,,,,,,,,,,1,1,1,,,,,,,,,,,,,,,,,,,,,,,… CO,90,1,840000013,240407 SI,90,1,190118610,,,7,,,,,,,1,1,1,1,1,1,1,,,,,,,,,,,,,,,,,,…

Page 15: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータとの戦い 請求用コード

• 請求用マスタで日本語に翻訳

15

請求用マスタ レセプト電算処理コード/印字例 診療行為 160020910 中性脂肪(検査) 特定器材 700080000 四ツ切(レントゲンフィルム) 医薬品 610444041 ガスターD錠10mg 傷病名 0703025 C型慢性肝炎 修飾語 8002 の疑い コメント 840000013 退 院 年 月 日

体系的な コードへ

プレゼンター
プレゼンテーションのノート
診療情報提供サービス 基金マスター: http://www.iryohoken.go.jp/shinryohoshu/downloadMenu/
Page 16: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換しよう! 薬剤(約20,000種)

• 様々な薬品のためのコード –薬価基準収載医薬品コード – HOTコード – JANコード

• 何をもって1種類の薬? – 薬効(解熱鎮静剤/血圧降下剤…) – 剤形(飲み薬/注射/塗り薬…) – 製造元(先発メーカー/後発メーカー…)

16

プレゼンター
プレゼンテーションのノート
厚生労働省使用薬剤の薬価(薬価基準)に収載されている医薬品について(平成26年2月3日現在): http://www.mhlw.go.jp/topics/2012/03/tp120305-01.html 医薬品HOTコードマスター: http://www2.medis.or.jp/master/hcode/
Page 17: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換しよう! 例えば薬価基準収載医薬品コード

2 3 2 5 0 0 3 F 3 0 3 5 • 2*:個々の器官系医薬品 • 23*:消化器官用薬 • 232*:消化性潰瘍剤 • 2325*:H2遮断剤 • 2325003*:ファモチジン • 2325003F*:の、飲み薬 • 2325003F3035:アステラス製薬のガスターD錠10mg

17

IY,21,1,610444041,3,3,2,,,,,…

任意の粒度で集計・分析

ガスターD錠10mg

Page 18: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換しよう 傷病名コード(約25,000種)

• 世界的な傷病統計用コード – ICDコード

International Statistical Classification of Diseases and Related Health Problems 疾病及び関連保健問題の国際統計分類

18

プレゼンター
プレゼンテーションのノート
ICD10 国際疾病分類第10版: http://www.dis.h.u-tokyo.ac.jp/byomei/icd10/
Page 19: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換しよう ICDコード

C161

• C*:新生物 • C16*:胃の悪性新生物 • C161:胃の悪性新生物, 胃底部

19

SY,1513002,4240124,1,8002,,,

胃底部癌

任意の粒度で集計・分析

Page 20: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換したいのに 未コード化傷病名

• マスタは全病名を網羅してはいない –新種の病気 –何とも診断がつかない状態

不明コード+テキスト病名

入力時に検索できてない 20

SY,0000999,4240124,1,,二型糖尿病,,

『2500015 2型糖尿病』では?

Page 21: tokyowebmining36th 国立病院機構における診療情報分析

体系的なコードに変換しよう! テキスト病名で集計はしたくない

• DPC調査データの病名欄 –診断病名 + ICDコード

21

DPC調査データ ICD 病名

E119 2型糖尿病 E119 II型糖尿病 E119 二型糖尿病 E119 糖尿病(2型) E119 インスリン非依存性糖尿病

レセプトデータ 病名 ICD

2型糖尿病 NULL 二型糖尿病 NULL 2型糖尿病合併症なし NULL

E119 E119

医師の知見を利用

Page 22: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータとの戦い 1. 請求用コード

–体系的なコードに変換しよう!

2. 行列ではないCSV –成形しよう!

3. 審査の都合で… –どうしよう!

22

Page 23: tokyowebmining36th 国立病院機構における診療情報分析

成形しよう! 記載の省略 -最低限記載主義-

埋める!

23

IY,21,1,620004915,1,,… IY, ,1,620003619,1,,… IY, ,1,620000167,1,,… IY, ,1,610443053,1,,… IY, ,1,620002429,1,15,…

21 21 21 21

Page 24: tokyowebmining36th 国立病院機構における診療情報分析

成形しよう! 行ごとに異なる種類の情報

テーブル化!

24

RE,61,1119,42404,サンプル 61,1,3160927… HO,06132013,1234567,61,7,16794,,20,… SY,4319018,4240124,1,,,01, SY,8839792,4240124,1,,,, … SI,13,1,180016110,,250,1,,,,,,,,,,,,,1,,,,,,,,,,,… IY,21,1,613330003,3,3,2,,,,,,,,1,1,,,,,,,,,,,,,,,…

医療行為 病院ID 患者ID 診療月 医療行為

プロフィール 病院ID 患者ID 診療月 生年月日 性別

病名 病院ID 患者ID 診療月 病名

Page 25: tokyowebmining36th 国立病院機構における診療情報分析

成形しよう! 1日の情報、2日の情報、3日の情報…31日の情報

縦積み! 25

IY,21,1,620004915,1,,11,,,,,,,1,1,1,1,1,1,5… IY,,1,620003619,1,,11,,,,,,,1,1,1,1,1,1,5… IY,,1,620000167,1,,11,,,,,,,1,1,1,1,1,1,5…

1日の情報

2日の情報

3日の情報

実施日 医療行為 数 2014/04/01 620004915 1 2014/04/02 620004915 1 2014/04/03 620004915 1

… 620004915 … 2014/04/07 620004915 5

Page 26: tokyowebmining36th 国立病院機構における診療情報分析

成形しよう! だんだん集計できそうになってきたけど…

• 集計の単位は何? –のべ人月? –ユニーク患者数?

• 医療者が知りたいのは症例数

–発症/治療開始~治癒/治療終了 –便宜上、入院~退院

26

Page 27: tokyowebmining36th 国立病院機構における診療情報分析

成形しよう! 1入院1レコード化

入退院日を抽出してソート

27

RE,1,1115,42604,国病太郎,1,358311,,4260225,… … CO,90,1,840000013,260301 CO,,1,840000014,260305

病院ID 患者ID 入院日 退院日 123456789 000000123 2014/02/25 2014/03/01 123456789 000000123 2014/03/05 NULL 123456789 000000246 2014/03/01 2014/03/04 123456789 000000482 2014/03/05 2014/03/07

和暦→西暦へ

Page 28: tokyowebmining36th 国立病院機構における診療情報分析

レセプトデータとの戦い 1. 請求用コード

–体系的なコードに変換しよう!

2. 行列ではないCSV –成形しよう!

3. 審査の都合で… –どうしよう!

28

Page 29: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! 病名の記載多すぎ

• 病名/医療行為の整合性審査 –その病名の患者にそれをすべきだったか?

• 病名別 入院患者数 上位

–高血圧症 –高脂血症 –糖尿病 –便秘症 –不眠症

29

これらの治療のための 入院ではないはず!

Page 30: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! 主傷病欄は助けてくれない

• あることにはある『主傷病』欄

–1つも主傷病を持たない患者 –何十個も主傷病を持つ患者

別に重みづけは審査に関係ないし… 30

オンライン又は光ディスク等による請求に係る記録条件仕様(医科用)より抜粋

Page 31: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! どうしよう

お医者さんに聞きました 『メインの病名から順に書くよ』 • 一番上の病名を暫定主病名とする

#発症順に書いてる人もいるよなー • 機械学習する?

–医療行為+記載病名 31

Page 32: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! 主病名が選べても…

• 様々な患者状態像 –重症/軽症 –初期/末期 –急性期/慢性期 –一時的/永続的 –初発/再発 –手術あり/なし –合併症あり/なし

32

混ぜたら 比較出来ない

Page 33: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! 解決策1 丁寧な患者抽出ロジックで集団を捕捉

• 学会の治療ガイドライン • 専門医の知見

–重症/軽症 •この病気の重症者に投与される注射薬は?

–急性期/慢性期 •この病気で手術ありということは急性期?

33

Page 34: tokyowebmining36th 国立病院機構における診療情報分析

どうしよう! 解決策2 診断群分類でグループ化

• 診断群分類 –メインの病名と手術・処置の組合せ

入院患者を重複なく1,500種+に分類

34

胃がん

手術なし 処置なし

合併症なし

合併症あり 処置あり

手術あり 処置なし

プレゼンター
プレゼンテーションのノート
診断群分類(DPC)電子点数表について: http://www.mhlw.go.jp/topics/2012/03/tp0305-02.html
Page 35: tokyowebmining36th 国立病院機構における診療情報分析

3. 処理によって得られた効果 戦いの果てに…

35

Page 36: tokyowebmining36th 国立病院機構における診療情報分析

コード変換、成形による効果 各種統計との比較

• DPC導入の影響評価に関する調査 –国病以外の病院との比較

• 国勢調査/患者調査 –地域の推計患者数

• 将来推計人口 –将来推計患者数

36

平成24年度 診療機能分析レポートより抜粋 推計患者数におけるシェア

プレゼンター
プレゼンテーションのノート
国立病院機構 診療機能分析レポート: http://www.hosp.go.jp/treatment/treatment_repo.html 厚生労働省 DPC導入の影響評価に関する調査:集計結果: http://www.mhlw.go.jp/bunya/iryouhoken/database/sinryo/dpc_b.html#link02 厚生労働省 患者調査: http://www.e-stat.go.jp/SG1/estat/GL08020101.do?_toGL08020101_&tstatCode=000001031167&requestSender=dsearch 総務省 国勢調査: http://www.e-stat.go.jp/SG1/estat/GL02100104.do?tocd=00200521 国立社会保障・人口問題研究所 将来推計人口 : http://www.ipss.go.jp/syoushika/tohkei/Mainmenu.asp
Page 37: tokyowebmining36th 国立病院機構における診療情報分析

丁寧な抽出ロジックによる効果 病院横断的比較

• 臨床評価指標 –医療の質を定量的に評価

37

平成24年度医療の質の評価・公表推進事業に おける臨床評価指標より抜粋

プレゼンター
プレゼンテーションのノート
国立病院機構 臨床評価指標: http://www.hosp.go.jp/treatment/treatment_rinsyo.html 国立病院機構臨床評価指標計測マニュアル: http://www.hosp.go.jp/treatment/nw1-0_000043.html
Page 38: tokyowebmining36th 国立病院機構における診療情報分析

終わりに データとの戦いは続く

• データの二次利用 = ゴミ箱あさり –綺麗なゴミを捨てて下さいとは言えず…

• ゴミの山 = 宝の山 –磨けば光ると信じて

• JSON化+Riak実験中 – GitHub kuenishi/meddatum/src/rezept_parser.erl

38

プレゼンター
プレゼンテーションのノート
kuenishi/meddatum: https://github.com/kuenishi/meddatum
Page 39: tokyowebmining36th 国立病院機構における診療情報分析

ありがとうございました

39