ページの本文へ

Hitachi

ビッグデータ×AI(人工知能)

‐お知らせ‐
医療系ビッグデータ解析システムにおける医療経済研究機構・東大生研とのオープンイノベーションの成果の紹介

2019年7月12日
株式会社日立製作所

‐お知らせ‐
医療系ビッグデータ解析システムにおける医療経済研究機構・東大生研とのオープンイノベーションの成果の紹介

研究者の知見を生かした多様な解析ツールの提供や膨大なレセプトデータの高速解析などにより利用者の利便性を向上し、医療研究の進展に寄与

株式会社日立製作所(以下、日立)は、一般財団法人 医療経済研究・社会保険福祉協会 医療経済研究機構(以下、医療経済研究機構)と東京大学生産技術研究所(以下、東大生研)とのオープンイノベーションの成果として、全国民のレセプト情報・特定健診等情報(以下、NDB*1データ)や自治体が保有する健診・医療・介護データといった医療系ビッグデータの活用を目的とする解析システム「超高速・超学際レセプト情報等ビッグデータ解析プラットフォームシステム(以下、SFINCS*2)」を構築・運用しています。2017年の稼働以来、医療系研究者の知見を取り込み多様な解析ツールを順次拡充したほか、SFINCSに蓄積された6年分の全国民のレセプトデータ(約2,000億レコード)全件の解析にかかる時間を、従来の日単位または時間単位から分単位または秒単位に短縮*3するなど、研究者のデータ解析における利便性を向上しています。これにより、従来は時間的制約により実現が困難であった悉皆調査*4や深掘り調査などが可能になり、例えば、生活習慣病の実態調査や地域の健診・医療・介護の横断的な調査など、健康長寿社会の実現に向けた医療研究の進展に寄与しています。今後も日立は、オープンな技術に基づくSFINCSのクラウドネイティブ*5化や、パーソナルデータの安全な利活用を促進する匿名加工処理の高速化技術の実装など、次世代NDBデータの研究基盤であるSFINCSの進化に尽力し、健康長寿社会の実現へ貢献していきます。

*1
NDB:National Database of Health Insurance Claims and Specific Health Checkups of Japan
*2
SFINCS:Super-Fast super-INterdisciplinary japanese medical insurance Claim bigdata analytics platform System
医療経済研究機構が2016年度に国立研究開発法人 日本医療研究開発機構から受託した「エビデンスの飛躍的創出を可能とする超高速・超学際次世代NDBデータ研究基盤構築に関する研究」の成果を利用
*3
2019年6月現在、SFINCSに蓄積されたNDBデータ(約2,000億レコード)全件の解析にかかる時間について、当社従来品と比較
*4
悉皆(しっかい)調査:調査探究対象を全て漏れなく、また重複することなく調査する方法
*5
クラウド利用を前提として設計されたシステムやサービス

日本政府により未来社会の姿として提唱されている「Society 5.0」を受け、ヘルスケア分野においては、治療から未病ケア・予防へのシフトなどが提案されています。NDBデータは、医療サービスの質の向上などをめざす公益性の高い研究において定量的・客観的なエビデンス創出に役立つデータとして注目されており、有識者会議による認可を受けた研究グループへの第三者提供が2013年度から開始されました。しかし、大規模かつ複雑なNDBデータを活用した先進的な研究を進めるにあたり、各研究者がデータ解析を行う上で時間と手間を要するという課題がありました。

まず、SFINCSは、将来にわたり活用され続けることを念頭に、オープンな技術に基づいたシステムとしました。汎用ハードウェアを用いるほか、解析ツール(SFINCS App)の開発には一般的なプログラミング技術や標準かつオープンな規格であるSQLを採用し、多くのITエンジニアがSFINCS Appを開発できるようにすることで、技術面だけでなく人材面からも将来にわたって容易に拡張できるシステムを実現しました。現在までに 20種類以上の解析ツールを整備しています。

研究者がNDBデータの解析を行う上で時間と手間がかかるという課題に対しては、データベースエンジンにHitachi Advanced Data Binder (以下、HADB) *6を採用することで、データの解析ごとに必要であった目的別のデータベース(データマート)の作成を不要としました。この結果、データの解析にかかっていた時間は分単位または秒単位まで大幅に短縮されました。加えて、複雑なNDBデータを解析する前の加工処理(データクレンジング)をSFINCS Appから使える共通機能として提供することで、すぐに解析が可能となりました。

*6
HADBは、内閣府の最先端研究開発支援プログラム「超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」(中心研究者:喜連川 東大教授/国立情報学研究所所長)の成果を利用

現在、SFINCSを核とした医療経済研究機構の研究プロジェクトには、15大学、6学会、60名を超える有識者が参加し、NDBデータを活用する研究が広がっています。例えば、全国の生活習慣病の診療実態の調査や、地域の健診・医療・介護の横断的な調査など研究の成果が出ています。また、医療行為などと認知症の進行度合いの関係性や、医療費と介護費の傾向や総費用の解析といった、健康長寿社会の実現に向けた先進的な研究も進んでいます。

今後日立は、東大生研とのオープンイノベーションの成果*7をもとに、SFINCSのクラウドネイティブ化や、プライバシー保護とデータの有用性を両立する匿名加工処理の高速化技術の実装に取り組むなど、SFINCSをヘルスケア分野でのビッグデータ活用プラットフォームとして進化させ、健康長寿社会の実現に貢献していきます。さらに、さまざまな分野でオープンイノベーションの取り組みを推進するとともにその成果を共有し、一人ひとりが生き生きと快適に暮らせる持続可能な社会の実現に努めていきます。

*7
内閣府 総合科学技術・イノベーション会議が主導する革新的研究開発推進プログラム(ImPACT)「社会リスクを低減する超ビッグデータプラットフォーム」

SFINCSの概要

図:SFINCSの概要

本システム(SFINCS)における現在までの主な成果

1.医療系研究者の知見を生かした20種類以上の解析ツールにより、容易なデータ解析を実現

多様な研究テーマを持つ医療系研究者の解析に関する要望を取り込みながらSFINCS Appを順次拡充し、現在20種類以上の解析ツールを提供しています。利用者はSFINCS App を活用し、NDBデータの構造やプログラムの知識がなくても画面操作により容易にデータを解析可能です。

2.全件解析にかかる時間を分単位または秒単位にまで大幅に短縮

研究者はNDBデータの解析をさまざまな視点で繰り返して研究を進める必要があり、解析時間の短縮が求められています。データマートが不要で大量データの高速処理に適したHADBの活用により、SFINCSに蓄積された6年分のNDBデータ (約2,000億レコード)全件の解析にかかる時間を、従来の日単位または時間単位から、分単位または秒単位にまで短縮しました。また、解析ツールごとのデータマートが必要ないことから、複数のツールを組み合わせた解析も短時間で処理できます。さらに、解析対象データが増大しても高速な解析処理を維持できるほか、新たな解析ツールなどを拡充する際にもデータマートの構築などが不要であり迅速にサービス提供することができます。

3.データクレンジングなど研究者が解析前に行なっていた作業を大幅に削減

ビッグデータの解析においては、実際の解析よりも、 データクレンジングなどの前処理に多くの時間を費やすことが課題となっています。NDBデータの研究においても、医科レセプトと調剤レセプトのつきあわせや治療期間の算出などデータクレンジングの手間が膨大であるという課題がありました。SFINCSでは、各種クレンジング手法をSFINCS Appから使える共通機能として実装しているため、利用者は解析前の準備にかかる作業を大幅に削減できます。

商標に関する表示

記載の会社名、製品名はそれぞれの会社の商標または登録商標です。

お問い合わせ先

株式会社日立製作所 サービスプラットフォーム事業本部 IoT・クラウドサービス事業部

お問い合わせフォーム
https://www.hitachi.co.jp/it-pf/inq/NR/

以上