ページの本文へ

Hitachi

画像 石井一夫特任教授 プロフィールはこちら

高性能なハードウェアや複雑なソフトウェアといった最先端技術を結集して実現するビッグデータ活用において、実は今、最も不足しているのはそのリテラシーを有する"人材"だと語る東京農工大学の石井一夫氏。そんな問題意識から「ビッグデータ活用実務フォーラム」を設立し、専門であるゲノム研究の傍ら、データサイエンティストの育成に力を注いでいる石井氏に、近年、特に社会的な関心が高まっており、氏も深く関わる医療分野でのビッグデータ活用の取り組みなどについて伺ったお話を3回にわたってご紹介します。

価値を導き出す"データサイエンティスト"を育てるために

現在、世界で最も注目を集める職業とも言われるデータサイエンティストは、ビッグデータから価値のある知見を導き出す専門家です。すでに日本の企業でもデータを収集・分析して予測モデルをつくるデータサイエンティストが活躍し始めています。また、ビッグデータや統計解析に関する勉強会や講習会は軒並み盛況で、データサイエンス分野への人々の関心も大きな高まりを見せています。

写真

しかし一方で、日本におけるデータサイエンティストの数はまだ圧倒的に不足しており、その育成のための仕組みや機会もおよそ十分とは言えないのが現状です。昨年6月、私が「ビッグデータ活用実務フォーラム」を設立したのは、こうした状況を少しでも改善することで一人でも多くのデータサイエンティストを育成し、さらなるビッグデータ活用を促進させたいと思ったからです。

若きデータサイエンティストやデータサイエンティストをめざす学生、さらにさまざまな分野の若手技術者、研究者を対象とするこのフォーラムでは、従来の学会よりも自由でオープンな活動を通じて、これまで十分とは言えなかった、ビジネスや研究の現場でのビッグデータ活用に関する情報交換、情報共有、情報発信の場を提供しています。実は、このフォーラムの参加者は、研究者だけでなく一般企業に属する方も多く、しかも20〜30代の若い方が目立ちます。このことからも、いま幅広い分野でデータサイエンティストの育成が求められていることが伺えます。

それは、世界を根底から変え続けるイノベーション

マスコミでも毎日のように目にするほどの注目度や、あまりの関心の高さから、「ビッグデータ」という単語を"バズワード※"と捉えている方もいらっしゃるかもしれません。けれど、「ビッグデータ」をただの流行と捉えるのは表層的な見方だと言わざるを得ません。

ビッグデータ活用のそもそもの発端は1990年代後半からGoogleが開発と実用化に着手し、2004年前後に論文として公開した、NoSQLとも言われる列指向型データベース「BigTable」、分散ファイルシステム「Google File System」、分散型並列処理システム「MapReduce」などの画期的な技術革新にあります。従来のリレーショナルデータベースでは処理できない膨大なデータの取り扱いを可能にしたこれらのテクノロジーによってGoogle創業者のセルゲイ・ブリンとラリー・ペイジは、インターネットを通じて文字通り世界を根底から変えるイノベーションを起こしました。

写真

私たちの生活はもはや「検索」抜きでは考えられず、その膨大な「検索」情報をもとに新しいサービスやビジネスが日々生み出されます。その影響力はビジネス領域に留まらず、オバマ大統領が選挙の際に各州の有権者データを分析したり、選挙結果をシミュレートしたりするなど、再選の原動力になったりします。すなわち、ビッグデータは単なるバズワードなどではなく、暮らし、ビジネス、さらには世界を変えるイノベーションと呼ぶに値するものです。

今から10年以上も前に始まったそのイノベーションは、今日もとどまることなく世界を変え続けています。その登場の前後で、私たちの生活や価値観、世界観は根底から変わったといえるでしょう。

※説得力があるようで、実際には具体性に欠け明確な合意や定義のないキーワード

生活の質を大きく向上させるビッグデータ

ビジネスパーソンの皆さんが「ビッグデータ」という言葉から真っ先に思い浮かべるのは、前述したウェブログ解析や、広告サイトでのレコメンデーション機能といったものかもしれません。一方で、ビッグデータの活用領域はビジネスの領域からその他の分野へ、より高次でインフラ的な分野へと確実に広がりつつあり、これもまたビッグデータが単なる一過性のブームではないことを裏づけています。

例えばすでに、天体物理学や高エネルギー物理学といった極めて専門性の高い学究領域でも、ビッグデータ活用が大きな成果を上げつつありますが、特に、私の専門分野である医療、農業、環境分野でも今後の展開が非常に注目されています。

農業分野ではイネなど農産物の新品種の開発に遺伝子情報を生かす「ゲノム育種」という研究が進んでいたり、環境分野でも土壌の中の環境微生物を数万、数億という単位で丸ごと分析して、環境汚染の状況を正確に把握したり、生物の分類・分布に関する膨大なデータを分析して生態系の状態を調査する「環境アセスメント」などの取り組みも進んでいます。

また、とりわけ多くの人々が関心を寄せているのが、医療分野におけるビッグデータ活用です。ビッグデータとその活用は、これまでの医療のあり方を根底 から変革しようとしており、その計り知れない成果が人々の"Quality of Life"を格段に向上させることは間違いないでしょう。

写真

そして、現在すでにスタートしているのが、ゲノム解析に基づく患者さん一人ひとりに対する「個別化医療」です。個別化医療では、血圧や血糖値、その他の生化学的な指標に基づく従来の医療に比べて段違いにきめ細やかな、いわばオーダーメイドの医療を提供できるようになります。遺伝子レベルでその人の健康状態を極めて高精度に診断したり、将来患う可能性の高い疾患を予測したりすることが可能になります。

その具体例のひとつが、世界的な注目を集めた米国の女優アンジェリーナ・ジョリーさんの決断です。彼女は将来、乳がんになるリスクが高いという遺伝子検査の結果を受けて、乳房の切除手術を受けています。

ほかにも、ゲノム解析の結果をもとにより効果の高い薬を開発する創薬の領域や、数多くの人々を対象に長期にわたって健康追跡調査を行い、体質や生活習慣、環境と、疾病の関係性を解明しようという「コホート調査」など、医療分野におけるビッグデータ活用は、その応用範囲を広げながら、今後ますます本格化していくことでしょう。

さらなるビッグデータ活用の鍵は人材育成にあり

写真

ただし、こうした医療の領域は人の生命に関わる、いわば"ミッションクリティカル"なフィールドです。決してミスが許されない領域だからこそ、この分野におけるビッグデータ活用には大きな責任が伴うと私は考えています。

そういう意味でも、今後ビッグデータ活用の可能性をさらに広げていくための最重要課題は、人材育成にほかなりません。なぜなら、ビッグデータ活用に必要不可欠となる統計学や解析学、また、その基盤となる線形代数や微分積分は、ゆとりの教育の中で最もないがしろにされてきた分野で、最初にお話しした通り、これらを駆使して活躍できるデータサイエンティストの数は、まだまだ圧倒的に不足しているからです。

例えば自然科学の分野でも医学や薬学、農学といった領域は、これまで化学を基盤に発達してきた歴史があり、研究の最前線に立つ人々であっても、情報科学や数理科学に関しては非常に弱いのが現状です。また最近まで、統計学を基盤を行う研究の重要性は、残念ながら一部の方を除いて一般的に認知されていなかったのです。

しかしこのままでは、たとえビッグデータという宝の山が与えられたとしても、それを使いこなす能力がないがために、文字通り宝の持ち腐れになってしまう。あるいは、統計学のリテラシーがないために、誤った結論を導き出してしまう可能性すらあります。

だからこそ、各領域の専門知識だけでなく、情報や統計、データ分析などのリテラシーも備えたデータサイエンティストを育成していくことは、ビジネスも学究領域も含めたあらゆるフィールドで日本全体を底上げしていくための最重要課題なのです。

プロフィール

石井 一夫(いしい かずお)

東京農工大学農学府農学部農学系ゲノム科学人材育成プログラム特任教授。ゲノム研究者としての実務家の視点から、ビッグデータ活用のあるべき姿を追求するために「ビッグデータ活用実務フォーラム」を2013年6月に設立。さまざまな現場でのビッグデータ活用に関する情報の交換・共有・発信の場を提供することを通じて、若手データサイエンティストの人材育成に取り組んでいる。

オススメ記事