本文へジャンプ

Open Middleware Report Web

Hitachi

【基幹系と情報系、そしてデータマートのお話】

今回のテーマは「リレーショナルデータベース(その2)」です!
石川先生、長江先生、前回に引き続き、よろしくおねがいします!

みどるちゃん

よろしくね。

長江先生

よろしくね、みどるちゃん。
前回のRDBの話はちゃんと覚えてるかな?

石川先生

はい!もちろんです!
難しそうだったRDBのことがわかってスッキリしました!
先生、今回は「すごいRDB」の話を聞かせてもらえるということで、とても楽しみにしてました。

みどるちゃん

そう、今回は「すごく速いRDB」のお話よ。

長江先生

今までの100倍※1

※1 自社従来製品比。

石川先生

100倍!
私の歩く速さが時速2キロだから、10倍で20キロ、100倍なら200キロ!
私が新幹線みたいに速く走れるってこと?

みどるちゃん

たとえがちょっと違う気がするけど、まあ、そのくらいインパクトがあると考えてもらってもいいよ。
去年の6月に日立が製品化した高速データアクセス基盤「Hitachi Advanced Data Binder プラットフォーム※2」、略してHADBっていうのに入っている超高速データベースエンジンが、その速いRDBなんだ。
これは企業の情報系システム向けの新しいデータベースエンジンとして作られたものなんだよ。

※2 内閣府の最先端研究開発支援プログラム「超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価」(中心研究者:喜連川 東大教授/国立情報学研究所所長)の成果を利用。

石川先生

じょうほうけい…って?
先生!

みどるちゃん

あらいやだ、また難しい言葉が出てきちゃったわね。
でもとっても大事なことだから、これは覚えてほしいの。
えーと、企業が使う情報システムは一般的に「基幹系」と「情報系」という2つに分けられるの。

長江先生

そうそう。
代表的な例で考えてみようか。
基幹系っていうのは企業が製造・販売する商品やサービスの流れ、そのために必要な材料の準備、社員の情報などを管理するシステム。
そして情報系は、基幹系で処理されたデータを時系列に集めて、いろいろな角度から分析することで商品やサービスあるいは作業効率の改善や、売上の拡大に役立てるためのシステムなんだ。

石川先生

うーん…

みどるちゃん

もっと簡単に言うと、現在の仕事をきっちり進めるためのシステムが基幹系。
現在の仕事をよりよく改善するためのシステムが情報系ね。

長江先生

さすが相棒、まさにそのとおり!

石川先生

先生たち、あいかわらず息がピッタリですね。

みどるちゃん

そのため基幹系からは毎日たくさんのデータが情報系に渡され、ため込まれていく。
たとえば、基幹系の情報を分析することで、これからの経営方針や営業アクションをどうするか、どんな商品を開発したら売れるのかといった判断材料を見つけるためにね。
でもね、情報系では基幹系のデータの中身をそのまま分析しているわけではないんだ。
多くの場合は、まず情報系システムの中核にある「セントラル・データウェアハウス」という"大箱"に、基幹系システムのデータを日々ためていく。
そしてそれを経営者や開発部門、マーケティング部門が必要とするデータだけを"小箱"である「データマート」として切り出していくんだ。
このデータマートが、経営現場などで判断材料として分析するデータベースとなるわけ。

石川先生

データマートの小箱には何が入っているんですか?

みどるちゃん

たとえば商品の売上情報であれば、商品別の売上明細を日別・週別・月別、商品別、担当者別・グループ別・支店別といった形に切り出して、あらかじめ集計したものが「データマート」になるの。

長江先生

はたらくミドルウェア

どうして、あらかじめそんな面倒なことをするの?

みどるちゃん

データベースエンジンの処理スピードが、データ量の増大に追いつかないからだよ。
"大箱"である「セントラル・データウェアハウス」に日々ためられていく生データ、たとえば商品の売上明細データなんかをそのまま分析しようとすると、あまりにデータ量が大きすぎて、見たい結果を出すまでに、数時間から数日もかかってしまう。
だから「この部分は判断に関係ないから(たぶん)いらないでしょ」「これは1年前のデータだから(たぶん)必要ないでしょ」というように、データを削ぎ落として、すばやく結果を得るために「データマート」を作るんだよ。

石川先生

社内には、それぞれいろんな切り口でデータを分析したりレポートを作成したりしたい人がいるの。
だから情報システム部門では、あらかじめ想定した複数の切り口で、データマートを作る必要があるのだけど、その作成時間がデータマートの数に比例して増大してしまうという悩みがあるの。
一般的には、基幹系の業務が終了した後、そのデータをもとに翌日用のデータマートを何個も作り始めるから、朝までかかっても追いつかないことがあるほどね。

長江先生

それじゃ、いつまでたっても分析できないんじゃ…

みどるちゃん

実際そういう悩みもたくさんあるね。だから「一応、結果は出たけどサンプル数が少なすぎて判断のふんぎりがつかない。
ここは一発、勘と経験と度胸でいくか!」みたいに、勢いに任せて日々決定を下してしまう職場も少なくないんだ。

石川先生

その方がよさそうです。

みどるちゃん

本当にそうかしら?
当たればいいけど、外れてしまったら大変でしょ。
経営判断のミスが重なると、経営そのものが傾いてしまうわ。
根拠に基づいた判断にするためにも、データをきちんと活用すべきなのよ。

長江先生

でも、分析までに時間がかかってしまうんでしょ。
どうすれば…

みどるちゃん

そこで最初に出てきた100倍速いデータベースエンジンの出番となるわけ!
あー、前置きが長かった。

石川先生

あっ、忘れてた。
100倍速いデータベースエンジン…

みどるちゃん

3ページ中1ページ