本文へジャンプ

Open Middleware Report Web

Hitachi

【ためずに処理するのがストリームデータ処理だよ!】

今回のテーマは「ストリームデータ処理」です!
横山先生、池永先生、はじめまして!
今日はよろしくお願いします。

みどるちゃん

こんにちは、みどるちゃん。

横山先生

よろしくね。
あら、みどるちゃんってホントにかわいいのね。

池永先生

やだ、そんなこと言われたらテレちゃいます…
えっと、さっそくですが先生、ストリームデータ処理ってなんですか?

みどるちゃん

簡単に言うと、「データをためずに、その場でササッと処理しちゃうデータベース技術」のことだよ。

横山先生

え、データをためなくてもいいんですか!?
前にお話を聞いた時は、たくさん蓄積したデータが壊れないよう、しっかり守りながら、いろんな検索とか分析をするのがデータベースのお仕事だったような気がするけど…

みどるちゃん

確かにリレーショナルデータベース(RDB)はそうね。
たくさんの情報を大きなデータベースにためておいて、後で一度に集計/分析するという考え方。そこで使われるデータは、商品の売上情報や銀行の口座情報、自治体の住民情報といった記録されているデータだけど、ストリームデータは、それらとはちょっと種類が違うの。

池永先生

えっ、どんなデータなんですか?

みどるちゃん

「無限に到来する時刻順のデータ」って言えばいいのかな。
たとえば、常に変動し続ける気温や道路の交通状況、WebへのアクセスやPC操作のログ情報、レジのPOS情報、生産/物流ラインや環境計測などのセンサー情報などがそうだね。
これらのデータは常に僕らの身近にあるものだけど、データを蓄積してないものがほとんどだ。
ストリームデータ処理は、こうした時々刻々と発生するデータに、あらかじめ用意しておいた分析シナリオをあてはめて、「いま」の状況を瞬時に、リアルタイムに分析していく。
これがデータをためるRDBとの大きな違いなんだよ。

横山先生

つまり、「いま起きていることを、すぐに知りたい。
それに合わせてすばやくアクションを起こしたい」というニーズに応えるためのものなの。

池永先生

なるほど、リアルタイムに分析していくためデータをためないんですね。

みどるちゃん

"生けす"と"川"の違いにたとえるとわかりやすいかもしれない。
RDBっていうのは大きな生けすで、そこに取った魚をたくさん泳がしておいて、必要な時に網ですくう。
一方のストリームデータ処理は、流れる川の中を泳いでいる魚を、あらかじめ張っておいた網で必要な分だけすくい上げる。

横山先生

漁師料理…、なんとなくわかってきました!

みどるちゃん

これまでのデータ処理というのは、「この瞬間、このクルマはこの位置にいました」というようにある瞬間の"点"のデータを対象にしていたんだ。でもストリームデータ処理は、ある一定の時間枠の中で集めたデータを分析して、点ではなく"軌跡"を見ることもできる。
時系列で見るから「このクルマは、この時間内でどこからどこへ移動したのか」といった動きがわかるんだ。
同じように、温度や振動、圧力といったセンサーデータなら、一定時間の動きが"波形"で把握できるから、その波形を分析すれば、いつもと違う予兆を捉えて、事前にトラブルが起きるんじゃないかといった予測もたてられる。

横山先生

なんだかよくわからないけど、すごそう!

みどるちゃん

もともとストリームデータ処理は、2002年からアメリカの大学で研究が始まった技術で、日立も当初から研究員を派遣して、一緒に研究を進めていったんだ。
先輩たちは、これは将来きっとすごいことができる技術になると予想していたんだろうね。
そして2008年、その研究成果を活かして開発したのが、ストリームデータ処理基盤「uCosminexus Stream Data Platform」という製品なんだ。

横山先生

製品化した当時は、まだビッグデータの"ビ"の字もなかった時代。
お客さまに提案しても「なんですかそれ?」「確かにスゴイけど、ウチの業務には関係ないです」っていう対応ばかりされたそうよ。
でも、ここ何年かのビッグデータの追い風もあって、ようやくその秘めた能力や可能性の高さに注目が集まってきたの。

池永先生

ストリームデータ処理は"未来"のデータ技術だったんですね!

みどるちゃん

発生し続ける情報から「いまを見える化」できるという意味で、とても先進的だと思うわ。
ただ、ビッグデータを活用するには、リアルタイムに処理する以外にも、大量のデータをきっちり蓄積すること、蓄積したデータを分析することといった、他の用途も必要になってくるの。
だから、それぞれの用途に応じて必要な機能が違ってくるから、この前に紹介した「すごく速いRDB」なら、蓄積したデータの分析にぴったりというわけ。
日立はさまざまなニーズに対応したミドルウェアを用意しているから、それらを組み合わせて、お客さまからのどんな要求にも応えることができるの。

池永先生

ゴルフと一緒だね。
飛ばしたいならドライバー、寄せたいならウェッジ、カップに入れる際はパターといったように、目的に合った道具をうまく使いこなすことが勝利への近道ということさ。

横山先生

ゴルフはやったことないからよくわからないけど…
上手にミドルウェアを使うことが大切だということですね!

みどるちゃん

そうそう、さすが、みどるちゃん。
じゃあ実際どんな仕事でストリームデータ処理が活用できるのか、説明していこうか。

横山先生

はい!

みどるちゃん

3ページ中1ページ