ページの本文へ

Hitachi

OSS(オープンソース・ソフトウェア)

Cloudera社

Clouderaは、クラウドに最適化された、機械学習と分析のための最新のプラットフォームを提供する会社です。 本コラムではClouderaがお客様のビジネス拡大を支援するために提供するデータ基盤の必要性やその容易な運用管理を実現するツールとサービス、お客様の成功事例などについてご紹介します。

第2回 ビッグデータがもたらす新しいビジネス機会

前回はClouderaの強みとご提供する価値をご紹介しました。今回はその強みがどのようにビジネスにつながるのかをご説明します。

「迅速な意思決定」がビジネス成功の鍵

ビジネスの成功の鍵の一つは「迅速な意思決定」と言われています。従来は個人的な勘や経験に基づいて行われていた意思決定を、より正確で誰もが納得のいく明確で客観的なデータに基づいて行うために、多くの企業ではBIツールを活用したり、ダッシュボードによる可視化を行なったりしています。

一方で近年のデジタル化、IoT、モバイルデバイスの浸透により活用できるデータが質・量ともに爆発的に増えています。従来のデータ(売上、顧客情報、サポート情報など)の他に、RFIDやセンサーの普及による商品状況の情報、webやSNS上の顧客の行動や声、天候や地図などのサードパーティ情報などを組み合わせて活用することで新たなビジネスを創出することも可能となりました。よく知られている例ですが、購入履歴とウェブの閲覧履歴というまったく異なる種類のデータを突き合わせることでユーザーの趣向を理解し、その顧客に適切な商品をレコメンドするなどです。

ビッグデータ活用をめぐる課題

ところがそうした大量のデータを活用しようとすると、従来のデータ格納インフラストラクチャーでは十分な対応が難しくなってきます。データ量の増加に応じたストレージの拡張をタイムリーに行えなかったり、膨大なコストがかかったりするために、テープなどに古いデータをアーカイブする、あるいは保存しきれないデータを捨てる、などなんとか保存容量を保つ必要があります。その結果、例えば長期間にわたる顧客行動の傾向を知りたいのに昔のデータがない、あるいはアーカイブから復元するのに時間がかかる、などの課題が生じています。

またデータは種類やアプリケーションによって異なるデータベースに格納されています。例えば、購入履歴と閲覧履歴の情報は異なる部署、異なるデータベースに保存されています。このようにデータがサイロ化してしまうと、新しいビジネスにつながるインサイトを得ることが難しい状況です。

さらにデータ活用までのスピードの課題があります。データにも「鮮度」がありますが、データを入手してから加工しインサイトが得られる状態になるまでに何日も、時には何週間も時間がかかるケースはめずらしくありません。

データを活用して成功している多くの企業は、質の異なる大量のデータ(構造化、半構造化、非構造化)を格納できるプラットフォームの構築、すなわちデータ基盤のモダナイズを行なっています。そしてここが、Clouderaがお手伝いをできるところです。

前回ご紹介しましたように、Clouderaのデータ基盤は拡張が簡単で、データレイクと呼ばれる大規模なデータ基盤を簡単に構築できます。また、様々なデータをセキュリティやコンプライアンスの面から一元的に把握することでサイロ化の問題を回避することができます。そのため多くの先進企業に採用されています。

ではこのモダナイズされたデータ基盤の活用を通じて成功した企業はどういったことを行なっているのでしょうか?

「可視化」の先にあるビジネスイノベーション

そもそもデータ活用の目的は、さまざまなデータを組み合わせて分析することで、過去の失敗の原因や成功要因などの規則性(インサイト)を見つけ出し、同じ失敗を繰り返さない、あるいは成功事例を繰り返すことにあります。従来は人手で行なっていたこうした作業も、扱うデータ量や種類が増えすぎてしまうと組み合わせが無限大になり、人の手による分析が不可能となります。そこで機械学習を使うことで大量のデータの中から規則性を見つけ出し、その規則性に基づいた将来の予測を行うのです。いくつか具体的な事例をご紹介いたします。

(1)製造業における事例

露天掘り、および坑内掘り向け鉱山機器の製造・販売・サービスを提供するグローバル企業コマツマイニングは、1台のマシンに設定された数百〜数千の指標をもとに1分間に3~5万も生成されるデータを、機械学習を使って分析することで、マシンの稼働状況を完全に把握し、その結果システムの稼働率を2倍にまで向上させています。

(2)金融業界における事例

ニューヨーク証券取引所では、市場監視機能を強化し取引会員のコンプライアンス対応状況を確認するために、膨大な取引情報をリアルタイムに分析する必要がありました。データ量は20PBを超え、かつ毎日30TBのデータが追加されます。Clouderaのプラットフォーム上での機械学習による分析を通じてリアルタイムにインサイトを引き出すことに成功しています。

(3)通信における事例

NTTドコモの欧州活動拠点であるDOCOMO Digitalは、ビッグデータの処理とデータ分析、機械学習アルゴリズムを活用しています。その結果、モバイルコマースにおける不正行為検知能力の強化と、正確なA/Bテストによるコンバージョンレートの20%向上を実現しました。

まとめ

今回はビッグデータ活用にあたっての課題とその先にある成功事例をご紹介しました。多くの企業はまだ「現状の可視化」にとどまっている状態ではないでしょうか。ビッグデータは可視化のためだけでなく、新しいビジネスの創出につながる可能性を秘めています。そのためにもデータ基盤のモダナイズは必須と言えます。


コラム執筆者
Cloudera株式会社 マーケティング部