ページの本文へ

Hitachi

エンタープライズ アプリケーションサービス

AIを活用し、データ分析・利活用の準備作業を効率化 Data Preparation Service

社内外の多種多様な収集データを利活用する際には、
利活用できる形にデータを加工する準備作業(前処理作業)が必要です。
本作業はデータ利活用プロセスの約80%の工数を占めるといわれています。

日立のData Preparation Serviceは、データの特徴をAIで解析し、
データ加工方法の検討と検討内容を実装した前処理ロジックの検証を支援します。
属人的であったデータ前処理作業の負荷を軽減し、本来時間と工数をかけるべき
分析作業に注力することが可能となり、お客さまのデータ利活用を促進します。

[Data Preparation Serviceの概要]データの特徴をAIが解析(効果:データ理解における解析作業負荷を軽減)→データの加工方法(ロジック)の共有・選択(効果:ロジックの検討・実装の効率を向上)→高品質なデータを効率的に準備

↓

お客さまのデータ利活用の促進と
デジタルトランスフォーメーションの
加速を支援

Data Preparation Service の特長

AIによるデータ理解の支援

AIでデータ理解を支援

データの仕様や品質をAIで解析し、項目名や外れ値、データ間の関連性などデータの理解を支援します。手作業による確認作業の負荷を軽減します。

  • データ項目名をAIで推定
  • データ間の関連性をリコメンド
  • データプロファイリングにより、
    外れ値や形式不統一なデータなどをグラフで可視化

データ参照から前処理ロジックの検討・検証に至るノウハウの共有による検討・検証作業の効率化

加工方法の検討・検証を支援

定義済みの標準的な加工方法(前処理ロジック)に加え、有識者の加工ノウハウを登録して共有する機能やコーディングレスな画面操作により、クレンジングや統合などの加工方法の検討・検証を効率化します。属人的かつ実装スキルを伴うデータ加工方法の検討・検証作業の負荷を軽減します。

Data Preparation ServiceとETLツールの連携

ETLツールに連携

検証したデータ加工方法をお客さま任意のETLツールに連携できます。データ理解からデータ加工方法の検証、実運用までをシームレスにつなぎ、お客さまのデータ利活用を促進します。

スムーズなデータ前処理作業で、お客さまのデータ利活用を促進

データ利活用の流れの説明。データの前処理:[データの理解]従来はヒアリングや調査など手作業によりデータを解析。Data Preparation Serviceの利用では、AIでデータ理解を支援(項目推定、プロファイリング、関連性分析)。→[データ加工方法の検討と検証(仮説と検証のサイクル)]従来はデータ加工方法を属人的に実装して検証。Data Preparation Serviceの利用では、加工方法の検討・検証を支援(標準的な加工方法の提供(クレンジング/統合)、独自加工方法の追加登録(ノウハウ共有))。→[実装]従来は検証した加工方法をETLツールに実装。Data Preparation Serviceの利用では、検証した加工方法をETLツールに連携(加工方法をエクスポート)。→[データ加工実行]従来は実装した加工方法を用いてETLツールでデータを加工。Data Preparation Serviceの利用では、連携したETLツールでデータを加工。Data Preparation Serviceは、データの理解から実装までわかりやすい画面でシームレスにつなぐ。⇒データレイク(従来の方法では人により品質にばらつきが出る。Data Preparation Serviceの利用で、データレイクの品質向上を支援。)⇒データ分析・利活用(Data Preparation Serviceの利用で、データ分析への注力を促進。)⇒データ分析・利活用の結果をデータにフィードバック

Data Preparation Serviceが
実現すること ―ユースケース―

利活用するIoTデータの前処理時間を短縮したい

店舗内データや工場機器などから収集するIoTデータは大量かつ多様であり、利活用するためのデータ前処理作業に大幅な時間を要する場合があります。本サービスにより想定外のデータを検出し、前処理ロジックの検討を支援することで、前処理作業の負荷を軽減でき、本来時間をかけるべきデータ分析作業に注力することが可能です。

AIによるデータ解析で想定外のデータを検出。→前処理ロジックを検討(データの変換、フォーマットの統一、不要なデータを取り除くなど)。Data Preparation Serviceの利用により、データ準備作業の負荷が軽減し、データ分析作業に注力できます。

利活用結果の精度を向上したい

購買実績や利用実績など蓄積したデータを利活用したい場合、異常値が含まれていると、求めていた結果が得られない場合があります。本サービスにより紛れ込んでいる異常値を検出し、蓄積データの品質を向上させてから利活用することで、購買予測によるビジネス拡大や工場機器の故障検知による損失防止など、より精度の高い利活用結果につながります。

AIが異常値を検出。→異常値を含むデータの適切な処理を検討。Data Preparation Serviceがデータの品質向上を支援し、より精度の高い利活用結果につながります。

データレイクの内容をわかりやすく整備したい

データレイクは、さまざまなシステムから多種多様なデータが保存されています。どのようなデータが保存されているかをわかりやすくするためには、内容の整理整頓が必要になります。データレイクに保存されているデータを解析することで、それぞれの属性情報が抽出できるため、データカタログとしてわかりやすく整備できます。

データレイクに保存されているデータを解析し、データの属性情報を抽出。→データカタログとして整備。Data Preparation Serviceが、保存されているデータをわかりやすく整備します。

サービスの仕様は、改良のため予告なく変更することがあります。
ページの先頭へ