社内外の多種多様な収集データを利活用する際には、
利活用できる形にデータを加工する準備作業(前処理作業)が必要です。
本作業はデータ利活用プロセスの約80%の工数を占めるといわれています。
日立のData Preparation Serviceは、データの特徴をAIで解析し、
データ加工方法の検討と検討内容を実装した前処理ロジックの検証を支援します。
属人的であったデータ前処理作業の負荷を軽減し、本来時間と工数をかけるべき
分析作業に注力することが可能となり、お客さまのデータ利活用を促進します。
お客さまのデータ利活用の促進と
デジタルトランスフォーメーションの
加速を支援
データの仕様や品質をAIで解析し、項目名や外れ値、データ間の関連性などデータの理解を支援します。手作業による確認作業の負荷を軽減します。
定義済みの標準的な加工方法(前処理ロジック)に加え、有識者の加工ノウハウを登録して共有する機能やコーディングレスな画面操作により、クレンジングや統合などの加工方法の検討・検証を効率化します。属人的かつ実装スキルを伴うデータ加工方法の検討・検証作業の負荷を軽減します。
検証したデータ加工方法をお客さま任意のETLツールに連携できます。データ理解からデータ加工方法の検証、実運用までをシームレスにつなぎ、お客さまのデータ利活用を促進します。
スムーズなデータ前処理作業で、お客さまのデータ利活用を促進
店舗内データや工場機器などから収集するIoTデータは大量かつ多様であり、利活用するためのデータ前処理作業に大幅な時間を要する場合があります。本サービスにより想定外のデータを検出し、前処理ロジックの検討を支援することで、前処理作業の負荷を軽減でき、本来時間をかけるべきデータ分析作業に注力することが可能です。
購買実績や利用実績など蓄積したデータを利活用したい場合、異常値が含まれていると、求めていた結果が得られない場合があります。本サービスにより紛れ込んでいる異常値を検出し、蓄積データの品質を向上させてから利活用することで、購買予測によるビジネス拡大や工場機器の故障検知による損失防止など、より精度の高い利活用結果につながります。
データレイクは、さまざまなシステムから多種多様なデータが保存されています。どのようなデータが保存されているかを分かりやすくするためには、内容の整理整頓が必要になります。データレイクに保存されているデータを解析することで、それぞれの属性情報が抽出できるため、データカタログとして分かりやすく整備できます。