※「株式会社リクルート キーマンズネット2007/06/26より転載」
DataStage Common Edition(ETLツール)![]() 日立製作所 |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() ![]() 掲載日:2007/06/26 |
![]() |
|
社内に散在する膨大なデータ。人手でさばくのは、もはや限界に…
近年、社内の各部門や業務システムごとに蓄積されているデータを、戦略的意思決定に活かそうとする動きが企業規模によらず広がってきている。
このため情報システム部門には毎日、経営幹部や業務の現場から、データを抽出・編集して非定型レポートにまとめて欲しいといった依頼が届く。だが、散在する膨大で多種多様なデータを手作業で統合するのは容易でない。そのため情報システム部員は連日、深夜までレポート作成に追われることもある。また、分散したシステム間の連携を行う際にも、データ連携が必要になるたびに連携プログラムが手作りされ、複雑に絡み合っている。場合によってはシステムごとに異なるデータベース(DB)が使用されていることもあり、データ活用やデータ連携のためのプログラム開発や、DBに関する高いスキルを持つ人材が不足しがちである。
こうしたことから、データ活用、データ連携を人手に頼って進めるには限界があると言えそうだ。
![]() ![]() |
情報活用の鍵を握るETLツール。そのリーダーがDataStage!
そこで、戦略的な情報活用成功へのソリューションとして注目されるのが、ETLツールを活用したデータ統合だ。ETLツールとは、散在するデータを抽出(Extract)、加工・編集(Transform)し、格納(Load)するソフトウェアであり、GUIでのビジュアル開発で生産性、保守性を向上する。これまで、データ統合ではこれら一連の処理の開発に多くの時間とコストを要した。つまり、ETLツールの導入は、データ統合を成功に導く鍵と言える。
現在、多くの企業で導入が進むETLツールの中で、最も実績があるのが「DataStage」。2006年度の市場シェアは37.8%(出典:富士キメラ総研・2007 パッケージソリューション・マーケティング便覧)で、2002年以降トップシェアを続けている。
従来、予算面からETLツールの導入を見送る企業も多かったが、日立では、豊富な機能はそのままに価格を抑えた「DataStage Common Edition」を提供し、中規模システムへの適用を後押ししている。
![]() ![]() DataStageはデータ統合のための情報資産管理基盤 |
高い生産性 |
分かりやすいビジュアルなジョブ開発で高い生産性を実現 |
DataStageが多くの企業で導入されている最大の理由は、ETL処理(データの抽出・変換・格納)のジョブ開発における高い生産性にある。多くの場合、手組み開発の数倍の生産性を実現できるという。分かりやすいビジュアル開発環境によりプログラムレスで開発できるため、開発期間を短縮できる。加えて、従来のプログラムやDBに関する高度なスキル習得に比べてDataStageのジョブ開発のスキル習得は易しいため、開発人員の確保が容易となる。
■GUIでのビジュアル開発
データ抽出・変換・集計などの機能があらかじめ部品として用意されている。この部品アイコンをドラッグ&ドロップでキャンバス画面に貼り付け、リンク線でつないでデータの流れをつくり、パラメータを設定することでジョブが開発できる(図)。これらは、すべてマウス操作だけで可能である。
■200以上の豊富な変換関数を標準提供
異種システム間のデータのマッチング、ソート、集計処理に加え、データ連結/分割、計算、日付変換、フォーマット編集など、データ変換用の関数も200以上と豊富に用意されている。そのため、複雑な加工処理もシンプルに設定でき、生産性を向上できる。
■各種文字コードセットをサポート
DataStageは、メインフレーム系、オープン系の各種文字コードセットの変換をサポートしている。また、外字がある場合も、文字コードセットのマップを拡張するインターフェースを標準提供しており、柔軟に対応することができる。
■データソース/ターゲットの幅広いサポート
HiRDB、DB2、Informix、Oracle、Microsoft SQL Server、Teradata、Sybaseなど、各種データベースに幅広く対応し、ODBCインターフェースもサポートしている。また、シーケンシャルファイルに加え、XMLファイルにも標準で対応している。
高い保守性 |
繰り返されるシステム変更・拡張にも高効率に対応 |
経営環境の変化に伴い、経営方針も進化していく。それを支える企業システムも変化に応じて進化・拡張を繰り返していく必要がある。このようなシステムの保守/拡張フェーズでの開発効率が高いこともDataStageの大きな特長である。
従来の手組み開発では、開発を行った本人以外によるプログラム修正は時間もかかりミスも多かった。だが、DataStageではデータ加工処理のフローがビジュアル化されるため、担当者が代わった場合でも処理内容が容易に理解でき、修正、変更の開発効率が向上する。また、DataStageがメタデータを一元管理しているため、修正、変更の影響分析を行うことができ、保守性/拡張性を大きく高めている。
更にDataStageは、開発したジョブのフロー図や仕様をまとめたHTML形式のジョブレポートを自動生成できるため、保守用ドキュメント作成の工数を大幅に削減できる。
日立の優位性 |
開発パートナーとしてのアドバンテージを発揮する日立 |
日立は1999年から開発・販売パートナーとして、DataStageの日本語化、品質テストで協力し、現在も開発元のIBM社と強固な協業体制を敷いている。販売面においても、国内におけるDataStageの半数以上が日立から提供されているという実績を持つ。
これは、日立にはDataStageエンジニアや、データ統合を支援するコンサルタントが多数おり、上流のコンサルティングからシステム設計、構築、運用にいたるまでの一貫したサービスを提供できる点が、多くのユーザに支持された結果と言える。また、長年培った豊富な製品知識に基づく正確で迅速なサポートサービスや、ユーザの状況と要望にあわせた各種コンサルティングサービスを提供しており、DataStage導入を強力にサポートしていることも大きな魅力だ。
導入効果例 |
手組み開発に比べ、初期開発の期間・コストがともに大幅削減 |
ある製造業で、SCM(サプライチェーンマネジメント)業務を支援する分析システムの構築にDataStageを適用。
【ユーザの課題】
・各種業務システムは、工場別、販売会社別に独自に構築されており、正確な実在庫数量の把握が困難であった。
・当初、手組み開発を計画したが、要員・開発期間・コストの見込みが大きく膨らんでしまった。
▼そこで、DataStage適用に変更
【導入効果】
●業務システム群から在庫データを抽出・変換し、在庫統合DBに格納するバッチ処理をDataStageで
効率良く開発。在庫統合DBを参照することで、正確な実在庫数量の把握が可能に。
●手組み開発と比較して、要員・開発期間・コストを大幅に削減。
・国内在庫の分析機能の開発では、開発期間を6ヵ月から2ヵ月に短縮。
・海外在庫の分析機能の開発では、要員を3名から1名に変更。
導入効果例 |
大量かつ複雑なマスタ更新処理を迅速に構築 |
ある小売業で、情報分析システム構築にDataStageを適用。
【ユーザの課題】
・分析業務を行う上で、大容量の商品マスタ、店舗マスタから用途や目的に応じたマスタ群を生成する
複雑な処理を開発する必要があった。
・システムの連携部分を手組み開発した場合、システム改修のたびに多くの工数とコストが見込まれた。
▼そこで、DataStageを適用
【導入効果】
●システムの短期構築とコスト削減を同時に実現。
・DataStage導入で生産性が向上し、開発者1名、2ヵ月間で複雑なマスタ更新処理を開発。
●データ処理の可視化により、システム改修にも素早く対応。
・GUIで設定できるので、手組み開発のようにデータの流れがブラックボックス化せず、保守性が大幅に向上。
中規模システム向けキャンペーン実施中の今が、導入のチャンス!
日立では現在、独自キャンペーン製品のDataStage Common Editionの提供を行っている。
DataStage Common Editionは、中堅規模企業や、学校、病院、地方自治体など、主に中規模システムでのETLツール導入を検討しているユーザに向けて、導入が容易な価格を設定したキャンペーン製品である。
といっても、対象となるシステムの規模を除けば、基本機能はDataStage Standard Editionとまったく同等。2008年3月末日までの期間限定での提供なので、導入検討は早めに開始することをお勧めする。