ページの本文へ

Hitachi
お問い合わせお問い合わせ

超高速データベースエンジン Hitachi Advanced Data Binder:世界初、日立が「TPC-H」 100TBクラスに登録

世界初、日立が「TPC-H」 100TBクラスに登録 高速データアクセス基盤「Hitachi Advanced Data Binder プラットフォーム」が打ち立てた記録とは?

この記事に記載されている情報は2014年3月24日の発表時点のものです。

2013年10月19日、「Hitachi Advanced Data Binder プラットフォーム」が、データベースシステムの検索処理性能に関する業界標準のベンチマークである「TPC-H」の最大クラス(100TBクラス)の性能評価リストに世界で初めて登録されました。

データベースの検索処理性能 業界標準ベンチマーク「TPC-H」で世界初の100TBクラス登録(2013/10/19登録)

「TPC-H」の性能評価リストに登録されているデータベースシステムは2007年から30TBクラスが最大でしたが、2013年、「Hitachi Advanced Data Binder プラットフォーム」が最大クラスのリストを更新しました。

この「TPC-H」 100TBクラスの性能評価リストへの登録は、東京大学生産技術研究所(以下、東大生研)と日立による日本発のデータベース技術の有効性が、国際的な基準の下で証明されたことを示しています。

「TPC-H」はデータベースの性能を測るものさしのようなもの

「TPC-H」とは、トランザクション処理性能評議会(Transaction Processing Performance Council:以下TPC)が運営するデータベースの処理性能の指標(ものさし)の1つです。

客観的、検証可能なデータベースのパフォーマンスの指標を定めるTPC

TPCは、トランザクション処理に関する性能指標の標準化を進め、客観的で検証可能なデータベースシステムのパフォーマンスデータを普及することを目的として設立された非営利法人です。TPCベンチマークとして「TPC-H」「TPC-C」などの各種指標を定め、この指標に基づいたテストケースを用いてベンダーの構築したシステムを測定、評価し、公表しています。

TPCベンチマークの種類

TPCベンチマークには「TPC-H」のほかに、2014年2月現在で「TPC-C」「TPC-E」「TPC-DS」「TPC-VMS」があります。一般的なものは、「TPC-C」と「TPC-H」で、それぞれ以下のデータベースシステムを対象としています。

「TPC-C」
オンライントランザクション処理(以下OLTP)の分野のデータベースシステムの処理性能の指標です。
OLTPは主に基幹系業務システムに用いられ、インターネットバンキング、電子商取引、座席予約システムなどの分野で使われます。
「TPC-H」
意思決定支援システム、データウェアハウス(以下DWH)の分野のデータベースシステムの検索や抽出処理性能の指標です。
DWHは、意思決定支援に最適化したデータベースです。データを分析に適した形に加工せず、生のデータを長期間保持・蓄積することが特徴で、データ容量は非常に大きくなります。
「TPC-H」には、データ容量に応じて100GB、300GB、1TB、3TB、10TB、30TB、そして今回日立が登録された100TBのクラスがあります。

TPCベンチマークテストの様子をご紹介

日立が構築した意思決定支援システムの構成は、以下のとおりです。
一般的に、HDDの台数に比例してデータベースシステムの性能も高まりますが、日立は今回100TBというデータの規模からすると少ない台数である1,600台のHDD構成でテストに挑戦しました。
なぜなら、「Hitachi Advanced Data Binder プラットフォーム」が実装している「非順序型実行原理」によりリソースを無駄なく活用することで、ハードウェアの処理性能を最大限に引き出すことができる、という自信があったからです。

システム構成
システム種別 製品名 装置仕様 式数
データベース Hitachi Advanced Data Binder 01-02
サーバー BladeSymphony BS2000 8CPU(80コア構成)、2TBメモリ 4式
ストレージ Hitachi Unified Storage 150 900GB 10,000rpm SAS HDD×100台 16式


システム構成図

データベースシステムに求められるACID特性のテスト状況

「TPC-H」は、意思決定支援システム向けのベンチマークであることから、性能評価の項目だけだと思われがちですが、実はデータベースシステムの基本機能であるACID特性の厳しい検査があります。

日立は、2013年8月6日から8月9日の期間で、TPCの公認Auditor(監査人)立ち会いの下でオンサイト監査を実施しました。 このとき、「Hitachi Advanced Data Binder プラットフォーム」は完成して間もない状況でしたが、ACIDテストは極めて順調に、問題なくクリアすることができました。ACIDテストでは、データベースの更新トランザクションを実行中に、サーバーやストレージの電源を切断したり、HDDを抜き取ったりするなど、ハードウェア障害を意図的に発生させましたが、ハードウェアは電源回復後に正常起動し、また、「Hitachi Advanced Data Binder プラットフォーム」は、コミット済みのトランザクションをきちんと回復していることが確認できました。

今回のような、新製品でこのACIDテストに一回で合格するのは稀であり、公認Auditorにとっても、驚きだったようです。


オンサイト監査の様子


TPC Benchmark H Executive Summary

用語集

ACID特性(アシッドとくせい)
データベースのトランザクション処理に求められる4つの特性のこと。
  • Atomicity(原子性):
    トランザクションの各処理がすべて実行されるか、すべて実行されないかのどちらかの状態でなくてはいけない。
  • Consistency(一貫性):
    トランザクションの前後でデータの整合性が保たれている。
  • Isolation(独立性):
    トランザクションがほかの処理に影響を与えない。
  • Durability(耐久性):
    完了したトランザクションは結果が記録され、障害が発生しても失われない。
TPC(ティー・ピー・シー)
トランザクション処理性能評議会(Transaction Processing Performance Council)のこと。データベースシステムのベンチマークテストの策定と検証を行う非営利団体。
意思決定支援システム(いしけっていしえんしすてむ)
経営上の意思決定を支援するシステムのこと。さまざまなデータを検索・分析し、シミュレーションを行うことで戦略の立案に役立てることができる。
DSS(Decision Support System)。
クエリ
プログラミングの問い合わせ、情報検索にいおける情報の取得要求のこと。データベースのクエリは、データの抽出、集計、追加。削除、更新などのSQL文を意味する。
非順序型実行原理(ひじゅんじょがたじっこうげんり)
喜連川 優 東大生研教授/国立情報学研究所所長と合田 和生 東大生研准教授が考案したリレーショナルデータベースの処理の原理のこと。
1つの命令を実行し、それが完了してから次の処理を実行する順序型に対し、各命令の処理の完了を待たずに、次々とスレッドを立ち上げて処理を並列に行うことで、データベースシステムのリソースを無駄なく活用でき、処理速度の飛躍的な向上が可能。
ベンチマークテスト
ベンチマークとはシステムの性能を測るための指標のこと。プログラムを実行し、その時間を計測することをベンチマークテストという。