本文へジャンプ

ハーモニアス・コンピテンス・センター

Hitachi

情報漏えいなどに対するセキュリティ強化のため、操作ログや検索ログのログデータの解析が急務となってきました。しかし、従来のログ解析では、膨大なログデータの中から必要な情報を抽出する際に、辞書登録されていない言葉を検索できないため、検索漏れが生じてしまいます。
日立の全文検索は検索アルゴリズムに、n-gram(*1)を拡張した日立独自の方式を採用し、検索漏れがなく日本語特有の表記の揺れにも強い、柔軟なログ検索を実現します。

*1
n-gram(n-gramインデックス方式)・・・入力されたテキストをn文字ごとに区切り、各文字列が含まれる文書番号と、文字列の出現位置によるインデックスを作成する方式。検索時には上記インデックスを利用して、漏れの無い高速全文検索を実現しています。

漏れのない柔軟な検索を実現する『日立の全文検索ソリューション』

日立の全文検索ソリューションは、n-gram方式を採用した全文検索エンジンをデータベースソフトHiRDBに組み込み、テキストデータとデータベース内の属性情報を組み合わせた、柔軟な検索を実現しました。
効率的な検索を行えることを実演すると共に、日立の全文検索ソリューションの優位点を紹介します。

デモ内容
  1. 日立の全文検索ソリューション概要説明
    • 従来の方式によるログ解析
    • n-gram方式を利用したログ解析
  2. 実機デモ
    • n-gram方式を利用したログの全文検索の実演
PPTによる概要説明+実機デモ
所要時間 約30分