ページの本文へ

Hitachi

ソフトウェア

セールスポイント

大量文書を高速検索

「日立高速全文検索シリーズ」では、1サーバで100万件を超える文書を漏れなく高速にキーワード検索(全文検索)、自然文検索(概念検索)することが可能です。日立独自の「インクリメンタルn-gram*1(特許出願中)」インデックス方式により、必要最小限のインデックス拡張で高速な検索をご提供します。

*1
入力されたテキストをn文字ごとに区切り、各文字列が含まれる文書番号と、文字列の出現位置によるインデックスを作成する方式。検索時には上記インデックスを利用して、漏れの無い高速全文検索を実現しています。

ナレッジ検索を実現する自然文検索を標準サポート

任意の文章を入力し、その内容に類似した文書を検索する自然文検索(概念検索)をサポートしております(HiRDB Text Search Plug-inではオプション機能としてサポート)。検索結果には、類似度のスコア情報を表示します。


新語辞書メンテナンス不要

検索用インデックスの作成に辞書を必要としないため、辞書メンテナンス無しで、新語・造語に対応したキーワード検索(全文検索)、自然文検索(概念検索)が可能です。


多様な検索を提供

同義語(例:アメリカと米国)・異表記(例:全半角、大文字小文字等)展開検索機能により、表記の揺れを吸収した検索が可能です。同義語展開検索には辞書*2を利用します。近傍条件、検索対象の絞り込み、論理演算式を利用した検索も可能です。

*2
同義語辞書はお客様で作成頂く必要があります。またオプション製品として、約11,000語を収録した同義語辞書のご提供も行っております。

構造化テキスト文書対応

XML/SGML等に対して、タグ情報を属性情報として取り込めます。指定した属性情報で絞り込んだ検索も可能です。


主要な言語インタフェースをサポート*3

C、ASP(COMインタフェース)のインタフェースを用意しております。またJavaに関しても計画中です。

*3
インタフェースのサポート範囲は、製品ごとの詳細説明を参照してください。

各製品の特徴

アプリケーション

パッケージ

開発用部品