ページの本文へ

Hitachi

ソフトウェア

全文検索スウィート「Bibliotheca21」は、2014年3月から販売形態を変更し、エンタープライズサーチ「uCosminexus Enterprise Search」の1コンポーネント「小規模向け簡易版」としてご提供することとなりました。
製品情報については「uCosminexus Enterprise Search」をご参照ください。

機能一覧


分類 機能 内容
検索機能 キーワード検索
(全文検索)
任意のキーワードを入力して、そのキーワードが文書テキスト中に存在する文書を検索します。
自然文検索
(概念検索)
任意の文章を入力して、その内容に類似した文書を検索します。
プロパティ検索
(文書属性検索)
更新日、URLなど、文書のプロパティ情報(文書属性)を入力して、その文書情報を手がかかりに文書を検索します。
複合検索 上記検索機能の組み合わせで文書を検索します。
類似文書検索 検索結果文書を元に自然文検索で文書を検索します。
予約検索*1 あらかじめ指定した検索式で定期的に検索を実行し、検索結果が更新されるとメールで通知します。
なお、予約検索はアクセス権限検索ができません。また、Notes収集によって収集された文書は予約検索の対象となりません。
検索結果一覧機能 検索結果文書の
参照
検索結果から直接文書実体を参照することができます。例えば、HTML文書はWebブラウザを開いて直接HTML文書を参照することができます。
テキスト情報の
参照
検索結果文書のテキスト情報を参照することができます。表示するテキスト情報では、検索キーワードがハイライト表示されます。
アクセス権付きの
結果表示
全てのコンテンツ(Web/NTFS/Notes/RDB)に対し、Active Directory による文書へのアクセス権情報を利用して、「検索を実行するユーザが参照権限を持つ文書」だけを検索結果として表示することができます。
表示順 検索条件に含まれるキーワードの出現回数などを基に検索結果の各文書に内部的に得点を付けて、得点の高い順に検索結果を表示します。
被リンク数による順位付け機能 Web収集において、検索結果一覧の順位付け方法を選択できます。従来からのキーワード数による順位付けに加え、被リンク数による順位付けができるようになります。
おすすめキーワード、おすすめリンクの表示 取得したログを集計し、おすすめキーワードやおすすめリンク、ランキング情報などを表示することができます。
文書収集先 WWW(Web収集) インターネットまたはイントラネットでURL指定できる場所
NTFS(ファイルサーバ収集) ローカルドライブまたはネットワークドライブ
Notes(Notes収集) Lotus Dominoの文書データベース(添付ファイルを含む)
RDB(RDB収集) SQL Server、Oracle、HiRDBなどのRDB
※OLE DBプロバイダを使用してアクセスできるデータベース
文書収集方法 新規収集 収集先に格納されているすべての文書を対象に収集・登録します。
差分収集 文書を収集済みの収集先に対して、前回の収集以降に追加・更新された文書だけを対象に収集・登録します。
分割収集 収集先の文書を数回に分けて収集・登録します。分割する単位は収集する文書数または収集処理時間から選択できます。
差分分割収集 文書を収集済みの収集先に対して、前回の収集以降に追加・更新された文書だけを数回に分けて収集・登録します。
検索画面のカスタマイズ 簡易レベル コンフィグレーションファイルにパラメタを定義するだけで、検索結果のリンクを別ウィンドウで表示したりといったカスタマイズが可能です。
開発レベル 開発環境(COMのインタフェース群)*2を利用して、検索画面のカスタマイズや検索クライアントアプリケーションを作成することが可能です。
なお、バージョン02-40以降の検索画面のカスタマイズについては別途お問い合わせください。
運用
その他
ログの取得 検索および文書参照時に使用した情報をログに取得します。
登録件数制限 制限なし(推奨100万件〜300万件以下*3
検索画面 標準検索画面はASP.NETで作成しています。
バージョン02-31以前のASP検索画面も使用することができます。
定義ユーティリティ 文書の収集環境の作成を支援する収集定義ウィザードと、テキストストデータベースの作成を支援するDBユティリティを提供しています。画面から操作できます。
文書の整合性確保 収集先で削除されている文書をデータベースから削除して、収集先とデータベースの文書の整合性を確保することができます。
Cosminexus Portal Framework連携*1 Cosminexus Portal Framework上にBibliotheca21の検索ポートレット画面を表示可能です。ASPによる検索画面のみの対応です。
サーバの負荷分散*4 WebサーバをBibliotheca21のサーバシステムとは異なるマシンに配置して、サーバの負荷を分散することが可能です。
*1
ASP版検索テンプレートを使用している「Bibliotheca21 Standard」と、オプション製品の「Bibliotheca21 for Portal」を連携して文書検索システムを運用している場合に利用できる機能です。
*2
オプション製品 「Bibliotheca21 Development Kit for ASP」 が必要です。
*3
マシンスペックや文書内容などの条件により変動します。
*4
オプション製品 「Bibliotheca21 Searching +」 が必要です。

Bibliotheca21 で収集・検索可能な文書

Bibliotheca21 で収集・検索できる文書のファイル形式およびバージョンは、以下のとおりです。

ファイル形式 文字コード/バージョン
テキスト形式
(拡張子:.txt、.ini、.c、.cpp、.h、.log、.cfg、.csv、.bat)
SJIS、JIS、EUC-JP、UTF-8
HTML形式(拡張子:.htm、.html) SJIS、JIS、EUC-JP、UTF-8
XML形式(<? xml version="1.0" ?>から始まるファイル) SJIS、JIS、EUC-JP、UTF-8
RTF形式 1.3、1.4、1.5
Microsoft Word 形式 95、97、98、2000、2002、2003、2007
Microsoft Excel 形式 95、97、2000、2002、2003、2007
Microsoft PowerPoint 形式 95、97、2000、2002、2003、2007
一太郎 形式 7、8、9、10、11、12、13、
2004、2005、2006、2007
PDF 形式 1.2、1.3、1.4、1.5、1.6、1.7、
および ISO 32000-1準拠
OASYS 形式 5、6、7、8、2002
DocuWorks 形式 4、5、6
Lotus 1-2-3 形式 R5J、97、98、2000、
Millennium Edition
IFilter*1を使用してテキスト抽出可能なファイル形式およびバージョン(導入するIFilter用ライブラリに依存)
*1
各種アプリケーションからテキストデータを抽出するためのMicrosoft Indexing Service用のテキスト抽出拡張コンポーネントです。テキスト抽出可能なファイル形式のバージョンなど、IFilterに関する情報は各IFilterの提供元にご確認ください。

Notes収集機能を使用する場合に必要なソフトウェアと対応バージョン

バージョン02-40以降でNotes収集機能を使用するには、Lotus Domino/Notesの以下のソフトウェアを必要とします。

ソフトウェア 対応バージョン Bibliotheca21としての用途 インストールが必要なマシン
Lotus Domino 6.5、7.0 Bibliotheca21の検索対象となるNotes文書の格納先サーバ 同左
Lotus Notes 6.5、7.0 Bibliotheca21がDominoサーバに接続してNotes文書を収集するためのクライアント機能を使用 Bibliotheca21のインストール先と同じマシン
検索結果からNotes文書の実体を参照するために使用 Bibliotheca21の検索機能を使用するすべてのクライアントマシン*1
*1
検索結果のNotes文書の参照にWebブラウザを使用する設定の場合、検索クライアントマシンへのインストールは不要です。