収集できる文書
Bibliotheca2 Web Searchでは,Text文書やHTML文書のほか,以下に示す各種アプリケーションで作成された文書の収集が可能です。
HI-UX/WE2 Bibliotheca2 Web Search 0100/E で収集できる文書
文書種類 |
バージョン |
RTF |
1.5 |
Microsoft(R) Word |
Word 95 |
Microsoft(R) Excel |
Excel 95 |
Microsoft(R) PowerPoint |
PowerPoint 95 |
Windows NT Bibliotheca2 Web Search 0202 で収集できる文書
文書種類 |
バージョン |
RTF |
1.5 |
Microsoft(R) Word |
Word 95, Word 97, Word 98, Word 2000 |
Microsoft(R) Excel |
Excel 95, Excel 97, Excel 2000 |
Microsoft(R) PowerPoint |
PowerPoint 95, PowerPoint 97, PowerPoint 2000 |
一太郎 |
Version 8, Version 9 |
Lotus 1-2-3 |
R5J, 1-2-3 97 |
PDF |
Version 1.2 |
注意事項
(1)収集する文書によっては,下記のような現象が発生することがあります。
- 文書のプロパティ情報が空のとき,不必要な値が登録される場合があります。
- 収集したデータの一部(半角の\など)が,文字化けする場合があります。この部分は,検索してもヒットしません。
- アプリケーションで変換した文書(特にLotus 1-2-3でExcel形式で保存した場合)を収集すると,収集したデータが文字化けすることがあります。このときは,変換後のアプリケーションで再保存すると正常に収集できるようになります。
- 図やグラフに含まれる文字は,収集できなかったり,文字化けする場合があります。この部分は,検索してもヒットしません。
(2)一太郎の文書で,下表のように,ひとつの表セル内のデータが複数行で構成されている場合,文書収集時,”顧客手アンテナ””数料工事費”というデータとして収集します。したがって,”顧客手数料”というキーワードで検索しても,この文書はヒットしませんので,ご注意ください。
(3)Word文書において,傍点を設定した文字が抽出できないことがあります。この部分は,検索してもヒットしません。
(4)Acrobat 3.0J のPDF Writerか,またはAcrobat 4.0のPDF Writer以外で作成したPDFファイルは,テキストが正しく抽出できない場合があります。
(5)次のセキュリティが設定されたPDFファイルは,テキストが抽出できません。
- パスワード
- プリント書類の変更
- テキスト/グラフィックの選択
- ノートの追加/変更
(6)PDFファイルから抽出されたテキストの順番は,必ずしもPDFの表示結果と一致しません。このため検索条件によってはヒットしない場合があります。
(7)PDFファイルの次の文字は文字化けする場合があります。この部分は,検索してもヒットしません。
|