Web検索エンジン

Web検索エンジンHyper Estraierの紹介

Hyper Estraierは全文検索システムです。クローラー、インデクサー、サーチャーが含まれている。

http://fallabs.com/hyperestraier/

Hyper Estraier特徴

  • インデックスを使った高速な検索ができます。
  • 大量の文書のインデックスを短時間で作成できます。
  • N-gram方式による漏れのない検索ができます。
  • 形態素解析とN-gramのハイブリッド機構で検索精度を向上させます。
  • フレーズ検索や正規表現検索や属性検索や類似検索をサポートします。
  • 世界各国の言語が扱えます。
  • 対象文書の所在や形式に依存しません。
  • 賢いWebクローラが付属しています。
  • ライブラリとして各種製品に組み込めます。
  • P2P連携機能をサポートします。

INSTALL

  • Unix
    • FreeBSD
    • Debian
  • ファイル変換ツール
    • PDF形式ファイルをHTMLに変換ツール
    • Word形式ファイルをHTMLに変換ツール
    • ExcelとPowerPoint形式ファイルをHTMLに変換ツール

PDF論文検索システム

  • Hyper Estraierのインストール
  • ファイル変換ツールのインストール
  • ローカルファイルインデックス作成
  • 検索用CGI の設置
  • 検索用CGIスクリプトで確認

WEBクローラー

  • Hyper Estraierのインストール
  • ファイル変換ツールのインストール
  • WEBクロール, インデックス作成
  • 検索用CGI の設置
  • 検索用CGIスクリプトで確認

Leave a Reply

Your email address will not be published. Required fields are marked *

Skip to toolbar