目次
検索エンジン
検索エンジンとは
検索エンジン
分かち書きエンジン
インデクサー
Estraier
HyperEstraier
概要
関連サイト
インストール(Windows)
Namazu
検索エンジン
検索エンジンとは
検索エンジン
検索エンジンは、あらかじめ単語がどのページのどの位置に現れるかを示す索引を作成し、問い合わせがあったときには索引を調べるだけで済ませるため(全文書を検索しないで済むので)、短時間で検索結果を返すことができる。
日本語の検索エンジンは、分かち書きエンジンと索引作成エンジン(インデクサー)とから成る。
分かち書きエンジン
英語では単語が空白で区切られているのに対し、日本語では単語の区切りが不明確であるため、単語毎の索引を作成するには、まず文章を単語に分割する必要がある。この作業を行うのが、分かち書きエンジンである。
インデクサー
単語がどのページのどの位置に現れるかを示す索引を作るソフトウェア。
Estraier
HyperEstraier
概要
日本語を機械的に分かちするN-Gram方式の分かち書きを採用する全文検索エンジン。
2006年4月30日現在のWindows版最新バイナリは1.2.4である。
関連サイト
【公式サイト】
http://hyperestraier.sourceforge.net/
インストール(Windows)
Archiveをダウンロード
Archiveを解凍し、estseek.* ファイルを全てcgiフォルダへコピーする
estseek.conf の一行目を修正:Indexを保管するフォルダを指定
indexname
:
c
:
\temp\hyperestraier\index
Namazu