no way to compare when less than two revisions
差分
このページの2つのバージョン間の差分を表示します。
— | public:search_engine [2013/12/20 17:53] (現在) – 作成 - 外部編集 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
+ | == 検索エンジン == | ||
+ | === 検索エンジンとは === | ||
+ | |||
+ | ==== 検索エンジン ==== | ||
+ | * 検索エンジンは、あらかじめ単語がどのページのどの位置に現れるかを示す索引を作成し、問い合わせがあったときには索引を調べるだけで済ませるため(全文書を検索しないで済むので)、短時間で検索結果を返すことができる。 | ||
+ | * 日本語の検索エンジンは、分かち書きエンジンと索引作成エンジン(インデクサー)とから成る。 | ||
+ | |||
+ | ==== 分かち書きエンジン ==== | ||
+ | * 英語では単語が空白で区切られているのに対し、日本語では単語の区切りが不明確であるため、単語毎の索引を作成するには、まず文章を単語に分割する必要がある。この作業を行うのが、分かち書きエンジンである。 | ||
+ | |||
+ | ==== インデクサー ==== | ||
+ | * 単語がどのページのどの位置に現れるかを示す索引を作るソフトウェア。 | ||
+ | |||
+ | === Estraier === | ||
+ | |||
+ | === HyperEstraier == | ||
+ | |||
+ | |||
+ | ==== 概要 ==== | ||
+ | |||
+ | * 日本語を機械的に分かちするN-Gram方式の分かち書きを採用する全文検索エンジン。 | ||
+ | * 2006年4月30日現在のWindows版最新バイナリは1.2.4である。 | ||
+ | |||
+ | |||
+ | ==== 関連サイト ==== | ||
+ | * 【公式サイト】http:// | ||
+ | |||
+ | ==== インストール(Windows) ==== | ||
+ | |||
+ | - Archiveをダウンロード | ||
+ | - Archiveを解凍し、estseek.* ファイルを全てcgiフォルダへコピーする | ||
+ | - estseek.conf の一行目を修正:Indexを保管するフォルダを指定 | ||
+ | <code php> | ||
+ | |||
+ | === Namazu === | ||