本サイトは個人的なまとめサイトです。 記載内容に誤り等がありましたらご指摘ください。

no way to compare when less than two revisions

差分

このページの2つのバージョン間の差分を表示します。


public:search_engine [2013/12/20 17:53] (現在) – 作成 - 外部編集 127.0.0.1
行 1: 行 1:
 +== 検索エンジン ==
 +=== 検索エンジンとは ===
 +
 +==== 検索エンジン ====
 +  * 検索エンジンは、あらかじめ単語がどのページのどの位置に現れるかを示す索引を作成し、問い合わせがあったときには索引を調べるだけで済ませるため(全文書を検索しないで済むので)、短時間で検索結果を返すことができる。
 +  * 日本語の検索エンジンは、分かち書きエンジンと索引作成エンジン(インデクサー)とから成る。
 +
 +==== 分かち書きエンジン ====
 +  * 英語では単語が空白で区切られているのに対し、日本語では単語の区切りが不明確であるため、単語毎の索引を作成するには、まず文章を単語に分割する必要がある。この作業を行うのが、分かち書きエンジンである。
 +
 +==== インデクサー ====
 +  * 単語がどのページのどの位置に現れるかを示す索引を作るソフトウェア。
 +
 +=== Estraier ===
 +
 +=== HyperEstraier ==
 +
 +
 +==== 概要 ====
 +
 +  * 日本語を機械的に分かちするN-Gram方式の分かち書きを採用する全文検索エンジン。
 +  * 2006年4月30日現在のWindows版最新バイナリは1.2.4である。
 +
 +
 +==== 関連サイト ====
 +  * 【公式サイト】http://hyperestraier.sourceforge.net/
 +
 +==== インストール(Windows) ====
 +
 +  - Archiveをダウンロード
 +  - Archiveを解凍し、estseek.* ファイルを全てcgiフォルダへコピーする
 +  - estseek.conf の一行目を修正:Indexを保管するフォルダを指定
 +<code php>indexname: c:\temp\hyperestraier\index</code>
 +
 +=== Namazu ===
  

ログイン