単一単語検索
調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。例: 人民日報
AND検索
ある単語とある単語の両方を含む文書を検索します。検索結果を絞り込むのに有効です。3つ以上の単語を指定することも可能です。単語と単語の間に
and を挿みます。例: Linux
and Netscape
and
は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。
OR検索
ある単語とある単語のどちらかを含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に
or を挿みます。例: Linux
or FreeBSD
NOT検索
ある単語を含み、ある単語を含まない文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に
not を挿みます。例: Linux
not UNIX
グループ化
AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。例:
( Linux or FreeBSD ) and
Netscape not Windows
フレイズ検索
2語以上からなる複合語を検索します。 "..."
と2重引用符で、あるいは {...}
と中括弧で囲みます。Namazuのフレイズ検索は精度が
100 % ではないため、ときどき誤ることがあります。例: {GNU
Emacs}
部分一致検索
部分一致検索には前方一致、中間一致、後方一致の
3種類があります。
- 前方一致検索
- inter*
(inter
から始まる単語を含む文書を検索)
- 中間一致検索
- *text* (text
を内包する単語を含む文書を検索)
- 後方一致検索
- *net (net
で終わる単語を含む文書を検索)
正規表現検索
検索するキーワードを正規表現で指定します。正規表現は
/.../
のようにスラッシュ記号で囲みます。正規表現のエンジンにはRubyのコードを利用しています。正規表現の書式はPerlとほぼ同じです。
例: /インター?フェ[イー]ス/
フィールド指定の検索
Subject:, From:, Message-Id:
といったフィールドを指定して検索する手法です。特にMail/News
のファイルを扱う際に効果を発揮します。例:
- +subject:Linux
(Subject: に Linuxが含まれる文書)
- +subject:"GNU
Emacs"
(Subject: に GNU Emacsが含まれる文書)
- +from:foo@bar.jp
(From: に foo@bar.jp が含まれる文書)
- +message-id:<199801240555.OAA18737@foo.bar.jp>
(Message-Id を指定)
特記事項
- いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
- 日本語の複合語は形態素単位に分割し、それらを
フレイズ検索します。分割は不適切に行なわれることがあります。
- JIS X 0208 (いわゆる全角文字)
の英数字と記号の一部 (ASCIIと重複しているもの)
は ASCII (いわゆる半角文字) として処理されます。
- 記号を含む語の検索ができます。例: TCP/IP。ただし、記号の処理は完全ではないので
TCP and IP のように分割してAND検索をかけた方が取りこぼしがありません
(その代わり余計なファイルまでヒットしてしまう可能性があります)。
- 中間一致・後方一致、正規表現、フィールド指定の検索には少し時間がかかります。
- and, or,
not
を単語として検索したいときはそれぞれ、
と2重引用符で、あるいは {...}
と中括弧で囲みます。
|