infosearch

06: クエリとインタフェース

情報検索の課題

クエリの質を向上させる技術

クエリ拡張

シソーラス利用

共起語の利用

共起語の相関係数

共起語の相関係数に基づくクエリ拡張

クエリログ

適合性フィードバック

地域情報の利用

モバイル環境におけるアプリ利用

クエリ生成時のステミング(語幹よせによる正規化)

ステムのクラス

ステムのクラスの修正アルゴリズム

スペルチェック

(defun ld(a b)
  (cond
    ((= (length a) 0)(length a))
    ((= (length b) 0)(length b))
    ((char= (char a 0)(char b 0))
      (ld (subseq a 1)(subseq b 1)))
    (t (1+ (min
      (ld a (subseq b 1))
      (ld (subseq a 1) b)
      (ld (subseq a 1) (subseq b 1)))))))
(ld "heool wrodl" "hello world") ;=> 5

Soundex

#!/usr/bin/sed -rf
s/^./\U\0/
s/[aeiouyhw]/-/g
s/[aeiouyhw]/-/g;s/[bfpv]/1/g;s/[cgjkqsxz]/2/g;y/dt/33/;y/l/4/;y/mn/55/;y/r/6/
s/([1-6])\1+/\1/g
s/-//g
s/^[A-Z][1-6]$/&00/;s/^[A-Z][1-6]{2}$/&0/;s/^([A-Z][1-6]{3})[1-6]+$/\1/

スペル修正のための問題点

雑音のある通信路モデルでのスペルチェック

雑音のある通信路モデル

情報要求

クエリと情報要求

ユーザとサーチエンジンとのインタラクション

ASK仮説

キーワードによるクエリ表現

スニペットの生成

スニペット生成のガイドライン

広告推薦

擬似適合性フィードバック

検索結果のクラスタリング

クラスタのラベル

ファセット

言語横断検索

統計的機械翻訳