タグ

検索に関するtyubeiのブックマーク (2)

  • 単語と文字の話 - Preferred Networks Research & Development

    4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という文脈ですと形態素インデックスという言葉がありますが、これは検索の最小単位を文字単位ではなくて形態素の単位にするということです。例えば「東京都」は「東京」「都」に分かれるため、「京都」というクエリに対して見つかるのを防ぐなど、精度を上げる効果があります。反面、深刻な検索漏れを引き起こす可能性があるため嫌われることが多いです。こうした漏れは検索に限らず、テキストマイニングなどの文脈でも問題となることが

  • ソーシャルネットワークを横断的に検索できるサービス「Socialseek」 : 二十歳街道まっしぐら

    「Socialseek」はソーシャルネットワークを横断的に検索できるサイトです。 キーワードを指定して検索をすると、ブログやTwitter,FacebookやFlickr,YouTubeなどから検索してくれますよ。 それらの結果がひとつの画面で閲覧できるところも特徴。 以下に使ってみた様子を載せておきます。 まず「Socialseek」へアクセスしましょう。 キーワードを指定して検索するとこのような結果が表示されます。 それぞれがソーシャルネットワークのカラムになっています。 たくさん並べていますが、必要なものだけ表示させられますよ。 YouTube動画やFlickrの写真など、検索結果の詳細はその場で閲覧できます。 ページ遷移がないので使いやすいですね。 さらに、リアルタイムに検索結果が更新されていきます。 ソーシャルネットワークから情報を引っ張り出したいときに是非ご活用下さい!

    ソーシャルネットワークを横断的に検索できるサービス「Socialseek」 : 二十歳街道まっしぐら
  • 1