まだピクミン2をクリアしてないのでケジメ的に新作ゲームを買えないmikioです。今回は、Tokyo Cabinetを使って激烈簡単に特定サイトの専用の検索機能を設置する方法について説明します。クローリングから検索までを10分くらいの作業で可能にします。 特定サイトの検索エンジン Web全体の検索機能を作るのは、途方もない技術力と設備を持っているGoogleやMicrosoftなどのビッグプレーヤでないと難しいのが現実です。でも、自分が気に入っているいくつかのサイトを対象とした検索エンジンを作るのであれば個人だってできます。また、インターネットから手が届かないイントラネットのコンテンツの検索機能は自分達で手がけないと構築できません。 ということで、企業用の検索システムが数多く売られていますし、LuceneやGroongaやHyper Estraierなどのオープンソース製品も世に多数存在しま
前の記事 いま好調な自動車市場は:ルーマニアと中国の例を見る 「スパコンが可能にした研究成果」を画像で紹介 次の記事 天才が作った新検索エンジン『Wolfram|Alpha』と、Googleへの影響 2009年5月11日 Ryan Singel 5月18日に一般公開される予定の新興検索エンジン『Wolfram|Alpha』が話題を集めている。 聞いたこともない、という人のために説明すると、Wolfram Alphaとは、たとえば「ヨーロッパのインターネット利用者」などといった検索クエリが求める内容を理解し、非常に適切な結果を返すという「コンピューター的な知識検索エンジン」だ。このマジカルな技術は、インデックスに、混乱したウェブページではなく構造化されたデータセットを使うことで実現されている。 同サービスのデモ[ハーバード大学バークマンセンターでの講演。動画は以下]は、最初は懐疑的だったDa
canonical(カノニカル)タグは、<link rel="canonical" href="○○">のように使われます。そもそもcanonical属性とは検索エンジンに対してどんな意味を持ったタグなのでしょうか? 基本情報からSEOで活用すべきシーンなどを事例で紹介します。 ヤフー、グーグル、そしてMSN Live Search(マイクロソフト)は、新しい「URL正規化タグ」をサポートすると発表した。 このタグを使えば、ウェブマスターやサイトオーナーが検索エンジンのインデックス内での重複コンテンツ問題を解消できる(ただし、自サイト内の問題のせいで生じる重複インデックスのみ)。 僕が思うに、これはSEOのベストプラクティスにとって、サイトマップの登場以来最大の変化だと思う。SEOmozでは最新ニュースを届けることより戦略について論じることに重点を置いているから、このブログで検索エンジン関
全文検索エンジンのgroongaをテストリリースしました。 groonga 本日開催された、key-value store勉強会で発表させていただきました。 今まで、Sennaには Tritonn経由で使った場合、MySQL側のインデックスとの併用が難しく、Senna本来のパフォーマンスが発揮できなかった。 従来のインターフェースでは、トークナイザの切り替えなどの柔軟性がなかった。 といった問題がありました。 groongaは、それに対する返答です。 自分でデータベース書けばいいんじゃね? 柔軟なAPI用意すればいいんじゃね? ってことですね。 データベースは、key-valueストアを組み合わせたcolumnストア的な感じになっています。 詳細については、今後別エントリやドキュメントで述べます。 今後は、Sennaはバグ修正のみ行うメンテナンスモードに移行します。 実際使ってみよう 今回
greeさんで開催されたKey Value Store勉強会に行ってきました。 時間にして4時間超え、内容も国内のKey-Value Storeなソフトウェアの最前線の話ばかりで相当なボリューム。以下、メモってたのを残しておきたいと思います。(誤字、脱字、内容に誤りを含むものなどありましたらお伝えください)また、発表者の方やプロダクトについて、ざっくり調べてURL見つけられたものについてはリンク張っています。 森さん / 末永さん groonga Sennaの後継エンジン 融通が効かないのがSennaのデメリット スコア算出式のカスタマイズなど Sennaの転置索引 索引の構成部品を自由に組み合わせて使える APIもいろいろ QL DB Low Level memcached互換のkey-value store バイナリのみ対応 計測 クライアント memstorm-0.6.8 mem
このドメインは お名前.com から取得されました。 お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。 日本のドメイン登録業者(レジストラ)(「ICANNがレジストラとして認定した企業」一覧(InterNIC提供)内に「Japan」の記載があるもの)を対象。 レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。
夏本番に向けて海に行ける体作りに励まないといかんなーと思いつつも、ついついDSのスターフォックスで遊んでしまうmikioです。さて今回は、人知れずリリースされている検索エンジンTokyo Dystopiaの概要と設計思想について述べます。 Hyper Estraierとの違い Tokyo Dystopia(以下、TDと呼びます)は、新しい検索エンジンです。しかし、私が作ったもう一つの検索エンジンHyper Estraier(以下、HEと呼びます)の後継としては位置付けていません。 Hyper Estraierの製品コンセプトは、「検索システムの需要が生じる様々なシーンで手軽に導入できる」ことです。言い換えれば、「いわゆるシロウトの人でも、お高い商用システムを買えない個人や小組織でも、ちょっとの努力で自分の要求を満たすシステムを構築できる」ことです。そのために、様々なファイル形式に対応したテ
「私たち国民とか我々市民とか負け組勝ち組とか なんでひとくくりにするんだろ?」 「そう・・・・人はやたら何でもひとくくりにして くくりたがるのです」 「くくっとけ!」 by さよなら絶望先生 第百四十四話 「ククリなき命を」 おすすめ いろいろな検索 便利なツール もっと楽しく
この特集で挙げた57の要因に関して、GoogleとYahoo! JAPANの利用率を考慮して総合的に算出した重要度のランキングを示す。 プラス要因トップ20(Google+Yahoo! JAPAN総合)titleタグ内でのキーワード使用被リンクのアンカーテキストサイト全体でのリンクポピュラリティYahoo!ディレクトリへの登録本文でのキーワード使用サイト内部構造としてのリンクポピュラリティサイト開設からの経過時間リンク元サイトのサイト全体でのリンクポピュラリティ被リンクの話題関連性話題コミュニティ内でのリンクポピュラリティリンク元ページとの話題の関連性被リンク増加率本文のコンテンツとキーワードの(トピック分析による)関連性サイトの主要テーマと検索の関連性h1タグ内でのキーワードの使用インデックス可能なテキストコンテンツの量外部サイト/ページへのリンクの質や関連性文書公開からの経過時間リンク
Google様毎日お世話になっております。そんな方も多いでしょう。ただ、なかなか目的のページに辿りつけない!そんな事もしばしばありますが、Googleは単純に「キーワード(スペース)キーワード」といったキーワードの組合せだけの検索ではなく、いろんな検索テクニックが存在します。私がよく使う検索テクニックをまとめておきます。 便利なGoogle検索の方法 検索結果が和英辞典・英和辞典になる方法 「和英 (日本語)」と入力してみてください。すると、検索結果のトップに「○○を和英辞書で調べる」という検索結果が必ず出てきます。ちょっとスペルが分からないときや、英語を調べたいとき、かなり手軽で役立ちます。ちなみに「英和 apple」と検索すると英和辞典代わりになります。 検索結果に不用な情報を排除する方法 例えば「オープンキャンパス」と検索すると、京都大学が上位に検索されます。でも、「大学の情報は検索
この特集で挙げた57の要因に関して、Googleに限定して集計した重要度のランキングを示す。 プラス要因トップ20(Google)titleタグ内でのキーワード使用被リンクのアンカーテキストサイト全体でのリンクポピュラリティサイト開設からの経過時間サイト内部構造としてのリンクポピュラリティ被リンクの話題関連性話題コミュニティ内でのリンクポピュラリティ本文でのキーワード使用リンク元サイトのサイト全体でのリンクポピュラリティ被リンク増加率外部サイト/ページへのリンクの質や関連性リンク元ページとの話題の関連性リンク元サイトの話題コミュニティ内でのリンクポピュラリティ本文のコンテンツとキーワードの(トピック分析による)関連性文書公開からの経過時間h1タグ内でのキーワードの使用インデックス可能なテキストコンテンツの量リンク設置からの経過時間サイトの主要テーマと検索の関連性リンク元サイトとの話題の関連
この特集で挙げた57の要因に関して、Yahoo! JAPANに限定して集計した重要度のランキングを示す。 プラス要因トップ20(Yahoo! JAPAN)titleタグ内でのキーワード使用被リンクのアンカーテキストサイト全体でのリンクポピュラリティ本文でのキーワード使用Yahoo!ディレクトリへの登録サイト内部構造としてのリンクポピュラリティリンク元サイトのサイト全体でのリンクポピュラリティサイト開設からの経過時間被リンクの話題関連性サイトの主要テーマと検索の関連性リンク元ページとの話題の関連性被リンク増加率本文のコンテンツとキーワードの(トピック分析による)関連性インデックス可能なテキストコンテンツの量h1タグ内でのキーワードの使用話題コミュニティ内でのリンクポピュラリティリンク元サイトとの話題の関連性リンク設置からの経過時間文書公開からの経過時間リンク周辺のテキストマイナス要因トップ5
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く