はてなダイアリーのようにキーワードを自動でリンクするアルゴリズムを知りたいです。単純に考えると、①キーワードのリストを持っておく。②対象となる文章に、あるキーワードが含まれているかを検索する。③「②」の検索をキーワードの数だけ繰り返す。ということになると思います。1万語のキーワードリストがある場合、1万回の検索を行うことになり、たとえば多数の投稿がある場合は効率も悪いですし負荷も掛かります。もっと効率のいいアルゴリズムがあるのでしょうか。
ahocorasick -- search for matches with a keyword tree [Downloads] [Introduction] [Usage] [Development Details] [Related Modules] [Bugs/Changelog] Downloads ahocorasick-1.0pre.tar.gz (2005/07/28) ahocorasick-0.9.tar.gz (2005/05/01) ahocorasick-0.8.tar.gz (2005/03/20) ahocorasick-0.7.tar.gz (2005/03/14) Sorry about the rapid releases! ahocorasick-0.6.tar.gz (2005/03/14) ahocorasick-0.5.tar.gz (2
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く