エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント2件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
RSS clustering
id:kawasakiさんの日記「Google Newsが自分で作れる?」でも取り上げられてますが、O'Reilly Radarで知... id:kawasakiさんの日記「Google Newsが自分で作れる?」でも取り上げられてますが、O'Reilly Radarで知った英語圏でのRSS Clustering実装例。 rssclustering 一般的なBlog,SBM等が生成するRSSにクラスタリングが適用できないかと思って、クラスタリングについて5月くらいから調査していたので、個人的にちょうどいいタイミングの記事。 簡単にまとめると、 集約期間を変更可能にするため、RSSフィードから取得したデータはDBに保存 句読点、stop word(i,you,and,to,world,national,a等)の削除 単語を基本形にする(fires,fired,fireは同じものとして扱う) 集約結果表示時は一つの情報ソースを複数のクラスタに重複表示しない(これは重複表示したほうがよい場合もあるかもしれないけど、データ量が多くなる
2005/07/16 リンク