LDAではトピック数を決定する必要がありますが、Baysian Nonparametricsによってトピック数を最適化する拡張モデルもあります。ライブラリとして利用できるかどうかは分かんないけど。→ http://www.cs.berkeley.edu/~jordan/papers/hdp.pdf /

fufufukakakafufufukakaka のブックマーク 2015/09/21 06:14

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

【機械学習】Yahoo Newsの記事をMLlibのトピックモデル(LDA)でクラスタリングする。 - Qiita

    Sparkシリーズ第3弾の記事です。MLlibのLDAを使ってYahoo Newsの記事をトピックモデル(LDA:Latent Dirichlet allocation)でクラスタリングしてみます。 第一弾 【機械学習】iPython NotebookでSparkを起動させて...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう