[B! R][コーパス] kazutan711のブックマーク

kazutan711 id:kazutan711

Rとコーパスに関するkazutan711のブックマーク (1)

trigram以上へのMIスコアの拡張 - DTAL（旧RCEAL）留学記録
昨年International Journal of Corpus Linguistics誌にNaixing Wei氏とJingjie Li氏による、MIスコアをtrigram以上のn-gramに拡張するという論文が掲載されました（こちら）。読んでみて面白そうだと思ったので、Rで実装しました。以下で公開しています。parse()やeval()の使い方、直接必要ではないのにターム文書行列を作成している点など、不満な点は多々あるのですが、手を入れる時間がしばらくは取れなさそうなので、公開します。誤りや不自然な点等ありましたら是非お知らせください。 newMI 以下のようにして走らせることができます。詳細はここをご覧ください。 # 必要なパッケージの読み込み。ない場合はinstall.packages()でインストール library(RWeka) library(tm) library(dat
kazutan711 2014/02/27
R

コーパス
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx