タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

ideaとresearchに関するHooのブックマーク (1)

  • 最先端の実験は必然的に大規模化する - 武蔵野日記

    大規模テキストデータ(もう昨今 GB 単位はそんな大規模ではなく、TB 単位以上)を対象とした研究をしている自分が言うのもなんだが、そもそも自然言語処理の研究ってそんなに大規模化する必要はないし、データ量を増やしたからといってそんなに劇的に精度が変わったりするわけではない(むしろ扱いに独特なコツが必要なので、うかつに手は出さないほうがいい)、と思っているのだが、なんでみんな大規模化したがるのかなぁ、と不思議だった疑問に得心がいった。 もちろん増やしたデータ量に対し log スケールで改善する、というような微弱な改善効果はあるのだが、そんなことよりはアルゴリズムを変えたり、用いるデータの質を上げたり、もしくは使う素性を工夫したり、はたまた全部同じだけどパラメータだけチューニングしたりするほうが大幅に精度に影響したりするのは世の常である。 で、今晩見た爆問学問で、先週の情熱大陸と同じくノーベル

    最先端の実験は必然的に大規模化する - 武蔵野日記
    Hoo
    Hoo 2009/04/04
    >人間の扱える範囲を遙かに超えた量のデータから情報や知識を獲得できるというのは、なんか SF チックで(計算機がないと絶対できないことだし)楽しい。
  • 1