タグ

clusteringに関するYasSoのブックマーク (17)

  • Milk: Machine Learning Toolkit for Python - Luis Pedro Coelho

    Out of date and unmaintained: use scikit-learn This is the code that I use for my research projects. Where can I get it? Github as usual. Alternatively the python packages index also contains official releases,the latest of which can be obtained by: easy_install milk or: pip install milk if you use these tools. Examples Here is how to test how well you can classify some features,labels data, measu

  • 適切なクラスタ数を推定するX-means法 - kaisehのブログ

    K-means法によるクラスタリングでは、あらかじめクラスタ数Kを固定する必要があります。HatenarMapsでもK-means法を使っているのですが、クラスタ数は(特に根拠もなく)200個に決め打ちになっていました。 これに対して、X-means法というK-means法の拡張が提案されていることを知りました。X-means法を使うと、データに応じて最適なクラスタ数を推定できます。 K-means and X-means implementations http://www-2.cs.cmu.edu/~dpelleg/download/xmeans.pdf X-means法の考え方は、K=2で再帰的にK-means法を実行していくというもので、クラスタの分割前と分割後でBIC(ベイズ情報量規準)を比較し、値が改善しなくなるまで分割を続けます。 調べたところ、Javaのデータマイニングツー

    適切なクラスタ数を推定するX-means法 - kaisehのブログ
  • 「確率モデルによるwebデータ解析法」8章メモ - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥

    昔書いたやつを発掘してきた。また読み返す必要があるなー。 8章は商用アプリケーションの話、レコメンダシステムと顧客行動解析。 ここで扱うレコメンダシステムは、ユーザの行動履歴に基づきユーザに対してアイテムを推薦するようなもの。 興味深い問題として、欠損をすべて0と考えた場合、ユーザiがチェックしなかった項目jに関する行列V中の欠損地の扱いがある。これら欠損データは、必ずしも完全にランダムに欠損しているわけではなく、ユーザが好まない項目に対して「どちらかといえば選ばない」という負のバイアスが 影響していると思われる(Breese,J.S.,Heckerman,D. and Kadie,C. 1988 Empirical analysis of predictive algorithms for collaborative filtering.)。リコメンダシステムに関する多くの研究において、

    「確率モデルによるwebデータ解析法」8章メモ - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥
  • クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

    集合知プログラミング を読んでいたら、K-means 法(K平均法)の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると1ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって1ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ

  • クラスタリングによる迷路作成アルゴリズム

    はじめに クラスタリングアルゴリズムにより、解くと絵が浮かび上がる 迷路を作成する方法を紹介する。 クラスタリングとは ウェブのリンク情報や、mixiの友人関係など、ネットワークの性質を 知りたいことがよくある。このとき、ネットワークの性質として このネットワークにおいて任意に選んだ要素Aと要素Bはつながっているか? このネットワークは全体がつながっているか? つながっていないとしたらいくつのグループに分かれるか? 要素数最大のグループはどれか? などの情報が欲しくなる。このような解析をするときに 必要となるのがクラスタリングである。 クラスタリングとは、同値関係のリストが与えられたときにグループ分けを することである。たとえば、 友達友達友達である と定義すると、友人関係は同値関係を作る。 その上で、 A君とB君は友達 C君とE君は友達 B君とD

  • 文書クラスタリングの技法ゼミ

    III. 文書クラスタリングの技法 A. 単一パスアルゴリズム 1. k-means 法の適用 2. Willett のアルゴリズム 3. 平均クラスタリング・アルゴリズム

  • garcinia cambogia reviews

    Ufabet เว็บตรงเว็บตรง Ufabet คือเว็บไซต์อย่างเป็นทางการของ Ufabet ซึ่งเป็นผู้ให้บริการเดิมพันกีฬาและคาสิโนออนไลน์ที่ใหญ่ที่สุดในโลก เว็บไซต์นี้เปิดโอกาสให้ผู้ใช้เข้าถึงตัวเลือกการพนันที่หลากหลาย รวมถึงการเดิมพันกีฬา เช่น ฟุตบอล บาสเกตบอล เทนนิส และกีฬาอื่นๆ รวมถึงเกมคาสิโนยอดนิยมอย่าง โป๊กเกอร์ สล็อต บาคาร่า และรูเล็ต เว็บแม่ของ Ufabet เป็นแหล่งที่มาหลักของบริการเดิมพันออนไลน์ หรือเป็นเว็บไซต์หลัก

  • Toolbox : Cluster analysis

    Cluster Analysis 複数の属性によって特徴つけられた類似性の指標をもって、いくつかのグループに分類する一連の手法である。 通常、以下のような手順で分析が行われる。 距離または類似度の計算方法の選択 各個体間の距離の計算 クラスター化の計算方法の選択 クラスター間の距離の計算 個体間距離の計算 距離の指標 個体をグループに分類するためには、類似度を表す指標、またはその逆に遠さを表す距離を定義する必要がある。なお、以下に記述する数式は次の2つのベクトルであらわされる距離を定義するものとする。 ユークリッド距離 最も一般的に用いられる、2点間の最短距離を表す距離である。元データから直接ユークリッド距離を求める場合が多いが、測定項目によって単位系が異なるなど分散や規模が違う場合、標準化を行ったり、特に重視したい項目について重み付けを行うこともある。 市街距離 2点間の座標の差の絶対

  • viim - 新しいクラスタリング画像検索サービス

    新しい画像検索サービスが始まった。名前は viim (ヴィーム)。viim の特徴は、クラスタリング技術と今までにないインターフェース。開発しているのは Preferred といふ日のベンチャー。 Viim クラスタリング検索 検索エンジンでクラスタリング技術といへば、「検索結果をトピックごとに分類する」技術を指す。例へば「アップル」を検索したら、コンピューター会社のアップル、中古車買取サービスのアップル、それから音楽レーベルのアップルなんかが引っかかる。ここでトピックごとに検索結果が分けて、ユーザーの検索効率を上げてやるのがクラスタリング型検索エンジンの特徴。日だと Clusty なんかがクラスタリング検索エンジンとして有名かな? Clusty で「アップル」を検索 ウェブ検索エンジンに限っていへば、クラスタリング検索エンジンはそれほど目新しいサービスでもない。ただ、それを画像検索エ

    viim - 新しいクラスタリング画像検索サービス
  • 文書クラスタリングの技法:文献レビュー

    Library and Information Science No.49 2003 展望論文 文書クラスタリングの技法:文献レビュー Techniques of Document Clustering: A Review 岸  田  和  明 Kagualei KISHZDA Re−sume’    The document clustering technique is widely recognized as a useful tool for information retrieval, organizing web documents, text mining and so on. The purpose of this paper is to review various document clustering techniques, and to discuss resea

  • http://www.neurosci.aist.go.jp/~kurita/thesis/thesis/node23.html

  • 研究メモ BETA - flickrのタグのクラスタリング機能

    _[研究][論文] flickrのタグのクラスタリング機能 Flickrにタグのクラスタリング機能が実装されていたことを今日Automated Tag Clustering: Improving search and exploration in the tag spaceという論文を読んで知った. summerには,自然,水,ビーチ,花のクラスタができている. noseだと人と犬とのクラスタができる!面白い. 公式ブログによると2005年8月からあったようだ(Flickr Blog : The New New Things «).2年も前か….どうやってるんだろうなぁ.

  • Tags: Database schemas

    An online tech community is the most exciting place for a software developer to spend their time. It not only offers the chance to work and interact remotely, but also helps in honing one’s own skills and becoming a well-rounded programmer. Whether you are a budding software developer or simply passionate about technology, here are the best online software development communities you can join. The

  • Web検索結果のクラスタリング 2006年 オープンキャンパス

    2006/07/22 はじめに 近年、 Web上に存在する情報の増大により、ユーザの必要とする情報を絞り込むために、Web検索エンジンは必要不可欠なものとなっています。しかし、検索結果が数百件におよぶことは頻繁に起こります。このため、検索結果の概観を視覚化する研究が注目されています。 このページでは、Web文書の検索結果にクラスタリングの技術を適用することで、効率よく検索結果を閲覧・把握できるシステムを紹介します。 クラスタリングとは ここで言うクラスタリングとは、データの集合を、似ているもの同士が同じグループになるように分けることをいいます。複数のコンピュータを組み合わせて並列処理を行うこともクラスタリングといいますが、それとは別のものです(Wikipedia - クラスタリング)。 クラスタリング手法は、排他的に分割するものや、オーバーラップを許すもの、階層的なクラスタを作成するものな

  • Workshop on Data Mining in Web 2.0 Environments

  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • DBSJ Journal論文のスタイルファイル(MS Word版)-16ポイント

    論文 DBSJ Letters Vol.4, No.2 ―――――――――――――――――――――――――――――――――――― Max Flow アルゴリズムを用いた Web ページのクラスタリング方 法の提案 Clustering Web Pages Based on Maximum Flow Algorithm 大野 成義♥ 片山 薫♦ 渡辺 匡♦♦ 石川 博 ♦ 太田 学 ♠ Shigeyoshi OHNO Masashi WATANABE Kaoru KATAYAMA Hiroshi ISHIKAWA Manabu OHTA Web 上の情報を探すために使われる検索エンジンの多く はユーザに検索結果をスコア順のリストとして返す. 従って, リストが長い場合,求める情報を探すのは極めて難しい.そ こで, 検索結果をリストでなくクラスタリングして表示する 方法を提案する.

  • 1