タグ

aprioriに関するkanbayashiのブックマーク (2)

  • ~アプリオリアルゴリズム・極大頻出アイテム集合~

    Ck:要素数kの頻出アイテム集合の候補の集合 Lk:要素数kの頻出アイテム集合の集合 minsupは最小サポートを満たすために必要なトランザクション数   - 最小サポートにトランザクションの総数|D|を乗じた値。 トランザクション、候補アイテム集合、頻出アイテム集合中のアイテムは、 すべてある決まった順序にソートされている。 C1からL1を生成 アイテム集合C1 D → スキャン アイテム集合L1カウント 候補 → 生成 {A}{A}2 {B}{B}3 {C}{C}3 {D}{E}3 {E} C2からL2を生成 アイテム集合C2 D → スキャン アイテム集合L2カウント 候補 → 生成 {A,B}{A,C}2 {A,C}{B,C}2 {A,E}{B,E}3 {B,C}{C,E}2 {B,E} {C,E} C3からL3を生成 アイテム集合C3 D → スキャン アイテム集合L3カウント

  • アソシエーション分析(1)

    アソシエーション分析(associations analysis)は、百貨店や店舗などで集めている表1のようなトランザクションデータを活用するために、バスケットの中の商品間の関連性について分析を行う方法である。アソシエーション分析は、表1に示すような、トランザクションデータから、頻出するアイテムの組み合わせの規則を漏れなく抽出し、その中から興味深い結果を探し出すことを主な目的とする。 アソシエーション分析は、1990年代初めに英国の有力百貨店マークス&スペンサーの店舗で集めているデータの活用に関して相談を受けたことをきっかけとして、IBM研究所が研究を始め、Apriori(アプリオリ)というアルゴリズムを開発したと言われている。Aprioriアルゴリズムは、巨大なデータベースからアソシエーションルール(associations rules)を抽出することを実現し、データマインニングの実用

  • 1