タグ

分析に関するyamataku13のブックマーク (12)

  • http://bdm.change-jp.com/?p=2761

    http://bdm.change-jp.com/?p=2761
  • とっつきにくいけど実はエクセル以上に賢いヤツ フリー統計解析ソフトウェア「R」を触ってみよう【R入門講座】

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    とっつきにくいけど実はエクセル以上に賢いヤツ フリー統計解析ソフトウェア「R」を触ってみよう【R入門講座】
  • 5年後のデータサイエンティスト

    2. お前誰よ ところてん – http://twitter.com/tokoroten 大学時代 – – – – – 電子透かしの研究(B2~B4) コンシューマゲーム会社で9ヶ月のインターン(B3) 自然言語処理を利用したPhishing対策(B5~M2) 半導体計測器開発ベンチャーでバイト、C++と光学設計(B4~M2) IPA未踏ユース(M1)、学生ベンチャー起業(M2) 社会人 – 某通信会社の研究所(3年弱) – コンピュータウィルスの収集、分析 – クラウド、ビッグデータ関連の研究 – ドリコム(2年目) – インフラ → プロモーション分析 → アプリ分析 – 現在はソーシャルゲームデータ分析 兼 企画含めた何でも屋 Copyright Drecom Co., Ltd All Rights Reserved.

    5年後のデータサイエンティスト
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • ソーシャルゲームのためのデータストリームマイニング : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 別に(ソーシャル)ゲームに限らず、ユーザのそういった行動ログはweb閲覧履歴など...の形態で蓄積されていたはずで,それに比べてデータ量が大きく増えたわけではないのに、何で今更ビッグデータがどうのこうのと言われているんでしょうか? ソーシャルゲームの会社は口を揃えてユーザの行動ログを分析...マイニングして売り上げ増やしたいと思ってますが、しかしデータマイニングについては基的に心構えというか、ある種の"覚悟"のようなものが要りますよ。 「ビッグデータがあるので、これを分析して何か面白いことがわからないか」 とか言う

    ソーシャルゲームのためのデータストリームマイニング : 研究開発
  • 東日本大震災ビッグデータWS project 311に参加する その1 - Fire and Motion

    (2012/9/19 22:51追記 url切れが多かったは間違いだったので修正.奥村先生の分析結果と数が合わないのはもう一度チェックする!) (2012/9/20 14:24追記 1tweetに複数以上のurlが含まれていても1つしか抽出していなかったので修正.奥村先生の抽出結果の数字とほぼ同じオーダーの数値になったが,今度はこちらが10〜20程度多いものがある…なぜ…?) (2012/9/20 22:05追記 奥村先生とのツイート数のずれはURLの後ろに付いた#が原因であることが判明.詳細は奥村先生のtwitter分析のページに記載されています) Googleが幹事となり,朝日新聞社,JCC,Twitter Japan,日放送協会,田技研工業,レスキューナウ,ゼンリンデータコムによる8社が2011年3月11日前後のデータを公開して,当時何が起こったのか,震災時に必要なサービスは何か

    東日本大震災ビッグデータWS project 311に参加する その1 - Fire and Motion
  • UMLを使った既存システムの分析

    UMLで表現する 分析のためのモデリング 今回紹介する表現方法は、分析の手法として活用するものです。つまり「調べる⇒分析する⇒結果を記述する」という流れではなく、「調べる⇒記述する⇒分析する」というサイクルを前提にしています。限られたアイコンを使い、パターンに従って記述することが分析につながります。個々の要素をつなげる、分類するという行為を繰り返すことが、対象を深く知ることになるのです。ポイントは、間違っていてもいいので、とにかく記述することです。間違いは気づいたときに直せばいいのです。 以下に表現方法を紹介しますが、結果を整理するのではなく「書きながら考える」ということを意識しながら使ってください。そうすると、少数の記号と決まったパターンで表現することの価値を実感できると思います。 表現方法 システムの地図は6種類のデータと2つのモデルで表現します。 誰に:  「アクター」、「外部システ

    UMLを使った既存システムの分析
  • Tポイントの会員データ分析から企業は何を知るのか

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 多様なシステムから生み出される多種、大量の「データ」を高速に分析し、そこから得た知見をビジネスの競争力強化や顧客満足度の向上に役立てようとする取り組み——「ビッグデータ」が、大きな注目を集めている。 4月中旬に開催された日IBM主催の「Information On Demand Conference Japan 2012」の中で、実際にこのビックデータを活用して成果をあげているいくつかの企業の事例が紹介された。その中には、日人口の約3割におよぶ個人消費者の購買行動に関するデータを活用し、パートナーに対してマーケティング視点での分析サービスを提供している企業があった。 「Tポイント」サービスを展開するカルチュア・コンビニエンス・クラブ

    Tポイントの会員データ分析から企業は何を知るのか
  • 「Webサイト改善は図を描きなさい!」 〜 SiteCatalyst達人から教わった分析フレームワーク-Six Apart ブログ|オウンドメディア運営者のための実践的情報とコミュニティ

    TOP > 「Webサイト改善は図を描きなさい!」 〜 SiteCatalyst達人から教わった分析フレームワーク こんにちは。マーケティング担当の伊藤大地です。 先日、米AdobeでWeb解析ツール「SiteCatalyst」のプロダクトマネージャープログラムマネージャー(初出時、役職を誤って表記しておりました。お詫びし、訂正いたします)を務めていらっしゃる清水誠さんが、一時帰国された折に弊社に遊びに来てくださいました。たっぷり2時間、最新Webマーケティング事情やWeb解析についてお話を伺いした中から、WebのKPI測定・改善サイクルとそのノウハウについて、エッセンスをお伝えしたいと思います。 清水さんが提唱されているWeb改善のフレームワーク「コンセプトダイアグラム」という手法は、主に3つのプロセスから成り立っています。 ユーザー視点でサイトを図解し、コンセプトを明確にする サイトの

    「Webサイト改善は図を描きなさい!」 〜 SiteCatalyst達人から教わった分析フレームワーク-Six Apart ブログ|オウンドメディア運営者のための実践的情報とコミュニティ
  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
    yamataku13
    yamataku13 2012/03/14
    あとで読む
  • 直帰率を下げるためのアクセス解析術――回遊分析(1) [アクセス解析tips] | 衣袋宏美のデータハックス

    前回まで4回にわたって流入分析を解説してきたが、今回からは回遊分析についてお話ししていく。回遊分析とは、サイトに来訪したユーザーが目的の情報にたどり着けているかを明らかにするための分析である。サイト内でユーザーが最初に見るページを「入口ページ(ランディングページ、閲覧開始ページ)」と呼ぶが、まずは入口ページでの直帰率が分析ポイントとなる。 何らかの目的を持って来訪したユーザーが、入口ページを見ただけでサイトから出ていってしまうことを「直帰」といい、直帰したユーザーの割合を「直帰率」という。直帰率が高い場合には、いきなりアクセス解析から始めるよりも、まずは基的なことができているかどうかを確認しよう。一般に直帰率を下げる施策としては、 全文表示しないで続きを読ませる(ブログ)商品を多く並べて賑やかにする(ショッピングサイト)Flashの多用をやめる画像リンクをテキストリンクにするといった基

    直帰率を下げるためのアクセス解析術――回遊分析(1) [アクセス解析tips] | 衣袋宏美のデータハックス
  • データの細部に気を取られずに<br/>“当たり”をつけて全体を一言で表そう:日経ビジネスオンライン

    前回は緊急提言としてTQMの視点からトヨタ自動車の問題を取り上げた。 今回は前々回の続きとして、日常業務に使える統計学の基的な話に戻りたい。ここでは分布の全体像を単一の数字で表す方法を学ぶ。 統計学では調査の対象全体をユニバース(注)とか母集団という。前々回ではユニバースからデータを集めて、度数分布表や度数順位表を作成し、ヒストグラムやパレート図を描く事をお話した。今回はさらに一歩進めて、それらの表やグラフから、そのグループを一言で言うとどういうグループなのかという事を考える。 読者の便宜のため、ここに、前々回と同じ例を示す。 例 度数分布表を使って、次のような場合を考えてみよう。ある消費市場調査会社が代表的な3つの中型乗用車の耐用キロ数を調べたところ、表1のような度数分布表を得た。これをヒストグラムにすると図1のようになる。 データを集めて、そのデータを分析する目的は状況に応じていくつ

    データの細部に気を取られずに<br/>“当たり”をつけて全体を一言で表そう:日経ビジネスオンライン
  • 1