タグ

Analysisに関するagwのブックマーク (22)

  • 4象限グラフの罠

    「アクセス解析では偏差値は使わない方がよい」に続いて、Web担当者Forumに掲載された株式会社CreatorsNetの菅原 裕さんのこの記事でもう一つ。 繰り返すが、「データを入力するだけで簡単にアクセス解析レポートを作れる、エクセルのフォーマットをダウンロードできる形で用意した。自分なりにアレンジしてぜひ活用してもらいたい。このツールを使えば、アクセス解析ツールだけでは直接読み取れない、別の視点からウェブサイトを解析できる。」というものだが、確かにアレンジが必要で、リサーチ・リテラシーを要求できない一般の方には危険が一杯である。 こちらも繰り返すが、勿論菅原さんは存じ上げているし、実践を積まれている方だ。ご人は重々承知の上で、サンプルも教科書的にうまく仕上げていらっしゃるのだと理解した上で、使い道には気をつけようという主旨。 記事の中の一つに「散布図を使って困ったページを見つける」と

    4象限グラフの罠
  • 平均の罠2(1日平均)

    ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。 今回は1日平均に関して考えてみる。 ある記事で気になったコメントだが、「外れ値を除いて平均値を出す」といった事が書かれていた。アクセス解析は、サンプル調査ではなく、全てがありのままの数字なので、外れ値という考え方はあるのだろうか。サンプル調査でたまたま年収で1億の人がいたら、平均年収の数字をかなり上げてしまうため、この人の年収は平均の算出から外す、つまり外れ値は集計から外すというのが、サンプル調査に於ける外れ値の扱い方だ。 またロボットなどからのアクセスが外れ値の一例として挙げられてい

    平均の罠2(1日平均)
  • 平均値の罠1

    ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。

    平均値の罠1
  • アクセス解析では偏差値は使わない方がよい

    ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。 今回はアクセス解析における意見をご紹介する。きっかけはWeb担当者Forumに掲載された株式会社CreatorsNetの菅原 裕さんのこの記事。 http://web-tan.forum.impressrd.jp/download/webtan08 こちらのブログはトラックバックが飛ばせないようなので、先方の記事でコメントを付ける予定。 「データを入力するだけで簡単にアクセス解析レポートを作れる、エクセルのフォーマットをダウンロードできる形で用意した。自分なりにアレンジしてぜひ活用して

    アクセス解析では偏差値は使わない方がよい
  • An Intuitive Explanation of Bayesian Reasoning

    An Intuitive Explanation of Bayesian Reasoning Bayes' Theorem for the curious and bewildered; an excruciatingly gentle introduction. By Eliezer Yudkowsky Your friends and colleagues are talking about something called "Bayes' Theorem" or "Bayes' Rule", or something called Bayesian reasoning.  They sound really enthusiastic about it, too, so you google and find a webpage about Bayes' Theorem an

  • スパム対策に欠かせないベイズ理論とは?

    測定できなければ科学は成立しない、と言う人がいる。ベイズ理論は、以前は測定できなかった物の測定方法を提示する。仮説や予測を検証し、結論や決断を洗練していく。この理論を利用したベイジアンフィルターは、今、スパムコントロールの分野でホットな話題となっている。 扱う要因と可能性が限定されている場合、基的な確率の計算は簡単だ。例えば、出走馬が10頭の競馬レースを考えてみよう。どの馬に賭けるかの根拠となる情報が、「出走馬が10頭」だけであれば、どの馬を選んでも、勝つチャンスは10分の1だ。しかし、こんな計算を競馬場に持ち込んだら、たちまち財布は空になってしまう。現実の世界はもっとはるかに複雑だ。そしてここに、ベイズ理論の出番がある。 実際には、10頭の出走馬はそれぞれ、すでに少なくとも数レースは経験している。つまり、戦歴がある。ライトニングという馬が連戦連勝で、サンダーという馬が出走したすべてのレ

    スパム対策に欠かせないベイズ理論とは?
  • 「平均のひとつ覚え」から卒業 〜社会人なら知らなきゃ恥ずかしい統計の基礎知識 | Web担当者Forum

    1日あたりの訪問者数を単純に平均すると次のようになる。 単純な平均訪問者数:4699人 しかし、このサイトは週末のアクセス数は平日の数分の1しかないため、平日と週末を分けて考えてみるのもいいだろう。そこで、平日と週末でそれぞれ平均を出すと、次のようになる。 平日の平均訪問者数:6223人 週末の平均訪問者数:888人 これで、平日は6223人より少なければ「アクセスが少なかった」、週末は888人より多ければ「アクセスが多かった」と判断していいのだろうか。 週末の平均はたしかに代表的な数値となっているが、どうも平日の平均がおかしい。グラフを見ても、ほとんどの平日は5000人以下と、平均よりも1000人以上少ないアクセス数になっている。 よく見ると9月14日のアクセス数が非常に多い。この日は、あるページがヤフーニュースで紹介されたために、非常に多くの人がサイトを訪れていたのだ。ヤフー以外にも人

    「平均のひとつ覚え」から卒業 〜社会人なら知らなきゃ恥ずかしい統計の基礎知識 | Web担当者Forum
  • 数学によって導く最適な著作権期間は14年 | スラド

    70年にしろだとか、延長は反対だとかで何かと揉める著作権保護期間に関する問題であるが、家/.の方に数学によって最適な著作権期間を決定するという記事が載っている。ケンブリッジ大学博士課程の学生の論文[PDF]がネタ元のようで、それによれば最適な著作権期間は14年ということである。ars technicaの記事にもなっているが、このような計算で著作権法が置き換わるとは思えないものの、感情論に流れがちな期間の議論に対して、考え方や視点を変えてみるということで面白い試みかもしれない。

  • わたしが知らないスゴ本は、きっとあなたが読んでいる: 陸上自衛隊作戦幕僚の情報理論「オペレーショナル・インテリジェンス」

    陸上自衛隊の情報幕僚が「情報」をどのように扱っているか、守秘義務ギリギリで明かしてくれる一冊。わたしが何気なく使っている「情報」とは違った立ち位置なので、えらく新鮮に読めた。総務・人事やエグゼクティブが、経営関連の情報をどうやってスキミング・評価して使うかという腹積もりで読むと、得るところ大だろう。 例えば、「情報収集の基は公開情報から」の原則。公開情報が占めるイメージを可視化すると、こうなる。見事に80/20の原則に従っているが、事実と類推情報のバランスは想像していたのとずいぶん異なっている。 さらに、オペレーショナル・インテリジェンス―― 作戦情報の原則がスゴい。決められることを今決めることだそうな。つまり、決断と判断においては、どこまで決定できるのかを先行的に決めておく。つまり、「何をいつ決めるのかを、いま決めよ」というのだ。作戦遂行時は状況が次々と変わってゆく、しかもクリティカル

    わたしが知らないスゴ本は、きっとあなたが読んでいる: 陸上自衛隊作戦幕僚の情報理論「オペレーショナル・インテリジェンス」
  • 男性が女性と言い争った時の勝率グラフ - GIGAZINE

    男性が女性と言い争ったときに、どれだけの割合で勝てるのか?という勝率を人生のステージごとにグラフ化したものです。ちょっとエスプリがきいたユーモアです。 詳細は以下の通り。 Chances Of A Man Winning An Argument | gigglesugar - Funny Videos & Humor. 「Dating(付き合っている間)」では勝率が50%あったものの、「Engagement(婚約中)」が近づくにつれて徐々に下がり、25%になっています。そして「Marriage Period(結婚期)」になると、最初の一部を除いて勝率はゼロに。結婚すると頭が上がらなくなる男性は多いということでしょうか。 よく言われている「結婚人生の墓場」という言葉は、これを指しているのかもしれませんね。

    男性が女性と言い争った時の勝率グラフ - GIGAZINE
  • 「PS3は、どのくらいのペースで売れているの?」について

    Digg - VG Chartz Show Both PS3 and X360 on Pace with PS2 Sales digg経由。 「VGChartzは、PS3とX360がPS2と同じペースで売れていることを示している」 って感じで、diggで盛り上がってましたんで。 なわけで、今日は、それに尻馬してPS3が「どのくらいのペースで売れているのか?」という問題について、ちと話をしてみようかと思います。 えーと、まず、VG Chartzからキャプってきましたが、現在のところ、PS3のセールスは、悪くありません。PS2と、そんなに変わらないんですね。 実際のところ、ほぼ同ペースなんです。 じゃあ、「イケテル?」と思われるかもしれませんが、まぁ、ちょっと待ってくださいや。 まず、こちらのチャートを。VG Chartzからキャプった奴です。 これは、セガサターン、任天堂64、PS1のチャー

    「PS3は、どのくらいのペースで売れているの?」について
  • ウェブサイトのトラフィックを分析する50の方法 - ネタフル

    Analytics Toolbox: 50+ Ways to Track Website Trafficというエントリーより。 From analyzing your RSS feed to counting page views to visual representations of where your visitors are clicking, there is no shortage of companies looking to help you better understand your web site’s traffic. ウェブサイトのトラフィックを分析するための、50の方法が紹介されているエントリーです。 一口で言うと、アクセス解析ということになるのだと思いますが、様々なサイトがあるのですね。 カテゴリーとしては、 ・Web Traffic Visualizati

    ウェブサイトのトラフィックを分析する50の方法 - ネタフル
  • http://www.asahi.com/culture/update/0602/TKY200706020175.html

  • 画像で使われているフォントを調べる方法 | POP*POP

    今回の「諦めている不便利」はこちらの投稿をご紹介(企画の詳細はこちら)。 ロゴを作る時に、クライアントから希望のフォントが使われている印刷物やビットマップ画像を示されて「このフォントで」と言われることがあります。その字形からフォント名(もしくは形が近いフォント)を検索する手はないものでしょうか?(ルミエールさんありがとうございます!) 個人的にも「このフォントいいな。何というフォントだろう?」と思いながら、わからなかった経験があります。 この解決方法を調べてみました。 「WhatTheFont」というサイトを使ってみるのはいかがでしょうか。画像で使われているフォントを調べてくれるサイトです。残念ながら日フォントには対応していませんが便利ですよ。 » WhatTheFont 使い方を簡単にご紹介します。 ↑ 調べたいフォントが描かれている画像をアップロードします。URLを指定しても取り込

    画像で使われているフォントを調べる方法 | POP*POP
    agw
    agw 2007/03/10
  • Gnuplot で日々のランキングをグラフにする

    Gnuplot で日付を含むデータ (例えば下のようなもの) をグラフに直す Tips について。 2006-01-24 929 56 30 2006-01-23 923 56 30 2006-01-22 1060 58 33 2006-01-21 1245 64 36 2006-01-20 1577 74 41 2006-01-19 2030 80 45 2006-01-18 2794 93 54 2006-01-17 3711 107 61 このデータは clmemo@aka のブログランキング ドット ネットでのランキング。昨日のエントリーは、実はこのための前振り。 Gnuplot のバージョンは 4.0。 Gnuplot のスクリプト まずスクリプトを招介して、後でコードの説明を個別にしやう。スクリプト名は blogranking.net.gp。データは blogranking.n

    Gnuplot で日々のランキングをグラフにする
  • 検索ツールに足りないものは何か

    多くの人が毎日のように、奇妙で不思議な現象に遭っている。そこにあることは分かっているのに、手の届かないものがある。 いったい何だろう。異次元の存在なのだろうか? 異界のパワーによって、凡人には見つからないようにしているのだろうか? それとも、すぐ目の前にあるのかもしれない。適切な検索ツールさえ持っていれば、簡単に発見できるのかもしれない。 そうしたツールは既にあり、すぐにでも知識を求める人々の役に立つと言う人もいる。一方、そうしたツールは不十分で、せいぜい半端で分かりにくい答えをもたらすだけだと言う人もいる。 どちらが正しいのだろうか? 隠された知識を見つけるツールは存在するのだろうか? さあ、「ミスター・スポックを、ではなくて検索ツールを探せ!」 別にここでミスター・スポックを探す必要はなかった。だが、ここ最近の検索をめぐる関心の高まりや大手ベンダー間の競争を思えば、優れた検索ツールはビ

    検索ツールに足りないものは何か
  • カブロボ、優秀者に5億円の運用託す | スラド

    Anonymous Coward曰く、"トレードサイエンス株式会社がマネックス証券の特別協賛を得て開催する株式自動売買ソフトウェアコンテスト、カブロボですが、次回となる第3回では優秀者になんと5億円の運用を託すそうです。実運用成績に応じて報酬も出るとのこと。 近々説明会もあるようなので、Javaが得意なデイトレーダー諸氏、あるいはデイトレードにハマったJavaプログラマ諸氏は挑戦してみてはいかがですか?"

  • 【レポート】フリーソフト「Bonanza」が初出場で優勝 - 第16回コンピュータ将棋選手権 (MYCOMジャーナル)

    コンピュータ将棋の最強ソフトを決める戦いである「第16回世界コンピュータ将棋選手権」(コンピュータ将棋協会主催)が、今年も3日から5日まで千葉県木更津市のかずさアークにて開かれた。ここ数年はゴールデンウィーク中の開催が定着しているこのイベントだが、今年も日を始めアメリカ・イギリス・カナダ・北朝鮮など各国から計40チーム(+招待1チーム)が集まった。 今年のコンピュータ将棋選手権は、ここ数年決勝トーナメントの常連であり過去4回の優勝を飾っている「IS将棋」(商品版は「最強 東大将棋」)が「思考ルーチンを1から作り直したが、バグが取りきれなかった」との理由で欠場(なおIS将棋来前年3位の資格で決勝シードとなるのだが、自主的にシードを返上しており1次予選から出場の予定だった)。このことが決勝の常連である他のソフトの力関係にどのように影響を及ぼすかが注目された。 また、昨年彗星のようにコンピ

  • クラスタリング技術を使った「はてなブックマーク」でのお気に入りユーザ数ランキング(簡易ジャンル別) - llameradaの日記

    今度は「はてなブックマーク」の「お気に入り」ネットワークで、ジャンル別のランキングを求めてみました。同じユーザから「お気に入り」されているユーザは、同じジャンルに分類されます。詳細は以前の記事を参照してください。 参考リンク:クラスタリング技術を使ったAmazon DVDでの出演回数ランキング(簡易ジャンル別) - llameradaの日記 結果をみると「はてな」の人々が同じクラスタに分類されたり、サブカル系のブックマークをするユーザがまとまっているなど、そんなに結果は悪くないようです。新たな「お気に入り」を探す手助けになるかもしれません。なお、ユーザ数は今回収集した3647ユーザ中での数になりますので、実際より少なくなります。 追記:深い考えもなしに公開してしまいましたが、人を分類するのは問題が多いです。しかも、クラスタリング技術は基的に大雑把で分類精度はあまり高くないのが普通です。い

    クラスタリング技術を使った「はてなブックマーク」でのお気に入りユーザ数ランキング(簡易ジャンル別) - llameradaの日記
  • ネットで渋滞シミュレータ

    Javaで動く渋滞シミュレータのミニ版です。いろいろな道路のタイプが選択でき、どれぐらいの自動車を走らせるのか、そのうちトラックの割合はどれぐらいにするのか?などのパラメータをマウスでぐりぐり動かして変更すれば、リアルタイムに反映されます。どういうのがきっかけで大渋滞が起き始めるのかが手に取るように分かります…。あと、渋滞が解消していく様子も分かります。 Microsimulation of road traffic http://vwisb7.vkw.tu-dresden.de/~treiber/MicroApplet/ 同じようなものだと、こういうのもあるようです。 Simulation Viewing http://www.cs.utexas.edu/~kdresner/2004aamas/index.html この理屈で行くと、全自動車にETCを付けると料金所付近が原因の渋滞は解消

    ネットで渋滞シミュレータ