タグ

統計に関するakkun_choiのブックマーク (33)

  • 因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。ファミコンソフトの中で一番好きなのは『ソロモンの鍵』です*1。 さて。 今回は、因果関係と相関関係について書いていきたいと思います。「因果関係と相関関係は違う」というのはみなさまご存知かと思われますが、そこをまともに論じていくとけっこう入り組んだ議論となります。 「そもそも因果とは」とか「因果は不可知なのか」のような点について論じるとヒュームから分析哲学(様相論理)へと語る流れ(ここのスライド前半参照)になりますし、統計学的に因果をフォーマルに扱おうとするとRubinの潜在反応モデルやPearlのdo演算子やバックドア基準(ここのスライド後半参照)の説明が必要になってきます。 その辺りのガッツリした説明も徐々に書いていきたいとは考えておりますが(予告)、まあ、その辺りをいちどきに説明しようというのは正直なかなか大変です。 なので今回は、あまり細かくて遭難しそうな話には

    因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) - Take a Risk:林岳彦の研究メモ
    akkun_choi
    akkun_choi 2013/04/19
    偶然、逆、上流側に共通要因、合流点
  • ソシャゲへの反感はワインの方程式が生んだ反感と同じ ?ゲームと心理学(2) | 新清士の「デジタルと人が夢見る力」 - コミニー[Cominy] / ブログ

    プロフィール 新清士 ジャーナリスト。立命館大学映像学部非常勤講師。1970年生まれ。慶應義塾大学商学部及び環境情報学部卒。著書に、『ゲーム産業の興亡』(アゴラブックス)。 2008年に、プリンストン大学の経済学者オーリー・アッシェンフェルターが発表した論文「ボルドーワインの質と価格を予想する(Predicting the Quality and Prices of Bordeaux Wines)」という論文は、ビンテージワインの専門家に対して、とどめを刺すとでもいえるような論文だ。 ビンテージワインは同じブドウ園で生産されたワインであっても、年によって出来不出来があるために、値段が変化する。品質によっては、10倍以上の差が生まれることがある。世界中にはワインコレクターがおり、将来にワインが成熟して評価が高まることで、値段が高くなることを見越して投機の対象として購入している人々もいる。 実

    akkun_choi
    akkun_choi 2012/12/26
    ゲームの面白さが検証可能になったこと
  • 相関と因果について考える:統計的因果推論、その(不)可能性の中心

    3. 今回のもくじ イントロ -『相関と因果』再訪 基礎編 - 因果概念の変遷: 心の習慣 から 反事実 へ - 因果と確率論を繋ぐ:Pearlのdo演算子 実務編 - 重回帰とは因果構造分解酵素である - バックドア基準による変数選択 考察 - 因果推論の不可能性, モデル選択の3視点 4. 相関と因果は一致しない 86 女 性 84 の 平 82 均 寿 80 命 78 (歳) 30 34 38 NHKの放送受信契約数(百万) http://www.stat.go.jp/data/nihon/02.htm 元データ→ http://pid.nhk.or.jp/jushinryo/know/pdf/toukei2010.pdf 5. 相関と因果は一致しない 86 p < 0.00000002 女 2 性 84 R = 0.99 の 平 82 均 寿 80 命 78 (歳) 30 34 3

    相関と因果について考える:統計的因果推論、その(不)可能性の中心
  • 図録▽神の存在・死後の世界に対する見方

    「神の存在」や「死後の世界」を信じているかどうかについて、「信じている」、「信じていない」、「わからない」の割合を対象となっている世界77か国について図示した。国の順番は「信じている」の割合の大きい順である。 (神の存在を信じるか) まず「神の存在」についてであるが、「信じている」の割合は最も高いエチオピアの99.9%から最低である中国の16.9%まで大きく異なっている。神の存在感は国によってまことに様々であることが分かる。 それにしても図を見て、まず、目立っているのは、神の存在を信じている国民の多さである。90%以上の国民が「神の存在」を信じている国は36か国と半数近くにのぼっており、95%以上に限っても26か国もある。 95%以上と国民のほとんどが「神の存在」を信じている国を見るとイスラム圏の国が12カ国と最も多く、カトリック国が9カ国、それ以外の途上国が5カ国となっている。 主要先進

  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    サヨナラ検定、グッバイ統計的有意性/統計を使うつもりなら必読の論文はこれ
  • 統計の基礎

    平均値 $n$ 個の数値 $x_1$,$x_2$,...,$x_n$ が与えられたとき,これらの値を代表する値(代表値)として最もよく使われるのが平均値(mean,average) \[ \bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n} \] です。$\bar{x}$(エックス・バー)は $x$ の平均値を意味します。 平均値を意味する英語は mean と average の二通りがあります。平均値を求めるのにExcelでは average() という関数を使いますが,Rでは短いほうの mean() が関数名になっています。 > x = c(0, 7, 8, 9, 100) > mean(x) [1] 24.8 上で定義したものを相加平均または算術平均(arithmetic mean)ともいいます。これに対して,積の $n$ 乗根 \[ \sqrt[

  • 図録▽自殺率の国際比較

    は欧米先進国と比較すると確かにかなり高い自殺率となっている。さらに範囲を広げた国際比較では、図のように、日は、世界第18位の自殺率の高さとなっている。過去の当図録では世界第6位だったこともあり、2012年推計では9位だったので、最近はランクを大きく下げていることが分かる。もっとも、日を上回っている国は一部の途上国、あるいは体制移行国だけであり、先進国の多くは日より低いということから日の自殺率はやはり非常に高い値であるといわざるを得ない。もっとも近年韓国が日を抜きOECD諸国の中で最高となったので先進国中世界一の座は明け渡した格好である(図録2774参照)。 中国の自殺率については、初の全国調査(1995-1999)で年間自殺者数28万7千人、自殺率は10万人当たり23人というデータも報じられていた(People's Daily Online 2002.11.)が(旧版図録27

  • お勧めは年上女性! - P.E.S.

    ちょっといまさらのネタではありますが、今年のバレンタインディも涙にくれたOkemosです。 さて、当ブログP.E.S.はその紹介にもありますように、政治、経済、SFネタの翻訳をやっておりますが、裏のテーマは婚活です...いや、90%くらい誇張が入ってますが、婚活とか考えなきゃとか思っているのは事実です。なのにも関わらず、はてブのランキングなどをみると、婚活での「うわー、女コエー!」なネタなどが時々ランクインしていまして、わが足を躊躇させます。 ところでアメリカ男女マッチングサイト(一応、出合い系って、ことになりますか)のOkCupidってのがあるんですが、ここがブログをやってまして、自分のところの会員のデータを使った分析を色々とやっています。その2月16日の分析が「男ども、年上に目を向けろ!(若くて綺麗な子なんてどうせ無理なんだから!)」というものでした。私は知的なお姉さま好きですので、

    お勧めは年上女性! - P.E.S.
  • 統計学の面白さはどこにあるか - hiroyukikojimaの日記

    先日、とあるパーティで、統計学者の松原望先生と会った。 松原望先生は、早期からベイズ統計学の重要性を世にアピールしてきた先駆者である。ぼくは、経済学部の大学院在学時に、選択科目ではあったが、松原望先生の「ベイズ統計学」という講義を受け、そこでベイズ理論の指南をしていただいた。ぼくは『確率的発想法』NHKブックスや『使える!確率的思考』ちくま新書の中で、ベイズ理論を紹介していて、それが多くの読者にウケて、この二冊はセールス的にも良い実績を出しているのだけど、正直言ってここに書いてあることの多くは、松原望先生の講義の受け売りである。そういう意味では、下品ないいかたになるが、大学院の数ある講義の中で最も「金に換えることのできた」講義が先生の講義だった、ということになる。 そのときは、放送大学の教材であった『統計的決定』というを教科書に使った。これがめちゃくちゃいいで、今でもベイズ統計学に関し

    統計学の面白さはどこにあるか - hiroyukikojimaの日記
    akkun_choi
    akkun_choi 2008/07/25
    「数学は完全無欠な「演繹的推論」であるが、統計学には一部に「帰納的」な考えが混入しているのだ。それが、数学にどっぷり漬かってきたぼくには、「論理飛躍」に見えていた部分だったのだ。」
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • 内閣府が「ネット調査と訪問調査でどんな差が出るか?」を詳細に報告していた | Web担当者Forum

    少し古い記事になるが、内閣府が以下のようなコンテンツを公開していた。 → インターネットによる国民生活に関する意識調査 ~ 世論調査との比較分析 ~ http://www8.cao.go.jp/survey/sonota/h19-internet/index.html わかりやすくいうと、「ネットリサーチを使った調査と、調査員による個別面接聴取による調査とで、どんな違うが出るか調べてみた」というものだ。 2007年7月調査のものなので、2008年版が出たら記事として取りあげようかと思っていたのだが、編集部コラムのネタが切れてきたので出してしまおうと思う。 同じ設問でネットリサーチと訪問調査をそれぞれ行っているのだが、まず、それぞれの調査の共通点と相違点をまとめてみよう。 2つの調査に共通すること・調査項目 現在の生活について(生活の向上感、満足度等)今後の生活について(生活の見通し、力点等

    内閣府が「ネット調査と訪問調査でどんな差が出るか?」を詳細に報告していた | Web担当者Forum
  • 自分達のマイノリティーさを再確認してみた

    人口 約1億2776万人(平成17年国勢調査) 男性 約6230万人(総人口中48.7%。平成17年国勢調査)女性 約6546万人(総人口中51.2%。平成17年国勢調査)未成年 約2357万人(総人口中18.4%。平成17年国勢調査)高齢者人口 約2560万人(総人口中20.0%。65歳以上・平成17年統計局調査)労働者人口(15歳以上の就業者+失業者) 約6600万人(総人口中51.6%。2004年総務省労働力調査) 完全失業者数 約268万人(総人口中2%。労働者人口中4%。統計局平成20年3月速報。 ※正確に把握できてるのかなあこれ)フリーター人数 約187万人(総人口中1.4%。労働者人口中2.8%。2006年厚生労働省調べ ※正確に把握できてるのかなあこれ)ニート人口 約85万人(総人口中0.6%。2002年内閣府調べ ※正確に把握できてるのかなあこれ)年間自殺者数 約32

    自分達のマイノリティーさを再確認してみた
  • 元シンクタンクの達人が明かす「だまされない統計データの読み方」

    ブロガーが絶大な信頼を寄せる「社会実情データ図録」 今やインターネットには星の数ほどのウェブサイトがあふれ、検索サイトを使えば誰でも知りたい情報を容易に探せる時代だ。しかし、その一方でインターネットには必ずしも正しいことが書かれているとは限らず、都市伝説や常識の誤認識などもあとを絶たない。 あるウェブサイトで「真実」と言われる情報でも、その分野に詳しくない人に取っては真偽を見分けるのは難しい。ましてや個人サイトからの情報発信となると、情報の信憑性を低く感じてしまう人もいるかもしれない。 そのような状況にあって、多数のブロガーや読者から絶大な信頼を得ているのが「社会実情データ図録」だ。官庁や国際機関、新聞社などが作成したさまざまな統計データをまとめたウェブサイトで、大手ポータルサイトもたびたび引用している。顔の見えるインターネット第8回は、その管理人・川氏に、情報を取捨選択する極意について

  • kikulog

    kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord

  • 統計学習リンク集 ★ ★ ★

    WWWで統計を学習しよう 検索系相談等|統計教育リンク|統計学用語集|case study(問題集)|統計学から分散分析・重回帰まで|総合的|特定分野 (統計教育・注意|研究法|歴史|測定|サンプリング|分布|検定力|meta-analysis|resampling|bootstrap|cross-validation|AIC, BIC, 情報量|nonparametric test|exact test|conjoint analysis|実験計画法・分散分析 |多変量解析|因子分析・共分散構造モデル|multi level|多次元尺度解析|グラフ化|・論文案内 )|研究|雑誌|ソフト手引き(SPSS|SAS|S|LispStat|Stata|Statview|Epi Info|Excel)| <統計ソフト・統計学習用データ>|統計関係総合リンク|統計ソフト紹介関係|統計ソフト会社|共

  • 定量調査: 何人のユーザでテストすればよいか

    ユーザビリティの計測を行うとき、20 人のユーザをテストすれば、大抵の場合は妥当な信頼区間を得られる。 Quantitative Studies: How Many Users to Test? by Jakob Nielsen on June 26, 2006 ユーザビリティの質を表すには、ユーザの要する習得時間、効率、記憶量、犯す間違いの数、主観的な満足度など、品質指数として表現することが可能だ。残念ながら高い費用が必要になるため、そのような調査を行うプロジェクトは希だ。そういった調査には、簡単なユーザテストを行うのに比べて 4 倍ものユーザを必要とする。 各ユーザのパフォーマンスには大きな違いがあるため、より多くのユーザが必要となる。ユーザの計測を行えばどんな場合でも、とても速くタスクをこなす人と、とても時間をかける人が、多少いるものだ。それを考慮すると、ユーザの数を多くして、この差

    定量調査: 何人のユーザでテストすればよいか
  • Amazon.co.jp: JMPによる多変量データ活用術: 廣野元久, 林俊克: 本

    akkun_choi
    akkun_choi 2006/07/25
    助かりました
  • R による統計処理

    R による統計処理     Last modified: Sep 08,2009 リンク(50 音順) 石田基広さん R と Linux と... 岡田昌史さん RjpWiki 奥村晴彦さん 統計・データ解析 奥村泰之さん 無料統計ソフトRで心理学 -Passepied- 里村卓也さん マーケティング・サイエンスの道具箱 竹内昌平さん R on Windows 田畑智司さん 統計解析言語 R で多変量解析を行う 中澤港さん 統計処理ソフトウェア R についての Tips R 関連文書邦訳 pdf 版 濱岡豊さん データとの対話(情報処理 3) 『経済・経営のための統計学』(第 8 章;有斐閣) 山義郎さん R - 統計解析とグラフィックスの環境 R 入門 メディアラボ株式会社 Linux で科学しよう! - R 直前のページへ戻る   E-mail to Shigenobu AOKI

  • 誕生日のパラドックス - Wikipedia

    誕生日のパラドックス(たんじょうびのパラドックス、英: birthday paradox)とは「何人集まれば、その中に誕生日が同一の2人(以上)がいる確率が、50%を超えるか?」という問題から生じるパラドックスである。鳩の巣原理より、366人(閏日も考えるなら367人)が集まれば確率は100%となるが、その5分の1に満たない70人でもこの確率は99.9%を超え、50%を超えるのに必要な人数はわずか23人である。 誕生日のパラドックスの「パラドックス」は、論理的矛盾という意味ではなく、結果が一般的な直感に反するという意味でのパラドックスである。 この理論の背景には Z.E. Schnabel によって記述された「湖にいる魚の総数の推定[1]」がある。これは、統計学では標的再捕獲法 (capture‐recapture法) として知られている。 ある集団に同じ誕生日のペアがいる確率。23人で確