タグ

統計に関するTomosugiのブックマーク (36)

  • 「未婚男性の死亡年齢中央値だけが異常に低い件」は間違い? ちゃんと調べた その2

    前 https://anond.hatelabo.jp/20241014004111 未婚男性が死にやすい状況も変わらないようだった 各区分の死亡した人の平均年齢 ※これで論じるのは良くないと思うが、2019年と2022年で大きな差はないことを確認するため 2022年性別未婚離別有配偶死別既婚男性65.372.580.587.681.2女性75.979.677.190.286.3 2019年性別未婚離別有配偶死別既婚男性63.57179.586.880.3女性75.778.47689.685.5 以下は計算に使ったデータ 2019 男性年齢区分平均年齢男性総数男性未婚者数既婚者数既婚率死者総数有配偶死者数離別死者数死別死者数既婚死者数未婚者死者数15~19歳1727816062757418241880.9771000077120~24歳222948345260239534595011.71

    「未婚男性の死亡年齢中央値だけが異常に低い件」は間違い? ちゃんと調べた その2
  • 「未婚男性の死亡年齢中央値だけが異常に低い件」は間違い(?)なこと、ちゃんと調べた

    追加:調べ終わったから一番最後だか見るのオススメ。残念ながら相関は「あった」。しかし元記事は言い過ぎ。 追記:さらに調べた ・低収入が原因である可能性はありそう ・アメリカで同様の議論や研究があった(原因は結局特定に至っていない?) ーーーー この件、これより前にもあったと思う https://news.yahoo.co.jp/expert/articles/afc7fac67c5e9a7cf41f0c1096096c5851c25872 Youtubeやらでめっちゃ拡散されてたよね 非常に怪しいと思いながら、統計調べるのってすごーーくめんどくさいから放置してた そしたら大和総研でちゃんと否定してた https://www.dir.co.jp/report/column/20241011_012166.html これ見て「ああそういうことか」と思ってちゃんと調べることにした 3時間くらいか

    「未婚男性の死亡年齢中央値だけが異常に低い件」は間違い(?)なこと、ちゃんと調べた
  • 信頼できるメディアはテレビなのか、私をたたかないで - ネットロアをめぐる冒険

    大変久しぶりです。特に何かあったわけではなく、単純に忙しい日々でした。 世間から忘れ去られてしまう前に、ちょこっと記事を書こうと思います。こんな画像がバズってました。 信頼できるメディアは?→ 1位「テレビ」、2位「新聞」、3位「ラジオ」(池上彰のニュースそうだったのか!!) | Share News Japan これについて、「おいおい嘘はやめろよ」「テレビテレビを挙げるなんて...」みたいなツッコミコメントが多数ついていました。 定期的に前から挙げられてはおんなじような反応が跋扈している話題なのですが、このアンケート、どの程度信憑性があるのか、というところを調べてみました。結論を書けば、「まあ普通の結果だろうけど実は…」という感じです。面倒な方はいつも通り「今日のまとめ」だけ読んでください。 【目次】 放送内容について アンケートの元は何か 他の調査と比較する 各国の比較 なぜ「テレ

    信頼できるメディアはテレビなのか、私をたたかないで - ネットロアをめぐる冒険
  • 野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由

    Sports Analyst Meetupは、現役スポーツアナリストとスポーツ分析に興味のある方の情報共有イベント。ここでは認知科学研究者のなういず氏が、時間割引の視点からどうしてバントは減らないのか、心理学的アプローチから解説しました。 どうして送りバントは減らないのか? なういず氏(以下、なういず):『どうして送りバントをやめられないのか』というタイトルで発表いたします。なういずと申します。よろしくお願いします。 初めましての方もいると思いますので、最初に簡単に自己紹介させてください。私、なういずというハンドルネームで活動しています。Twitterは@nowism_sportsでやっていますのでフォローしてもらえると嬉しいです。サッカーは柏レイソルを、野球は巨人を応援しています。 普段は東京大学の大学院で認知科学を研究しています。研究の中では人間の非合理的な意思決定というものに興味があ

    野球で送りバントが減らないのはなぜか 認知科学研究者が分析する送りバントをする心理学的理由
  • ア㊙️イさんのお尻と学ぶ統計学(仮置場)

    目次からリンクで飛べる各トピックはツリー形式になっているのだ。 あまりにツイート量が膨大になってしまったので、123回目以後は各ツリーの最初のツイートへリンクだけまとめておくのだ。 お尻さんは各国の歴史や制度に詳しいわけではないし統計手法も誤って理解していることがあるから(それなら黙っておけという話だけど)、間違いがあったらどんどん指摘して欲しいのだ!

    ア㊙️イさんのお尻と学ぶ統計学(仮置場)
  • 平気寿命は嘘をつく 現在50代の男性2人に1人は90歳超まで生きる│NEWSポストセブン

    人の平均寿命は男性約81.1歳、女性約87.3歳(2017年)に達した。「人生100年時代と騒がれているけど、平均寿命がそこまで延びるのはまだ先の話」――このデータを見て、そう考える人も多いのではないか。しかし、それは大間違いである。 実は、日人の“当の寿命”はもっと長い。現在55~60歳の男性の「2人に1人」は90歳超、女性の半数は100歳近くまで生きる――そう推定されているのだ。 なぜ、公表されている平均寿命と“当の寿命”に乖離があるのか。計算方法に理由がある。 「平均寿命」とは生まれたばかりの新生児(生後0週)の推定寿命であり、年齢別の死亡率をもとに計算される。若いうちに亡くなるケースも計算に含まれることから、実際の寿命よりかなり低くなる傾向がある。 それに対して、ある年齢に達した人がこの先、何年生きるかを推計したのが「平均余命」だ。最新の統計(厚労省「平成29年簡易生命表

    平気寿命は嘘をつく 現在50代の男性2人に1人は90歳超まで生きる│NEWSポストセブン
  • 日本は統計が不正確だったから敗けたのではなく、現実を直視できなかったから敗けた - 読む・考える・書く

    安倍政権の統計不正問題にからんで、敗戦後に吉田茂がマッカーサーに語ったという、あるエピソードが話題になっている。 日経済新聞「春秋」(1/19): 終戦直後、吉田茂は「餓死者が大勢出る」と連合国軍総司令部(GHQ)のマッカーサーに訴え、米国から大量の料を送らせた。だがそんな状況にはならない。日の統計はでたらめだと詰め寄られるや、「日の統計が正確だったら、米国と戦争などしていない」。 ▼ユーモアを武器に、和製チャーチルと評された元首相の面目躍如たるエピソードだ。(略) 仮に吉田茂がこう語ったのが事実だとしても、戦前の日の統計がデタラメだったというのは事実ではない。実際、対米開戦前には「内閣総力戦研究所」が統計その他のデータをもとに対米戦争のシミュレーションを行い、日は必ず負けるという正確な結論を出していた。 対米戦争になったらどうなるか?というシミュレーションは内閣総力戦研究所と

    日本は統計が不正確だったから敗けたのではなく、現実を直視できなかったから敗けた - 読む・考える・書く
  • ついカッとなる人、減少中? 「鉄道係員への暴力」17年度は過去10年で最少

    JR東日JR西日、東京都交通局など鉄道大手34社はこのほど、2017年度(17年4月~18年3月)に発生した鉄道係員に対する乗客の暴力行為は656件で、過去10年間で最も少なかったと発表した。「啓発ポスターの掲出、警察官の巡回、監視カメラの設置などが抑止に貢献した」という。

    ついカッとなる人、減少中? 「鉄道係員への暴力」17年度は過去10年で最少
  • What makes a country good at football?

  • 何がサッカー代表チームを強くするのか?

    by Rémi Jacquaint 2018年6月14日から開催されている2018 FIFAワールドカップでは、グループリーグで優勝候補の一角であったドイツが敗退し、決勝トーナメント1回戦でもスペインやアルゼンチン、ポルトガルといった強豪国が次々と敗れる波乱の連続が起きています。ワールドカップを見ているとふと考えてしまう「何が国を代表するサッカーナショナルチームを強くするのか?」について、経済紙のThe Economistが統計データなどを用いて分析しています。 What makes a country good at football? - The World Cup https://www.economist.com/international/2018/06/09/what-makes-a-country-good-at-football ある土曜日の晴れた午後、サッカーのウルグアイ

    何がサッカー代表チームを強くするのか?
  • 冬季オリンピックでメダルを取れる国の条件を、重回帰分析で探る! - プロクラシスト

    こんにちは、ほけきよです。 冬季オリンピック、今日で閉会式ですね。*1 連日、各国選手の美しいプレーには感動しています。 データによれば、 日は獲得メダル数過去最高らしいです! そこで、ふと気になることがありました。 「冬季オリンピックって、どういう国がメダルをたくさんもらっているのだろう??」 今回は、過去のオリンピックのデータを用いて、冬季オリンピックの強い国の条件を大雑把に分析してみます! 考えられる要因のリストアップ 気温 GDP 人口 開催地からの距離 分析 手順 重回帰分析とは 結果 : どの要素が一番強いのか? メダルポイントの式 精度はどうなの? まとめ 考えられる要因のリストアップ 今回、冬季オリンピックに強い国になりうる理由を、4つ考えてみました 気温 やはり、寒い国が勝つのは、直感的にも正しそうですよね? 赤道直下じゃ雪なんか降らないですものね。 今回は簡単に、各国

    冬季オリンピックでメダルを取れる国の条件を、重回帰分析で探る! - プロクラシスト
  • 市場規模展望台

  • Exit Polls 2016

  • 競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ

    記事のタイトル通り、競馬で回収率100%を超える方法を見つけたので、その報告をする。 ちなみに、この記事では核心部分はぼかして書いてあるため、読み進めたとしても「競馬で回収率100%を超える方法」が具体的に何なのかを知ることはできない。(私は当に有効な手法を何もメリットが無いのに公開するほどお人好しではないので) 当に有効な手法を見つけたいのであれば、あなた自身がデータと向き合う以外の道は無い。 ただし、大まかな仕組み(あと多少のヒントも)だけは書いておくので、もしあなたが独力でデータ解析を行おうという気概のある人物なのであれば、この記事はあなたの助けとなるだろう。 ちなみに、これは前回の記事の続きなので、読んでない方はこちらからどうぞ。 stockedge.hatenablog.com オッズの歪みを探す さて、前回からの続きである。 前回の記事のブコメで「回収率を上げたいならオッズ

    競馬の解析をガチでやったら回収率が100%を超えた件 - stockedge.jpの技術メモ
  • When ‘Moneyball’ Meets Medicine (Published 2015)

  • 統計学(笑)データ分析(爆笑)

    ある大手チェーンのスーパーであったこと。 そこは東京近郊の駅前にあって24時間営業の店なんだけど、朝の6時~8時はレジを2~3台で回していた。 でもある日、上の意向でこの時間のレジは基1台のみで回すことになった。 レジの回転率の数値を見て1台で充分回せるとわかったため経費削減の判断だ。 しばらくレジは1台で回していたのだが、ほどなくしてこの時間帯の来客・売上げはかなり落ちてきた。 レジの稼動を1台に絞れという判断は、来客が少ないのにレジに余計な人件費をかけるという 無駄を事前に防ぐことができたとその判断自体はそれなりに評価されたらしい。 でもこの時間帯に現場で働いている人間はバイトでも知っている。 来客数・売上げが落ちた理由は稼動レジを1台に絞ったためだ。 確かにレジ1台でも充分裁くことができる来客数だったんだけど1台だと常にレジに列ができている状況だった。 この時間帯に来る客は、主に通

    統計学(笑)データ分析(爆笑)
  • 生きたことばをモデル化する統計科学の研究:研究室訪問:統計数理研究所

    「いづれの御時にか、女御更衣あまたさぶらひける中にいとやむごとなき際にはあらぬが、すぐれてときめきたまふありけり」で始まる『源氏物語』。平安時代中期(11世紀)に成立した宮廷の恋愛物語は、世界最古の長編小説として有名だが、江戸時代の人々にすら極めて難解なことばの集合で、多くの注釈書が発刊されていた。 ことばは時代と共に変化し、それを正しく理解することは失われた意味を復元する作業にも似る。冒頭にかかげた源氏の一節も、教えてくれる人がいなければ、それぞれの単語がどこで切れるのかすら判然としない。 言語を確率論的にとらえ、計算式によって解析(処理)するなら現代語も古典も、未知の言語すらも容易に理解できるようになる――このように考えて「計算言語学」の旗をかかげる統計科学者がいる。 言語の差異構造を統計的に理解する 持橋の専門分野は、「統計的自然言語処理」と「統計的機械学習」。それは簡単に表現するな

  • エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!

    2014/10/14 追記 書87ページに「母数」という単語が複数回出てきますが、 これは全て「分母」とすべきでした。*1 通常、統計学の文脈では、母数は各確率分布を特徴付ける変数を指す単語であり、 例えば正規分布は平均と分散という二つの母数によって形状が決定されます。 決して母数と分母(あるいは全数)と誤解してはなりません。 しかし母数と分母を混同することは当によくあることで、 書はこのような頻出する誤解を訂正し、 皆様が統計を用いる際の失敗を一つでも減らす という目的で執筆に至ったにも拘らず、 まさか書でこのような重大な失敗をしてしまったことに対し 心からお詫び申し上げ訂正させて頂きます。 なお、問題個所の記述は共著者の森藤氏ではなく 私が記述したものであり、全責任は私にあります。 を書くに当たり、誤字脱字や言い回しの不備は出来る限り無くすべきですが、 人間であるためミスをす

    エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!
  • P値が有意になるように頑張りすぎちゃっていませんか?

    Natureに統計学的検定の問題についてのエッセイが出ていた。フィッシャー、ネイマン、ピアソンの言い争いの紹介も含めて、P値にまつわる議論を短くまとめている。何でも、この世には統計学的に有意であるのに再現性の無い調査や研究は多々あるのだが、統計学的な検定を盲信してしまい考察が疎かになっているせいだそうだ。 P値を扱うときの問題が三つ上げられている。一つは、偽陽性の可能性がP値から連想する以上に高いことだそうだ。統計学的な厳密な議論は説明されていなかったが、例えば帰無仮説が0.5のときに、P値が0.01で有意になったとしても、再現実験では11%以上の確率で再現が得られないそうだ。一つは統計的有意であることに満足して、その効果の大きさを考察しないことがあるそうだ。一つは、P値が有意になるように分析方法を工夫しすぎてしまうケース(P-hacking)があるそうだ。 エッセイでは探索的研究と検証的

    P値が有意になるように頑張りすぎちゃっていませんか?
  • 職業別の生涯未婚率

    生涯未婚率という指標をご存知でしょうか。読んで字のごとく,生涯,未婚の状態にとどまる者がどれほどいるかです。 これは,全人口の人生を死ぬまで追跡して出すような,込みいったものではありません。生涯未婚率としては,50歳時点の未婚率が用いられます。この年齢以降は,結婚する者はほとんどいないであろう,という仮定に立つわけです。 なお,多くの官庁資料の年齢統計は5歳刻みのものですが,5歳刻みの統計から生涯未婚率を出す場合,40代後半と50代前半の未婚率を平均するという便法がとられます。 私は,この方式に依拠して,男女の生涯未婚率を職業別に計算してみました。こういうデータは見かけないので,興味を持った次第です。正規・非正規の影響を除くため,正規職員男女の率を出すこととします。資料は,2012年の総務省『就業構造基調査』です。 http://www.stat.go.jp/data/shugyou/2

    職業別の生涯未婚率