タグ

timeseqとdataに関するs-fengのブックマーク (8)

  • [R] CausalImpact でできること, できないこと - ill-identified diary

    概要Brodersen, Gallusser, Koehler, Remy, & Scott (2015) により提案され, R で実装された時系列因果推論フレームワーク, CausalImpact は, シンプルで分かりやすい difference in differences (DID) の因果推定理論に基づいており, マーケティングイベントがもたらすインパクトを計測するツールとして紹介されている. しかし, DID が非常にシンプルであれるのは, 厳格な仮定を置いているからであり, 利用する際には多くの注意が伴う. そこで今回は, より発展的な理論について考察したことを垂れ流してみる. あとついでに tsibble パッケージの使い方とかも少しだけ触れている. この問題は CausalImpact の考案以前からある議論についても振り返る必要があるので, まず Rubin (1974

    [R] CausalImpact でできること, できないこと - ill-identified diary
  • Facebookの予測ライブラリProphetを用いたトレンド抽出と変化点検知 - Gunosyデータ分析ブログ

    Gunosyデータ分析部アルバイトの五十嵐です。 Gunosyには大規模なKPIの時系列データがあります。 今回はKPIの時系列分析を行なった際に得た知見についてまとめたいと思います。 具体的にはFacebookが開発した時系列予測ツール Prophetを用いて、KPIのトレンド分析を行いました。 時系列予測について Prophetについて 実装例 モデルの適用 将来のアクセス数予測 トレンド性と周期性の抽出 変化点抽出 Slackを利用した自動化 まとめ 時系列予測について 以前、 KPIのトレンド抽出について以下のブログで紹介しました。 data.gunosy.io ここでは時系列データをトレンド成分と季節成分に分解し、トレンドの把握を容易にする分析を行なっていました。 KPIのトレンドを知ることでサービスの状態を把握することが目的でした。 今回はこの分析をさらに進め、トレンドの変化点

    Facebookの予測ライブラリProphetを用いたトレンド抽出と変化点検知 - Gunosyデータ分析ブログ
  • 「天気の子」興行収入127憶円を408万ツイートで予測・説明する。1/3|マーケティング・アナリスト/小川 貴史/(株)秤代表

    CEを用いて「天気の子」の単語を含むツイートを集計したところ、408万強のツイートがありました。 2軸の折れ線グラフにしました。販売数は土日や祝日(お盆など)で急上昇する周期を描きながら緩やかな右肩下がりで少しずつ減少しています。2か月近く販売数を維持しています。対してツイート数は同様のトレンド(右肩下がり)で緩やかに減少していますが、土日や祝日の急上昇はありません。 ツイート数を使って販売数を予測・説明するために回帰分析という、統計解析ではオーソドックスな手法を使います。 方程式を導く回帰分析 回帰分析とは、Y=aX+b という方程式を導き、説明変数Xによって、目的変数Yの変動をどれくらい説明できるのか?Xが1増えるとYがいくつ増えるか?などを把握できる手法です。Excelでできます。Xを複数用いることもできます。 天気の子のツイートが1増えると映画館の販売数がいくつ増えるのか?その関係

    「天気の子」興行収入127憶円を408万ツイートで予測・説明する。1/3|マーケティング・アナリスト/小川 貴史/(株)秤代表
  • 特異スペクトル変換法による時系列の異常検知 - Qiita

    目的 随時更新されているKPIの時系列データに関して、数値に異常があった場合になるべく早くアラートを出せるようにしたいという要請がありました。これはいわゆる異常検知の問題です。多くの場合、異常検知では異常・正常を判定するラベル情報がないので、教師あり学習ができないことが多いです。教師なしで時系列データを異常検知する方法としては、ARIMA など時系列モデルを当てはめて、予測値と実績値の差が大きすぎるものを異常判定する、という方法が考えられます。しかし、この方法は精度の高い時系列モデルを作成できることが前提です。そこで、別のアプローチがないか調べたところ、参考文献 [3] で特異スペクトル変換 (SST, 別名: SSA, 特異スペクトル分析)という方法を見つけたので試すことにしました。 特異スペクトル変換には、 時系列データの分布の形状に依存せず、さまざまな形状に対応できる 仕組みが比較的

    特異スペクトル変換法による時系列の異常検知 - Qiita
  • Pythonによる状態空間モデル | Logics of Blue

    最終更新:2017年06月06日 Pythonを用いた、状態空間モデルの実装方法について説明します。 なお、正規線形状態空間モデル(動的線形モデル)のみをここでは扱います。 Pythonを使えば、カルマンフィルタや最尤法によるパラメタ推定を短いコードで簡潔に実装することができます。 なお、この記事ではOSはWindowsPythonは『Python 3.6.0 :: Anaconda custom (64-bit)』を使用して、JupyterNotebook上で計算を実行しました。 JupyterNotebookの出力はリンク先を参照してください。 目次 状態空間モデルとPython時系列分析 データの読み込み ローカルレベルモデルの推定 ローカル線形トレンドモデルの推定 季節変動の取り込み 推定するパラメタの数を減らす モデルの比較と将来予測 1.状態空間モデルとPython時系列分析

  • LSTMで仮想通貨の価格予測をする - Qiita

    この記事はNIFTY Advent Calendar 2017の24日目の記事です。 昨日は@megane42さんのNeo4j を駆使して格ゲーに勝つという記事でした。 1 はじめに 1.1 モチベーション 普段はネットワークとかインフラ寄りのエンジニアをしているニフティ4年目の@licht110です。 今回は完全に趣味でやっていることの話で、この記事を書いたモチベーションは以下の通りです。 ブロックチェーンを調べているうちに仮想通貨の取引にハマった 機械学習・深層学習を学ぶことによるスキルアップ 仮想通貨で大儲けして遊んで暮らしたいなどとは微塵も思っていませんよ。 ※この記事を参考にして行った仮想通貨の取引によって生じた損害またトラブルについては一切の責任を負いかねます。 1.2 この記事で取り扱う内容 仮想通貨取引所のAPIを使って価格データを取得する kerasとscikitlear

    LSTMで仮想通貨の価格予測をする - Qiita
  • ストリームデータ解析の世界

    機械学習アドベントカレンダー2015 8日目】 ストリームデータ解析 という分野がある。ある生成元から絶えずデータが到来する環境で、いかにそれらを捌くかという話。「時間計算量はほぼ線形であって欲しいし、空間計算量も小さく抑えつつ精度を担保したいよね」ということを考える世界。個人的に最近はそのあたりの情報を追いかけていたので、整理も兼ねてその世界を俯瞰したい。 すごいリンク集 はじめに、この分野で外せないと思うリンクを3つ挙げておく。 ■ SML: Data Streams YahooGoogleの研究所を経てCMUの教授をしているAlex Smola先生の講義の一部(スライド+動画あり)。理論からシステムアーキテクチャまで包括した実際的な機械学習ならこの人。この人の機械学習サマースクールの講義は最高だった。 古典的なものから最近のものまで、代表的なアルゴリズムについて直感的な説明といい

    ストリームデータ解析の世界
  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
  • 1