過去から現在・未来に向かって時系列に記録されている数字があるとします。
気温・降水量・売上など、数字の中身は特に何でもよく、具体的には次のような感じです。
ケース1 : 10,23,43,23,45,64,22
ケース2 : 13,43,21,11,15,34,56
ケース1、ケース2の数字はどちらが伸びているのか?
それぞれ、増加傾向にあるのか?減少傾向にあるのか?
このようなことを何らかの数式を持って絶対値で比較したいのですが、何か良い方法があれば教えてください。
よろしくお願いします。
線形近似をすればいいです。
これは1次式で一番各データとの誤差が少なくなるような直線を表します。
試しにエクセルで計算してみたら下記のようになりました。
R^2はどれくらい直線からデータが離れているかを示します。
数値が小さいほど直線に近いです。
ケース1
y = 4.2857x + 15.714
R^2 = 0.2503
ケース2
y = 3.75x + 12.571
R^2 = 0.2217
この結果から判断するとどちらもXの係数が正なので伸びる傾向にあり、ケース1の方が係数が大きいので伸びの勢いはケース1の方が大きいといえます。
http://ja.wikipedia.org/wiki/%E7%B7%9A%E5%9E%8B%E8%BF%91%E4%BC%B...
線形近似をすればいいです。
これは1次式で一番各データとの誤差が少なくなるような直線を表します。
試しにエクセルで計算してみたら下記のようになりました。
R^2はどれくらい直線からデータが離れているかを示します。
数値が小さいほど直線に近いです。
ケース1
y = 4.2857x + 15.714
R^2 = 0.2503
ケース2
y = 3.75x + 12.571
R^2 = 0.2217
この結果から判断するとどちらもXの係数が正なので伸びる傾向にあり、ケース1の方が係数が大きいので伸びの勢いはケース1の方が大きいといえます。
http://ja.wikipedia.org/wiki/%E7%B7%9A%E5%9E%8B%E8%BF%91%E4%BC%B...
コメント、ありがとうございます。
リンク先がとても参考になり助かります。
ケース1、ケース2の数字はどちらが伸びているのか?
->これについては、単回帰式を作ってみてパラメータの係数を比較したらよいでしょう。
それぞれ、増加傾向にあるのか?減少傾向にあるのか?
->これについても同様で、単回帰式を求め、その変数の係数の値が正か負かで確認することができます。
参考までに
http://www.aoni.waseda.jp/abek/document/regression-1.html
Excelによる回帰分析(単回帰)
コメント、ありとうございます。
おおよその仕組みが分かってきました。
やはり移動平均が一番良いと思います。
当該値を挟んで3つ(もしくは5つ)の値の平均値を計算し、
グラフ化するとよくわかります。
⇒例の数字では、ケース1、2とも増加傾向にあり、ケース1のほうがより顕著かと思われます。
移動平均は何となく分かりますし、回帰分析よりもはるかに簡単だと思うのですが、結果が1番目に回答いただいた方と同様になっている点が非常に興味深いところです。
例えば3つで平均しようとする場合、両端に近い数字は左端・右端の数字が足りなくなるのですが、この場合はどのようにしたらいいのでしょうか?
もしよろしければ、具体的な計算過程(数式)を書いていただけませんか?
例えば3つで平均しようとする場合、両端に近い数字は左端・右端の数字が足りなくなるのですが、この場合はどのようにしたらいいのでしょうか?
移動平均は足りなくなる部分のデータは計算してはいけません。したがって3つ平均の場合は両端のデータに対応する平均値は求められません。つまり使えるデータ数が減ります。
ですから質問にあるような数が少ない場合は移動平均は適切ではありません。
また、移動平均を出したとしてもグラフを見て比べることしかできず、増加傾向の比較を数値で行おうとすると近似直線(ケースによっては他の曲線を選びます)を求めてそれ同士の比較で評価せざるを得ません。
移動平均が効果があるのは長い周期と短い周期があわさった現象の傾向を見る場合に短い周期のデータ数で移動平均を行うことで長い周期の形が浮かび上げってくるなどのケースです。例えば、1時間毎の気温1年分のデータを24個の移動平均して日中の変化をキャンセルするとか、毎日の電力消費量を7個の移動平均をして一週間の変動をキャンセルするなどです。
おぉ、分かり易い説明をありがとうございます。
実はプログラムの一部で計算が必要で、エクセルで計算することが出来ないような状況なのです。
もちろん、エクセルで回帰分析することが最も正確なのでしょうか、簡単な数式で出来るような計算式はないでしょうか?
おおよその増加具合と傾向が分かり、それぞれに優劣が付けられれば良いのですが。
回答者1のaobadaiさんのでほとんど済んだ問題ですが、
平均の比較:t検定をなさったらいかがでしょうか?
http://ja.wikipedia.org/wiki/T%E6%A4%9C%E5%AE%9A
t検定
2組の標本について平均に有意差があるかどうかの検定などに用いられる。
http://kogolab.jp/elearn/hamburger/chap4/sec3.html
こちらでExcelの計算方法はあります。
グラフで折れ線グラフを2組描き、各々の標準偏差を加えた線で評価します。
このとき、どちらかの標準偏差を含めた範囲に他方の標準偏差を含めた範囲が含まれなければ、
差があると言えます。例えば、こんな感じのグラフです。
http://www.nature.com/jhh/journal/v21/n8/images/1002211f2.jpg
http://www.statistix.com/images/MeansPlot.gif
箱ひげ図を参考にして下さい。
コメントありがとうございます、一番下のURLが参考になりました。
コメント、ありがとうございます。
リンク先がとても参考になり助かります。