zhaozhengcoder
diff --git a/‎序列预测/PCA去趋势化/Figure_1.png
34.2 KB b/‎序列预测/PCA去趋势化/Figure_1.png
34.2 KB
diff --git a/‎序列预测/PCA去趋势化/lstm_new.py
Lines changed: 166 additions & 0 deletions b/‎序列预测/PCA去趋势化/lstm_new.py
Lines changed: 166 additions & 0 deletions
@@ -0,0 +1,166 @@
+import numpy
+import matplotlib.pyplot as plt
+from pandas import read_csv
+import math
+from keras.models import Sequential 
+from keras.layers import Dense 
+from keras.layers import LSTM 
+from sklearn.preprocessing import MinMaxScaler 
+from sklearn.metrics import mean_squared_error
+import pickle
+
+# load the dataset
+# dataframe = read_csv('1.csv', usecols=[1], engine='python', skipfooter=3)
+#dataframe = read_csv('123.csv', usecols=[0], engine='python', skipfooter=3)
+#dataset = dataframe.values
+
+
+def myload(filename):
+    abs_path='C:/Users/wwwa8/Documents/GitHub/Machine-Learning/序列预测/PCA去趋势化/'
+    f = open(abs_path+filename,'rb')
+    data =pickle.load(f)
+    f.close()
+    return data
+
+rest_x = myload("dump_rest_x_9-13.txt")
+
+rest_x = rest_x.reshape(-1,1)
+
+dataset = rest_x
+
+# 将整型变为float
+dataset = dataset.astype('float32')
+#plt.plot(dataset,'.')
+#plt.plot(dataset,'.')
+#plt.show()
+
+# X is the number of passengers at a given time (t) and Y is the number of passengers at the next time (t + 1). 
+# convert an array of values into a dataset matrix 
+
+def create_dataset(dataset, look_back=1):
+    dataX, dataY = [], [] 
+    for i in range(len(dataset)-look_back-1): 
+        a = dataset[i:(i+look_back), 0] 
+        dataX.append(a) 
+        dataY.append(dataset[i + look_back, 0]) 
+    return numpy.array(dataX), numpy.array(dataY)
+
+numpy.random.seed(7)
+
+# normalize the dataset
+scaler = MinMaxScaler(feature_range=(0, 1))
+dataset = scaler.fit_transform(dataset)
+
+# split into train and test sets
+train_size = int(len(dataset) * 0.67)
+test_size = len(dataset) - train_size
+train, test = dataset[0:train_size,:], dataset[train_size:len(dataset),:]
+
+# use this function to prepare the train and test datasets for modeling
+look_back = 1
+trainX, trainY = create_dataset(train, look_back)
+testX, testY = create_dataset(test, look_back)
+
+# 转换成lstm需要的数据格式 
+# reshape input to be [samples, time steps, features]
+trainX = numpy.reshape(trainX, (trainX.shape[0], 1, trainX.shape[1]))
+testX = numpy.reshape(testX, (testX.shape[0], 1, testX.shape[1]))
+
+# create and fit the LSTM network
+model = Sequential()
+model.add(LSTM(3, input_shape=(1, look_back)) )
+model.add(Dense(1)) 
+model.compile(loss='mean_squared_error', optimizer='adam') 
+model.fit(trainX, trainY, epochs=30, batch_size=1, verbose=2)
+
+# make predictions
+trainPredict = model.predict(trainX)
+testPredict = model.predict(testX)
+
+# 反标准化
+trainPredict = scaler.inverse_transform(trainPredict)
+trainY = scaler.inverse_transform([trainY])
+testPredict = scaler.inverse_transform(testPredict)
+testY = scaler.inverse_transform([testY])
+
+trainScore = math.sqrt(mean_squared_error(trainY[0], trainPredict[:,0]))
+print('Train Score: %.2f RMSE' % (trainScore))
+testScore = math.sqrt(mean_squared_error(testY[0], testPredict[:,0]))
+print('Test Score: %.2f RMSE' % (testScore))
+
+# shift train predictions for plotting
+trainPredictPlot = numpy.empty_like(dataset)
+trainPredictPlot[:, :] = numpy.nan
+trainPredictPlot[look_back:len(trainPredict)+look_back, :] = trainPredict
+
+# shift test predictions for plotting
+testPredictPlot = numpy.empty_like(dataset)
+testPredictPlot[:, :] = numpy.nan
+testPredictPlot[len(trainPredict)+(look_back*2)+1:len(dataset)-1, :] = testPredict
+
+# plot baseline and predictions
+plt.plot(scaler.inverse_transform(dataset))
+plt.plot(trainPredictPlot)
+plt.plot(testPredictPlot)
+plt.show()
+
+
+
+###-----------------###
+
+# In [5]: testPredict.shape
+# Out[5]: (632, 1)
+
+# In [6]: trainPredict.shape
+# Out[6]: (1284, 1)
+
+###-----------------###
+
+# Test Score: 11.96 RMSE
+
+arr = myload("dump_arr_9-13.txt")
+main_x = myload("dump_main_x_9-13.txt")
+
+arr = arr.reshape(-1,1)
+main_x = main_x.reshape(-1,1)
+
+###
+main_x_train = main_x[:trainX.shape[0]]
+main_x_test  = main_x[train_size:]
+main_x_test  = main_x_test[:testX.shape[0]]
+
+
+###
+arr_train = arr[:trainX.shape[0]]
+arr_test = arr[train_size:]
+arr_test =arr_test[:testX.shape[0]]
+
+###add 
+all_train_predict = main_x_train + trainPredict
+all_test_predict = main_x_test + testPredict
+
+def cal_mre(pre_y,train_y):
+    diff = abs(pre_y-train_y)
+    mre_matrix = diff/train_y
+    return mre_matrix.mean()
+
+def replace_ele(train_y):
+    train_y[train_y<0.01]=0.1
+    return train_y
+
+arr_train = replace_ele(arr_train)
+arr_test  = replace_ele(arr_test)
+all_train_predict =replace_ele(all_train_predict)
+all_test_predict  =replace_ele(all_test_predict)
+
+print ("train mre : ",cal_mre(all_train_predict,arr_train))
+print ("test mre : ",cal_mre(all_test_predict,arr_test))
+
+##plt 
+plt.plot(arr_train)
+plt.plot(all_train_predict)
+plt.show()
+
+plt.plot(arr_test)
+plt.plot(all_test_predict)
+plt.show()