基于Python的LSTM网络实现单特征预测回归任务

发布于:2024-05-07 ⋅ 阅读:(32) ⋅ 点赞:(0)

长短期记忆网络(Long Short-Term Memory, LSTM)是一种特殊的递归神经网络(RNN),适用于处理时间序列数据和其他序列数据的预测问题。它特别适合处理具有时间依赖性和长期依赖关系的序列数据。

以下是基于Python和Keras库的LSTM网络实现单特征预测回归任务的详细代码介绍:

import numpy as np
import pandas as pd
from keras.models import Sequential
from keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

# 加载数据
# 在这里,我们假设你有一个CSV文件 'data.csv',其中有两个列:'date' 和 'value'
data = pd.read_csv('data.csv')
data['date'] = pd.to_datetime(data['date'])

# 将数据按时间排序
data.sort_values(by='date', inplace=True)

# 提取单一特征
feature = data['value'].values

# 将数据缩放到0到1之间
scaler = MinMaxScaler(feature_range=(0, 1))
feature_scaled = scaler.fit_transform(feature.reshape(-1, 1))

# 准备数据
def prepare_data(feature, look_back=1):
    X, y = [], []
    for i in range(len(feature) - look_back):
        X.append(feature[i:i + look_back])
        y.append(feature[i + look_back])
    return np.array(X), np.array(y)

look_back = 10  # 选择过去多少个时间步作为输入
X, y = prepare_data(feature_scaled, look_back)

# 划分训练和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 将输入数据重新调整为LSTM所需的三维数组格式
# 格式为 (样本数量, 时间步, 特征数量)
X_train = np.reshape(X_train, (X_train.shape[0], X_train.shape[1], 1))
X_test = np.reshape(X_test, (X_test.shape[0], X_test.shape[1], 1))

# 创建LSTM模型
model = Sequential()
model.add(LSTM(50, input_shape=(look_back, 1)))
model.add(Dense(1))

# 编译模型
model.compile(optimizer='adam', loss='mean_squared_error')

# 训练模型
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_test, y_test))

# 预测
y_pred = model.predict(X_test)

# 将预测结果反缩放
y_pred_inv = scaler.inverse_transform(y_pred)
y_test_inv = scaler.inverse_transform(y_test)

# 评估模型
from sklearn.metrics import mean_squared_error
mse = mean_squared_error(y_test_inv, y_pred_inv)
print("均方误差 (MSE):", mse)

# 可视化结果
import matplotlib.pyplot as plt

plt.plot(data['date'].iloc[-len(y_test):], y_test_inv, label='真实值')
plt.plot(data['date'].iloc[-len(y_test):], y_pred_inv, label='预测值')
plt.legend()
plt.show()

以下是代码中各个部分的介绍:

  • 数据加载和预处理:代码开始通过pandas加载数据,并将其按时间排序。然后提取所需的特征,将数据缩放到0到1之间,以确保模型的稳定性。

  • 准备数据prepare_data函数将数据转换为训练和预测所需的格式,主要是通过滑动窗口机制,将时间序列数据转换为输入和目标的组合。

  • 模型创建和编译:创建了一个简单的LSTM模型,包括一个LSTM层和一个Dense层。模型使用adam优化器和均方误差作为损失函数。

  • 训练模型:通过调用model.fit,训练模型,并指定训练数据、验证数据、批次大小和训练轮次。

  • 预测和评估:在测试集上进行预测,将预测结果反缩放到原始值,然后计算均方误差(MSE)。最后,通过可视化比较预测值和真实值。

该代码示例展示了如何使用LSTM模型进行时间序列数据的预测任务。通过调整模型的超参数和层数,你可以优化模型以更好地适应你的数据和任务。