原文链接:http://tecdat.cn/?p=18037

原文出处:拓端数据部落公众号

 

根据我们对温度的预测,我们可以预测电力消耗。绘制电力消耗序列图:

plot(elect,type="l")

 

 

我们可以尝试一个非常简单的模型,其中日期Y_t的消耗量是时间,温度(以多项式形式表示)以及工业生产指数IPI_t的函数。

 lm(Load~1+Time+as.factor(Week)+poly(Temp,3)+Temp+IPI,data=elect )

温度影响的多项式函数来自下图(去除线性趋势后的消耗序列)

 

我们还可以假设自回归形式,其中Y\_ {t} 是Y\_ {t-1} 的函数

lm(Load~1+Load1+Time+as.factor(Week)+
poly(Temp,3)+Temp1+IPI,data=elect

然后,我们可以尝试进行预测。第二个模型的问题是自回归部分。要预测Y\_ {t + h} ,我们必须使用在t + h-1,Y ^ t + h − 1中所作的预测。


 
IPI = elect[futur,"IPI"])
for(t in 1:110){ 
 base_prevision[t+1,"Load1"] = p}

然后,我们可以预测 Y ^ t与观察值 Yt进行比较。

 

 

我们在夏季估计良好(我们预测了8月上半月的高峰),但我们低估了冬季的消耗量。

最后,我们可以忽略解释变量,而直接尝试建立时间序列模型。

plot(elect[passe,"Load"],type="l")

 

 

令人担忧的是该序列的异方差,其最小斜率低于最大斜率。

n=length(passe)="l")
m=aggregate(elect
by=list(as.f
points(sort((1
xM=((1:n)[vM])
regm=lm(m$x~xm,col="blue")
regM=lm(M$x~xM,col="blue")
abline(regm,lty=2)
abline(regM,lty=2)

 

 

经典(简单)的解决方案是取对数

plot(elect
plot(z,type="l")
B = data.frame(z=z,t=1:length

 

 

然后,我们必须消除线性趋势,以平稳序列

z = residuals(lm(z~t,data=B))

 
arima(Z,order = c(4,0,0), 
seasonal = list(order = c(1 

第一个模型是稳定的,没有单位根。我们可以尝试引入季节性单位根

 arima(Z,order = c(0,0,0), 
seasonal = list(order = c(0,1, 

最后,最后一个要简单一些

arima(Z,order = c(1,0,0), 
seasonal = list(order = c(2,0,0)))

然后,我们将所有预测存储在数据库中

然后将线性趋势添加到残差的预测中

reg = lm(z~t,data=B)

在这里,我们在 logY上建立了线性模型,即 logY〜N(μ,σ2),因此 E [Y] = exp(μ+σ2/ 2)

sqrt(predict(modelz1,n.ahead = 111)$se^2+sigma^2),
 

 

我们在这里假设两个模型(线性趋势和自回归模型的线性)的预测估计量是独立的,因此我们可以对方差项求和。另外,Y的预测是

 exp(DOz$z1+1/2*DONNseu$seu1^2),

我们比较三个模型的预测(与观察值)

 

 

我们与之前的预测进行比较,

lines(futur,base_previ
col="orange")

 

 

夏季预测会有所偏差,而冬季预测我们有所改善。


最受欢迎的见解

1.用SPSS估计HLM层次线性模型模型

2.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)

3.基于R语言的lmer混合线性回归模型

4.R语言Gibbs抽样的贝叶斯简单线性回归仿真分析

5.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析

6.使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM

7.R语言中的岭回归、套索回归、主成分回归:线性模型选择和正则化

8.R语言用线性回归模型预测空气质量臭氧数据

9.R语言分层线性模型案例


拓端tecdat
195 声望46 粉丝