时间序列也称动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列

时间序列分析大致可分成三大部分,分别是描述过去、分析规律和预测未来。

时间序列数据

组成要素:时间(年、季度、月份等)+数值
时间序列根据时间和数值性质的不同,可以分为时期时间序列时点时间序列
时期序列中,数值要素反映现象在一定时期内发展的结果 如中国2018-2019的GDP增长
时点序列中,数值要素反映现象在一定时点上的瞬间水平 如从出生到现在体重的增长
时期序列可以相加 时点序列不行

时间序列分析

graph LR
A(时间序列分析)-->B(描述过去:描述时间序列的动态变化)
A(时间序列分析)-->C(分析规律:揭示数值背后的变化规律)
A(时间序列分析)-->D(预测未来:根据规律预测未来趋势)

步骤

  • 作时间序列图
  • 判断时间序列包含的变动成分
  • 时间序列分解(有周期性且包含长期趋势、季节变动或循环变动)
  • 建立时间序列分析模型
  • 预测未来的指标数值

时间序列分解

一般情况下,时间序列的数值变化规律有:

  1. 长期变动趋势T
  2. 季节变动趋势S (月份、季节、周都可以为单位 不能以年为单位
  3. 循环变动趋势C
  4. 不规则变动I(随机扰动项)

一个时间序列往往是以上四类变化形式的叠加。
如果四种变动相互独立,那么叠加模型为$$Y=T+S+C+I$$
如果四种变动相互影响,那么乘积模型为$$Y=TSC*I$$

注:(1)数据具有年内的周期性时才能使用时间序列分解,例如数据是月份数据(周期为12)、季度数据(周期为4) ,如果是年份数据则不行。
(2)在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得越来越大,则反映各种变动之间的关系发生变化,建议使用乘积模型
反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型;当然,如果不存在季节波动,则两种分解均可以。

SPSS处理时间序列中的缺失值

缺失值如果在收尾直接删除 如果在中间就用SPSS处理

操作:转换——替换缺失值——选择方法

方法:

  1. 序列平均值 用整个序列的平均数代替缺失值
  2. 临近点的平均值 用相邻若干个点的平均数来替换缺失值(默认为两个点)
  3. 临近点的中位数 用相邻若干个点的中位数来替换缺失值(默认为两个点)
  4. 线性插值 用相邻两个点的平均数来替换缺失值
  5. 邻近点的线性趋势 将时期数作为x,时间序列值作为y进行回归,求缺失点的预测值

SPSS定义时间变量

操作:数据——定义日期和时间——选择并设置起始时间

SPSS做时间序列图

操作:分析——时间序列预测——序列图
作图都需要有解释性文字

季节性分解

操作:分析——时间序列预测——季节性分解——根据分析选择乘法/加法——移动平均值权重需要根据周期的奇偶性选择
(奇数选择所有点相等 偶数选择端点按0.5加权)
ERR:I SAS:T+C+I SAF:S STC:T+C

解读季节因子

加法分解:
所有季节因子和为0
以按季度分的销售水平为例子
若第一季度第二季度季节因子为正,说明该产品第一季度平均销量要高于第三季度第四季度,且第一季度的平均销量要高于全年平均水平的(季节因子)件

乘法分解:
所有季节因子乘积为1
若第一季度第二季度季节因子大于1,说明该产品第一季度平均销量要高于第三季度第四季度,且第一季度的平均销量要是全年平均水平的(季节因子)倍

画出分解后的时序图

操作:分析——时间序列预测——序列图——把刚刚分解的变量都加进去

时间序列分析模型

指数平滑模型

simple模型

适用条件:不含趋势和季节成分 约等于ARIMA(0,1,1)

概念
SPSS会自动选好平滑系数。

弊端:只能预测一期 因为在计算第二个时xt+1=x^t+1x_{t+1}=\hat{x}_{t+1},代入公式会得到x^t+2=x^t+1\hat{x}_{t+2}=\hat{x}_{t+1},因此只能预测一期的值

线性趋势模型

适用条件:不含季节成分、线性趋势

在这里插入图片描述

论文里要把各个公式写出来

阻尼趋势模型

适用条件:不含季节成分、线性趋势逐渐减弱

在这里插入图片描述

简单季节模型

适用条件:稳定的含季节成分、不含趋势

在这里插入图片描述

温特加法模型

适用条件:含有线性趋势和稳定的季节成分

在这里插入图片描述

温特乘法模型

适用条件:含有线性趋势和不稳定的季节成分

在这里插入图片描述

一元时间序列分析的模型

时间序列的平稳性

若时间序列{xt}\left\{x_t\right\}满足以下三个条件,则{xt}\{x_{t}\}为协方差平稳,又称弱平稳
(1) E(xt)=E(xts)=uE\left(x_t\right)=E\left(x_{t-s}\right)=u (均值为固定常数)
(2) Var(xt)=Var(xts)=σ2\operatorname{Var}\left(x_t\right)=\operatorname{Var}\left(x_{t-s}\right)=\sigma^2 (方差存在且为常数 即不存在异方差)
(3) Cov(xt,xts)=γs\operatorname{Cov}\left(x_t, x_{t-s}\right)=\gamma_s (协方差只和间隔 ss 有关, 与 tt 无关 ))

若时间序列 {xt}\left\{x_t\right\} 满足以下三个条件:
(1) E(xt)=E(xts)=0E\left(x_t\right)=E\left(x_{t-s}\right)=0
(2) Var(xt)=Var(xts)=σ2\operatorname{Var}\left(x_t\right)=\operatorname{Var}\left(x_{t-s}\right)=\sigma^2 (方差存在且为常数)
(3) Cov(xt,xts)=0(s0)\operatorname{Cov}\left(x_t, x_{t-s}\right)=0(s \neq 0)
则称 {xt}\left\{x_t\right\} 为白噪声序列(white noise)。白噪声序列是平稳时间序列的一个特例。

差分方程

将某个时间序列变量表示为该变量的滞后项、时间和其他变量的函数, 这样的一个函数方程被称为差分方程

yt=α0+α1yt1+α2yt2++αpytp+εt (自回归AR (p) 模型) yt=εt+β1εt1+β2εt2++βqεtq (移动平均MA (q) 模型) yt=α0+i=1pαiyti+εt+i=1qβiεti (自回归移动平均ARMA (p,q) 模型) yt=a+byt1+czt+dzt1+εtyt=a+byt1+ct+εt\begin{aligned} & y_t=\alpha_0+\alpha_1 y_{t-1}+\alpha_2 y_{t-2}+\cdots+\alpha_p y_{t-p}+\varepsilon_t \quad \text { (自回归AR }(p) \text { 模型) } \\ & y_t=\varepsilon_t+\beta_1 \varepsilon_{t-1}+\beta_2 \varepsilon_{t-2}+\cdots+\beta_q \varepsilon_{t-q} \quad \text { (移动平均MA }(q) \text { 模型) } \\ & y_t=\alpha_0+\sum_{i=1}^p \alpha_i y_{t-i}+\varepsilon_t+\sum_{i=1}^q \beta_i \varepsilon_{t-i} \quad \text { (自回归移动平均ARMA }(p, q) \text { 模型) } \\ & y_t=a+b y_{t-1}+c z_t+d z_{t-1}+\varepsilon_t \\ & y_t=a+b y_{t-1}+c t+\varepsilon_t\\ \end{aligned}

差分方程的齐次部分:只包含该变量自身和它的滞后项的式子。

yt=α0+i=1pαiyti+εt+i=1qβiεti (ARMA (p,q) 模型) y_t=\alpha_0+\sum_{i=1}^p \alpha_i y_{t-i}+\varepsilon_t+\sum_{i=1}^q \beta_i \varepsilon_{t-i} \quad \text { (ARMA }(p, q) \text { 模型) }

齐次部分: yt=i=1pαiytiy_t=\sum_{i=1}^p \alpha_i y_{t-i}
将齐次部分转换为特征方程(代数方程): 令 yt=xty_t=x^t 后带入齐次方程化简 $$xt=\sum_{i=1}p \alpha_i x^{t-i} \Rightarrow x^p=\alpha_1 x^{p-1}+\alpha_2 x^{p-2}+\cdots+\alpha_p$$(同时除以 xtpx^{t-p} 即可)
特征方程是一个 pp 阶多项式, 对应可求出 pp 个解 (可能有实根, 也可能有虚根)
pp 个解的模长 (实根取绝对值, 虚根取模) 的大小决定了形为ARMA (p,q)(p, q) 模型的 {yt}\left\{y_t\right\} 是否平稳。

滞后算子:Liyt=ytiL^{i}y_t=y_{t-i} 满足结合律、分配律

ARMA(p,q)\operatorname{ARMA}(p, q) 模型:

yt=α0+i=1pαiyti+εt+i=1qβiεtiyt=α0+i=1pαiLiyt+εt+i=1qβiLiεt(1i=1pαiLi)yt=α0+(1+i=1qβiLi)εt(1α1LαpLp)yt=α0+(1+β1L++βqLq)εt\begin{aligned} & y_t=\alpha_0+\sum_{i=1}^p \alpha_i y_{t-i}+\varepsilon_t+\sum_{i=1}^q \beta_i \varepsilon_{t-i} \\ & \Rightarrow y_t=\alpha_0+\sum_{i=1}^p \alpha_i L^i y_t+\varepsilon_t+\sum_{i=1}^q \beta_i L^i \varepsilon_t \\ & \Rightarrow\left(1-\sum_{i=1}^p \alpha_i L^i\right) y_t=\alpha_0+\left(1+\sum_{i=1}^q \beta_i L^i\right) \varepsilon_t \\ & \Rightarrow\left(1-\alpha_1 L-\cdots-\alpha_p L^p\right) y_t=\alpha_0+\left(1+\beta_1 L+\cdots+\beta_q L^q\right) \varepsilon_t \\ & \end{aligned}

运用差分将不平稳数据变成平稳数据
一阶差分:

Δyt=ytyt1=(1L)yt\Delta y_t=y_t-y_{t-1}=(1-L) y_t

二阶差分:

Δ2yt=Δ(Δyt)=Δ(ytyt1)=(ytyt1)(yt1yt2)=yt2yt1+yt2=(12L+L2)yt=(1L)2yt\begin{aligned} \Delta^2 y_t & =\Delta\left(\Delta y_t\right)=\Delta\left(y_t-y_{t-1}\right) \\ & =\left(y_t-y_{t-1}\right)-\left(y_{t-1}-y_{t-2}\right) \\ & =y_t-2 y_{t-1}+y_{t-2} \\ & =\left(1-2 L+L^2\right) y_t \\ & =(1-L)^2 y_t \end{aligned}

dd 阶差分:

Δdyt=(1L)dyt\Delta^d y_t=(1-L)^d y_t

季节差分 ( m(~ m 为周期 )) :

ΔytΔytm=(ytyt1)(ytmytm1)=(1LLm+Lm+1)yt=(1L)(1Lm)yt\begin{aligned} \Delta y_t-\Delta y_{t-m} & =\left(y_t-y_{t-1}\right)-\left(y_{t-m}-y_{t-m-1}\right) \\ & =\left(1-L-L^m+L^{m+1}\right) y_t \\ & =(1-L)\left(1-L^m\right) y_t \end{aligned}

应用

思考步骤(不写在论文里)

1. 处理缺失值 生成时间变量并画出时间序列图
2. 数据是否为季度数据/月份数据(至少有两年)如果是 要看是否存在季节性波动
3. 根据时间序列图判断是否为平稳序列(数据围绕均值上下波动且无趋势和季节性)
4. SPSS:分析——时间序列预测——创建传统模型
5. 如果是ARIMA(p,0,q),可以画出时间序列样本ACF和PACF图形进行分析,如果结果与季节性相关,可以考虑使用时间序列分解

SPSS时间序列建模器

变量:选择方法专家建模器——条件里面离群值全部勾选上(为了处理异常值)
在这里插入图片描述
在这里插入图片描述

白噪声残差检验:
Q检验得到的p值大于0.05,说明无法拒绝原假设,即为白噪声(也可以用ACF与PACF图形说明)