时间序列也称动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列。
时间序列分析大致可分成三大部分,分别是描述过去、分析规律和预测未来。
时间序列数据
组成要素:时间(年、季度、月份等)+数值
时间序列根据时间和数值性质的不同,可以分为时期时间序列和时点时间序列。
时期序列中,数值要素反映现象在一定时期内发展的结果 如中国2018-2019的GDP增长
时点序列中,数值要素反映现象在一定时点上的瞬间水平 如从出生到现在体重的增长
时期序列可以相加 时点序列不行
时间序列分析
graph LR A(时间序列分析)-->B(描述过去:描述时间序列的动态变化) A(时间序列分析)-->C(分析规律:揭示数值背后的变化规律) A(时间序列分析)-->D(预测未来:根据规律预测未来趋势)
步骤
- 作时间序列图
- 判断时间序列包含的变动成分
- 时间序列分解(有周期性且包含长期趋势、季节变动或循环变动)
- 建立时间序列分析模型
- 预测未来的指标数值
时间序列分解
一般情况下,时间序列的数值变化规律有:
- 长期变动趋势T
- 季节变动趋势S (月份、季节、周都可以为单位 不能以年为单位)
- 循环变动趋势C
- 不规则变动I(随机扰动项)
一个时间序列往往是以上四类变化形式的叠加。
如果四种变动相互独立,那么叠加模型为$$Y=T+S+C+I$$
如果四种变动相互影响,那么乘积模型为$$Y=TSC*I$$
注:(1)数据具有年内的周期性时才能使用时间序列分解,例如数据是月份数据(周期为12)、季度数据(周期为4) ,如果是年份数据则不行。
(2)在具体的时间序列图上,如果随着时间的推移,序列的季节波动变得越来越大,则反映各种变动之间的关系发生变化,建议使用乘积模型;
反之,如果时间序列图的波动保持恒定,则可以直接使用叠加模型;当然,如果不存在季节波动,则两种分解均可以。
SPSS处理时间序列中的缺失值
缺失值如果在收尾直接删除 如果在中间就用SPSS处理
操作:转换——替换缺失值——选择方法
方法:
- 序列平均值 用整个序列的平均数代替缺失值
- 临近点的平均值 用相邻若干个点的平均数来替换缺失值(默认为两个点)
- 临近点的中位数 用相邻若干个点的中位数来替换缺失值(默认为两个点)
- 线性插值 用相邻两个点的平均数来替换缺失值
- 邻近点的线性趋势 将时期数作为x,时间序列值作为y进行回归,求缺失点的预测值
SPSS定义时间变量
操作:数据——定义日期和时间——选择并设置起始时间
SPSS做时间序列图
操作:分析——时间序列预测——序列图
作图都需要有解释性文字
季节性分解
操作:分析——时间序列预测——季节性分解——根据分析选择乘法/加法——移动平均值权重需要根据周期的奇偶性选择
(奇数选择所有点相等 偶数选择端点按0.5加权)
ERR:I SAS:T+C+I SAF:S STC:T+C
解读季节因子
加法分解:
所有季节因子和为0
以按季度分的销售水平为例子
若第一季度第二季度季节因子为正,说明该产品第一季度平均销量要高于第三季度第四季度,且第一季度的平均销量要高于全年平均水平的(季节因子)件
乘法分解:
所有季节因子乘积为1
若第一季度第二季度季节因子大于1,说明该产品第一季度平均销量要高于第三季度第四季度,且第一季度的平均销量要是全年平均水平的(季节因子)倍
画出分解后的时序图
操作:分析——时间序列预测——序列图——把刚刚分解的变量都加进去
时间序列分析模型
指数平滑模型
simple模型
适用条件:不含趋势和季节成分 约等于ARIMA(0,1,1)
SPSS会自动选好平滑系数。
弊端:只能预测一期 因为在计算第二个时,代入公式会得到,因此只能预测一期的值
线性趋势模型
适用条件:不含季节成分、线性趋势
论文里要把各个公式写出来
阻尼趋势模型
适用条件:不含季节成分、线性趋势逐渐减弱
简单季节模型
适用条件:稳定的含季节成分、不含趋势
温特加法模型
适用条件:含有线性趋势和稳定的季节成分
温特乘法模型
适用条件:含有线性趋势和不稳定的季节成分
一元时间序列分析的模型
时间序列的平稳性
若时间序列满足以下三个条件,则为协方差平稳,又称弱平稳:
(1) (均值为固定常数)
(2) (方差存在且为常数 即不存在异方差)
(3) (协方差只和间隔 有关, 与 无关
若时间序列 满足以下三个条件:
(1)
(2) (方差存在且为常数)
(3)
则称 为白噪声序列(white noise)。白噪声序列是平稳时间序列的一个特例。
差分方程
将某个时间序列变量表示为该变量的滞后项、时间和其他变量的函数, 这样的一个函数方程被称为差分方程。
差分方程的齐次部分:只包含该变量自身和它的滞后项的式子。
齐次部分:
将齐次部分转换为特征方程(代数方程): 令 后带入齐次方程化简 $$xt=\sum_{i=1}p \alpha_i x^{t-i} \Rightarrow x^p=\alpha_1 x^{p-1}+\alpha_2 x^{p-2}+\cdots+\alpha_p$$(同时除以 即可)
特征方程是一个 阶多项式, 对应可求出 个解 (可能有实根, 也可能有虚根)
这 个解的模长 (实根取绝对值, 虚根取模) 的大小决定了形为ARMA 模型的 是否平稳。
滞后算子: 满足结合律、分配律
模型:
运用差分将不平稳数据变成平稳数据
一阶差分:
二阶差分:
阶差分:
季节差分 为周期 :
应用
思考步骤(不写在论文里)
1. 处理缺失值 生成时间变量并画出时间序列图
2. 数据是否为季度数据/月份数据(至少有两年)如果是 要看是否存在季节性波动
3. 根据时间序列图判断是否为平稳序列(数据围绕均值上下波动且无趋势和季节性)
4. SPSS:分析——时间序列预测——创建传统模型
5. 如果是ARIMA(p,0,q),可以画出时间序列样本ACF和PACF图形进行分析,如果结果与季节性相关,可以考虑使用时间序列分解
SPSS时间序列建模器
变量:选择方法专家建模器——条件里面离群值全部勾选上(为了处理异常值)
白噪声残差检验:
Q检验得到的p值大于0.05,说明无法拒绝原假设,即为白噪声(也可以用ACF与PACF图形说明)