自回归滑动平均模型中阶数及参数的确定
来源:微智科技网
维普资讯 http://www.cqvip.com 理论新探; 。 年第12期(总第18O期) 自回归滑动平均模型中 ■杨振成 时间序列中的模型,即自回归滑动 LM检定用作模型初选,t检定用来检定 表1 1952~1998年陕西省GDP(亿元】 平均模型,是在2O世纪7O年代由Box— 模型参数的显著性,最后通过Q检定对 年份 CDP 年份 CDP 年份 CDP Jenkins提出的,由于其准确的短期预测 所选模型进行诊断检定。 能力,近年来在经济预测方面得到了广 1.ADF检定 泛应用。建立模型的关键在于模型阶数 1952 1953 l954 1955 l956 l957 l958 l959 l2.85 l7.44 20.04 20.58 27.14 25.58 31.02 35.58 38 30 31.64 26.85 2736 29.34 1968 l969 l970 1971 l972 l973 l974 l975 l976 l977 l978 l979 l980 28.¨ 40.73 46.84 57.66 57.76 59.63 62.03 64 92 62.94 69.99 81.07 94.52 94.9l l984 l985 l986 1987 l988 l989 l990 l99l l992 l993 l994 l995 l996 l4935 l8o.87 208.3l 244.96 3l4.48 358I37 404I30 466.84 538.43 661.42 8l6.58 l000_03 l175.92 ARMA(p,q)模型适用于稳定时间序 及参数的确定,过去许多文献探讨过有 列,在建模之前需要检定时间序列的稳 关定阶和参数估计的方法,但其中无论 定性。本文通过单根检定中的ADF 是AIC、BIC准则法还是观察自相关函数 (Augmented Dickey-Fuller)检定序列的 图和偏自相关函数图法等,往往对两个 稳定性。ADF检定的回归方程式及虚无 l96o 阶数相近的模型不能作有效的优劣判 假设表示为: 断,建模不够准确且效率不高。为了更准 下通过LM检定、t检定及Q检定建立模 Ayl:6+.yl+PYl-1+BlAyl11+…+BI卜l△y卜 l+ l96l l962 l963 l964 确、高效的建立模型,本文提出在估计法 £ H0:p=0 型的方法,并通过对1952-2002年陕西 趋势成分。 省GDP水平的实证研究验证了该方法 的可行性。 (5) 其中,△y.=y.一Y ,6为定值, 为时间 l965 1966 l967 35.93 40.47 36.84 l98l 1982 l983 102.09 l997 111.95 1998 l23_39 l300.03 1381.53 检定OLS估计值P,若接受H。,则 数据来源:陕西省统计局.陕西五十年.西安三奏出版 z=l为式(4)中 (L)=O的解,Y.非稳定,需 社.1999. ARMA{p,q)模型及其建模方法 检定第二个单根的存在。依此类推,若通 率密度不能作如上简化。若根据CSS估 过ADF检定得到竹(L)=O的个单根,即 计法设定y y …=y。 :0,Y.的条件概率 (1一L) 竹 (L)=O,则△ 为稳定时间序列。 密度可统一表示为残差项的概率密度,2.LM检定 Godfrey研究表明,如果一组资料已 则式(7)的概似函数简化为: T (一)ARMA(p,q)模型简介 ARMA(p,q)模型表示为: H ly 广·¨- py.f£.+0tt ̄ I十…+Od ̄1) 其中e, ̄WN(0,盯2),若引入滞后因子 L,可以方便的把模型表示为: (L)yt:0(L)£。 lnL=∑lng((et )=- 下 1 ln2"n一 一下 1 lno-2_ t=1 厶 厶 其中 (10=1一 。L一·一 0jL+…+0 p,q)模型得到残差值£,有两组 【2) 由ARMA(对立假设可以进行检定: 0(10=1+ =…= :0,0q十l:…=e州:0 【6) T ∑e.: u ':l (8) 当p=0时,ARMA(p,q)模型简化为 MA(q)模型(Moving Average Mode1),而 当q=0时,ARMA(p,q)简化为AR(P)模 型(Autoregressive Mode1)。 即ARMA(P,q)检定的对立假设分别 由式(4)可知任何ARMA(p,q)模型都 )的形式,根据CSS估 为ARMA(p,q+q )及ARMA(p+p 'q)。在极 可以转换成AR(。-_y =…--0,概似函数简化 大似然估计法(MLE)架构下,由于LM 计法设定y y一8)的形式。在此假设下LM检定量 检定量只需在虚无假设下进行估算,使 为式( 得对于复杂度较高的ARMA模型而言 表示为:ARMA(p,q)模型适用的序列是一稳 定可逆时间序列,满足稳定性的条件是 (z)=O所有解的绝对值均大于1,此时Y. 可表示为£”£I.。…的线性组合。 £ 其中 ̄(L)--6(L) 0(L) J=0 计算较LR、Wald检验更为简便。本文即 是在条件平方和(CSS)估计法下运用 LM检定量对式(6)中ARMA(p,q)的两组 LM=cr。£.,z.(0)[zI(0) (0)】 z。(0) £. (9) 其中0,盯 为虚无假设下CSS估计的 z.(0)= c3010。 对立假设分别进行检定。CSS估计法是 参数,种近似的极大似然估计法,以AR(p)为 对ARMA(o,q ̄型的两组对立假设分 例说明CSS估计法的原理。运用MLE对 别进行LM检定,若均通过则暂时接受此 模型AR(p)估计时的概似函数可写为: {模型,若有一个不能通过,需改变模型阶 满足可逆性的条件是0(Z)=O所有解的绝 }数P或q重新检定,以此进行模型初选。 对值均大于1,此时£。可表示为: lnL= lnf(y.1n 。)+lnf(yo) (7) 3.t检定 (3) T t=p ̄-I £F (L)0(L) yl 盯(L)yF 1;jy J;0 【4) 其中n =(y ,y:,…,y },f(v 为序列前 选取模型时应遵循Parsimony准则, p,q)模型在满足和稳定时间序 P项的联合概率密度。由AR(p)模型yt: 即ARMA((二)ARMA(p,q)模型的建立 q值 4)ly l+…+ +£.可知,当t>p时,nI-l为 列绝对拟合的条件下,模型阶数P,本文建立ARMA(p,q)的过程依次分 已知,Y.的条件概率密度f(y。 一-)可简单 应尽量为小。为此本文以t检定量检定 为ADF检定、LM检定、t检定及Q检定 表示为残差项£ 的概率密度g(e。)。而当 通过LM检定的模型的参数,若存在不 四个模块,ADF检定时间序列的稳定性, t≤P时,n 中存在部分未知量,条件概 显著系数则不能通过检定,说明模型阶 8 统计与决策 维普资讯 http://www.cqvip.com 理论新探 2004至笺 2期(总第180期) 差项不是白噪音 应重新设定模型并回 1,2…7的ADF检定量如表2所示: 到LM检定阶段: 参照Dickey—Fuller t分布表的l% 本文对以上四个模块的检定运算均 及5%临界值可得式(4 (L)=0中含有两 由程序实现,整个建模过程的程序流程 个单根,即△ 是稳定时间序列。 如图1所示。 本文应用LM检定ARMA(p,q)模型 二、实证研究 时,对两个虚无假设ARMA(p+1,q)及 个国家或地区的GDP水平受到 ARMA(p.q+1)分别进行检定:另外,根据 诸多因素的影响,除受该国家或地区的 Pa ̄imony准则,ARMA(P,Q)模型的阶数 客观历史条件外,人力资源、社会资 不会太高,一般p+q≤5可以拟合绝大多 本的变化,贸易条件、经济的变化, 数时间序列,本文首先假定真实模型为 甚至气候条件的变化均会对GDP水平 ARMA(3,2),再依次减小P或q的值进行 产生影响,这些影响往往不是瞬间结束 检验:在各个假设下,LM检定量(p值)、 的,而在后续几期或更长时间内继续起 t检定量及Q检定量的值如表3所示 ARMA(P,q) 作用,这种记忆功能造成GDP水平的前 图1 Gauss程序建模流程图 后相关符合模型研究的条件:本文以 由表3可以看出,ARMA(3,2)、AR— MA(2,2)、ARMA(2,0)和ARMA(1,1)不能通 998年陕西省GDP水平为研究对 数设定过大,减小P或q的值并重新回 1952~1ARMA(1,2)、AR— 象(见表1),通过简单的数据处理及前面 过LM检定(5%拒绝),到LM检定阶段。 2,1)和ARMA(0,2)由于存在不显著系 I所述一系列检定过程建立ARMA(p,q)模 MA(4.Q检定 数,被t检定拒绝,式(9)中取s=9,ARMA 本文采用Ljung—Box的Q检定实现 型,并以此为基础对1999~2002年GDP (0,1)不能通过Q检定(16.8412>15.507, 水平进行短期预测,通过和实际资料的 对通过t检定的ARMA(p,q)模型的诊断 5%拒绝),所以仅有模型ARMA(1,01符合 比较检验ARMA(p,q)模型的预测能力: 检定: 要求:由Gauss程序输出对ARMA(1,0) (一)数据处理及模型建立 Q=T(T+2)k = J击 一^ t 鉴于1952年到1998年陕西省GDP 进行LM检定时计算的参数 ,则AR.MAf1.0)模型表示为: 水平跨越三个数量级,首先对每年的 {GDP取常用对数以得到相对平滑的时间 山 +0.3877 ̄¨=8 8 ~WN(0,o。) O1) 其中 (∑ /(∑ ) 序列Y 然后对时间序列y 、△y 、△ 分别 若pk中有一项显著大于零,说明残 进行ADF检定,其中对) △). 检定时取 表2 ̄ekey—nIIler Fuller t统计量 DF 1 33 (二)预测分析 在1998年应用ARMA(1,0)模型对 1999~2002年陕西省GDP水平作预测, 结果如表4所示。从表4可以看出 1999 ̄2001年的预测误差均在5%以下. 2 6O 3 O3 —3.58 ADF(1) ADF【2) ADF(31 ADF(41 ADF(5) ADF(61 ADF(71 临界值 1 53 1.75 2.O7 3 O6 2.14 Ay △ 一5.69 一lO.O .4 34 一6 73 —3 99 -6 67 —3.29 —6.54 —2.17 -6O7 —1 64 —4 8O 一l 04 一3 56 一l 52 -3.79 —3 58 一l 95 其中1999年几乎和实际值吻合,而 2002年的预测误差较大,说明ARMA(p q)模型只能用于短期预测。此外应用 表3 LM检定量(P值)、t检定量及Q检定量 初设模型 ARMA(3,21 ARMA(2,2) 虚无假设模型 ARMA(3,31 LM检定(P值) O.O5O9 O.O16O t检定 O检定 接受/拒绝 拒绝 拒绝 ARMA(421 ARMA(p,q)模型作实际预测时可即时更 新.即把最新资料加入原始资料重新建 模后再作预测,可大大减小预测误差 三、结论及建议 ARMA(2,3) O.o08O ARMA【3 2) ARMA(I,31 OO485 0.0583 O44O4 -2()969 —0 2926—1 9767 ARMA(1,2) ARMA(2,11 ARMA(2,01 ARMA(0,2) ARMA(22) 拒绝 拒绝 拒绝 1.本文提出在CSS估计法下通过 ARMA(2,2) O.7173 O.11l1 04797 —0 8373一l1 22l7 ARMA(31) LM检定、t检定及Q检定对稳定时间序 列建立ARMA(p,q)模型的方法 首先假 设一阶数较高的模型,然后根据LM检 定、t检定及Q检定的判别条件实时调 节P、q值,直至找到符合要求的ARMA ARMA(2,1 1 ARMA(301 0.3599 OO1O2 ARMA(0,3) ARMA(12) 0.2530 0.3563 -5.0967 —0 6732 拒绝 ARMA(I,2) O.oooo O.oooo  ̄RMA(I.11 ARMA(211 拒绝 ( q)模型,从而使建模准确、高效,具有 重要的理论意义和实际参考价值 2.运用ADF检定时P值的选取非 常重要,P值选取过小可能会引起检定 错误,为此多选几个P值分别进行检定 (如表2)会使ADF检定更加准确: (作者单位/西安交通大学 金禾经济研究中心) (责任编辑/李友平) ARMA(!,1) O l112 O.2O43 0.2431 ARMA(1.01 ARMA(0,1) ARMA(201 —2 7970 。 一l2.0235 14 2191 16.84l2 接爱 拒绝 ARMA【0,2) ARMA(11) 0.2240 表4 1999~2o02年陕西GDP水平的预测值、实际值及预测误差 —\ 1999 200o 2o01 2o02 含固定值、不含时间趋势的 预测值(亿元1 实际值(亿元) 预测误差(%) 1490.81 1487.61 O.215 1599.21 1660.92 —3 72 175945 1844.27 -4.59 1902 28 2035 9E 回归方程式,对△ 检定取 不含固定值及时间趋势的 -6.57 数据来源:陕西省统计局.陕西统计年鉴.中国统计出版社,2o02,2o03 回归式。对应P值分别为0, 9