
1. 什么是时间序列模型的自相关问题当你用Stata分析经济数据时经常会遇到一个让人头疼的问题自相关。简单来说自相关就是误差项之间存在相关性。想象一下你在测量一条河流的水位如果今天的测量误差偏高明天很可能也会偏高这种误差的记忆效应就是自相关。在实际分析中比如研究美国50年的汽油需求数据自相关会导致几个严重问题OLS估计量虽然还是无偏的但不再是最优的标准误的估计会出现偏差t检验和F检验的结果不可靠我处理过的一个典型案例是预测季度GDP增长。最初使用普通OLS回归时DW统计量只有0.3左右远低于2说明存在强烈的正自相关。这时候如果不处理得出的预测区间会比实际窄很多。2. 诊断自相关的四种实用方法2.1 残差图分析法在Stata中做完OLS回归后先用predict命令保存残差reg lgasq lincome lgasp lpnc lpuc predict e1, residuals然后绘制残差与其滞后项的散点图twoway scatter e1 L.e1 || lfit e1 L.e1这个图如果呈现明显的线性趋势比如从左下到右上的分布就暗示存在正自相关。我分析汽油数据时图形显示相关系数达到0.87这是个很强的信号。2.2 DW检验详解DW统计量是最经典的自相关检验方法estat dwatson经验法则是2表示无自相关0-2之间表示正自相关2-4之间表示负自相关但要注意DW检验的局限性只能检验一阶自相关当模型包含滞后因变量时无效存在不确定区间(dL和dU)2.3 BG检验实战技巧BG检验(Breusch-Godfrey)更灵活可以检验高阶自相关estat bgodfrey, lags(2) estat bgodfrey, lags(2) nomiss0建议至少测试2-3阶因为经济数据常常存在季节性模式。在汽油需求案例中二阶检验的p值0.0000强烈拒绝无自相关的原假设。2.4 Q检验与自相关图Q检验和自相关图配合使用效果更好wntestq e1 corrgram e1 ac e1自相关图中超出阴影带的 spikes 表示显著的自相关。我发现汽油数据在2阶和4阶都有显著峰值说明可能存在季节性因素。3. 修正自相关的三大解决方案3.1 HAC标准误的应用当只想修正标准误而不改变系数估计时Newey-West方法最实用newey lgasq lincome lgasp lpnc lpuc, lag(3)关键是如何选择滞后阶数p。我通常用规则p floor(4*(T/100)^(2/9))其中T是样本量。对于52年的数据p3是合理的。建议尝试不同p值看结果是否稳健。3.2 FGLS估计的两种实现3.2.1 Cochrane-Orcutt迭代法prais lgasq lincome lgasp lpnc lpuc, corc这个方法会自动迭代直到收敛。在我的实践中CO法有时会丢失首尾观测值需要注意样本量的变化。3.2.2 Prais-Winsten变换prais lgasq lincome lgasp lpnc lpuc, nologPW法的优势是保留所有观测值。但汽油数据案例显示PW估计结果的经济意义不如OLS合理这说明FGLS并非万能。3.3 动态模型设定加入滞后因变量常能有效消除自相关reg lgasq L.lgasq lincome lgasp lpnc lpuc在汽油需求模型中滞后项系数0.9且高度显著说明消费确实有很强惯性。修正后模型的DW值提升到1.9左右BG检验p值0.46自相关问题基本解决。4. 方法比较与选择建议通过汽油需求案例我总结出几点经验HAC标准误最适合大样本数据只需要修正推断结果不想改变系数估计FGLS方法要注意小样本时可能不稳定变换后的模型经济解释可能变化需要检查最终模型的DW值动态模型的优势如果理论支持滞后效应能同时解决遗漏变量问题但会引入新的估计问题(内生性)实际操作中我通常会尝试所有方法比较系数大小、显著性和经济意义。比如汽油价格弹性在OLS下不显著但在动态模型中变得显著且为负这更符合经济理论。最后提醒一点在Stata中处理完自相关后一定要再次诊断残差。我曾遇到过FGLS处理后仍然存在高阶自相关的情况这时可能需要考虑更复杂的ARMA结构。