| 
Ⅳ.时间序列数据的相关系数计算与一元线性回归预测法1. 时间序列数据相关系数的计算方法
 例如:某公司为了研究广告费支出(ad)对销售额(sale)的影响,统计了过去 10 个月的数据,请计算两者的相关系数。
 问当投入广告费 1 万元时,估计的销售额会有多少?
 表 7-3    某公司的广告费支出与销售额的关系(万元)
 ----------------------------------------------------------
 月份     广告费(ad)     销售额(sale)
 -------------------------------------------------------------------
 1          0.1              10.0
 2          0.1              20.0
 3          0.2              20.0
 4          0.2              30.0
 5          0.3              30.0
 6          0.4              40.0
 7          0.5              50.0
 8          0.6              50.0
 9          0.7              70.0
 10          0.9              80.0
 -------------------------------------------------------------------
 11          1.0
 -------------------------------------------------------------------
 在程序文件(CorreRegre.sps,例 *1)的“BEGIN DATA”与“END DATA”之间,即录入表中第 (2) 列ad 与第 (3) 列 sale的数据。
 计算相关系数的命令是“CORRELATION”,产生的过程是:Analyze → Correlate → Bivariate → 将 ad 与 sale 选入右侧的“Variables”窗中 → Paste。
 2. 时间序列数据一元线性回归方程拟合与预测方法
 要知道投入广告费(ad) 1 万元时,预测销售额(Esale)是多少,则为双变量的直线回归分析(引自王宪玉主编. 1999 年,P.166。数据有改动),即要计算一元线性回归方程:
 Y = b0 + b1×x1
 本例为:Esale = b0 + b1 × ad
 SPSS 中的 REGRESSION 命令即可算得此回归方程。REGRESSION 命令产生的过程是:Analyze → Regression → Linear → 将 sale 选入 “Dependent” (因变量)窗中 → 将 ad 选入“Independent(s)” 窗中 → Paste。
 用前述曲线拟合法同样可得此回归方程。曲线拟合的命令是“CURVEFIT”(直线是特殊形式的一种曲线!),此命令产生的过程是:Analyze → Regression → Curve Estimation → 将 sale 选入右侧的“Dependent(s)”窗中 →将 ad 选入右侧的“Independent”窗中(这时默认的拟合模型为直线回归方程 Linear)→ 击右下方的“Save”钮 → 将新出现的小窗中Save Variables中的“Predicted Values”、“Residuals”与“Prediction Intervals” 全勾选 → Continue → Paste → 出现 “CURVEFIT”命令。
 上述 REGRESSION 与 CURVEFIT 两个命令的拟合结果是相同的;REGRESSION 命令也可得到相关系数的结果。
 * Correlation and regression; Filename: CorreRegre.sps.
 *-----------------------------------------------------------------------.
 *1. From Wang Xian-Yu: Market Survey and the Prediction, P.166:.
 DATA LIST FREE /ad sale.
 BEGIN DATA.
 0.1 10    0.1 20    0.2 20    0.2 30    0.3 30    0.4 40    0.5 50
 0.6 50    0.7 70    0.9 80
 END DATA.
 CORRELATIONS /VARIABLES=ad sale /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE .
 REGRESSION /STATISTICS COEFF OUTS R ANOVA
 /CRITERIA=PIN(.05) POUT(.10) CIN(95)
 /NOORIGIN
 /DEPENDENT=sale
 /METHOD=ENTER ad
 /CASEWISE=ALL
 /SAVE=PRED.
 GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad.
 * Curve Estimation.
 CURVEFIT /VARIABLES=sale WITH ad
 /CONSTANT
 /MODEL=LINEAR
 /PLOT FIT
 /CIN=95
 /SAVE=PRED RESID CIN.
 *-------------------------------------------------------------------------------.
 用CORRELATIONS命令:相关系数计算结果,r = 0.980, P = 0.000。
 Correlations
 AD SALE
 AD Pearson Correlation 1.000 .980
 Sig. (2-tailed) . .000
 N 10 10
 SALE Pearson Correlation .980 1.000
 Sig. (2-tailed) .000 .
 N 10 10
 **  Correlation is significant at the 0.01 level (2-tailed).
 用REGRESSION命令:相关系数计算结果相同,r = 0.980 (即 R = 0.980; R Square = R2 = 0.960), P = 0.000。
 Model Summary
 Model R R Square Adjusted R Square Std. Error of the Estimate
 1 0.980 0.960 0.956 4.7673
 a  Predictors: (Constant), AD
 CoefficientsUnstandardized Coefficients  Standardized Coefficients t Sig.
 Model  B Std. Error Beta
 1 (Constant) 7.273 2.790  2.607 .031
 AD 81.818 5.868 .980 13.943 .000
 a  Dependent Variable: SALE
 Casewise Diagnostics(a)Case Number Std. Residual SALE Predicted Value Residual
 1 -1.144 10.00 15.4545 -5.4545
 2 .953 20.00 15.4545 4.5455
 3 -.763 20.00 23.6364 -3.6364
 4 1.335 30.00 23.6364 6.3636
 5 -.381 30.00 31.8182 -1.8182
 6 .000 40.00 40.0000 .0000
 7 .381 50.00 48.1818 1.8182
 8 -1.335 50.00 56.3636 -6.3636
 9 1.144 70.00 64.5455 5.4545
 10 -.191 80.00 80.9091 -.9091
 a  Dependent Variable: SALE
 输出的预测值(Esale)即“Predicted Value”,见“Casewise”表第4 列。在 REGRESSION 命令的子命令“/SAVE=PRED”中,可自行存储下预测值(Esale)的变量名“pre_1”,它可用于其下一句的绘图:“GRAPH /LINE(MULTIPLE)=VALUE(sale, pre_1) BY ad.”,并绘出如下拟合图:
 
 回归方程Esale = b0 + b1×ad 的计算结果:b0 = Constant = 7.273,b1 = 81.818。可得: Esale = 7.273 + 81.818×ad。
 当投入广告费(ad)1 万元时,估计的销售额为:
 Esale =  7.273 + 81.818×1 = 89.55 万元。
 用CURVEFIT命令拟合直线回归方程的结果: 即Rsq = R Square = R2 = 0.960;即r = R = 0.980。可见 b0 = 7.2727 = 7.273, b1 = 81.8282 = 81.818, 结果同上。
 Independent:  AD
 ----------------------------------------------------------------------------
 Dependent  Mth    Rsq     d.f.       F    Sigf       b0         b1
 ----------------------------------------------------------------------------
 SALE      LIN   0.960      8    194.40   .000   7.2727     81.8182
 ----------------------------------------------------------------------------
 The following new variables are being created:----------------------------------------------------------------------------
 Name        Label
 ----------------------------------------------------------------------------
 FIT_1       Fit for SALE with AD from CURVEFIT, MOD_3 LINEAR
 ERR_1       Error for SALE with AD from CURVEFIT, MOD_3 LINEAR
 LCL_1       95% LCL for SALE with AD from CURVEFIT, MOD_3 LINEAR
 UCL_1       95% UCL for SALE with AD from CURVEFIT, MOD_3 LINEAR
 ----------------------------------------------------------------------------
 拟合图形详下。
 |