Ⅱ.多种影响因素中主要影响因素的筛选 — 多元逐步回归分析
1. 拟合二元回归方程估计销售额
例如:拟合二元回归方程估计此公司的销售额,需用 REGRESSION 命令。
此命令产生方法、步骤是:
SPSS 程序编辑窗主菜单 Analyze → 选 Regression (回归分析) → 选 Linear (线性回归分析,出现 Linear Regression 窗口 → 将 y 选入右边的 Dependent(因变量) 窗口中,因为要估计销售额 y → 将 x1 与 x2 均选入右边的Independent(s)(自变量) 窗口中,因为 x1 与 x2 是自变量,此时默认拟合线性回归的方法是 Enter(强制选入)→ 再击下方的 Statitics 钮,将下方的 Residuals 窗口中的所有预测值 Casewise Diagnostics勾选,并勾选 → 再击下方的 Save 钮,将 Predictive values 窗口中预测值 Unstandardized 勾选;再勾选 All cases 将其下方的 Prediction Intervals 中的 Mean 与 Individual 勾选 → Paste,即出现程序文件中的第 1 句 REGRESSION 命令。运算后可得:
Coefficients(a)
Model Unstandardized Coefficients Standardized Coefficients t Sig.
B Std. Error Beta
1 (Constant) -22.167 81.293 -.273 .796
X1 2.000 8.899 .068 .225 .831
X2 8.833 2.935 .905 3.009 .030
a Dependent Variable: Y
Casewise Diagnostics(a)
Case Number Std. Residual Y Predicted Value Residual
1 -.985 260.00 268.0000 -8.0000
2 .431 300.00 296.5000 3.5000
3 1.149 240.00 230.6667 9.3333
4 .472 320.00 316.1667 3.8333
5 .574 310.00 305.3333 4.6667
6 .287 290.00 287.6667 2.3333
7 -.841 270.00 276.8333 -6.8333
8 -1.087 270.00 278.8333 -8.8333
a Dependent Variable: Y
即可写出预测销售额(PY)的二元回归方程:PY = -22.176 + 2.000 x1 + 8.833 x2。
预测销售额(PY)见表中第 4 列“Predicted Value”。
如果广告费用 x1 增至 20 万元, 经营人员数 x2 增至 35 人, 预测销售额 PY = ?
PY = -22.176 + 2.000*20 + 8.833*35 = 301.71 万元。
2. 以多元逐步回归方程估计销售额
前述二元回归方程预测销售额,是人为决定以 x1 与 x2 预测 y,但通过上述拟合可发现 x1 在预测中意义不大。因为其回归系数的 t 值不显著(P=0.831)。
以多元逐步回归方程估计销售额,可由 SPSS 软件包逐步地、自动地选入有统计显著性的自变量。其命令的产生方法基本同前,只是要将拟合方法“METHOD”,从“ENTER x1 x2”,改为“STEPWISE x1 x2”,即逐步回归法。即出现程序文件中的第 2 句 REGRESSION 命令。
运算此命令后可得:
Coefficients(a)
Model Unstandardized Coefficients Standardized Coefficients t Sig.
B Std. Error Beta
1 (Constant) -5.556 31.048 -.179 .864
X2 9.444 1.014 .967 9.311 .000
a Dependent Variable: Y
Casewise Diagnostics(a)
Case Number Std. Residual Y Predicted Value Residual
1 -1.118 260.00 268.3333 -8.3333
2 .447 300.00 296.6667 3.3333
3 1.267 240.00 230.5556 9.4444
4 .596 320.00 315.5556 4.4444
5 .522 310.00 306.1111 3.8889
6 .373 290.00 287.2222 2.7778
7 -1.043 270.00 277.7778 -7.7778
8 -1.043 270.00 277.7778 -7.7778
a Dependent Variable: Y
可见以逐步回归法分析,程序会自动地删除没有统计显著性的自变量 x1。这时有统计显著性(P = 0.000)的自变量x2 留在方程中: PY = -5.556 + 9.444 x1。
前面“人力资源统计与人事管理数据库的统计分析”的例子中,研究的是对当前薪金水平(salnow,因变量)影响因素的多元逐步回归分析,自变量有起点薪金 (salbeg)、性别(sex)、工龄月数 (time)、年龄 (age)、教育水平 (edlevel) 等 5 个。
所用的程序文件名为Personnel-Bank.sps,可参阅。多元逐步回归分析命令是:
REGRESSION /VARIABLES=salnow sex edlevel age time salbeg
/STATISTICS=R ANOVA COEFF OUTS
/CRITERIA=FIN(3.84)
/DEPENDENT=salnow
/METHOD=STEPWISE
/DESCRIPTIVES=MEAN STDDEV CORR.
从该例分析可见:影响该银行职员现工资(Esalnow)的最主要因素是: 受教育的水平(第 4 个模型:EDLEVEL,其回归系数 B 值最大,达 264.456),其次是工龄资历(TIME,B=68.244)。预测现工资(Esalnow)的线性回归方程是:
Esalnow = -4911.556 + 1.75*8 SALBEG - 64.197*AGE + 68.244*TIME + 264.456*EDLEVEL。
欢迎光临 FRM论坛 (http://frmspace.com/) | Powered by Discuz! 7.2 |