上一主题:SPSS课程第三课:SPSS的数据管理
下一主题:请教各位达人,variables 的聚类和因子分析有何区别?
返回列表 发帖

SPSS教程第七课:方差分析

方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。

第一节 Simple Factorial过程

6.1.1 主要功能

调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。

6.1.2 实例操作

[例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析。

运 动 员

大 学 生

身高

肺活量

身高

肺活量

184.9

167.9

171.0

171.0

188.0

179.0

177.0

179.5

187.0

187.0

169.0

188.0

176.7

179.0

183.0

180.5

179.0

178.0

164.0

174.0

4300

3850

4100

4300

4800

4000

5400

4000

4800

4800

4500

4780

3700

5250

4250

4800

5000

3700

3600

4050

168.7

170.8

165.0

169.7

171.5

166.5

165.0

165.0

173.0

169.0

173.8

174.0

170.5

176.0

169.5

176.3

163.0

172.5

177.0

173.0

3450

4100

3800

3300

3450

3250

3600

3200

3950

4000

4150

3450

3250

4100

3650

3950

3500

3900

3450

3850

TOP

6.1.2.1 数据准备

激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。

6.1.2.2 统计分析

 激活 Statistics 菜单选ANOVA Models中的Simple Factorial...项,弹出Simple Factorial ANOVA对话框(图6.2)。在变量列表中选变量y,点击Ø钮使之进入Dependent框;选分组变量group,点击Ø钮使之进入Factor(s)框中, 并点击Define Range...钮在弹出的Simple Factorial ANOVAefine Range框中确定分组变量group的起止值(1,2);选协变量x,点击Ø钮使之进入Covariate(s)框中。

点击Options...框,弹出Simple Factorial ANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项:

1、Unique:同时评价所有的效应;

2、Hierarchical:除主效应外,逐一评价各因素的效应;

3、Experimental:评价因素干预之前的主效应。

本例选Unique方法,之后点击Continue钮返回Simple Factorial ANOVA对话框,再点击OK钮即可。

TOP

6.1.2.3 结果解释

在结果输出窗口中可见如下统计数据:

先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。

接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。

最后系统输出公共回归系数, = 36.002,该值可用于求修正均数:

= - ( - )

本例为 = 4399.00 - 36.002×(178.175 - 174.3325)= 4260.6623

= 3667.50 - 36.002×(170.49 - 174.3325)= 3805.8377

Y by GROUP

Total Population

4033.25

( 40)

GROUP 1 2

4399.00 3667.50

( 20) ( 20)

Y by GROUP

with X

UNIQUE sums of squares

All effects entered simultaneously

Sum of Mean Sig

Source of Variation Squares DF Square F of F

Covariates 1630763 1 1630762.635 10.679 .002

X 1630763 1 1630762.635 10.679 .002

Main Effects 1407847 1 1407847.095 9.220 .004

GROUP 1407847 1 1407847.095 9.220 .004

Explained 6981685 2 3490842.568 22.860 .000

Residual 5649992 37 152702.496

Total 12631678 39 323889.167

40 cases were processed.

0 cases (.0 pct) were missing.

Covariate Raw Regression Coefficient

X 36.002

TOP

6.1.2.3 结果解释

在结果输出窗口中可见如下统计数据:

先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。

接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。

最后系统输出公共回归系数, = 36.002,该值可用于求修正均数:

= - ( - )

本例为 = 4399.00 - 36.002×(178.175 - 174.3325)= 4260.6623

= 3667.50 - 36.002×(170.49 - 174.3325)= 3805.8377

Y by GROUP

Total Population

4033.25

( 40)

GROUP 1 2

4399.00 3667.50

( 20) ( 20)

Y by GROUP

with X

UNIQUE sums of squares

All effects entered simultaneously

Sum of Mean Sig

Source of Variation Squares DF Square F of F

Covariates 1630763 1 1630762.635 10.679 .002

X 1630763 1 1630762.635 10.679 .002

Main Effects 1407847 1 1407847.095 9.220 .004

GROUP 1407847 1 1407847.095 9.220 .004

Explained 6981685 2 3490842.568 22.860 .000

Residual 5649992 37 152702.496

Total 12631678 39 323889.167

40 cases were processed.

0 cases (.0 pct) were missing.

Covariate Raw Regression Coefficient

X 36.002

TOP

6.2.2.2 统计分析

 激活Statistics菜单选ANOVA Models中的General Factorial...项,弹出General Factorial ANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x,点击Ø钮使之进入Dependent Variable框;选要控制的分组变量base、sero和pct,点Ø钮使之进入Factor(s)框中,并分别点击Define Range钮,在弹出的General Factorial ANOVAefine Range对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。之后点击OK钮即可。

6.2.2.3 结果解释

在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。

分析表明,模型总效应的F值为10.55,P值 < 0.001,说明三因素间存在有交互作用。单因素效应和交互效应导致的组间差别比较结果是:

单因素组间比较:

A:基础液(BASE)

F = 4.98,P = 0.012,说明三种培养基培养钩体的计数有差别;

B:血清种类(SERO)

F = 61.265,P < 0.001,说明两种血清培养钩体的计数有差别;

C:血清浓度(PCT)

F = 3.49,P = 0.070,说明两种血清浓度培养钩体的计数无差别。

两因素构成的一级交互作用:

A×B:基础液(BASE)×血清种类(SERO)

F = 5.16,P = 0.011,交互作用明显;

B×C:血清种类(SERO)×血清浓度(PCT)

F = 15.96,P < 0.001,交互作用明显;

A×C:基础液(BASE)×血清浓度(PCT)

F = 0.78,P = 0.465,交互作用不明显。

三因素构成的二级交互作用:

A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT)

F = 6.75,P = 0.003,交互作用明显。

48 cases accepted.

0 cases rejected because of out-of-range factor values.

0 cases rejected because of missing data.

12 non-empty cells.

1 design will be processed.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Univariate Homogeneity of Variance Tests

Variable .. X

Cochrans C(3,12) = .34004, P = .036 (approx.)

Bartlett-Box F(11,897) = 1.69822, P = .069

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

* * * * * * A n a l y s i s o f V a r i a n c e -- design 1 * * * * * *

Tests of Significance for X using UNIQUE sums of squares

Source of Variation SS DF MS F Sig of F

WITHIN+RESIDUAL 2459233.75 36 68312.05

BASE 679967.38 2 339983.69 4.98 .012

PCT 238713.02 1 238713.02 3.49 .070

SERO 4184873.52 1 4184873.5 61.26 .000

BASE BY PCT 107005.54 2 53502.77 .78 .465

BASE BY SERO 705473.04 2 352736.52 5.16 .011

PCT BY SERO 1089922.69 1 1089922.7 15.96 .000

BASE BY PCT BY SERO 922307.37 2 461153.69 6.75 .003

(Model) 7928262.56 11 720751.14 10.55 .000

(Total) 10387496.31 47 221010.56

R-Squared = .763

Adjusted R-Squared = .691

TOP

第三节 Multivarite过程

6.3.1 主要功能

调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。

6.3.2 实例操作

[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?

TOP

学生编号

甲地区

乙地区

丙地区

身高

体重

胸围

身高

体重

胸围

身高

体重

胸围

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

119.80

121.70

121.40

124.40

120.00

117.00

118.10

118.80

124.20

124.90

124.70

123.00

125.30

124.20

127.40

128.20

126.10

128.70

129.50

126.90

126.50

128.20

131.40

130.80

133.90

130.40

131.30

130.20

136.00

141.00

22.60

21.50

19.10

21.80

21.40

20.10

18.80

22.00

21.30

24.00

23.30

22.50

22.90

19.50

22.90

22.30

22.70

23.50

24.50

25.50

25.00

26.10

27.90

26.80

27.20

24.40

24.40

23.00

26.30

31.90

60.50

55.50

56.50

60.50

57.70

57.00

57.10

61.70

58.40

60.80

60.00

60.00

65.20

53.80

59.50

60.00

57.40

60.40

51.00

61.50

63.90

63.00

63.10

61.50

65.80

62.60

59.50

62.60

60.00

63.70

125.10

127.00

125.70

114.90

124.90

117.60

124.20

117.90

120.40

115.00

126.20

125.10

114.90

121.50

114.00

118.70

120.60

122.90

119.60

112.30

121.30

121.20

120.20

120.30

120.00

123.30

122.10

123.30

109.90

125.60

23.00

21.50

23.40

17.50

23.50

18.90

20.80

20.30

20.00

19.70

21.20

22.10

19.70

22.00

19.00

19.10

20.00

18.50

19.50

20.00

20.00

21.20

23.10

21.00

22.20

20.10

21.00

21.50

17.80

23.30

62.00

59.00

61.50

52.50

58.50

57.00

58.50

61.00

56.00

56.50

56.50

58.50

56.00

57.00

54.50

54.50

55.50

56.00

59.50

58.00

58.00

59.00

59.50

59.50

59.50

56.50

57.50

61.00

56.50

60.50

118.30

121.30

121.80

124.20

123.50

123.00

134.90

123.70

105.20

112.20

118.60

112.00

121.50

124.50

119.50

122.50

115.50

122.50

124.50

125.00

117.50

127.30

122.30

121.30

120.50

116.00

120.50

114.50

131.00

122.50

20.40

20.00

26.60

22.10

23.20

22.90

32.30

22.70

20.20

20.80

21.00

23.20

24.00

21.50

20.50

23.00

19.00

22.50

25.00

25.50

23.00

22.50

22.00

21.00

22.00

19.00

20.00

19.00

25.50

24.50

54.40

54.30

61.10

TOP

henhao a

TOP

返回列表
上一主题:SPSS课程第三课:SPSS的数据管理
下一主题:请教各位达人,variables 的聚类和因子分析有何区别?