2017公卫助理医师卫生统计学考点:方差分析
来源 :中华考试网 2017-03-16
中第八章 方差分析
【教学要求】
掌握:方差分析的基本思想;完全随机设计、随机区组设计、析因设计和重复测量设计方差分析的变异和自由度的分解方法及假设检验过程。
熟悉:方差分析的前提条件;多个样本均数的两两比较。
了解:方差齐性检验和变量变换。
【重点难点】
第一节 方差分析的基本思想
方差分析的基本思想就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,总自由度也分解成相应的几个部分,再作分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。
第二节 完全随机设计资料的方差分析
一、离均差平方和与自由度的分解
完全随机设计全部试验数据大小不同称为总变异,包括随机误差和处理效应的作用。各处理组样本均数各不相同,与总均数也不相同,这种变异称组间变异(variation between groups),它反映了处理的影响,同时也包括了随机误差。各处理组内部观察值大小不同,这种变异称组内变异(variation within groups),组内变异仅反映随机误差。 =N-1=(k-1)+(N-k)=+二、完全随机设计资料方差分析的基本步骤
完全随机设计资料的方差分析用于多个样本均数的比较,属单向(因素)方差分析(one-way ANOVA),它将数据按一个方向(即同一处理的不同水平或不同处理)进行分组整理。
方差分析的基本步骤:
(1)建立检验假设,确定检验水准
Ho:多个总体均数全相等
H1:多个总体均数不全相等,即至少有两个总体均数不等
α=0.05
(2)计算检验统计量(表8-1)
表8-1完全随机设计方差分析的计算公式
变异来源 |
SS |
df |
MS |
F |
总变异 |
或(N-1) |
N-1 |
|
|
组间 (处理组间) |
|
k-1 |
/(k-1) |
|
组内(误差) |
或 |
N-k或 |
/(N-k) |
|
(3)确定P值,作出推断结论:以计算F值时分子的自由度v1= v组间、分母的自由度v2= v组内查F界值表得P值,P和α比较得出推断结论。
第三节 随机区组设计资料的方差分析
一、离均差平方和与自由度的分解
随机区组设计全部试验数据的变异除了总变异、处理的变异和随机误差外,还存在区组的变异。区组变异是指区组的样本均数各不相同,与总均数也不相同。它既反映了区组因素的影响,也包括了随机误差。
二、随机区组设计资料方差分析的基本步骤
(1)建立检验假设,确定检验水准
对于处理组
Ho:多个总体均数全相等,即各处理效果相同
H1:多个总体均数不全相等,即各处理效果不全相同
对于区组
Ho:多个总体均数全相等,即各区组效果相同
Hi:多个总体均数不全相等,即各区组效果不全相同
α==0.05
(2)计算检验统计量(表8-2)
表8-2随机区组设计方差分析的计算公式
变异来源 |
SS |
df |
MS |
F |
总变异 |
或(N-1) |
N-1 |
|
|
处理组 |
|
k-1 |
/(k-1) |
|
区组 |
或 |
N-k或 |
/(N-k) |
|
(3)确定P值,作出推断结论:分别以计算F值时分子的自由度y处理和p区组、分母
的自由度v误差查F界值表得处理效应的P值和区组效应的P值,P和口比较得出推断结论。
第四节 析因设计资料的方差分析
一、单独效应、主效应和交互效应
单独效应是指其他因素水平固定时,同一因素不同水平的差别。主效应是指某一因素各水平间的平均差别。当某因素的各单独效应随另一因素变化而变化时,则称这两个因素问存在交互效应。若存在交互效应,须逐一分析各因素的单独效应。反之,若不存在交互效应,则分析某一因素的作用只需考察该因素的主效应。
二、离均差平方和与自由度的分解
析因设计是将两个或多个实验因素的各水平进行排列组合、交叉分组进行实验,因此其方差分析的总变异可以纷为处-理和误差两部分。2×2析因设计的处理变异包含了A因素、B因素的主效应以及A、B两因素间的交互效应;同样,自由度也可作相应的分解。
=+
=(++)+ (8-5)
=
=(+)+
三、析因设计资料方差分析的基本步骤
(1)建立检验假设,确定检验水准
对于因素A
Ho:因素A的作用无效
H1:因素A的作用有效
对于因素B
Ho:因素B的作用无效
H1:因素B的作用有效
对于交互作用AB
Ho:因素A和因素B无交互效应
H1:因素A和因素B有交互效应
α=0. 05
(2)计算检验统计量(表8-3)
表8-3 2×2析因设计方差分析的计算公式
变异来源 |
SS |
df |
MS |
F |
总变异 |
或 (N-1) |
N-1或abn-1 |
|
|
处理 |
|
ab-1 |
|
|
A |
|
a-1 |
/(a-1) |
MSA/ MSE |
B |
|
b-1 |
/(b-1) |
MSB/ MSE |
AB |
SS处理- SSA- SSB |
(a-1)(b-1) |
SSAB/[(a-1)(b-1)] |
MSAB/ MSE |
误差 |
SSE=SS总- SS处理 |
N-ab或ab(n-1) |
SS误差/[ab(n-1)] |
|
(3)确定P值,作出推断结论:以计算F值时分子自由度vl、分母自由度v2查F界值表得相应P值。首先看A因素和B因素交互效应AB的P值。若存在交互效应,须逐一分析各因素的单独效应,即固定某一因素水平,分析另一因素的单独效应。若不存在交互效应,则分析某一因素的作用只需考察该因素的主效应。
第五节 重复测量资料的方差分析
重复测量资料是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料。重复测量资料和随机区组设计资料的区别主要有二:
(1)重复测量资料中同一受试对象(看成区组)的数据高度相关。
(2)重复测量资料中的处理因素在受试对象问为随机分配,但受试对象内各时间点却不能随机分配;随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。
一、离均差平方和与自由度的分解
两因素重复测量资料的总变异包括两部分,一部分为受试对象问的变异,另一部分为受试对象内的变异。
=+
=(+(8-6)
=
=(
二、重复测量资料方差分析的基本步骤
(1)建立检验假设,确定检验水准:
对于处理因素K
Ho:处理因素K不同水平效应相同
H1:处理因素K不同水平效应不同
对于时间因素I
Ho:时间因素I不同水平效应相同
H1:时间因素I不同水平效应不同
对于交互作用KI
Ho:处理因素K和时间I无交互效应
H1:处理因素K和时间I有交互效应
α=0. 05
(2)计算检验统计量:重复测量资料的方差分析计算较为复杂,一般采用统计软件包SAS或SPSS等完成。
(3)确定P值,作出推断结论:以计算F值时分子自由度、分母自由度查F界值表得相应P值,或直接由计算机所给P值作出推断结论。
三、重复测量资料方差分析的前提条件
进行重复测量资料的方差分析,除需满足一般方差分析的条件外,还需特别满足协方差阵的球形性或复合对称性。若球形对称性质不能满足,则方差分析的F值有偏,因为它增大了第一类错误的概率。球对称性通常采用Mauchly检验来判断,若按规定检验水准α=0. 10,拒绝Ho,则从理论上讲应对受试对象内所有变异的自由度进行校正,用校正后的自由度查F界值表获得P值,再做出推论。如果球对称性不满足时,也可采用多变量方差分析的方法。
第六节 多个样本均数的两两比较
若经ANOVA分析得到处理因素的P<0. 05,按α=0.05水准,拒绝Ho时,说明多个总体均数不全相等,需进一步作两两比较。两两比较的方法很多,选择方法时需依据以下两种情形:
(1)在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数不全等的提示后,才决定多个均数的两两事后比较,常用于探索性研究,往往涉及到每两个均数的比较。可采用SNK法、Bonfcrroni t检验、Sidak t检验等等;
(2)在设计阶段就根据研究目的或专业知识而计划好的某些均数问的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较。可采用Dun-nett-t检验、LSD-t检验等,也可用Bonferroni r检验、Sidak z检验。
一、SNK法
SNK法也称NK法,属多重极差检验(multiple range test),其检验统计量为q,故又称q检验,具体检验步骤如下:
(1)建立检验假设,确定检验水准:
Ho:,即任两对比组的总体均数相等
H1:,即任两对比组的总体均数不等
α=0.05
(2)计算检验统计量:首先将各样本均数白小到大排列,并编组次,再计算q检验量。
q== v= (8-7)
(3)确定P值,作出推断结论:以、对比组内包含组数a和q值查q界值表得相应P值,P和a比较得出推断结论。
二、Dunnett法
Dunnett法其检验统计量为tD,故又称Dunnettt检验。它适用于k-l个实验组与对照组均数的比较,其具体步骤如下:
(1)建立检验假设,确定检验水准:
Ho:即任一实验组与对照组的总体均数相等
H1:,即任一实验组与对照组的总体均数不等
α=0.05
(2)计算检验统计量:
== v= (8-8)
(3)确定P值,作出推断结论:以、 α和tD值查Dunnett t界值表得P值,P和α比较得出推断结论。
三、Bonferroni法
又称Bonferroni t检验,该法是对检验水准进行调整,使多次比较后犯第一类错误的累积概率保持不变或至少不超过原有水准的方法,该法适用于所有的两两比较。基本步骤如下:
(1)建立检验假设,确定检验水准:
Ho:,即任两对比组的总体均数相等
H1:,即任两对比组的总体均数不等
==
(2)计算检验统计量:
t== v= (8-9)
(3)确定P值,作出推断结论:以上述t值和查t界值表得各对比组的P值,P和α比较得出推断结论。
*第七节 方差分析的前提条件和数据变换
一、方差分析的前提条件
从理论上讲,进行方差分析的数据应满足如下两个基本假设:
(1)各样本是相互独立的随机样本,均服从正态分布;
(2)各样本的总体方差相等,即方差齐性(homogeneity of variance)。
当样本含量较小时,资料是否来自正态分布的总体难于进行直观判断和检验,常常需根据过去经验;当样本含量较大时,中心极限定理均保证了样本均数的抽样分布仍然服从或接近服从正态分布。
对方差齐性的判断通常采用方差齐性检验,如Bartlett检验和Levene检验。
二、方差齐性检验
检验两总体方差是否不等采用的是F检验,多总体方差是否不等采用的是Bart-lett 检验。这两种方法对资料的正态性要求苛刻,而Levene检验适用于任意分布的
两组或多组资料,但计算较为繁琐,而且需要原始数据。
1.Bartlctt检验
(1)建立检验假设,确定检验水准:
Ho:多个总体方差全相等
H1:多个总体方差不全相等
α=0.10
(2)计算检验统计量:
= v=k-1 (8-10)
式中合并方差亦即组内或误差的均方MS组内或MS误差。
(3)确定P值,作出推断结论:以自由度v和值查界值表得相应P值。按
a-0. 10水准,做出推论。
2.Levene检验
式中N=∑ni,k为样本数。离差计算方法有如下几种:
(1) =|| ,(2) = ,(3) =|| (8-12)
第i组的算术均数、Mi第i组的中位数。该法又称Brown & Forsythe法(1974)。
(4) (8-13)
该法又称O'Brien法(1979,1981)。其中W一般取0.5.用它可以调整资料分布的峰度。
3.考察前提条件的残差图法
方差齐性最为简单、直观和有效的判断方法就是考察残差图,如作分组的残差图或以残差e为Y轴,拟合的期望值为X轴作图。如果数据符合方差分析的要求,则残差图的散点均分布在残差为0的横线上下,不应有任何特殊的结构。
三、数据变换
对于明显偏离正态性和方差齐性条件的资料,通常有两种处理方式:一是通过某种形式的数据变换以改善其假定条件;二是改用秩变换的非参数统计方法,如秩和检验等。数据变换虽然改变了资料分布的形式,但未改变各组资料问的关系,常用的数据变换方式有对数变换、平方根变换及平方根反正弦变换。