2017公卫助理医师卫生统计学考点:假设检验基础
来源 :中华考试网 2017-03-16
中第七章 假设检验基础
【教学要求】
掌握: 假设检验的基本步骤;单样本设计资料的t检验;配对设计资料的t检验;两独立样本设计资料的t检验;学会综合考虑研究目的、设计类型、变量类型、样本含量等要素选择合适的假设检验方法的技巧。
熟悉 :假设检验的概念与原理;二项分布资料的Z检验以及Poisson分布资料的Z检验的分析与计算过程,包括每种检验方法的适用条件和不同类型。
了解: 二项分布与Poisson分布;通过电脑实验了解常用的正态性检验的方法;假设检验功效的意义及计算;假设检验的两类错误之间的区别与联系;区间估计与假设检验之间的关系。
【重点难点】
第一节 假设检验的概念与原理
一、假设检验的思维逻辑
基本推断原理 :小概率事件在一次随机试验中不(大)可能发生。
特点 :从研究总体中抽取大小合适的随机样本,应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。
二、假设检验的基本步骤
基本概念 :假设检验就是首先根据设计和研究目的提出某种假设,然后根据现有资料提供的信息,推断此假设应当拒绝还是不拒绝。
假设检验的基本步骤 :分为三步:①建立检验假设,确定检验水准;②计算统计量;③确定P值,做出推断。
第二节t检验
t检验的应用条件:当样本含量较小时,要求样本取自正态总体;对于两独立样本设计资料,要求具有方差齐性(两个总体方差相等)。
一、单样本设计资料的z检验
检验统计量:
t=, v=n-1
其中,为已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)。
二、配对设计资料的t检验
基本概念 :配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法。
检验统计量:
t=
其中,为差值的均数,为差值的样本标准差,n是对子数。
三、两独立样本设计资料的t检验
(一)两样本所属总体方差相等
检验统计量:
t=,v=+-2
==
其中,是合并方差。
(二)两样本所属总体方差不等 (t’检验)
检验统计量:
t’=,v=
其中,和分别为两样本的均数,和分别为两样本的样本方差。
四、两独立样本设计资料的方差齐性检验
检验统计量:
F=,v1=-1,v2=-1
其中,与是被比较的两个样本方差。
五、大样本资料的Z检验
(一)单样本设计资料的Z检验
检验统计量:
当n较大时,公式为:
Z=
其中、S、n分别为样本的均数、标准差、样本含量;为总体均数。
(二)两独立样本设计资料的Z检验
检验统计量:
当两样本含量、均足够大(n>100)时,公式为:
Z=
其中、、、、、分别为两样本的均数、标准差、样本含量。
第三节 二项分布资料与Poisson分布资料的Z检验
二项分布资料的正态近似条件:n较大、π不接近0也不接近1。实践中,若np与n(1-p)均大于5,便可认为符合条件。
Poisson分布资料的正态近似条件 :总体均数λ较大。实践中,若X≥20,便可认为符合条件。
一、二项分布资料的Z检验
(一)单样本设计资料的Z检验
检验统计量:
Z= 或 Z=
当n不太大时,需作如下的连续性校正:
Z= 或 Z=
其中,π为已知的总体概率(一般为理论值、标准值或经过大量观察所得的稳定值等),p=。
(二)两独立样本设计资料的Z检验
检验统计量:
Z= 或 Z=
其中,、分别为两样本的样本含量;p1和p2分别为两样本的阳性频率;为两样本合并的阳性频率。分子中0.5(+)为连续性校正项;=;和分别为两样本阳性例数。
二、Poisson分布资料的Z检验
(一)单样本设计资料的Z检验
检验统计量:
Z=
其中,为一个定值(一般为理论值、标准值或经过大量观察所得的稳定值等)。
(二)两独立样本设计资料的Z检验
检验统计量:
1.当两样本观测单位数相等时:
Z=
其中,Xl与X2分别为两样本的计数值。
2.当两样本观测单位数不等时:
Z=
其中,l与2分别为两样本均数,n1与n2分别为观测单位数。
第四节 假设检验与区间估计的关系
两个总体均数差值的双侧(1-α)置信区间:() ±
1.置信区间具有假设检验的主要功能。
2.置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义。
3.假设检验可以报告确切的P值,还可以对检验的功效做出估计。
第五节 假设检验的功效
一、假设检验的两类错误(表7-1)
表7-1 推断结论和两类错误的概率
实际情况检验结果
拒绝不拒绝
真第Ⅰ类错误(α)结论正确(1-α)
不真结论正确(1-β)第Ⅱ类错误(β)
当样本含量n一定时,α越小β越大;α越大β越小;要想同时降低α与β,唯一的方法是增大样本含量。
二、假设检验的功效
基本概念:1-β称为假设检验的功效,其意义是,当所研究的总体与Ho确有差别时,按检验水平α能够发现它(拒绝Ho)的概率。
1.单样本设计资料t检验的功效
计算:=—
其中,n为样本含量,δ为欲发现的最小差异或容许误差,σ为总体标准差,为假设检验的临界值(取单侧)。然后根据反查标准正态分布表,标准正态分布的密度曲线下,左侧的面积就是功效1-β。
2.两独立样本设计资料t检验的功效
计算:=—
其中,、分别为两样本的样本含量,其余符号含义同上。
三、应用假设检验需要注意的问题
对服从正态分布资料进行t检验,不是看样本均数间差别的大小,而是推断两个总体均数是否相等(或其中一个大于另一个);类似地,对服从二项分布资料或Poisson分布资料进行Z检验,目的也是对相应的总体参数大小进行推断。