2017公卫助理医师卫生统计学考点:参数估计基础
来源 :中华考试网 2017-03-16
中第六章 参数估计基础
【教学要求】
掌握: 均数的标准误和频率的标准误的计算方法;总体均数95%和99%置信区间的计算方法及适用条件;总体概率95%和99%置信区间估计的正态近似法及适用条件;标准差与均数标准误的区别。
熟悉: 抽样误差的概念;标准误的意义及其应用。
了解: 样本均数和样本频率的抽样分布规律;t分布的特征;查表法估计总体概率的置信区间。
【重点难点】
第一节 抽样分布与抽样误差
一、均数(频率)的抽样误差及抽样分布的特点
基本概念: 在同一总体中反复多次随机抽取样本含量相同的若干份样本,由于受个体差异和偶然性的影响,样本统计量与总体参数之间可存在差异,成为抽样误差。这种由抽样误差造成的样本均数与总体均数之间的差异称为抽样误差,频数与概率之间的差异称为频率的抽样误差。
特点: 从正态分布N(μ,)总体中随机抽样,样本均数仍服从正态分布;从非正态分布总体中随机抽样,只要样本含量足够大(n≥50),样本均数的分布也近似于正态分布。
在抽样研究中,抽样误差是不可避免的。用于表示抽样误差大小的指标称为标准误。
对任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由公式(6-1)计算。
二、标 准 误
(一)均数的标准误
意义: 均数标准误用符号表示,也称样本均数的标准差。它反映了样本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。
计算: 可按公式=计算在实际应用中,总体标准差σ常常未知,需要用样本标准差S来估计。此时,均数标准误的估计值为=。由此可见,若增加样本含量n可以减少样本均数的抽样误差。
主要应用: ①估计总体均数的置信区间;②均数的假设检验。
均数的标准误炸定义、计算及结果解释方面应注意与标准差相区别,不能将两者混淆。
(一) 频率的标准误
意义: 频率的标准误用符号表示,他反映了样本频率与样本频率之间,样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
计算: 可按公式=计算。在实际应用中,总体概率π常常未知,需要用样本概率p作为总体概率π的估计值,因此,概率的标准误的估计值为≈。由此可见,增加样本含量n可以减少样本频率的抽样误差。
主要应用: ①估计总体概率的置信区间;②频率指标的假设检验。
第二节 t 分 布
一、t分布的概念
t==服从自由度v=n-1的t分布。
T分布是总体均数的区间估计及假设检验的理论基础。
二、t分布的图形与曲线下面积的分布规律
与标准正态分布比较,t分布有如下特征:①单峰分布,以0为中心,左右对称;②自由度v越小,则越大,t值越分散,曲线的峰部越矮,尾部翘得越高;③当v逼近∞,t分布逼近标准正态分布。
t分布曲线下面积的分布规律为:
单侧:P(t≤-tα, v )= α 或 P(t≥tα, v )= α
双侧:P(|t |≥tα/2, v)= P(t≤-tα/2, v )+ P(t≥tα/2, v )= α
第三节 总体均数及总体概率的估计
一、参数估计的概念
参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种方法。
(一)点估计
直接用随机样本的样本均数作为总体均数μ的估计值或用样本频率p作为总体概率π的估计值的方法称为点估计。该法思维朴素,但没有考虑抽样误差。
(二)区间估计
用已知样本统计量与标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间,这一估计可相信的程度称为置信度或置信水平(如95%或99%)。若标准差不变,将置信度由95%提高到99%,则置信区间由窄变宽,估计的精度下降。
二、置信区间的计算
(一)总体均数的置信区间
总体均数置信区间的基本公式是±tα/2, vS。样本含量较大时,用公式±Zα/2或(后者用于总体标准差已知时)。
实际工作中,估计总体均数置信区间时,要注意与参考值范围相区别,见《卫生统计学》(第6版)教材的表6-5。
(二)总体概率的置信区间
根据样本含量n和样本频率p的大小,可以选用查表法或正态近似法。重点掌握正态远似法。
正态近似法:当n足够大,且样本频率p和(l- p)均不太小时,如np与力n(l-p)均大于5,p的抽样分布近似正态分布,此时总体概率的置信区间为(p-),可缩写为(p±)。