执业医师

导航

2016年公共卫生执业医师卫生统计学系统备考:第二章第三节

来源 :中华考试网 2016-03-08

第一节 计量资料的统计描述

第二节 正态分布和参考值范围的估计

  第三节 计量资料的统计推断

  一、均数的抽样误差与标准误

  一、均数的抽样误差概念

  由于总体中存在个体变异,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称均数的抽样误差。在抽样研究中,抽样误差是不可避免的,但可以估计其大小。

  二、中心极限定理

  1、在正态总体中,随机抽取例数为n的样本,样本均数X服从正态分布;

  2、在偏态总体中随机抽样,当n足够大时(n>50),X也近似正态分布;

  3、从均数为μ,标准差为σ的正态或偏态总体中,抽取例数为n的样本, 样本均数X的总体均数仍为μ,标准差为σx

  三、标准误意义及其计算方法

  1、意义: 说明均数抽样误差大小的指标,用σx表示。σx越大, 均数抽样误差越大;反之,σx越小,均数抽样误差越小。

  2、计算公式:

  3.均数的标准误的用途:

  (1)说明均数抽样误差大小,反映均数的可靠性。σx 越大,用样本均数推论总体均数越可靠,反之亦然

  (2)估计总体均数的可信区间

  (3)用于进行假设检验

  二、 t分布

  (一)t分布含义:

  由于呈正态分布N,则可以将一般正态变量变换成标准正态变量:将一般的正态分布变换为标准正态分布N(0、1)。可以算出一个t值,t值的分布称t分布。

  (二)t分布特征:

  1、以0为中心,左右对称的单峰分布;

  2、t分布的形态与自由度ν有关:

  ν越小,t分布曲线峰部越低平而尾部翘得越高;(t分布与u分布相差较大,即相同的曲线下面积,t值>u值)

  ν逐渐增大,t分布逼近标准正态分布;

  ν=∞,t分布=标准正态分布。(同样的曲线下面积,t值=u值)

  自由度不同,t分布曲线形态就不相同,因此t分布是一簇曲线,则就是说,自由度不同,相同的t值所对应的面积不同,或说,出现该t值的概率不同。

  (三)t值表

  对应于每一自由度取值,就有一条t分布曲线,每条曲线都有自身曲线下t值的分布规律,相同曲线下面积所对应的t值不同,计算t值较为繁杂。为此,统计学家已制成t值表,通过查表即获得相应的t值。查表须注意:

  1、横标目(左边第一列)为自由度,纵标目为概率(P),也就是t界值以外单侧或双侧尾部的面积占总面积的百分比,和t界值,用tα,ν表示;

  2、t值有正负值,由于t分布是以0为中心的对称分布,故表中只列正值,查表时,不管t值正负只用绝对值;

  3、当ν一定时,t值越大,P越小;

  4、当P一定时,ν越大,t值越小;ν=∞时,t=u;

  5、当ν和t值一定时, 双侧P=2倍单侧P。

  即 双侧tα,ν=单侧tα/2,ν。

  三、 总体均数的估计

  (一)估计方法:

  1、点值估计:用样本均数直接作为总体均数的估计值

  2、区间估计

  (二)总体均数的区间估计

  定义:按一定的概率(1-α)确定包含未知总体均数的可能范围。所确定的范围称为总体均数的可信区间(或置信区间,CI);1-α称可信度,最常用双侧95%。

  3、可信区间内涵义

  以95%总体均数可信区间为例:

  有95%的可能所计算出的区间包含了总体均数,即估计正确的概率为95%,错误5%。

  4、可信区间两个要素:

  (1)准确度:反映在可信度(1-α)的大小。1-α越接近1,越准确。

  如可信度99%比95%准确。

  (2)精确度:反映在区间范围宽窄。范围越摘越好。

  95%可信区间精度优于99%。

  在n确定的情况下,准确度↑,精确度↓。

  在兼顾准确度和精确度时,一般取95%可信区间。

  在可信度确定的情况下,增加样本例数,可提高精确度。

  5、可信区间与正常值范围区别:

  (1)意义不同:正常值范围是指绝大多数观察值在某个范围; 可信区间是指按一定的可信度估计总体参数(均数)可能所在的范围;

  (2)计算公式不同

  可信区间 和(大样本) 正常值范围,前者用标准误,后者用标准差。

  (3)用途不同:可信区间用于估计总体均数,参考值范围用于判断观察对象某项指标正常与否。

分享到

您可能感兴趣的文章