统计师

导航

2017年中级统计基础理论及相关知识《统计方法》知识点讲解2

来源 :中华考试网 2017-08-23

  四、用数字来概括数据

  1、对定性的集中趋势常用的方法就是计算百分比、中位数和众数。

  中位数(Median),它是按照大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)

  众数(MODE)是数据中出现次数或出现频率最多的数值,用得最多。

  2、定量数据:

  反映数据的集中趋势水平度量:平均数、中位数、众数和分位数等。

  反映数据离散程度的差异度量:极差、四分位差、标准差和方差。

  简单算术平均:

  加权算术平均:

  :平均数

   :单位变量值

  :总体单位数

  :权数

  平均数对于严重偏态分布的数据,代表性较差。

  中位数和众位数不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数,这时它们的代表性要比平均数好。

  极差:又称全距,是最简单的离散指标,是一组中最大值与最小值之差。R=Xmax-Xmin

  极差容易受数据中极端值的影响,不能准确地描述数据的分散程度。

  方差 :是将各个变量值和其均值离差平方的平均数,反映样本中各个观测值到其均值的平均离散程度。

  方差:不开( )根号,标准差:开( )根号。

  未分组的计算公式:

  分组的计算公式:

  标准差 :是方差的平方根。

  总体标准差计算公式:

  总体未分组的计算公式:

  总体分组的计算公式:

  样本标准差计算公式:

  未分组的计算公式:

  总体分组的计算公式:

  是总体的标准差;S是样本的标准差。

  在一个统计样本中,其标准差越大,说明它的各个观测值分布越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就超好。

  离散系数:也称变异系数、标准差系数。它是将一组数据的标准差除以其均值,用来测度数据离散程度的相对数。

  其计算公式:

  总体数据的离散系数:V = /

  样本数据的离散系数:V S=S/

  标准分数:标准化值或Z分数.它是变量值与其平均值的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置。

  计算公式:Z=(X- )/s

  标准分数的最大的用途是可以把两组数据中的两个不同均值、不同标准差的数据进行对比,以判定在各组中的位置。

分享到

相关推荐