第一章 资料的描述统计分析:通过试验或调查收集的原始数据资料,一般具有“大量”和“杂乱无章”的特点,不能直接考察其潜在的特征,所以首先要进行描述性统计分析,使之条理化,并成为宜于统计分析的形式,同时通过对资料的初步计算分析,对资料的统计特征有大致了解,为进一步深层次分析打好基础。整理试验或抽样调查获取的数据资料的过程,也称为描述性统计分析,通过这一过程,我们能够对数据资料的基本特征有初步的了解。本章首先介绍了数据资料的分类和对异常数据的判断及处理方法,然后介绍了对数据资料基本分布特征的分析方法,包括频数(率)分布的计算,常用统计表、统计图制作的一般原则和方法,以及对数据资料集中性和离散性度量指标(描述性统计量)的定义及其计算方法。1.1数据资料的分类:与一般资料相比,用于统计分析的资料具有数字性、大量性、具体性的特点。资料的分类是统计归纳的基础,根据资料的收集方法及数据的取值特征,通常可将资料分为连续型资料、离散型资料,离散型资料又可以进一步分为计数资料和分类资料。
1.2数据集中趋势的度量1:在统计分析中,我们首先希望知道的数据特征往往是是一组数据的集中趋势,即变量分布的中心位置。常用的度量指标有算数平均数、几何平均数、调和平均数、和众数。其中,算数平均数适用于正态或接近正态分布的数据资料,而几何平均数和调和平均数受极端值的影响较小,中位数反映出数据位置的中心,众数则能够代表大众水平。
1.3数据集中趋势的度量2:在数据完全对称分布的情况下,算数平均数、中位数及众数三者相等。但当数据呈现微偏态时,三者会呈现不同的关系。作为集中趋势的度量指标,应满足一定的条件。我们在具体的试验过程中,应根据需求的不同选择不同的度量指标。
1.4数据离散趋势的度量:仅仅了解数据的集中趋势是不够的,还需要用一些度量离散趋势(变异程度)的指标反映集中趋势对数据的代表程度。若样本观测值间变异程度小,则平均数的代表性就好;若观测值间变异程度较大,则平均数的代表性就差。度量数据离散趋势的常用指标有方差、标准差和变异系数,此外还有范围和平均绝对离差。
1.5异常值的判断和处理:异常数据是指定量资料中存在的极端值,这些极端值可能是试验错误引起的,也可能是数据本身的特性的反映。本节介绍了四分位数检验法和Grubbs检验法的具体操作,当两种检验结果出现差异时,应以较为严格的结果为准。
1.6习题解析:本章的练习主要介绍了如何用R进行资料数据的描述统计分析,需要理解和掌握的统计知识点有平均值、标准差、方差、众数和中位数等,以及什么是频数分布和频率分布。同时,需要掌握R函数mean、var、sd、median、summary、quantile等,以及如何用R绘制简单的直方图和饼形图。
[单选题]变异系数是衡量样本资料(   )程度的一个统计量。

选项:[准确, 集中, 变异, 同一]
[单选题]基因型(AA, Aa, aa)属于(   )。

选项:[计数资料, 连续型资料, 公称尺度, 等级尺度]
[单选题]假设一组数据中有10个样本,其离均差平方和为90,则该组数据的标准差为(   )。

选项:[3, 10, 9, √10]
[单选题]若一组数据的单位为kg,则该组数据方差的单位为(   )。

选项:[kg², kg, 无, √kg]
[单选题]假设一组数据中有9个样本,其样本标准差为0.09,平均数为1,则该组数据的变异系数为(   )。

选项:[30%  , 90%, 1%  , 9%  ]
[单选题]在一组数据中,若某一变量10的离均差是2,则该组数据的平均数(   )。

选项:[8或12, 10, 8, 12]
[单选题]投票选举时,一般使用(   )反映大众的意愿。

选项:[方差, 算数平均数, 中位数, 众数]
[单选题]度量猪瘦肉率的集中趋势,宜采用(   )。

选项:[众数, 调和平均数, 算数平均数, 几何平均数]
[单选题]比较大学生和幼儿园孩子身高的变异度,应采用的指标是(   )

选项:[众数 , 标准差  , 变异系数 , 平均数]
[单选题]以下属于离散型资料的是(   )。

选项:[小黄鱼的体长, 果蝇的翅型, 育肥猪的出栏体重, 绵羊的产毛量]

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部