上QQ阅读APP看书,第一时间看更新
第一节 变量间关系分析的统计描述
统计描述是应用较为普通的运算和直观的图表方法,对某特定变量的观察值(常为样本数据)的集中趋势、离散趋势以及分布特征进行描述,不涉及假设和推断的问题。
由于变量类型的差异,分为数值变量的统计描述和分类变量的统计描述,本节只作概要介绍,具体计算操作参见以后章节。
一、数值变量的统计描述
数值变量的统计描述一般是指计算数值变量观察值的均数、标准差、例数,以及将观察值转换成分组频数表即频数分布表数据,制作直方图等。
一般地,统计描述只涉及一个变量,如:计算某人群身高变量值的均数、标准差、身高值的分布情况等,所以单一变量的统计描述较为多见。
根据分析变量的个数来划分,统计描述还有两个数值变量的统计描述、多个数值变量的统计描述。如,某地区小学生身高和体重的二维频数表,某地区不同年龄(段)成年人血压和血脂的三维交叉频数表等。
就目前应用来看,两个或多个数值变量的统计描述,特别是编制二维或多维频数表时,一般用两个或分层多水平的单一变量统计描述进行替代。
二、分类变量的统计描述
分类变量的统计描述,一般是将分类变量值的观察值转换成分类频数表(也称分类频数表数据)、制作直条图,计算对应的率、构成比、相对比等。
分类变量的统计描述包括一个分类变量、二个分类变量或多个分类变量的统计描述,涉及的分类变量有二项分类变量、多项无序分类变量和多项有序分类变量。多少变量以及什么类型变量组合进行统计描述,一般根据实际需要予以确定。如:统计某人群不同性别的人数,属于一个二项分类变量的统计描述;统计某人群不同性别不同病情的人数,属于两个分类变量的统计描述;分性别统计不同药物治疗不同患者疗效的情况,属于三个(混合)分类变量的统计描述。
类似地,多个分类变量的统计描述也可用多个单分类变量的统计描述替代。