Stata统计分析与实验指导(视频教学版)
上QQ阅读APP看书,第一时间看更新

实验5-2 两个总体的假设检验

 实验基本原理

在实际的研究工作中,有时会用到两个正态总体的假设检验,两个正态总体的假设检验通常有以下两种情形。

1.未知μ1和μ2,检验假设H0:

在进行这个检验时,所使用的统计量为:

在这个公式中,S1和S2分别是两个总体样本的标准差,n和m分别是两个样本的容量。若F> Fα,则否定原假设,否则接受原假设。

2.未知,但知道=,检验假设H0: μ12

在进行这个检验时,所使用的统计量为:

在这个公式中,S1和S2分别是两个总体样本的标准差,n和m是两个样本的容量,是两个样本的均值,μ1和μ2是两个样本的总体均值。若|T|>tα,则否定原假设,否则接受原假设。

 实验目的与要求

(一)实验目的

1.掌握两个总体均值检验和方差检验的基本原理和方法。

2.掌握实验结果所代表的含义,并对原假设进行判别。

(二)实验要求

1.熟练掌握两个总体均值检验和方差检验的命令语句和操作方法。

2.理解均值检验和方差检验的输出结果,对检验的原假设做出合理的判断。

 实验内容及数据来源

实验数据来源于某学校对两个班的某次英语成绩的记录,其中score1代表一班的英语成绩,score2代表二班的英语成绩(数据单位:分)。完整的数据存储在本书下载资源\data\第5章\english.dta工作文件中,部分成绩数据如表5.2所示。

表5.2 部分成绩数据

利用english数据进行两个正态总体的方差和均值检验,检验两个班英语成绩的方差和均值是否相等。

 实验操作指导

1.两个正态总体的方差检验

两个正态总体的方差检验的命令与单个正态总体的方差检验较为相似,同样使用sdtest命令,具体格式有以下3种。

  •  两个样本方差检验:
     sdtest varname1 == varname2 [if] [in] [, level(#)]
  •  两组样本方差检验:
     sdtest varname [if] [in] , by(groupvar) [level(#)]
  •  仅利用样本特征值进行方差检验:
     sdtesti #obs1 {#mean1 | . } #sd1 #obs2 {#mean2 | . } #sd2 [, level(#)]

这些命令的具体参数含义与单个正态总体的基本一致,这里不再赘述。

利用english.dta数据库中的数据来分析两个班的英语成绩方差是否相等,可使用如下命令:

     sdtest score1==score2

执行这一命令,可得到如图5.6所示的结果。这个图中的表格展示了数据的情况,包括两个变量及其总体的样本容量、均值、标准误、标准差、置信区间的信息。在表格的下方展示了方差检验的结果,从中不难看出,检验的P值为0.3362,不能拒绝原假设,即认为两个班英语成绩的方差相等。

图5.6 两个正态总体方差检验结果

2.两个正态总体的均值检验

同样,两个正态总体的均值检验也是使用ttest命令,具体格式有以下4种。

  •  非配对样本的均值检验:
     ttest varname1 == varname2 [if] [in], unpaired [unequal welch level(#)]
  •  配对样本的均值检验:
     ttest varname1 == varname2 [if] [in] [, level(#)]
  •  分组的均值检验:
     ttest varname [if] [in] , by(groupvar) [options]
  •  仅利用样本特征值进行均值检验:
     ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2 [, options]

需要解释的有两点:一,配对样本数据是指对同一部分样本进行追踪调查所取得的数据;二,其中options选项的具体说明参见表5.3。

表5.3 options选项说明

利用english.dta数据库中的数据分析两个班的英语成绩均值是否相等,可使用如下命令:

     ttest score1==score2, unpaired

因为是两个班的英语成绩,并不是对一个班英语成绩的追踪记录,所以是非配对数据,应当使用unpaired选项,执行的结果如图5.7所示。这个图中的表格展示了数据的情况,包括两个变量、二者总体和二者之差的样本容量、均值、标准误、标准差、置信区间的信息。在表格的下方展示了均值检验的结果,从中不难看出,检验的P值为0.5721,不能拒绝原假设,即认为两个班的英语成绩均值相等。

图5.7 两个正态总体均值检验结果