6.1.2 描述统计工具 对于一组数据(即样本观察值),要想获得它们的一些常用统计量,可以使用Excel 2000提供的统计函数来实现。例如AVERAGE(平均值)、STDEV(样本标准差)、VAR(样本方差)、KURT(峰度系数)、SKEW(偏度系数)、MEDIAN(中位数,即在一组数据中居于中间的数)、MODE(众数,即在一组数据中出现频率最高的数值)等。但最方便快捷的方法是利用Excel 2000提供的描述统计工具,它可以给出一组数据的许多常用统计量,包括:
平均值 |
标准差 |
区域 |
计数 |
标准误差 |
样本方差 |
最大值 |
第K个最大值 |
中值(中位数) |
峰值(样本峰度) |
最小值 |
第K个最小值 |
模式(众数) |
偏斜度(样本偏度) |
总和 |
置信度 | 例如,下面列出了84个成年男子头颅的最大宽度(mm),试给出这些数据的均值、方差、标准差等统计量,并判断是否来自正态总体(取 =0.05)。
141 |
148 |
132 |
138 |
154 |
142 |
150 |
146 |
155 |
158 |
150 |
140 |
147 |
148 |
144 |
150 |
149 |
145 |
149 |
158 |
143 |
141 |
144 |
144 |
126 |
140 |
144 |
142 |
141 |
140 |
145 |
135 |
147 |
146 |
141 |
136 |
140 |
146 |
142 |
137 |
148 |
154 |
137 |
139 |
143 |
140 |
131 |
143 |
141 |
149 |
148 |
135 |
148 |
152 |
143 |
144 |
141 |
143 |
147 |
146 |
150 |
132 |
142 |
142 |
143 |
153 |
149 |
146 |
149 |
138 |
142 |
149 |
142 |
137 |
134 |
144 |
146 |
147 |
140 |
142 |
140 |
137 |
152 |
145 |
|
|
|
|
|
| 利用描述统计工具对这些成年男子头颅的最大宽度进行基本统计分析的具体操作步骤如下: 将所有的测试数据输入工作表中,本例存放在A1:A85区域中。 选择工具菜单中的数据分析命令。 这时将弹出数据分析对话框,如图6-1所示。
图6-1 在分析工具列表中,选择描述统计工具,单击确定按钮。 这时将弹出描述统计对话框,如图6-2所示。
图6-2 在输入框内指定输入数据的有关参数。 输入区域:指定要分析的数据所在的单元格区域。本例输入A1:A85。 分组方式:指定输入数据是以行还是以列方式排列的。这里选定逐列,因为给定的成年男子头颅的最大宽度是按列排列的。 标志位于第一行复选框:若输入区域包括列标志行,则必须选中此复选框。否则,不能选中该复选框,此时Excel自动以列 1、列 2、列 3 ……作为数据的列标志。本例选中此复选框。 在输出选项框内指定有关输出选项。 指定存放结果的位置:根据需要可以指定输出到当前工作表的某个单元格区域,这时需在输出区域框键入输出单元格区域的左上角单元格地址;也可以指定输出到新工作表组,这时需要输入工作表名称;还可以指定输出到新工作簿。本例选中将结果输出到输出区域,并输入左上角单元格地址C1。 汇总统计复选框:若选中,则显示描述统计结果,否则不显示结果。本例选中汇总统计复选框。 平均数置信度复选框:如果需要输出包含均值的置信度,则选中此复选框,并输入所要使用的置信度。本例键入95%,表明要计算在显著性水平为5%时的均值置信度。 第K大值复选框:根据需要指定要输出数据中的第几个最大值。本例选中第K大值复选框,并输入3,表示要求输出第3大的数值。 第K小值复选框:根据需要指定要输出数据中的第几个最小值。本例选中第K小值复选框,并输入3,表示要求输出第3小的数值。 单击确定按钮。 这时Excel 2000将描述统计结果存放在当前工作表的C1:D18区域中。如图6-3所示。 图6-3 分析结果可知,这些成年男子头颅的最大宽度的样本均值为143.7738、样本方差为35.6470、中值为143.5(即在这组数据中居于中间的数)、模式为142(即在这组数据中出现频率最高的数)、最小值为126、最大值为158,且偏斜度(= -0.1386)与峰值(=0.4685)都非常接近于0,因此可以认为这些数据是来自正态总体的。
|