Excel中的数据分析工具

《统计学》课程实验指导

【试验目的】

能够使学生在学习统计学原理课程时，掌握统计学中的计算过程，理论联系实际。由于Excel是目前办公软件中比较流行的软件，因此，本试验课以该软件为基础，实现它的统计计算功能。通过该试验课程的学习，使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算，并通过案例的学习，培养学生一定的解决实际问题的能力。

【试验内容】

Excel中的统计分析功能，包括算术平均数、加权平均数、方差、标准差、协方差、相关系数、统计图形、随机抽样、参数点估计、区间估计、假设检验、方差分析、移动平均、指数平滑、回归分析。

【试验计划】

两个教学周，上试验课一次，时间一小时。

【试验地点】

学院办公楼二层计算机机房

试验一：描述性统计在Excel中的操作程序

此分析工具用于生成对输入区域中数据的单变值分析，提供有关数据趋中性和易变性的信息。

（-）“描述统计”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

分组方式

如果需要指出输入区域中的数据是按行还是按列排列，请单击“逐行”或“逐列”。

标志位于第一行/列

如果输入区域的第一行中包含标志项，请选中“标志位于第一行”复选框；如果输入区域的第一列中包含标志项，请选中“标志位于第一列”复选框；如果输入区域没有标志项，则该复选框不会被选中，Microsoft Excel 将在输出表中生成适宜的数据标志。

平均数置信度

如果需要在输出表的某一行中包含均值的置信度，请选中此复选框，然后在右侧的编辑框中，输入所要使用的置信度。例如，数值 95% 可用来计算在显著性水平为 5% 时的均值置信度。

第 K 大值

如果需要在输出表的某一行中包含每个区域的数据的第 k 个最大值，请选中择此复选框，然后在右侧的编辑框中，输入 k 的数值。如果输入 1，则这一行将包含数据集中的最大数值。

第 K 小值

如果需要在输出表的某一行中包含每个区域的数据的第 k 个最小值，请选中此复选框，然后在右侧的编辑框中，输入 k 的数值。如果输入 1，则这一行将包含数据集中的最小数值。

输出区域

在此输入对输出表左上角单元格的引用。此工具将为每个数据集产生两列信息。左边一列包含统计标志项，右边一列包含统计值。根据所选择的“分组方式”选项的不同，Microsoft Excel 将为输入表中的每一行或每一列生成一个两列的统计表。

新工作表组

单击此选项，可在当前工作簿中插入新工作表，并由新工作表的 A1 单元格开始粘贴计算结果。如果需要给新工作表命名，请在右侧编辑框中键入名称。

新工作簿

单击此选项，可创建一新工作簿，并在新工作簿的新工作表中粘贴计算结果。

汇总统计

如果需要 Microsoft Excel 在输出表中生成下列统计结果，请选中此复选框。这些统计结果有：平均值、标准误差（相对于平均值）、中值、众数、标准偏差、方差、峰值、偏斜度、极差（全距）、最小值、最大值、总和、总个数、Largest (#)、Smallest (#) 和置信度。

（二）实例应用：

某老师对几名学生的五次考试成绩进行分析，以便对这几个学生在学习方面的问题加以解决。使用“描述统计”分析工具对其数据进行分析。（数据文件名：描述统计.xls）

操作步骤：

1、打开数据“描述统计.xls”。如下：

2、选择“数据分析”对话框中“描述统计”，跳出“描述统计”对话框。

2、在“输入区域”编辑框中键入三列数据所在的单元格区域引用（$A$4:$F$8）。

3、单击“逐行”选项。

4、选中“标志位于第一行”选项。

5、在“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表的名称。如：“描述统计结果”。

6、选中“汇总统计”。

7、选中“平均数置信度”，并在其相应的编辑框中输入“95”。

8、选中“第K大值”和“第K小值”，并在其相应编辑框中输入“1”。

9、单击“确定”。

10、数据输出在新创建的工作表“协方差分析结果”中的“A1:J18”区域。如下：

在数据输出的工作表中，可以看出每个学生的的成绩的各种分析结果。其中第3行至第18行分别为：平均值、标准误差、中值、标准误差、样本方差、峰值、偏度、最大值、最小值、和、计数、第1大值、第1小值、95%概率保证程度的置信度。根据“标准偏差”值可以看出王华的成绩离散程度最大，即是说其成绩极不稳定，刘明的成绩是最稳定的。若取中值进行分析则是王华的成绩最好。平均值为刘明最佳。总体上而言，王华的成绩应该是最好的，只是最后一次的成绩太差，造成了较大的影响。

试验二：统计直方图在Excel中的操作程序

在给定工作表中数据单元格区域和接收区间的情况下，计算数据的个别和累积频率，用于统计有限集中某个数值元素的出现次数。例如，在一个有 20 名学生的班级里，可以确定以字母打分（如 A、B^-等）所得分数的分布情况。直方图表会给出字母得分的边界，以及在最低边界与当前边界之间某一得分出现的次数。出现频率最多的某个得分即为数据组中的众数。

“直方图”对话框

接收区域（可选）

在此输入接收区域的单元格引用，该区域应包含一组可选的用来定义接收区间的边界值。这些值应当按升序排列。只要存在的话，Microsoft Excel 将统计在当前边界点和相邻的高值边界点之间的数据点个数。如果某个数值等于或小于某个边界值，则该值将被归到以该边界值为上限的区间中。所有小于第一个边界值的数值将一同计数，同样所有大于最后一个边界值的数值也将一同记数。

如果省略此处的接收区域，Microsoft Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。

柏拉图

选中此复选框，可以在输出表中同时按降序排列频率数据。如果此复选框被清除，Microsoft Excel 将只按升序来排列数据，即省略输出表中最右边的三列数据。

累积百分率

选中此复选框，可以在输出表中添加一列累积百分比数值，并同时在直方图表中添加累积百分比折线。如果清除此选项，则会省略累积百分比。

图表输出

选中此复选框，可以在输出表中同时生成一个嵌入式直方图表。

实例应用：

学生历次考试成绩统计，按照一定区间生成频数分布表，使用“直方图”分析工具来完成。（数据文件名：直方图.xls）

操作步骤：

1、打开数据“直方图.xls”，如图

2、选择“数据分析”对话框中“直方图”，跳出“直方图”对话框。

3、在“输入区域”对应编辑框输入学生成绩数据的引用。（$B$2:$B$15）

4、在“接受区域”对应编辑框输入数据划分单元格的引用。（$A$18:$A$22）

5、看是否在输入栏里是否选择了标志单元格，考虑选定“标志”。在输出选项中选择“新工作表组”，在其对应编辑框中输入输出工作表名称，如；“图表输出”。选择“帕拉图”、“累积百分率”、“图表输出”选项。

5、单击确定。结果输出如下

在图中显示的统计结果中，可以看见输出的内容分为两部分，一部分是数据表示形式，一部分是直方图形式。在数据表部分，显示每个区间中的人数及累计百分率数值。通过该统计结果，我们可以知道，在第一次考试中有6人在100~85分之间，5人在85~75之间，1人在75~65之间，1人在65以下。

试验三：协方差和相关系数在Excel中的计算

1、协方差

此分析工具及其公式用于返回各数据点的一对均值偏差之间的乘积的平均值。协方差是测量两组数据相关性的量度。

可以使用协方差工具来确定两个区域中数据的变化是否相关，即，一个集合的较大数据是否与另一个集合的较大数据相对应（正协方差）；或者一个集合的较小数据是否与另一个集合的较小数据相对应（负协方差）；还是两个集合中的数据互不相关（协方差为零）。

“协方差”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

实例应用：

用协方差分析工具分析某公司历史“推销费用”、“销售额”、“营业人员”三项数据之间是否存在相关。（数据文件名：协方差.xls）

操作步骤：

1、打开数据“协方差.xls”，如下：

2、选择“数据分析”对话框中“协方差”，跳出“协方差”对话框。

3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用（$B$1:$D$9）。

6、单击“逐列”选项。

7、选中“标志位于第一行”选项。

8、在“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表的名称。如：“协方差分析结果”。

9、单击“确定”。

10、数据输出在新创建的工作表“协方差分析结果”中的“A1:D4”区域。如下：

在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的协方差矩阵。明显，对角线上为各自方差；其他，三个变量相互之间协方差分别为：202.125、199.5、610.5，说明三个变量之间存在较显著的相关性，不是相互独立的。

2、相关系数

此分析工具及其公式可用于判断两组数据集（可以使用不同的度量单位）之间的关系。总体相关性计算的返回值为两组数据集的协方差除以它们标准偏差的乘积：

可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关，即，一个集合的较大数据是否与另一个集合的较大数据相对应（正相关）；或者一个集合的较小数据是否与另一个集合的较小数据相对应（负相关）；还是两个集合中的数据互不相关（相关性为零）。

“相关系数”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

实例应用：

对某厂销售额、营业人员、以及推销费用的历史数据进行相关分析。（数据文件名：相关系数.xls）

操作过程：

1、打开数据“相关系数.xls”。如下：

2、在数据分析对话框中选择“相关系数”后，跳出“相关系数”对话框。

3、在“输入区域”编辑框中输入三列数据所在的单元格区域引用（$B$1:$D$9）。

4、单击“逐列”选项。

5、选中“标志位于第一行”选项。

6、在“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表的名称。如：“相关分析结果”。

7、单击确定。

8、数据输出在新创建的工作表“相关分析结果”中的“A1:D4”区域。如下：

在上图所示的输出表为“推销费用”、“营业员”、“销售额”三个变量的相关系数矩阵。明显，对角线上变量与自己完全正相关，值为1；其他，三个变量相互之间相关系数分别为：0.989786、0.993619、0.996674，数值非常接近1，说明三个变量之间存在较显著的相关关系。

试验四： t 统计检验在Excel中的操作程序

“分析工具库”中提供了三种工具，可用来检验各种样本总体的均值。

(-)“t - 检验：双样本等方差假设”分析

此分析工具可以进行双样本学生氏 t - 检验。此 t- 检验先假设两个数据集的平均值相等，故也称作齐次方差 t - 检验。可以使用 t - 检验来确定两个样本均值实际上是否相等。

“t - 检验：双样本等方差假设”对话框

变量 1 的区域

在此输入需要分析的第一个数据区域的单元格引用。该区域必须由单列或单行的数据组成。

变量 2 的区域

在此输入需要分析的第二个数据区域的单元格引用。该区域必须由单列或单行的数据组成。

假设平均差

在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。

在此输入检验的置信度。该值必须在范围 0~1 之间。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

检验两组实验测试数据是否有差异。（数据文件名：双样本等方差假设.xls）

操作步骤：

1、打开“双样本等方差假设.xls”，如下

2、选择“数据分析”中的“t - 检验：双样本等方差假设”，跳出“t - 检验：双样本等方差假设”对话框。

3、在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。

4、 “输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表名称。如：“t检验分析结果”。

5、

6、单击确定。输出如下

根据图中所示工作表显示的计算结果数据，可一直到两个温度下产品的轻度不受影响（即可认为两种温度下强度祥等）。

（二）“t - 检验：双样本异方差假设”分析

此分析工具及其公式可以进行双样本学生氏 t –检验。此 t - 检验先假设两个数据集的方差不等，故也称作异方差 t - 检验。可以使用 t - 检验来确定两个样本均值实际上是否相等。当进行分析的样本组不同时，可使用此检验。如果某一样本组在某次处理前后都进行了检验，则应使用“成对检验”。

用于确定检验统计值 t 的公式如下：

下面的公式用于估计自由度。因为计算结果通常不为整数，从 t 分布表中查找临界值时，应使用最接近的整数。

“t - 检验：双样本异方差假设”对话框

假设平均差

在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。

在此输入检验的置信度。该值必须在范围 0~1 之间。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

提出零假设为强度有变化，检验两组实验测试数据是否有差异。（数据文件名：双样本异方差假设.xls）

操作步骤：

7、打开“双样本异方差假设.xls”，如下

8、选择“数据分析”中的“t - 检验：双样本异方差假设”，跳出“t - 检验：双样本异方差假设”对话框。

9、在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。

10、“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表名称。如：“t检验分析结果”。

10、单击确定。输出如下

根据图中所示工作表显示的计算结果数据，原假设不成立，可以知道两个温度下产品的强度不受影响（即可认为两种温度下强度相等）。

（三）t - 检验：平均值的成对二样本分析

此分析工具及其公式可以进行成对双样本学生氏 t - 检验，用来确定样本均值是否不等。此 t -检验并不假设两个总体的方差是相等的。当样本中出现自然配对的观察值时，可以使用此成对检验，例如对一个样本组进行了两次检验，抽取实验前的一次和实验后的一次。

注意由此工具生成的结果中包含有合并方差，亦即数据相对于平均数据离散值的累积测量值，可以由下面的公式得到：

“t - 检验：平均值的成对二样本分析”对话框

假设平均差

在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。

在此输入检验的置信度。该值必须在范围0~1 之间。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用:

采用与前相同数据，操作过程一样，结果如下：

试验五： z统计检验在Excel中的操作程序

此分析工具可以进行方差已知的双样本均值 z - 检验。此工具用于检验两个总体均值之间存在差异的假设。例如，可以使用此检验来确定两种汽车模型性能之间的差异情况。

“z - 检验：双样本平均差检验”对话框

变量 1 的方差（已知）

在此输入变量 1 输入区域的总体方差。

变量 2 的方差（已知）

在此输入变量 2 输入区域的总体方差。

实例应用：

比较不同两地区水源矿物质含量是否相同。（数据文件名：Z检验.xls）

操作步骤：

1、打开数据“Z检验.xls”，如下

2、选择“数据分析”中的“z - 检验：双样本平均差检验”，跳出“z - 检验：双样本平均差检验”对话框。

3、在“变量1的区域”、“变量2的区域”对应的编辑框中键入A、B地区数据所在单元格的引用。

4、在“变量1的方差”、“变量2的方差”编辑框中分别键入A、B方差5和8。

5、在“输出选项”下单击“新工作表组”选项，并在其对应编辑框中键入新工作表名称，如：“z检验分析结果”。

6、单击确定，数据结果如下

可以看到Z值为-1.61245，双尾临界值为1.959961，因此，可以接受零假设，认为两地水源矿物质含量无显著差异。

试验六： F统计检验在Excel中的操作程序

此分析工具可以进行双样本F - 检验，用来比较两个样本总体的方差。例如，可以对参加游泳比赛的两个队的时间记分进行 F- 检验，查看二者的样本方差是否不同。

“F - 检验：双样本方差分析”对话框

变量 1 的区域

在此输入对需要分析的第一列或第一行数据的引用。

变量 2 的区域

在此输入对需要分析的第二列或第二行数据的引用。

在此输入检验的置信度。该值必须在范围0~1 之间。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

对测试产品在不同温度下强度的实验数据进行“F - 检验双样本方差分析”，以检查两种数据下测得的数据方差是不是相等。（数据文件名：F - 检验：双样本方差分析.xls）

操作步骤：

1、打开“F - 检验：双样本方差分析.xls”数据，如图

2、选择“数据分析”对话框中“F - 检验：双样本方差分析”，跳出“F - 检验：双样本方差分析”对话框。

3、在变量1的区域、变量2的区域所对应的编辑框中输入所要引用的单元格的引用。

4、置信度对应数据框输入0.05。

5、在输出数据对应的编辑框中输入，输出单元格的引用。

6、单击确定。

试验七：方差分析 (anova)在Excel中的操作程序

“分析工具库”中提供了三种工具，可用来分析方差。具体使用哪一工具则根据因素的个数以及待检验样本总体中所含样本的个数而定。

（一）“Anova：单因素方差”分析

此分析工具通过简单的方差分析(anova)，对两个以上样本均值进行相等性假设检验（抽样取自具有相同均值的样本空间）。此方法是对双均值检验（如 t-检验）的扩充。

“Anova：单因素方差分析”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

在此输入计算 F 统计临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

检验某市职工工资总额与商品零售总额是否存在线性关系（数据文件名：单因素方差分析.xls）。

操作步骤：

1、打开数据“单因素方差分析.xls”，如下：

2、选择“数据分析”对话框中“单因素方差分析”，跳出“单因素方差分析”对话框。

3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用（$B$1:$C$11）。

4、单击“逐列”选项。

5、选中“标志位于第一行”选项。

6、在“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表的名称。如：“方差分析结果”。

7、单击“确定”。

8、数据输出在新创建的工作表“方差分析结果”中，如下：

通过图中显示数据，用户可以看到F值远大于“Fcrit”得知，因此零假设不被接受，说明年度职工工资总额对当前社会商品零售总额是显著的线性相关。

（二）“Anova：可重复双因素”分析

此分析工具是对单因素 anova 分析的扩展，即每一组数据包含不止一个样本。

“Anova：可重复双因素分析”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

每一样本的行数

在此输入包含在每个样本中的行数。每个样本必须包含同样的行数，因为每一行代表数据的一个副本。

在此输入需要用来计算 F 统计的临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

测试产品不同温度下的强度，将原来8次测试值改为每次试验得到4个测试值，而实验进行了2次。对两次试验得到的数据进行样本均值相等的假设检验。

操作步骤：

1、打开数据“双因素方差分析.xls”，选择“可重复双因素方差分析数据”工作表，如下：

2、选择“数据分析”对话框中“可重复双因素方差分析”，跳出“可重复双因素方差分析”对话框。

3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用（$A$1:$C$9）。

4、在“每一样本的行数”对应编辑框中填入4。

5、在“输出选项”下单击“新工作表组”选项，并在对应编辑框中输入新工作表的名称。如：“方差分析结果”。

11、单击“确定”。

12、数据输出在新创建的工作表“可重复双因素分析结果”中，如下：

在山图所示结果中给出了3个F值，分别用于不同样本之间的均值相等性假设检验。如果只是进行不同温度下的两组数据之间的均值相等性假设检验，则可以取“列”所对应的F值，并于同一行中所对应的“Fcrit”值进行比较，从而可以判断出该两组数据的均值相等性假设成立。

（三）“Anova：无重复双因素”分析

此分析工具通过双因素 anova 分析（但每组数据只包含一个样本），对两个以上样本均值进行相等性假设检验（抽样取自具有相同均值的样本空间）。此方法是对双均值检验（如 t-检验）的扩充。

“Anova：无重复双因素分析”对话框

输入区域

在此输入待分析数据区域的单元格引用。该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。

标志

如果在输入区域中没有标志项，则本复选框不会被选中，Microsoft Excel 将在输出表中生成适宜的数据标志。

在此输入需要用来计算 F 统计的临界值的置信度。Alpha 置信度为 I 型错误发生概率的显著性水平（舍弃真实假设）。

实例应用：

无重复双因素方差分析在使用时，不需人为将样本数据进行划分，而是自动将样本数据按照其所在的行为分为多个样本进行分析，这是和可重复双因素分析的区别所在。

采用无重复双因素方差分析与可重复双因素方差分析操作上差不多，将上例采用无重复双因素方差分析得出结果如下：

通过上图所示数据结果，可以看到他对给定样本的每一行都计算了平均值及方差，并根据特定的计算方法求得F值。虽然他求得的F值与其他两种分析工具求得的值不同，但三种方差分析工具的根本使用思想是一致的，将最终结果中“列”所对应的F值与“Fcrit”相比较，可以判断出样本均值相等性假设可以成立。

试验八：长期变动趋势在Excel中的操作程序

1、移动平均

此分析工具及其公式可以基于特定的过去某段时期中变量的均值，对未来值进行预测。预测值的计算公式如下：

式中

l N 为进行移动平均计算的过去期间的数目

l Aj 为期间 j 的实际值

l Fj 为期间 j 的预测值

移动平均值提供了由所有历史数据的简单的平均值所代表的趋势信息。使用此工具可以预测销售量、库存或其它趋势。

“移动平均”对话框

输入区域

在此输入待分析数据区域的单元格引用。该区域必须由包含四个以上数据单元格的单列组成。

间隔

在此输入用来进行移动平均计算的间隔数。默认间隔为 3。

输出区域

在此输入对输出表左上角单元格的引用。如果选中了“标准误差”复选框，Microsoft Excel 将生成一个两列的输出表，其中右边的一列为标准误差值。如果没有足够的历史数据来进行预测或计算标准误差值，Microsoft Excel 会在某些单元格中返回错误值 #N/A。

此分析工具的输出区域必须与输入区域在同一工作表中。因此，“新工作表组”和“新工作簿”选项均不可使用。

图表输出

选择此悬想可以在输出表中生成一个嵌入直方图。

标准误差

如果要在输出表的一列中包含标准误差值，请选中此复选框；如果只需要没有标准误差值的单列输出表，请清除此复选框。

实例应用：

对公司11个月的销售数据采用移动平均法进行预测12月份的销售。（数据文件：移动平均.xls）

操作步骤：

1、打开数据“移动平均.xls”，如下:

2、选择“数据分析”中的“移动平均”，跳出“移动平均”对话框。

3、在输入区与输入数据系列的引用。（$B$2:$B$12）

4、在间隔中输入移动平均间隔，在此，我们输入5。

5、在“输出区域”对应编辑框中键入结果数据放置的单元格区域。

6、可选择输出“图表输出”、“标准误差”。

7、单击确定。数据输出见前图。

2、指数平滑

此分析工具及其公式基于前期预测值导出相应的新预测值，并修正前期预测值的误差。此工具将使用平滑常数 a，其大小决定了本次预测对前期预测误差的修正程度。

注意 0.2 到 0.3 之间的数值可作为合理的平滑常数。这些数值表明本次预测需要将前期预测值的误差调整 20% 到 30%。大一些的常数导致快一些的响应但会生成不可靠的预测。小一些的常数会导致预测值长期的延迟。

“指数平滑”对话框

输入区域

在此输入待分析数据区域的单元格引用。该区域必须为包含四个以上单元格的单一行或列。

阻尼系数

在此输入需要用作平滑常数的阻尼系数。阻尼系数是用来将总体中数据的不稳定性最小化的修正因子。默认的阻尼系数为 0.3。

图表输出

选中此复选框可根据输出表中的实际数值和预测数值生成嵌入式图表。

实例应用：

对一系列数据的一次指数平滑预测。（数据文件名：指数平滑.xls）

操作步骤：

1、打开文件“指数平滑.xls”，如下图：（其中，B2单元格数据为3个时期平均值，即表达式为“=average(B3:B5)”。）

2、择“数据分析”对话框中“指数平滑”，跳出“指数平滑”对话框。

3、在“输入区域”编辑框中键入指标列数据所在的单元格区域的引用（$B$2:$B$14）。

4、在“阻尼系数”对应编辑框中键入“0.2”

5、在“输出选项”下的“输出区域”对应编辑框中输入“$C$2”。

6、若要显示输出图表和标准误差，则选中“图表输出”、“标准误差”。在此选中一项“图表输出”。

7、单击确定。（注：其他选择不同阻尼系数是改变阻尼系数大小，并更改相应输出区域引用。）

8、数据输出再说所确定输出区域，并给出相应的图形输出。如下

从上图可以看出，“阻尼系数”值为0.2的时候预测误差最小，因此，第13期的预测值为0.8×14＋0.2×16.8=14.56。

从上面的图可以看出，以指数平滑预测的结果存在滞后偏差，即当时间序列呈下降趋势时，预测值往往偏高；反之，则偏低。另外，一次指数平滑预测只能做下一期的预测。

3、回归分析

此工具通过对一组观察值使用“最小二乘法”直线拟合，进行线形回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量影响的。例如，观察某个运动员的运动成绩与一系列统计因素的关系，如年龄、身高和体重等。在操作时，可以基于一组已知的体能统计数据，并辅以适当加权，对尚未进行过测试的运动员的表现作出预测。

“回归分析”对话框

Y 值输入区域

在此输入对因变量数据区域的引用。该区域必须由单列数据组成。

X 值输入区域

在此输入对自变量数据区域的引用。Microsoft Excel 将对此区域中的自变量从左到右按升序排列。自变量的个数最多为 16。

置信度

如果需要在汇总输出表中包含附加的置信度信息，请选中此复选框，然后在右侧的编辑框中，输入所要使用的置信度。如果为 95%，则可省略。

常数为零

如果要强制回归线通过原点，请选中此复选框。

输出区域

在此输入对输出表左上角单元格的引用。汇总输出表至少需要有七列的宽度，包含的内容有 anova 表、系数、y 估计值的标准误差、r2 值、观察值个数，以及系数的标准误差。

残差

如果需要以残差输出表的形式查看残差，请选中此复选框。

标准残差

如果需要在残差输出表中包含标准残差，请选中此复选框。

残差图

如果需要生成一张图表，绘制每个自变量及其残差，请选中此复选框。

线性拟合图

如果需要为预测值和观察值生成一个图表，请选中此复选框。

正态概率图

如果需要绘制正态概率图，请选中此复选框。

实例应用：

根据某厂历年来销售额、营业人员数量和推销费用，若将营业人员增加到310人，推销费用提高到200万元，预测一下2000年销售额将会达到多少？（数据文件名：回归.xls）

操作步骤：

1、打开数据“回归.xls”，如下

2、选择“数据分析”的“回归”，跳出“回归”对话框。

３、在“Ｙ值输入区域”编辑框中键入销售额列单元格的引用。

４、在“Ｘ值输入区域”编辑框中键入推销费用、营业人员列单元的的引用。

５、在“输出选项”区域中单击“新工作表组”选项，在对应编辑框键入新工作表名称，如“回归分析结果”。

６、单击确定，输出数据如下

７、在“数据”工作表中C12单元格输入公式“=回归分析结果!B17+回归分析结果!B18*200+回归分析结果!B19*310”。

最后得出，2002年销售额预计为310.8314万元。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。