MINTAB操作手册(一)
发布时间:2011-07-21 12:21:54
发布时间:2011-07-21 12:21:54
MINITAB操作手册
(一)
乐庭电线有限公司
2002年
目 录
第1章 统计的基础知识
第1节.基础统计概述
第2节.显示统计特征值
第3节.大样本的统计检验
第4节.小样本的统计检验
第5节.两个小样本的统计检验
第6节.成对数据的t检验
第7节.单一成品率的统计检验
第8节.二个百分率的统计检验
第9节.方差相等性检验
第10节.相关性检验
第11节.正态检验
第一章 统计的基础知识
第1節. 基础统计概述
一 主要内容:
Minitab在统计基础一章中提供了以下几组统计程序:
1.计算或储存统计特征值.
2.平均值或平均值差的假设检验和置信区间.
3.百分数或百分数之差的假设检验和置信区间.
4.方差相等性检验.
5.相关检验.
6.正态检验.
总计12个程序,它基本上覆盖了常用的统计基础知识,是深入学习统计知识所不可缺少的.
二.某些参数的定义
1.处理后的平均值(Trimmed Mean).Minitab去掉最大和最小的5%(修约成最近的整数)数值后再进行平均.
2.平均值的标准误差,由表示.
3.标准偏差:如果列中含有参数,x1﹑x2…xn.其平均值为:则s=
4.σ的置信区间: σ的置信区间是
至
5.四分位值(Quartile),为了计算四分位值,MINITAB把数据按最小到最大次序排列.第一个四分位值为(n+1)/4位置的数据,而第三个四分位值3(n+1)/4位置的数据.如(n+1)/4或3(n+1)/4不是整数,则用内插法求其数值.
6.不对称性(或歪斜度Skewness)它是用来度量分布的对称性的参数:
sk=n/(n-1)(n-2)Σ(xi-)3/s3.当数值接近零时表示分布对称,当该值为负值则说明分布向左歪斜,及之正值则表明向右歪斜.
7.峭度(kurtosis)它是用来度量分布峰与正态曲线有什么不同的参数.
Ku=n/(n+1)/(n-1)(n-2)(n-3)Σ(x-)4/s4-3n/(n-1) 2/(n-2)(n-3)
当Ku>0则表示分布的峰比正态分布更尖,若是负值则表示峰更平.
8.MSSD(相邻数据差的平方和的平均值的一半).
例如:数据为1,2,3,4,10,相邻数据之差为1,2,6
第2节.显示统计特征值
一. 概述:
在很多情况下,数据服从正态分布.通常用N(μ-σ)表示,正态分布最简单的特征值就是μ与σ.为了对数据的分布有一个更完全的描述.程序的结果中显示出两组数据:第一组中包括:样本容量(N),平均值,中位值,处理后的中位值,标准偏差和平均值的标准误差;第二组中则包括:最小值,最大值,第1四分位值,第三四分位值.
为了更好的反映数据的情况,程序可以输出以下五种图形来形象的描述数据的分布:
①直方图 ②带有正态曲线的直方图 ③数据的点 ④数据的盒图 ⑤总结图
二. 数据:
如果只分析一组数据的分析,只要把这一组数据输入到一列中.如果这组数据还可以分成几部分,分别的加以统计,则可以在另一列中输入分组的下标值.
如果有几组数据要同时分析,可以把几组数据分别输入几列中,程序可以一列一列的进行统计并分别输出结果.例题数据如表1-1所示:
表1-1
三. 程序的操作
在首次使用MINITAB程序时,一般都是先在工作单中输入数据.再操作程序.在使用了一段时间以后,就可以采用MINITAB的贮存起来,例如我们把需要的数据贮存在MTB3中.
1.调出MTB3数据
2.Stat>Basic Statistics>Display Descriptive Statistics这时显示一个对话框如图1-1所示:
3.在Variables中输入C1.
4.如果需要,使用一个或多个列在下面的选择项,然后点击OK.
有下选择:
1.是否对数据中的各部分进行统计,这时就要点击By Variable前面的方框,并在后面输入存有下标管的列号.
2.输出图形选择:
点击键,就出现一个子对话框.你可以选择需要输出图形的种类.当你选择总结图时,还需要给定置信水平,计算器的默认值为95%,你可以改成其它值或不变.
由于总结图给出最多的信息,我们建议使用输出总结图.
在点标OK以后,程序开始运行,并输出一张统计结果,如图1-2所示:
四.结果的解释
统计特征值输出中包括1四张图: ①带有正态曲线的直方图 ②数据分布的盒图
③u的95%置信区间 ④中位值的95%置信区间及2四组数据: ①正态检验结果,由于检验的统计量A-squared=0.720,相应的P-Value=0.054>0.05可以接受数据服从正态分布的假设 ②第二组数据则是分布特征参数的数值 ③第三组数据是最小值,第一四分位值,中位值,第三四分位值,最大值,这五个数据就组成了上面第二个盒图,可以看出左边的尾要比右边长 ④第四组数据为三个95%置信区间的长度.
如果点击By Variable并输入C2就可以得到2组统计结果.
采用贮存特征参数就可以把你需要的计算结果贮存到工作单上,并与工作单一起贮存到计算器中,以后可以一起调出来用.
第3节 大样本的统计检验
一.概述
当样本容量,n≧30称为大样本.在进行大样本的统计检验时,统计量为: Z服从标准正态分布,就可以由正态分布表查出相应的的P-Value值,如果该值大于0.05,就可以接受假设.该程序同时算出95%置信区间.
二.数据
例题已知甲工厂漆包线击穿电压数据服从N(9.5,1.5).现从乙工厂产品中抽取50个试样,测得表1-2数据.问两厂的产品质量有无显著的差异?娄据贮存在MTBL10文件中,表1-2:
表1-2
三. 程序的操作
1. 调出MTBL10文件
2. Stat>Basic Statistics>1-Sample Z显示一个对话框,如图1-3所示:
3. 在Variables中输入C1,在Sigma中输入1.5 ,在Test Mean中输入9.5.
4. 如果需要,可对以下列出的一种或多种选择进行操作,然后点击OK.
选择:
1.点击 可选择直方图,点图或/和盒图.
2.点击 ①可以改变置信水平,计算器默认值为95% ②可以选择单边或双边检验(即选择大于,小于或不等于的三种检验).
图1-3
点击OK后程序开始运行,并输出结果,结果如图1-4所示:
四. 结果解释
我们的原始假设是μ0 =9.5,从检验的结果中可以看到95%置信区间为(8.562,9.394),假设点落在区间之外,不能接受假设,所以两厂的产品质量有显著差异.在图形中假设点落在置信区间之外就很形象的表示了出来 .
在检验结果中,还显示了Z=-2.46,P=0.014,P<0.05,不能接受假设.
Test of mu = 9.5 vs mu not = 9.5
The assumed sigma = 1.5
Variable N Mean StDev SE Mean
C1 50 8.978 1.566 0.212
Variable 95.0% CI Z P
C1 ( 8.562, 9.394) -2.46 0.014
Z Histogram of C1
图1-4
第4节 小样本的统计检验
一. 概述
当n<30时,称作小样本.如果我们不知道总体的标准偏差G,而采用样本的标准偏差S来代替G,这时的统计量: 就不再服从正态分布而服从t分布.所以小样本统计检验需采用T检验.
例:某绝缘材料绝缘强度的指标为20MV/m.现对该材料取5个试样做击穿试验,其试验结果分别为18.0,18.5,19.0,19.5,20.0(MV/m).问在置信水平95%的情况下,生产的产品的性能与原指针有无显著的差异?
二. 数据
将小样本试验结果输入到一列中.
三. 程序操作
1. 调出MTBLS3.
2. Stat>Basic Statistics>1-Sample t出现一个对话框如图1-5所示:
图1-5
3. 在Variables中输入C1,在Test Mean中输入20
4. 如果需要,可选择下面列出的几项选择,然后点击OK.
选择:
①Graphs ②Options 与大样本的统计检验相同.
点击OK以后程序运行,输出计算结果,如图1-6所示:
四. 结果解释
从假设点落在置信区间外面,及P-Value=0.04,小于0.05中的任何一项都可以证明不能接受假设,即产品的性能与原指针有显著的差异.
Test of mu = 20 vs mu not = 20
Variable N Mean StDev SE Mean
C1 5 19.000 0.791 0.354
Variable 95.0% CI T P
C1 (18.018, 19.982) -2.83 0.047
t Boxplot of C1
图1-6
第5节. 两个小样本的统计检验
一. 概述
在生产实践中,经常采用对比试验来比较新材料与老材料,新工艺与老工艺生产的产品性能有无显著差异.比较新老试验方法的试验结果有无显著差.在对比试验时有两个总体,再由二个小样本的试验结果去判断二个总体有无显著差异.
二个小样本的统计检验彩的也是t检验复杂的统计量计算由程序直接完成.
例:某打饼机在损坏前对产品的回波损耗RL造成较大的损害.检修复需要通过试验来证明.将修好的机器与原来是好的机器进行成对比较.用同样的线分别用2台打饼机生产出一些产品,各抽10个试样进行试验.试验结果如表1-3所示:
表1-3
二. 数据
二个小样本的数据有两种输入方式:
1. 将所有数据输入一列中,再在别一列中输入下标值来区分两个样本.
2. 将两个小样本分别输入两列中,(如表1-3数据).
三. 程序操作
1. 调出数据MTBLS5
2. Stat>Basic Statistics>2-Samples t出现一个对话框如图1-7所示:
图1-7
3. 在Samples in different column前的圆圈内点击一下,并在First中输入C1,在Second中输入C2.
4.如果需要,可选择下面列出的各项选择,然后点击OK.
选择:
①点击Graphs可选择输出数据的点图或盒图
②点击Options选择同上一程序.点击OK后程序开始运行,并输出运行结果,如图1-8所示:
Two-Sample T for C1 vs C2
N Mean StDev SE Mean
C1 10 2.20 1.30 0.41
C2 10 2.95 1.48 0.47
Difference = mu C1 – mu C2
Estimate for difference: -0.750
95% CI for difference: (-2.067 , 0.567)
T-Test of difference = 0 (vs not =): T-Value = -1.20 P-Value = 0.246 DF = 17
图1-8
四. 结果解释
图1-8为检验结果.
由95%置信区间(-2.067,0.567)包含了原始假设u1-u2=0,可以接受假设,认为两台打饼机的产品性能无显著差异,即这台打饼机已经修好.从T=-1.20,P-Value=0.240>0.05也可以判断接受假设.
第6节. 成对数据的t检验
一. 概述
在有些情况下会出现成对数据的情况,例如用同一个试样采用不同试验方法得到的二个数据.同一个试样在处理前与处理后得到的两个数据,等等都可以看成是成对数据,由于试验是在同一个试样上进行的,它可以避免一些偶然性误差.由成对数据得到的检验结果的可靠性也要相对的高一些.
例题:有10个个试样,用高压法与低压法测量试样的缺陷数得到表1-4数据.问两种试验方法得到的结果有无显著差异?(数据如表1-4所示)
表1-4
二. 数据
要求数据分别输入两列中,同一排的二个数据必须是成对的.
三. 程序操作
1.调出MTBLS6
2.Stat>Basic Statistics>Paired t出现一个对话框如图1-9所示:
图1-9
3.在First Sample中输入C1,在Second Sample中输入C2.
4.如果需要,可以作下面列出的选择,然后点击OK.
选择:
①选择输出差的直方图,差的点图和/或差的盒图
②选择置水平,检验的平均值或单双边检验.
点击OK后,程序运行输出如图1-10结果.
Paried T-Test and C1:C1,C2
Paired T for C1-C2
N Mean StDey SE Mean
C1 10 7.40 8.14 2.57
C2 10 12.50 10.41 3.29
Difference 10 -5.10 5.09 1.61
95% CI for mean difference:(-8.74,-1.46)
T-Test of mean difference = 0 (vs not = 0):T-Value = -3.17 P-Value = 0.011
t Boxplot of Differences
图1-10
四. 结果解释
从95%置信区间(-8.74,-1.46)不包含原假设H0=0,及P-Value=0.011<0.05判断不能接受假设.即两种试验方法得到的试验结果有显著的差异.
第7节. 单一成品率的统计检验
一. 概述
前面四节中讲的都是连续数据的统计检验,这些数据在大多数情况下都服从正态分布. 在生产中也经常会遇到可数数据,例如正品数(废品数),它们只可能是整数数值,这样的数据往往服从二项分布.
由于检验所采用的统计量与95%置信区间的计算公式都由统计专家按排列程序中了.对地我们只需要了解以下几个方面内容:
1.该程序解决的是什么问题
2.该程序的数据是怎样输入的
3.该程序应怎样操作
4.该程序输出的结果应怎样解释
这四个方面也就是我们在编写本讲义时每一节中的四部分内容.
单一成品率的检验是将一个生产过程生产的关于合格品的数据输入到程序中,由程序给出95%置信区间并检验是否与某规定指标有显著差异.
例题:某生产线连续生产30个产品,经检验只有21个合格,而原订的合格率指标是80%,问该生产线的合格率与指标有无显著差异?
二. 数据
数据据有两种输入方式输入:
1. 在工作单的一列中以数字或文体形式把每次检验结果一排一排的输入.在一列中要么都用数字输入,要么都用文本输入.在采用数字输入时,例如我们用”20”与”40”输入,那么20就代表废品(或失败),40则代表正品(或成功).如果我们用”a”与”b”输入,那么按字母次排列在前的a代表废品(或失败),排列次序在后的b就代表成品(或成功).数据如表1-5所示:
DATA of 1P
表1-5
2. 总结性数据:在Number of trials中输入30,在Number of Successes中输入21.
三. 程序操作
1.调出数据MTB1P
2.Stat>Basic Statistics>1 Proportion出现一个对话框如图1-11所示:
图1-11
3.进行下列操作之一:
①如果数据是排数据,在Samples in Columns中输入C1.
②如果数据是总结性数据:ⓐ在Summarized Data前点击一下 ⓑ在Number of Trials中输入30(总的试验数) ⓒ在Number of Successes中输入21(合格数,必要时可以输入几个数目).
4. 如果需要,可以作下面列出的选择,然后点击OK.
选择:
①置信水平:计算器默认值为95%,如有需要你可以将它改成90%或99%.
②检验百分数:计算器默认值为0.5,本题的指标值是80%,所以应把它改成0.8.
③单边与双边检验的选择,计算器默认为双边检验.
④选择精确计算还是近似的正态计算.默认为精确计算.
四. 结果的解释
计算器输出结果如图1-12所示:
Test and CI for One Proportion:C1
Test of p = 0.8 vs p not = 0.8
Success = 40
Exact
Variable X N Sample p 95.0% CI P-Value
C1 21 30 0.700000 (0.506041, 0.852655) 0.251
图1-12
可以看出95%置信区间(0.506041,0.852655)包含了H0=0.8,P-Value 0.251>0.05都可以判断该生产线的合格率与指标无显著差异.
第8节. 二个百分率的统计检验
一. 概述
除了上述的一个总体的检验外,有时也需要进行二个总体有关合格率的检验.
例题:有二条生产线生产同样的产品,各生产了20个产品,生产线1有4个合格品,生产线2有2个合格品,问两条生产线的合格率有无显著的差异?
这就是二个百分率检验和置信区间的典型例题.
二. 数据
有三种数据输入的方式:
1. 把所有数据输入一列中,而在另一列中输入,分组的下标值.数据区分成功与失败的规则同前一节.
2. 把两组数据分别输入两列中.
3. 总结性数据.
前二种数据如表1-6所示:
表1-6
三. 程序操作
1. 调出数据MTB 2P
2. Stat>Basic Statistics>2 Proportions出现一个对话框,如图1-13所示:
图1-13
3. 进行下列操作之一:
①如果所有的数据是输入一列中:
ⓐ选择Samples in One Column .
ⓑ在Samples,输入存有排数据的列,C1.
ⓒ在Subscripts中输入有下标的列号,C2.
②数据存在不同的列中:
ⓐ选择Samples in different columns .
ⓑIn first中输入第一组数据所在列,C3.
ⓒIn second中输入第二组数据在列,C4.
③总结性数据:
ⓐ选择Summarized data.
ⓑ在First sample中输入试样数20和14个合格品.
ⓒ在Second Sample中输入试样数20和12个合格品.
4. 如果需要,可以作以下列出的选择,然后点击OK.选择:
①选择置信水平,计算器默认值是95%.
②选择检验的原始假设.默认值是0.
③选择单边检验还是双边检验.默认双边检验.
④选择是否使用P的联合估计进行检验.
点击OK后,程序运行输出计算结果如图1-14所示:
四. 结果解释
由于95%置信区间为数(-0.193995,0.393995)包含了原始假设H0=0,且P-Value=0.505>0.05都可以判断两条生产线的合格率无显著差异.
Test and CI for Two Proportion: C1, C2
Success = 40
C2 X N Sample p
1 14 20 0.700000
2 12 20 0.600000
Estimate for p(1) – p(2): 0.1
95% CI for p(1) – p(2): (-0.193995,0.393995)
Test for p(1) – p(2) = 0 (vs not = 0: Z = 0.67 P-Value = 0.505)
图1-14
第9节. 方差相等性检验
一. 概述
对于某些检验,例如二个小样本的t检验,进行检验之前需证明前提条件是否满足,只有在前提条件满足时,其检验的结果才是有意义的.
二个小样t检验的前提条件是:
1. 二个总体都要服从正态分布,这可以用正态检验来加以证明.
2. 二个样本的方差要相等,这就需要用方差相等性检验来加以证明.
二. 数据
数据输入有两种方式,同第5.我们也是用MTBLS5数据来进行检验.
三. 程序操作
1. 调MTBLS5数据
2. Stat>Basic Statistics>2 Variances出现一个对话框如图1-15所示:
图1-15
3. 进行下列操作之一:
①如果数据输入一列中
ⓐ选择Samples in one columns
ⓑ在Samples中输入存有数据的列号
ⓒ在Subscripts中输入存有下标的列号
②如果数据输入不同列中,MTBLS5就是这种输入方法
ⓐ选择Samples in different columns
ⓑ在First中输入第1组数据的列号C1
ⓒ在Second中输入第2组数据的列号C2
点击OK后程序运行,输出结果如图1-16所示:
四. 结果解释
MINTAB同时进行了F检验和Levene’s检验,其中F检验适合于正态分布的数据,而后者则适合于任何连续分布的数据.
Level1 C1
Level2 C2
ConfLvl 95.0000
Bonferroni confidence intervals for standard deviations
Lower Sigma Upper N Factor Levels
0.851198 1.30128 2.62033 10 C1
0.970834 1.48418 2.98862 10 C2
F-Test (normal distribution)
Test Statistic: 0.769
P-Value :0.702
Levene’s Test (any continuous distribution)
Test Statistic: 0.018
P-Value : 0.894
Test for Equal Variances: C1 vs C2
Test for Equal Variances
95% Confidence Intervals for Sigmas Factor Levels
1 2 3
F-Test Levene’s Test
Test Statistic:0.769 Test Statistic:0.018
Boxplots of Raw Data
C1
0 1 2 3 4 5
图1-16
从两种检验的P-Value 0.702与0.894都远远的大于0.05,所以可以断定两个方差无显著差异,即可以认为两个样本的方差是相等的.
第10节. 相关性检验
一. 概述
对于两个变量之间很可能存在线性相关关系,可以利用计算Pearson相关系数来判断两个变量有线性相关关系的程度.Pearson相关系数的数值在-1至+1之间.如果相关系数α为正值,则说明两变量之间是正相关,即当x增大时,y也增大.反之, α为负值,则两变量是负相关,即x增大时,y减小.而相关检验的原始假设H0是α=0,即x与y之间不存在线性相关关系.
二. 数据
数据必须是相等长度的数字列.
表1-7数据为芯线水中电容与绝缘外径之间关系的原始数据.要证明一下,C与D之间有无线性相关关系.
表1-7
三. 程序操作
1. 调出数据MTB CORR
2. Stat>Basic Statistics>Correlation出现一个对话框,如图1-17所示:
图1-17
3. 在Variables,输入含有测量数据的列的列号(图1-17),本例中,C1与C2输入
4. 点击OK
四. 结果解释
Correlations:C1 ,C2
Pearson correlation of C1 and C2 = -0.930
P-Value = 0.000
图1-18
图1-18为相关检验的输出,可以看出α=-0.930,即D与C之间有负相关性,P-Value=0.000,小于0.05,不能接受两变量之间,没有线性相关关系的假设,也即证明两变量之间有线性相关关系.
第11节. 正态检验
一. 概述
很多统计都是在数据服从正态分布的前提下进行的.对于生产过程,产品性能服从正态分布是生产过程正常的重要证据.所以对于生产过程检验产品性能是否服从正态分布是应该经常进行的.
正态检验作出一个正态概率图,并进行正态检验.程序中可以选择三种检验方法:
①Anderson-Darling方法
②Ryan-Joiner方法
③Kolmogorov-Smirnov方法
①,②两种方法检验非正态性的能力相接近,而③的能力较低.计算器机默认的是第①种方法.
二. 数据
为了节约篇幅,本例采用MTB3数据.并在C3中输入参考概率0.1,0.3,0.5,0.7,0.9的数值.
三. 程序操作
1. 调出数据MTB3
2. Stat>Basic Statistics>Normality Test出现一个对话框,如图1-19所示:
图1-19
3. 在Variable中输入C1,在Reference probabilities中输入C3.在Title中输入Normality Test of R
4. 点击OK
四.结果解释
图1-20为输出的结果
数据按一定的规则在正态概率坐标纸上打点,如果数据的点刚好落在一条直线上,就说明数据服从正态分布.图中还根据参考概率值得到当概率为0.1时电阻率为1676.04;概率为0.3,电阻率1685.99;概率0.5时,电阻率1692.87;概率为0.7时,电阻率1699.76;概率为0.9时,电阻率率1709.70.
数据表中列出采用的是Anderson-Darling正态检验.统计量A-Squared=0.720 P-Value=0.054 ,P-Value>0.05,可以接受数据服从正态分布.
图1-20