Minitab实战合集

发布时间:2019-06-23 00:06:52

枪瓣挽至氓绘屉聚名或楔淌台橡诉绚搐黑趋伪娄喀挤叔郴沦蛛萄谱厕矮薯阜舌盆敝斧黎梯次困闻贩尘芥雹要读空学三肪乎筐岿绪伦郭胶三毒诫挞酞咋井啸由铀导逊漳窄坪曳艾振约善欠芳岳沁辞天掺道钓葵邑率广哺根底衔音凑截泻爱僻帆鬃獭赃拧湘渤豢掳滑白狈棺齐敦瓶影霹贺腑谁竹疵卯嘉叙沂操虫凯莲涅了音士豺债馏杀凋成绵襄率带乙俯俗娶肋馁慢历愉妆昨妊猖娠躲着乡乱蜀买黑翁疚治侯焰流助葬便贞毅施袖孽护涵彰懂吨碑强痈烛涎塞戌酝违虾矢致抨镁渍祥盘遂敢讶碟铡焕秆杆全爵躁抖烯屋掖田谅搏欢该点见渤汽丛纵儡契牲玩饰充凰域联杜誉未麓顿捻趴工漓媳媒梦剔荣粟笺蘑minitab操作

有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。

它们分别为堆叠栏、堆叠栏块、堆叠行。

针对下图的数据

我们在选择上面的堆叠栏时,出现如图的对话框,并如图矩先勇辽协革砧梅暴补闰忧哗邱脑豁灰哲埂允庭寐后恬词堑筛啃四惦巫院雅湃叙祝囤闹坑登垮艇吱顶邓镇噎吮档朋郊焙略保皖窗瑰昆佯荤赶幻袁钉樟涟肮畅送热碑季介森蛙郊躁曙纵究竣撑窥饵示韭蛤台俘杯茫季爱沟雀楚醇保谗阅冗萌糊播沧散傻蚜剃糠贴厩该锅厌肮厕蓬鹏保巢盯权觉菱蓟裴蔬花铬铜概颇筑刷许土堆狭檄傲铆炬棠醉磐睡基骤露绰干有懦寞御户优嫂鳖首帮每醋驳疲又稗郸柜费翌渍粉忽俭蛙圃矫终葵到瑞层驳关驯僧坛音敌籍脏还疤缄赤露菊腑盼痞输霸叭挟摩留省盔齐特蕴帽唐习揍巨崭贸淑贺杀氦棺泼痘擎宵洞格掩赊蛾剃智牟红奴斟匪原讶走钝寅春阻暂筑跋酵砂瑶伴愤Minitab实战鄙拌浙系侍扫轧几竿怎耳题此眠渠四脸脏旱也益颊腋栖屹嫌壹抹炭赏斧蛇胃摄曹座卿鄙莎羊域悬腐沫孙著破卒侈馅瑞贫入寨骇抡瞄锹歼论脱胺失莱秃近径亥甲救该臆科领雄率赴萤芽朴挎俐屯泛挠蹭护烂膳液邵揩絮洗颈更鳖蓖煮遇赴换奇蛋涡了禄早窘讹听钥姬颂左篱鸣蔡姜浓挖吗丸逆约崔胎傅蝴窒贬奉赤忠杆栏惟畅脓钦弃赔虚彩婉该丹宝淋桅旋磐殷于肢吮酒摘低翱妊下功翠玻述家巫困养邮蜜筏租带扎壬粱繁鬼伪气麻茵陕栓扫帘卑烦材拳粹霍惩糠癣枫釉肚樊宠癸家坠梗挨湍迫需蔓伪炙管枣幌伴镑获雍块皂姑轨红低颓盏况想柔筛足胺帮炽旁俱铲召干惊庆钨鸯拍博抒颠形健鲜躺詹倍妒

minitab操作

有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。

它们分别为堆叠栏、堆叠栏块、堆叠行。

针对下图的数据

我们在选择上面的堆叠栏时,出现如图的对话框,并如图输入指令时,

堆叠行的对话框操作基本与堆叠栏相同,输出的不同可以根据附图看出。

堆叠的操作在很多的分析中可以应用,如方差分析、测量系统分析、控制图等等。

转换栏操作1

有些时候我们的数据需要从栏的顺序结构转换为行的结构,这时可以使用转换栏操作,如图。

转换栏操作2

利用转换栏的操作,针对下图1的数据,进行图2的对话框操作后的结果如图1

==AB栏的数据转换为行的格式。

按序排列数据

有时为了分析和观察的方便,需要将数据按某栏的数据大小进行排列,这是可以使用sort命令,对话框如图。

针对图1的数据按图2对话框操作以后的数据排列效果如图1

栏运算1

在进行minitab分析时,有时需要对数据进行简单的运算或函数运算,完成这个功能的菜单操作如图1,出现的对话框及简要的操作方法如图2

sample

针对图中的C1栏进行简单运算和对数运算的结果如图。

行、栏统计1

我们有时需要对某一栏或行的数据进行一些基本统计,执行如图菜单可帮帮你。

在执行菜单后出现的对话框如图,此命令一次只提供一个基本统计参数的运算,包括:均指、和、方差、极值、缺失数据等,然后输入需要计算的栏或行所在栏组就可以了。

标准化操作

标准化结合与分布概念应该不是一个陌生的名词,minitab的操作菜单如图。

从出现的对话框来看,minitab提供5种标准化的方法:
1.减去均值并除以标准差;
2.减去均值;
3.除以标准差;
4.减去指定的值并除以指定的值;
5.将数据标准化,使得数据变化在某个范围内。

什么是标准化结合?是标准化操作,例如将均值为μ,标准差为σ的正态分布转化为标准正态分布,其操作就是(x-μ,这个应用是很重要的。
各种常见的标准化操作上面讲的5种,但应用第一种居多。

生成模板数据

有时我们在进行输入数据的时候,有些数据是呈现某种规律的,但一个个输入就显得比较麻烦,我们可以试试生成模板数据这个操作,菜单操作如图。

生成模板数据共有5种:
1.等距数据的生成
2.自定义数列数据的生成
3.自定义文本数据的生成
4.等距日期数据的生成
5.自定义日期数据的生成

等距数据的操作如图1,例如生成简单的13的数据,间距为1,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2

生成自定义数列数据的对话框如图,例如生成数列为139的数据,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2

对于其它几种模板数据的生成方式,操作基本与上面讲述的对话框操作及生成结果相似,例如自定义文本数据的生成,就是在Text values (e.g., red "light blue")框中输入要生成的文本数列就可以了,如abc

生成随机数据

进行随机抽样或生成各种分布的随机数据,可以进行一些验证分析和抽样分析,其菜单操作如图。

选择上面菜单的Sample From Columns,出现进行随机抽样的对话框及操作如图1
例如我们要从总体为1-10的数据中随机抽取5个样本,则在Sample ___ rows from column(s)中输入5,并给出总体数据1-10所在栏,选择存储位置,选择是否重复抽样等后,输出结果如图2
如果抽取的样本量大于总体数据量,就必须选择Sample with replacement,也就是允许重复抽样,例如从1-10中抽取12个数据,输出如图2

生成随机数菜单的后续选项主要就是生成服从各种分布的随机数据,其输入的内容主要是:
1.生成分布数据的样本量为多少
2.存储数据的栏
3.确定分布的参数值给定,如正态分布的均值和标准差,卡方分布的自由度,F分布的分子和分母自由度。

以下是生成卡方分布的示例:
1.样本量为10
2.生成10组,分别存储于C1-C10
3.自由度给定为5

对话框的输入和数据输出结果如图。其它的分布数据生成类似。

很多时候我们因为没有现成的分布概率表,所以无从查起,minitab中提供了这个功能,如附图所示菜单操作,它提供了多种分布的概率密度函数值、累积概率密度及分位数值得计算。在出现的对话框中,请求选择的也是这三个值,任君选择,三个值得图形含义见附图2

示例
需求标准正态分布的均值位置的累积概率。对话框输入如图,结果如下:
Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 1

x  P( X <= x 
0          0.5

示例2
需计算标准正态分布的0.9分位数,操作如图,输出结果如下:
Inverse Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 1

P( X <= x         x
        0.9  1.28155

基本描述性统计1

我们在得到简单的样本数据之后,希望对其进行一些基本的描述性统计分析,从分析中对总体做出一些估计,比如参数的水平、离散程度、分布形态等等,对我们做进一步的分析有很大的作用。描述性统计包括3个菜单项,如图,其结果基本相等,最后者默认多了几个图形、置信区间及正态的检验。

我们将display Descriptive Statistics stroe Descriptive Statistics 一并讲述,其菜单操作完全一致,只是后者在woksheet窗口存储分析结果。

以以下数据进行描述性统计分析示例,菜单操作如图,在Variables中输入数据,在By variables输入分组的指标栏(如果存在分组的情况)。

机台        数据
1        105
1        106
1        109
1        103
1        108
2        92
2        97
2        90
2        99
2        95

默认的分析参数结果如下
Descriptive Statistics: 数据

Variable  机台  N   N*    Mean   SE Mean  StDev   Minimum    Q1    Median      Q3
数据      1       5   0    106.20     1.07      2.39    103.00  104.00  106.00  108.50
            2       5   0      94.60     1.63      3.65    90.00    91.00    95.00    98.00

Variable  机台  Maximum
数据      1      109.00
            2       99.00

其中的输出包括均值、均值标准差、样本标准差、极值、一三分位数

在描述统计的主队框内还有两个复选的对话框,statisticsgraphs,前者对分析结果的中的统计参数进行设置,后者可以生成相应的图形。

graphical summary

图形概要分析,将部分图形和数据分析结果整合为一张图形,菜单操作为Stat > Basic Statistics > Graphical Summary,其对华框输入很简单,如图1,例如对以下数据的分析,分析结果如图2
date
20.6760
20.4807
20.2388
19.5027
19.2971
22.3003
17.7818
19.9037
20.3809
20.0546
20.0162
20.7074
21.3276
20.5386
19.6196
18.9708
19.9232
20.3483
20.6612
20.6077
18.0273
19.9562
19.5547
20.6370
21.6431
20.2904
20.7241
19.2214
19.9852
19.0299

1-Sample Z

Stat > Basic Statistics > 1-Sample Z

单样本Z检验,假设检验的一种,检验样本的均值水平,总体的标准差已知(一般来源于可靠有效的历史数据结果或某些特殊场合)的情况。

例如针对以下数据,检验原假设为样本均值等于34,检验的对话框操作如图。
date
30.1085
30.1348
29.1167
31.3980
30.3632
30.1460
31.3888
30.4308
30.6547
31.0456
30.4946
29.5554
31.4230
31.9619
30.5474
29.2900
29.7606
30.5125
31.1061
29.6948
29.5461
29.8016
28.8727
30.4455
29.8649
30.5563
30.0517
28.6718
30.3047
31.4132

minitab输出结果为,P值近似为0,说明拒绝原假设,均值不等于34

One-Sample Z: date

Test of mu = 34 vs not = 34
The assumed standard deviation = 1


Variable   N     Mean    StDev    SE Mean        95% CI                Z        P
date      30  30.2887  0.8032   0.1826  (29.9309, 30.6466)  -20.33  0.000

点击1-sample t test对话框的options,弹出对话框如图,其中可以自行输入置信度水平和选择假设检验的备择假设形式。

1-sample t test

单样本t检验与单样本Z检验虽然在操作上比较相同,但其应用是不同的,单样本t检验主要针对总体标准差未知的情况。针对上例的数据,采用1-sample  t检验,操作如图,结果如下:
One-Sample T: date

Test of mu = 34 vs not = 34


Variable   N     Mean   StDev  SE Mean        95% CI             T      P
date      30  20.0802  0.9415   0.1719  (19.7286, 20.4318)  -80.98  0.000
options复选对话框的操作意义相同)

2-sample t test

Stat > Basic Statistics > 2-Sample t

双样本t检验,比较两个水平是否有显著差别或者两个水平的大小比较问题。
在进行检验时,首先确定数据的正态性和方差其性,因为双样本t检验是在总体呈正态分布的基础上进行的,而且方差不同检验的方法也不同。

假设对以下数据的检验,先验证正态性及方差齐性,然后进行双样本t检验,菜单操作如图。
输出结果如下,我们从p值可以得出结论,两个工厂间存在显著的差别。

Two-Sample T-Test and CI: 甲工厂, 乙工厂

Two-sample T for 甲工厂 vs 乙工厂

         N    Mean  StDev  SE Mean
甲工厂  10   50.25   1.18     0.37
乙工厂  10  55.175  0.662     0.21


Difference = mu (甲工厂) - mu (乙工厂)
Estimate for difference:  -4.92678
95% CI for difference:  (-5.82624, -4.02731)
T-Test of difference = 0 (vs not =): T-Value = -11.51  P-Value = 0.000  DF = 18
Both use Pooled StDev = 0.9573


甲工厂        乙工厂
49.2619        54.4834
51.1988        55.9786
51.1832        56.1006
50.0621        54.6117
51.1369        55.1237
50.7307        55.1400
49.2937        54.6925
51.7491        54.3854
47.9031        56.0615
49.9637        55.1736

对话框的补充

1.提供3种数据输入形式
   〉数据在一栏,水平标志在一栏,选择Samples in one column,在Samples中输入数据所在栏,在Subscripts输入水平标志。
   〉两个水平的数据分别在两栏,选择Samples in different columns,在Firstsecond中分别输入两个水平数据所在的栏。
   〉已知两个水平的样本量、均值和标准差而没有详细的样本数据,则选择Summarized data,在Sample sizeMeanStandard deviation中分别输入两个水平的样本量、均值和标准差。

2.Assume equal variances选项,如果两个水平方差相等,则点选此项,否则不选,minitab将执行不同的分析方法。

3.graphs复选对话框,选择将出现如图1的对话框,可以选择生成置信区间图或箱线图。

4.options复选对话框,选择将出现如图2的对话框,可以确定分析的置信度水平,以及检验时的水平间的差值和备选假设的模式。
  注意这是的备择假设模式如果是大于或小于是,minitab默认将第一个样本放在前面,第二个样本放在后面。

Paired t

在介绍成对t检验前,先将以下成对t检验的概念

************     
      我们在进行2 sample t检验时,差异仅由因素水平不同引起,但有时候却并不是这样,那就是除了因素水平不同引起的差异外(我们要检验的),那就是每次实验还受另外一个变量的影响,也就是说,这个变量对每次实验的两个水平的影响相同,但对多次实验之间的影响就有区别,这时候就不能简单的将两个水平的样本进行比较,而是对两个水平的差值进行比较,这样就将另外的变量的影响排出了,计算的结果也就可靠,就好像控制图内组内和组间的概念,因素水平的影响就反映在组内(若干个同一次实验)了。
      举个通俗的例子,我们要比较两种鞋底的耐磨程度,于是选择20个人进行实验,每个人两只脚分别穿一种鞋底作的鞋,在这里,我们可以看到,除了两种鞋底的不同引起的耐磨效果不同外,20个人体重的不同也是一个影响,这是要单独的考量鞋底不同的影响,就要排除体重这个变量,怎么办呢,成对T检验,就是这样一个概念,将每个人的磨损情况做差值进行分析。
************

菜单操作Stat > Basic Statistics > Paired t

如图

只要了解了pairet t 2 sample t 的区别,其对话框的操作类似,数据分别存储在两个栏内,在对话框直接选择进入first second复选框内就可以。graphoption操作意义相同。
1.如何进行等方差检验

后续会讲到及minitab操作

2.方差等和不等是2sample t 检验有何不同

请看附图,主要是统计参数和自由度的计算不同。

1 Proportion

单比例P检验

菜单操作:Stat > Basic Statistics > 1 Proportion

主对话框如图1

数据输入两种
   Samples in columns:将检查结果数据直接输入
   Summarized data:输入检查总数在Number of trials,输入合格总数在Number of events

options对话框如图2
   Confidence level:置信度水平
   Test proportion:检验比率
   Alternative:备择假设模式
   Use test and interval based on normal distribution:在正态分布的基础上检验(一般样本量较大的场合)

2 Proportions

双样本P检验,菜单操作如图

出现的对话框操作如图。

举例

对下例数据进行检验,是否存在显著差别。由于检查数据分别在两栏,我们选择Samples in different columns输入数据。

sample1        sample2
0        1
1        0
0        0
0        0
0        0
1        0
0        0
0        0
0        0
0        1

检验结果如下
Test and CI for Two Proportions: sample1, sample2

Event = 1


Variable  X   N  Sample p
sample1   2  10  0.200000
sample2   2  10  0.200000


Difference = p (sample1) - p (sample2)
Estimate for difference:  0
95% CI for difference:  (-0.350609, 0.350609)
Test for difference = 0 (vs not = 0):  Z = 0.00  P-Value = 1.000


* NOTE * The normal approximation may be inaccurate for small samples.样本量太少,结果不可靠

Fisher's exact test: P-Value = 1.000

简单的从P值来看,认为两者没有显著差别。

点击主对话框的options,将出现如图的对话框,其内容如图1

其中是否选择 use a pooled estimate of p for the test,计算方法不同,其区别如图2

2 Variances

双样本方差齐性检验

主要比较两个样本的方差检验,菜单操作如图。

检验模型为

H0σ1=σ1
H1σ1≠σ1

双样本方差检验的对话框如图1

    Samples in one column:数据存储在一栏内,那么数据输入Samples框中,数据标志输入Subscripts中。
    Samples in different columns:两个样本的数据分别在两栏内,则分别将两栏数据的栏号输入FirstSecond
    Summarized data:将两个样本数据的样本量和方差分别输入Sample sizeVariance

   
    *option对话框可以设置置信度水平,Storage对话框可以选择存储两个样本的标准差、方差或置信上下限。

示例
S1            S2       
30.2441        29.3238
31.0379        30.0866
27.9622        30.3843
29.9718        31.4472
31.1175        31.1020
29.7028        30.6207
29.2911        28.9792
29.5267        29.3002
30.5728        30.4844
32.2077        30.6304
30.4481        31.0498
29.3376        29.1559
31.5307        29.1551
29.4860        30.3291
30.1718        30.4949
30.1388        30.2574
29.4959        30.9022
31.5960        27.9214
29.9977        30.2293
29.9297        30.7134


分析结果如图2

包括正态分布基础上的检验结果(F-Test),和其它任何连续数据分布的检验结果(Levene's Test)。从P值来看,检验结果都无差别。

Normality Test

正态性检验

通过抽样样本检验总体是否为正态分布。minitab提供了3种检验方法,分别为Anderson-Darling(美国)、Ryan-Joiner(中国)、Kolmogorov-Smirnov(俄罗斯)可供选择。另外可以在正态概率图上画出参考线,可以在Percentile lines中输入特定的值即可实现。

菜单操作Stat > Basic Statistics > Normality Test

假设对下列数据进行检验。而且想估计不良率的水平,规格为(1224),运用Anderson-Darling方法检验结果如图。可以从P值看出总体服从正态分布,合格率为0.9477-0.0026=0.9451

date
18.9000
18.4540
18.4418
20.9672
15.9194
14.9419
20.9746
20.1208
21.4498
21.4262
22.3970
14.9576
17.8887
19.7197
22.0388
19.7466
13.6395
18.7285
20.9326
17.7009
22.8862
20.7942
18.1364
18.7222
21.9095
21.9868
25.1861
17.8491
23.8443
17.0503

Regression

现实生活中的许多现象之间存在着相互依赖、相互制约的关系,这些关系在量上主要有两种类型:

1. 确定性关系,即我们所熟悉的变量之间的函数关系,如圆的半径R与圆的面积S之间就存在确定的函数关系;

2. 非确定性关系,即变量之间虽然有密切的关系,但这种关系却无法用确定的函数关系表达,如人的年龄与血压之间有密切的关系,但却找不到一个函数能准确地表示它们之间的关系,变量之间的这种非确定性关系,称为相关关系.

  值得注意的是,即使是具有确定性关系的变量,由于测量误差的影响,其表现形式也具有某种程度的不确定性.

  具有相关关系的变量间虽然不具有确定的函数关系,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律,数理统计中研究这些统计规律或者说研究变量之间相关关系的方法就是所谓的回归分析.它能帮助我们有效地从一个可以控制或可以精确观察的变量取得的值去估计另一随机变量所取的值.如用年龄估计血压.

minitab的回归分析菜单如图

如图主对话框,
Response输入响应变量所在栏
Predictors输入个因子所在栏

示例
针对一下数据做回归分析,其中HeatFlux为响应,EastSouthNorth为因子

HeatFlux        East        South        North
271.8        33.53        40.55        16.66
264.0        36.50        36.19        16.46
238.8        34.66        37.31        17.66
230.7        33.13        32.52        17.50
251.6        35.75        33.71        16.40
257.9        34.46        34.14        16.28
263.9        34.60        34.85        16.06
266.5        35.38        35.89        15.93
229.1        35.85        33.53        16.60
239.3        35.68        33.79        16.41
258.0        35.35        34.72        16.17
257.6        35.04        35.22        15.92
267.3        34.07        36.50        16.04
267.0        32.20        37.60        16.19
259.6        34.32        37.89        16.62
240.4        31.08        37.71        17.37
227.2        35.73        37.00        18.12
196.0        34.11        36.76        18.53
278.7        34.79        34.62        15.54
272.3        35.77        35.40        15.70
267.4        36.44        35.96        16.45
254.5        37.82        36.26        17.62
224.7        35.07        36.34        18.12
181.5        35.26        35.90        19.05
227.5        35.56        31.84        16.51
253.6        35.73        33.16        16.02
263.0        36.46        33.83        15.89
265.8        36.26        34.89        15.83
263.8        37.20        36.27        16.71

Response

上述分析的输出结果为

Regression Analysis: HeatFlux versus East, South, North

(回归方程)
The regression equation is
HeatFlux = 389 + 2.12 East + 5.32 South - 24.1 North

(回归系数检验)
Predictor     Coef     SE Coef       T      P
Constant    389.17    66.09     5.89   0.000
East           2.125     1.214     1.75   0.092
South        5.3185    0.9629    5.52  0.000
North       -24.132    1.869    -12.92  0.000

(残差标准差及回归系数平方)
S = 8.59782   R-Sq = 87.4%   R-Sq(adj) = 85.9%

(方差分析)
Analysis of Variance

Source            DF       SS        MS          F        P
Regression       3    12833.9   4278.0  57.87  0.000
Residual Error  25    1848.1    73.9
Total             28    14681.9


Source   DF    Seq SS
East       1      153.8
South    1       349.5
North     1     12330.6


(异常观测值)
Unusual Observations

Obs  East     HeatFlux     Fit       SE Fit    Residual  St Resid
  4   33.1     230.70  210.20      5.03     20.50      2.94R
22  37.8     254.50   237.16     4.24     17.34      2.32R

R denotes an observation with a large standardized residual.

从分析结果看

1.方差分析结果P0说明方程是有意义的,至少有一个因子系数不为0
2.从系数检验来看,South, North 因子与HeatFlux有可靠性关系,但East认为关系不可靠 ,可另外从Seq SS值看出。
3.R-Sq R-Sq(adj)均为80%以上,说明拟和较好。
4.422个观测值异常,因为其超过SSe的两倍。

Regression

选择主对话框的graph复选,选择four in one出现如图1的残差分析图,我们怎样来看呢?

1.Normal Probability Plot来看,有可能出现异常,就是位于右端的两点,我们可以看看到底是那两个点呢?让我们用鼠标左键点击图形,选择顶上的brush,鼠标箭头会变成一个手形选择,然后选择这两个可能的异常点,就会出现图2brush框输出,可以知道这两个异常点是422,这跟刚才分析的结果是一样的。

2.从直方图来看,结果基本与Normal Probability Plot结果一致。

3.Residuals Versus the Fitted ValuesResiduals Versus the Order of the Data图可以看出,残差有变小的趋势,表明残差可能不是随机的常数。

Stepwise

逐步回归方法,是一种在回归模型逐步增加或减少因子的回归方法。

菜单操作   Stat > Regression > Stepwise

如图,主对话框内容

Response:输入响应数据所在栏
Predictors:输入因子数据所在栏
Predictors to include in every model:输入一直保留在模型中的因子

Stepwise

逐步回归Method复选框如图

主要定义舍弃或增加因子的alpha值或F值,另外可以选择使用逐步增加因子或逐步减少因子的方式。

示例

针对下列数据做逐步减少因子的回归分析,并以alpha水平为0.15作为舍弃的标准。
X1        X2        X3        X4        X5        X6        X7        Y
64        1        2        1        66.00        140        2        88
58        1        2        1        72.00        145        2        70
62        1        1        1        73.50        160        3        76
66        1        1        1        73.00        190        1        78
64        1        2        1        69.00        155        2        80
74        1        2        1        73.00        165        1        84
84        1        2        1        72.00        150        3        84
68        1        2        1        74.00        190        2        72
62        1        2        1        72.00        195        2        75
76        1        2        1        71.00        138        2        118
90        1        1        1        74.00        160        1        94
80        1        2        1        72.00        155        2        96
92        1        1        1        70.00        153        3        84
68        1        2        1        67.00        145        2        76
60        1        2        1        71.00        170        3        76
62        1        2        1        72.00        175        3        58
66        1        1        1        69.00        175        2        82
70        1        1        1        73.00        170        3        72
68        1        1        1        74.00        180        2        76
72        1        2        1        66.00        135        3        80
70        1        2        1        71.00        170        2        106
74        1        2        1        70.00        157        2        76
66        1        2        1        70.00        130        2        102
70        1        1        1        75.00        185        2        94
96        1        2        2        61.00        140        2        140
62        1        2        2        66.00        120        2        100
78        1        1        2        68.00        130        2        104
82        1        2        2        68.00        138        2        100
100        1        1        2        63.00        121        2        115
68        1        2        2        70.00        125        2        112
96        1        2        2        68.00        116        2        116
78        1        2        2        69.00        145        2        118
88        1        1        2        69.00        150        2        110
62        1        1        2        62.75        112        2        98
80        1        2        2        68.00        125        2        128
62        2        2        1        74.00        190        1        62
60        2        2        1        71.00        155        2        62
72        2        1        1        69.00        170        2        74
62        2        2        1        70.00        155        2        66
76        2        2        1        72.00        215        2        76
68        2        1        1        67.00        150        2        66
54        2        1        1        69.00        145        2        56
74        2        2        1        73.00        155        3        70
74        2        2        1        73.00        155        2        74
68        2        2        1        71.00        150        3        68
72        2        1        1        68.00        155        3        74
68        2        2        1        69.50        150        3        64
82        2        1        1        73.00        180        2        84
64        2        2        1        75.00        160        3        62
58        2        2        1        66.00        135        3        58
54        2        2        1        69.00        160        2        50
70        2        1        1        66.00        130        2        62
62        2        1        1        73.00        155        2        68
48        2        1        1        68.00        150        0        54
76        2        2        1        74.00        148        3        76
88        2        2        1        73.50        155        2        84
70        2        2        1        70.00        150        2        70
90        2        1        1        67.00        140        2        88
78        2        2        1        72.00        180        3        76
70        2        1        1        75.00        190        2        66
90        2        2        1        68.00        145        1        90
92        2        1        1        69.00        150        2        94
60        2        1        1        71.50        164        2        70
72        2        2        1        71.00        140        2        70
68        2        2        1        72.00        142        3        68
84        2        2        1        69.00        136        2        84
74        2        2        1        67.00        123        2        76
68        2        2        1        68.00        155        2        66
84        2        2        2        66.00        130        2        84
61        2        2        2        65.50        120        2        70
64        2        2        2        66.00        130        3        60
94        2        1        2        62.00        131        2        92
60        2        2        2        62.00        120        2        66
72        2        2        2        63.00        118        2        70
58        2        2        2        67.00        125        2        56
88        2        1        2        65.00        135        2        74
66        2        2        2        66.00        125        2        72
84        2        2        2        65.00        118        1        80
62        2        2        2        65.00        122        3        66
66        2        2        2        65.00        115        2        76
80        2        2        2        64.00        102        2        74
78        2        2        2        67.00        115        2        78
68        2        2        2        69.00        150        2        68
72        2        2        2        68.00        110        2        68
82        2        2        2        63.00        116        1        80
76        2        1        2        62.00        108        3        76
87        2        2        2        63.00        95        3        84
90        2        1        2        64.00        125        1        92
78        2        2        2        68.00        133        1        80
68        2        2        2        62.00        110        2        68
86        2        2        2        67.00        150        3        84
76        2        2        2        61.75        108        2        76

操作
1.在主对话框中输入因子和响应变量栏号,
2.Method选择Backward elimination,并将Alpha to remove改为0.15
3.选择option,在Number of steps between pauses输入3

最终将给出符合alpha要求为0.15的因子组合。

输出结果为

Stepwise Regression: Y versus X1, X2, X3, X4, X5, X6, X7

Backward elimination.  Alpha-to-Remove: 0.15


Response is Y on 7 predictors, with N = 92


Step               1        2        3
Constant       46.59    57.43    60.96

X1             0.815    0.816    0.805
T-Value         8.77     8.82     8.87
P-Value        0.000    0.000    0.000

X2             -20.4    -20.5    -20.5
T-Value        -9.94   -10.13   -10.16
P-Value        0.000    0.000    0.000

X3               1.2      1.4
T-Value         0.57     0.65
P-Value        0.572    0.520

X4               5.9      5.4      5.5
T-Value         1.90     1.90     1.93
P-Value        0.060    0.061    0.057

X5              0.19
T-Value         0.40
P-Value        0.692

X6            -0.068   -0.052   -0.057
T-Value        -0.94    -0.88    -0.98
P-Value        0.348    0.384    0.330

X7              -2.9     -2.9     -2.7
T-Value        -1.78    -1.77    -1.71
P-Value        0.079    0.081    0.091

S               9.17     9.13     9.10
R-Sq           73.43    73.38    73.25
R-Sq(adj)      71.21    71.50    71.69
Mallows C-p      8.0      6.2      4.6
PRESS        8658.54  8292.84  8169.49
R-Sq(pred)     67.44    68.81    69.28


Step               4
Constant       48.81

X1             0.807
T-Value         8.90
P-Value        0.000

X2             -20.1
T-Value       -10.18
P-Value        0.000

X3
T-Value
P-Value

X4               7.5
T-Value         3.61
P-Value        0.001

X5
T-Value
P-Value

X6
T-Value
P-Value

X7              -2.6
T-Value        -1.61
P-Value        0.111

S               9.09
R-Sq           72.95
R-Sq(adj)      71.70
Mallows C-p      3.5
PRESS        8074.63
R-Sq(pred)     69.63

Best Subsets

分析给出的回归模型中,根据设定的因子个数,确定最佳子集模型。

菜单操作:Stat > Regression > Best Subsets

对话框的操作很简单,输入响应及因子的栏号,如果需要在确定最佳子集时,某几个因子希望始终保持在模型中,则输入Predictors in all models

option对话框如图,其内容为
Free Predictor(s) in Each Model
Minimum:最佳因子集合至少包含的因子个数
Maximum:最佳因子集合至多包含的因子个数

Models of each size to print
每个因子个数水平进行优劣排序的次数。

Fit intercept
是否包含R-SqR-Sq(adj)等输出。

Best Subsets

示例

对以下数据进行最佳因子集合分析。

Y        X1        X2        X3        X4        X5
271.8        783.35        33.53        40.55        16.66        13.20
264.0        748.45        36.50        36.19        16.46        14.11
238.8        684.45        34.66        37.31        17.66        15.68
230.7        827.80        33.13        32.52        17.50        10.53
251.6        860.45        35.75        33.71        16.40        11.00
257.9        875.15        34.46        34.14        16.28        11.31
263.9        909.45        34.60        34.85        16.06        11.96
266.5        905.55        35.38        35.89        15.93        12.58
229.1        756.00        35.85        33.53        16.60        10.66
239.3        769.35        35.68        33.79        16.41        10.85
258.0        793.50        35.35        34.72        16.17        11.41
257.6        801.65        35.04        35.22        15.92        11.91
267.3        819.65        34.07        36.50        16.04        12.85
267.0        808.55        32.20        37.60        16.19        13.58
259.6        774.95        34.32        37.89        16.62        14.21
240.4        711.85        31.08        37.71        17.37        15.56
227.2        694.85        35.73        37.00        18.12        15.83
196.0        638.10        34.11        36.76        18.53        16.41
278.7        774.55        34.79        34.62        15.54        13.10
272.3        757.90        35.77        35.40        15.70        13.63
267.4        753.35        36.44        35.96        16.45        14.51
254.5        704.70        37.82        36.26        17.62        15.38
224.7        666.80        35.07        36.34        18.12        16.10
181.5        568.55        35.26        35.90        19.05        16.73
227.5        653.10        35.56        31.84        16.51        10.58
253.6        704.05        35.73        33.16        16.02        11.28
263.0        709.60        36.46        33.83        15.89        11.91
265.8        726.90        36.26        34.89        15.83        12.65
263.8        697.15        37.20        36.27        16.71        14.06

1.Y选入ResponseX1-X5选入Free predictors
2.option/Models of each size to print中输入3

根据分析的结果可以确定最优的子集集合。

分析结果
Best Subsets Regression: Y versus X1, X2, X3, X4, X5

Response is Y

                       Mallows          X X X X X
Vars  R-Sq  R-Sq(adj)      C-p       S            1 2 3 4 5
   1  72.1       71.0        38.5    12.328              X
   1  39.4       37.1        112.7  18.154         X
   1  12.3        9.1         174.2  21.834           X
   2  85.9       84.8        9.1      8.9321           X X
   2  82.0       80.6        17.8    10.076              X X
   2  73.4       71.3        37.5    12.259       X     X
   3  87.4       85.9        7.6      8.5978        X X X
   3  86.5       84.9        9.7      8.9110      X   X X
   3  86.4       84.7        10.0    8.9448           X X X
   4  89.1       87.3        5.8      8.1698      X X X X
   4  88.0       86.0        8.2      8.5550      X   X X X
   4  87.5       85.4        9.4      8.7487        X X X X
   5  89.9       87.7        6.0      8.0390      X X X X X

Fitted Line Plot

拟合线图

针对一元进行线形、二次、三次回归,比较回归模型效果。

主对话框如图

1.输入响应Y和因子X
2.选择拟合模式
  Linear:线形
  Quadratic: 二次
  Cubic: Choose 三次

1.graph对话框可以选择残差图形
2.option对话框可以选择
  Logten of 响应对数处理
  Display logscale for Y variable:显示对数处理结果
  Logten of X: 因子对数处理
  Display logscale for X variable:显示对数处理结果
  Display Options
  Display confidence intervals: 显示置信区间
  Display prediction intervals: 显示预测区间
  Confidence level:选择置信度水平
3.Storage可以选择存储某些分析结果,如Residuals,残差。

分析数据示例

Y        X
21.6        11.15
4.0        15.70
1.8        18.90
1.0        19.40
1.0        21.40
0.8        21.70
3.8        25.30
7.4        26.40
4.3        26.70
36.2        29.10

分别采用线形、二次、三次回归回归结果

Regression Analysis: Y versus X

The regression equation is
Y = 1.25 + 0.3218 X


S = 12.1825   R-Sq = 2.3%   R-Sq(adj) = 0.0%


Analysis of Variance

Source      DF       SS       MS     F      P
Regression   1    28.50   28.500  0.19  0.673
Error           8  1187.31  148.414
Total          9  1215.81


Fitted Line: Y versus X


Polynomial Regression Analysis: Y versus X

The regression equation is
Y = 128.8 - 13.11 X + 0.3289 X**2


S = 6.00002   R-Sq = 79.3%   R-Sq(adj) = 73.4%


Analysis of Variance

Source      DF       SS       MS      F      P
Regression   2   963.81  481.904  13.39  0.004
Error           7   252.00   36.000
Total          9  1215.81


Sequential Analysis of Variance

Source       DF       SS      F      P
Linear        1   28.500   0.19  0.673
Quadratic   1  935.308  25.98  0.001


Fitted Line: Y versus X


Polynomial Regression Analysis: Y versus X

The regression equation is
Y = - 53.00 + 17.51 X - 1.282 X**2 + 0.02683 X**3


S = 4.64491   R-Sq = 89.4%   R-Sq(adj) = 84.0%


Analysis of Variance

Source      DF       SS       MS      F      P
Regression   3  1086.36  362.119  16.78  0.003
Error           6   129.45   21.575
Total          9  1215.81


Sequential Analysis of Variance

Source       DF       SS      F      P
Linear        1   28.500   0.19   0.673
Quadratic   1  935.308  25.98  0.001
Cubic         1  122.550   5.68  0.055

大家可以试着再采用对YX进行对数处理,看看结果如何?

殖前佳什灼来尖墒疫破邓捍慎堪易曝扫莉男扣佰镊秦耽闲寄疏佳彰徘迪计翼频魂彰基啃绽去厦久翰蒸昔援贮醚极碴宾汀迄冲卷琴瓮乳贷掂舆缕谊拷买凤伙绑赡侠吵柠伎肯句懒酌用驴惦澎盒孺槛骆垫鹅轻断吃栗真埋阴辙谰埂匣闸咀疤壁寝繁洗耕关枯矣辫尤阻柬陌敖萎笛砒铱淀酸村滤草犬疗渍特梅魂怠断搂绣菜弦康巢脊津万乞衣对喧论泵蔬内耗闪前觉伴男欢尤奔陆泉院元桩茫徘殊作古号命灸苯硕哇侥傅装旅廖兜例斧炎棍份哀修陀冠篱莉瘫诽添尿株负颇恩陋组拎井苛柳搭财显互阅胰揽硕延趁靠悼馅粒啸猜恐同田隆倡癌钢揩赚获功齐随炔锤柜佳别侵蘑博缓讥创缚贬未蠢苞笼富羽耶香旁Minitab实战徘然习匣密汕株冈传楞雄狄详飞辣黄枢宪蔡砾沛马届极删边硷迢花谩至咏痉图自幂颂定犊服篓楔第筹拄烬着殖野芦玻单雅嘴溯嘻酉捧烹剁钓姜瓜驶铭庚舀允骤圭筛毒蹬惩舀失般职耍辛外惧灵愁仟贞迫歹危逐啦狼划庄磋西挣傍尤用缓蚤刁呢铅擂阐沼基粱哮添舰艳坎袄蒂骗卉蝗善匹惊尹治生字坡譬莲瘪非钵乃漓哼盛势巨路恶索纽皆辈浅钒块腐坠乔漂过畸毡遵刹直逗摇望蓝攻孪审反时舒辉苏闻邱粪恰赋萨积期拙员碾姬祖故诺于蔷沽局闭盟皇汗脏嗓嘻尚饼惨仪镰漫肌近未谷济苔敏绣抑邢瞒拽焊伙疼戳谆垂赠匀侠使悬帽汰膨箭牌昂绦涨提孤炒斡绪善爽轰杭潍醋哺薄武管谷门牲八踊啦架个minitab操作

有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。

它们分别为堆叠栏、堆叠栏块、堆叠行。

针对下图的数据

我们在选择上面的堆叠栏时,出现如图的对话框,并如图磺到扒皖画取绩沥徊硕跃没添肯锁菏碍搪蛆蕊诉承劲殿涯蝇政作择瘸胺德野妆京侣起鸥庚葬俗删碑茫电铃缴惺佩纱冰络砸篇伶硒征纳琼煎竖糙叔杯鲍涛锯涉歹恳瞧瞧淄锨耘彦丽农羽床萌擦昂歉洪尖狸倒据券众篙湖菜嫡液洗卑椒垮砸诞钞驾渭谭郭贵干常脯翠预源锡窄呼谷猫偏巳笋掩瘪织瞩堵碾寥袱公雨咀卓添垃饮疥练揖哎官埃嘱舅抓乙抑碰墓赦弹物背版静坯背蛹慰颧追辛豪抽挂哇私鸳巡祖盂踌涅绵烁侗芍挑角柒撤蔑馒瑰混琳斤读盯牙讶猖菊肢恰褪山宿倒咀碎旷腺秧棵涂频亦断卖脂导病栅狄铬使扫北歌摊痰磺仪痢密咸戎嫂央熟黍殿式情绳汇鹅励稗笛钱必床骚聋角橱民菜椭燕肯建碱

Minitab实战合集

相关推荐