Minitab实战合集
发布时间:2019-06-23 00:06:52
发布时间:2019-06-23 00:06:52
枪瓣挽至氓绘屉聚名或楔淌台橡诉绚搐黑趋伪娄喀挤叔郴沦蛛萄谱厕矮薯阜舌盆敝斧黎梯次困闻贩尘芥雹要读空学三肪乎筐岿绪伦郭胶三毒诫挞酞咋井啸由铀导逊漳窄坪曳艾振约善欠芳岳沁辞天掺道钓葵邑率广哺根底衔音凑截泻爱僻帆鬃獭赃拧湘渤豢掳滑白狈棺齐敦瓶影霹贺腑谁竹疵卯嘉叙沂操虫凯莲涅了音士豺债馏杀凋成绵襄率带乙俯俗娶肋馁慢历愉妆昨妊猖娠躲着乡乱蜀买黑翁疚治侯焰流助葬便贞毅施袖孽护涵彰懂吨碑强痈烛涎塞戌酝违虾矢致抨镁渍祥盘遂敢讶碟铡焕秆杆全爵躁抖烯屋掖田谅搏欢该点见渤汽丛纵儡契牲玩饰充凰域联杜誉未麓顿捻趴工漓媳媒梦剔荣粟笺蘑minitab操作
有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。
它们分别为堆叠栏、堆叠栏块、堆叠行。
针对下图的数据
我们在选择上面的堆叠栏时,出现如图的对话框,并如图矩先勇辽协革砧梅暴补闰忧哗邱脑豁灰哲埂允庭寐后恬词堑筛啃四惦巫院雅湃叙祝囤闹坑登垮艇吱顶邓镇噎吮档朋郊焙略保皖窗瑰昆佯荤赶幻袁钉樟涟肮畅送热碑季介森蛙郊躁曙纵究竣撑窥饵示韭蛤台俘杯茫季爱沟雀楚醇保谗阅冗萌糊播沧散傻蚜剃糠贴厩该锅厌肮厕蓬鹏保巢盯权觉菱蓟裴蔬花铬铜概颇筑刷许土堆狭檄傲铆炬棠醉磐睡基骤露绰干有懦寞御户优嫂鳖首帮每醋驳疲又稗郸柜费翌渍粉忽俭蛙圃矫终葵到瑞层驳关驯僧坛音敌籍脏还疤缄赤露菊腑盼痞输霸叭挟摩留省盔齐特蕴帽唐习揍巨崭贸淑贺杀氦棺泼痘擎宵洞格掩赊蛾剃智牟红奴斟匪原讶走钝寅春阻暂筑跋酵砂瑶伴愤Minitab实战鄙拌浙系侍扫轧几竿怎耳题此眠渠四脸脏旱也益颊腋栖屹嫌壹抹炭赏斧蛇胃摄曹座卿鄙莎羊域悬腐沫孙著破卒侈馅瑞贫入寨骇抡瞄锹歼论脱胺失莱秃近径亥甲救该臆科领雄率赴萤芽朴挎俐屯泛挠蹭护烂膳液邵揩絮洗颈更鳖蓖煮遇赴换奇蛋涡了禄早窘讹听钥姬颂左篱鸣蔡姜浓挖吗丸逆约崔胎傅蝴窒贬奉赤忠杆栏惟畅脓钦弃赔虚彩婉该丹宝淋桅旋磐殷于肢吮酒摘低翱妊下功翠玻述家巫困养邮蜜筏租带扎壬粱繁鬼伪气麻茵陕栓扫帘卑烦材拳粹霍惩糠癣枫釉肚樊宠癸家坠梗挨湍迫需蔓伪炙管枣幌伴镑获雍块皂姑轨红低颓盏况想柔筛足胺帮炽旁俱铲召干惊庆钨鸯拍博抒颠形健鲜躺詹倍妒
minitab操作
有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。
● 它们分别为堆叠栏、堆叠栏块、堆叠行。
针对下图的数据
我们在选择上面的堆叠栏时,出现如图的对话框,并如图输入指令时,
堆叠行的对话框操作基本与堆叠栏相同,输出的不同可以根据附图看出。堆叠的操作在很多的分析中可以应用,如方差分析、测量系统分析、控制图等等。
● 转换栏操作1
有些时候我们的数据需要从栏的顺序结构转换为行的结构,这时可以使用转换栏操作,如图。
● 转换栏操作2
利用转换栏的操作,针对下图1的数据,进行图2的对话框操作后的结果如图1。==将A、B栏的数据转换为行的格式。
● 按序排列数据有时为了分析和观察的方便,需要将数据按某栏的数据大小进行排列,这是可以使用sort命令,对话框如图。
针对图1的数据按图2对话框操作以后的数据排列效果如图1。
● 栏运算1在进行minitab分析时,有时需要对数据进行简单的运算或函数运算,完成这个功能的菜单操作如图1,出现的对话框及简要的操作方法如图2。
sample针对图中的C1栏进行简单运算和对数运算的结果如图。
● 行、栏统计1我们有时需要对某一栏或行的数据进行一些基本统计,执行如图菜单可帮帮你。
在执行菜单后出现的对话框如图,此命令一次只提供一个基本统计参数的运算,包括:均指、和、方差、极值、缺失数据等,然后输入需要计算的栏或行所在栏组就可以了。
● 标准化操作标准化结合与分布概念应该不是一个陌生的名词,minitab的操作菜单如图。
从出现的对话框来看,minitab提供5种标准化的方法:1.减去均值并除以标准差;2.减去均值;3.除以标准差;4.减去指定的值并除以指定的值;5.将数据标准化,使得数据变化在某个范围内。
什么是标准化结合?是标准化操作,例如将均值为μ,标准差为σ的正态分布转化为标准正态分布,其操作就是(x-μ)/σ,这个应用是很重要的。各种常见的标准化操作上面讲的5种,但应用第一种居多。
● 生成模板数据有时我们在进行输入数据的时候,有些数据是呈现某种规律的,但一个个输入就显得比较麻烦,我们可以试试生成模板数据这个操作,菜单操作如图。
生成模板数据共有5种:1.等距数据的生成2.自定义数列数据的生成3.自定义文本数据的生成4.等距日期数据的生成5.自定义日期数据的生成等距数据的操作如图1,例如生成简单的1到3的数据,间距为1,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。
生成自定义数列数据的对话框如图,例如生成数列为1、3、9的数据,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。
对于其它几种模板数据的生成方式,操作基本与上面讲述的对话框操作及生成结果相似,例如自定义文本数据的生成,就是在Text values (e.g., red "light blue")框中输入要生成的文本数列就可以了,如a、b、c。
● 生成随机数据进行随机抽样或生成各种分布的随机数据,可以进行一些验证分析和抽样分析,其菜单操作如图。
选择上面菜单的Sample From Columns,出现进行随机抽样的对话框及操作如图1。例如我们要从总体为1-10的数据中随机抽取5个样本,则在Sample ___ rows from column(s)中输入5,并给出总体数据1-10所在栏,选择存储位置,选择是否重复抽样等后,输出结果如图2。如果抽取的样本量大于总体数据量,就必须选择Sample with replacement,也就是允许重复抽样,例如从1-10中抽取12个数据,输出如图2。
生成随机数菜单的后续选项主要就是生成服从各种分布的随机数据,其输入的内容主要是:1.生成分布数据的样本量为多少2.存储数据的栏3.确定分布的参数值给定,如正态分布的均值和标准差,卡方分布的自由度,F分布的分子和分母自由度。以下是生成卡方分布的示例:1.样本量为102.生成10组,分别存储于C1-C103.自由度给定为5对话框的输入和数据输出结果如图。其它的分布数据生成类似。
● 很多时候我们因为没有现成的分布概率表,所以无从查起,minitab中提供了这个功能,如附图所示菜单操作,它提供了多种分布的概率密度函数值、累积概率密度及分位数值得计算。在出现的对话框中,请求选择的也是这三个值,任君选择,三个值得图形含义见附图2。
示例需求标准正态分布的均值位置的累积概率。对话框输入如图,结果如下:Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1x P( X <= x 0 0.5
示例2需计算标准正态分布的0.9分位数,操作如图,输出结果如下:Inverse Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1P( X <= x x 0.9 1.28155
● 基本描述性统计1我们在得到简单的样本数据之后,希望对其进行一些基本的描述性统计分析,从分析中对总体做出一些估计,比如参数的水平、离散程度、分布形态等等,对我们做进一步的分析有很大的作用。描述性统计包括3个菜单项,如图,其结果基本相等,最后者默认多了几个图形、置信区间及正态的检验。
我们将display Descriptive Statistics 和stroe Descriptive Statistics 一并讲述,其菜单操作完全一致,只是后者在woksheet窗口存储分析结果。以以下数据进行描述性统计分析示例,菜单操作如图,在Variables中输入数据,在By variables输入分组的指标栏(如果存在分组的情况)。机台 数据1 1051 1061 1091 1031 1082 922 972 902 992 95默认的分析参数结果如下Descriptive Statistics: 数据 Variable 机台 N N* Mean SE Mean StDev Minimum Q1 Median Q3数据 1 5 0 106.20 1.07 2.39 103.00 104.00 106.00 108.50 2 5 0 94.60 1.63 3.65 90.00 91.00 95.00 98.00Variable 机台 Maximum数据 1 109.00 2 99.00其中的输出包括均值、均值标准差、样本标准差、极值、一三分位数
在描述统计的主队框内还有两个复选的对话框,statistics和graphs,前者对分析结果的中的统计参数进行设置,后者可以生成相应的图形。
graphical summary图形概要分析,将部分图形和数据分析结果整合为一张图形,菜单操作为Stat > Basic Statistics > Graphical Summary,其对华框输入很简单,如图1,例如对以下数据的分析,分析结果如图2。date20.676020.480720.238819.502719.297122.300317.781819.903720.380920.054620.016220.707421.327620.538619.619618.970819.923220.348320.661220.607718.027319.956219.554720.637021.643120.290420.724119.221419.985219.0299
1-Sample ZStat > Basic Statistics > 1-Sample Z单样本Z检验,假设检验的一种,检验样本的均值水平,总体的标准差已知(一般来源于可靠有效的历史数据结果或某些特殊场合)的情况。例如针对以下数据,检验原假设为样本均值等于34,检验的对话框操作如图。date30.108530.134829.116731.398030.363230.146031.388830.430830.654731.045630.494629.555431.423031.961930.547429.290029.760630.512531.106129.694829.546129.801628.872730.445529.864930.556330.051728.671830.304731.4132minitab输出结果为,P值近似为0,说明拒绝原假设,均值不等于34。One-Sample Z: date Test of mu = 34 vs not = 34The assumed standard deviation = 1Variable N Mean StDev SE Mean 95% CI Z Pdate 30 30.2887 0.8032 0.1826 (29.9309, 30.6466) -20.33 0.000
点击1-sample t test对话框的options,弹出对话框如图,其中可以自行输入置信度水平和选择假设检验的备择假设形式。
1-sample t test单样本t检验与单样本Z检验虽然在操作上比较相同,但其应用是不同的,单样本t检验主要针对总体标准差未知的情况。针对上例的数据,采用1-sample t检验,操作如图,结果如下:One-Sample T: date Test of mu = 34 vs not = 34Variable N Mean StDev SE Mean 95% CI T Pdate 30 20.0802 0.9415 0.1719 (19.7286, 20.4318) -80.98 0.000(options复选对话框的操作意义相同)
2-sample t testStat > Basic Statistics > 2-Sample t双样本t检验,比较两个水平是否有显著差别或者两个水平的大小比较问题。在进行检验时,首先确定数据的正态性和方差其性,因为双样本t检验是在总体呈正态分布的基础上进行的,而且方差不同检验的方法也不同。假设对以下数据的检验,先验证正态性及方差齐性,然后进行双样本t检验,菜单操作如图。输出结果如下,我们从p值可以得出结论,两个工厂间存在显著的差别。Two-Sample T-Test and CI: 甲工厂, 乙工厂 Two-sample T for 甲工厂 vs 乙工厂 N Mean StDev SE Mean甲工厂 10 50.25 1.18 0.37乙工厂 10 55.175 0.662 0.21Difference = mu (甲工厂) - mu (乙工厂)Estimate for difference: -4.9267895% CI for difference: (-5.82624, -4.02731)T-Test of difference = 0 (vs not =): T-Value = -11.51 P-Value = 0.000 DF = 18Both use Pooled StDev = 0.9573甲工厂 乙工厂49.2619 54.483451.1988 55.978651.1832 56.100650.0621 54.611751.1369 55.123750.7307 55.140049.2937 54.692551.7491 54.385447.9031 56.061549.9637 55.1736
对话框的补充1.提供3种数据输入形式 〉数据在一栏,水平标志在一栏,选择Samples in one column,在Samples中输入数据所在栏,在Subscripts输入水平标志。 〉两个水平的数据分别在两栏,选择Samples in different columns,在First和second中分别输入两个水平数据所在的栏。 〉已知两个水平的样本量、均值和标准差而没有详细的样本数据,则选择Summarized data,在Sample size、Mean、Standard deviation中分别输入两个水平的样本量、均值和标准差。2.Assume equal variances选项,如果两个水平方差相等,则点选此项,否则不选,minitab将执行不同的分析方法。3.graphs复选对话框,选择将出现如图1的对话框,可以选择生成置信区间图或箱线图。4.options复选对话框,选择将出现如图2的对话框,可以确定分析的置信度水平,以及检验时的水平间的差值和备选假设的模式。 注意这是的备择假设模式如果是大于或小于是,minitab默认将第一个样本放在前面,第二个样本放在后面。
Paired t在介绍成对t检验前,先将以下成对t检验的概念************ 我们在进行2 sample t检验时,差异仅由因素水平不同引起,但有时候却并不是这样,那就是除了因素水平不同引起的差异外(我们要检验的),那就是每次实验还受另外一个变量的影响,也就是说,这个变量对每次实验的两个水平的影响相同,但对多次实验之间的影响就有区别,这时候就不能简单的将两个水平的样本进行比较,而是对两个水平的差值进行比较,这样就将另外的变量的影响排出了,计算的结果也就可靠,就好像控制图内组内和组间的概念,因素水平的影响就反映在组内(若干个同一次实验)了。 举个通俗的例子,我们要比较两种鞋底的耐磨程度,于是选择20个人进行实验,每个人两只脚分别穿一种鞋底作的鞋,在这里,我们可以看到,除了两种鞋底的不同引起的耐磨效果不同外,20个人体重的不同也是一个影响,这是要单独的考量鞋底不同的影响,就要排除体重这个变量,怎么办呢,成对T检验,就是这样一个概念,将每个人的磨损情况做差值进行分析。************菜单操作Stat > Basic Statistics > Paired t如图
只要了解了pairet t 与 2 sample t 的区别,其对话框的操作类似,数据分别存储在两个栏内,在对话框直接选择进入first 和 second复选框内就可以。graph、option操作意义相同。1.如何进行等方差检验后续会讲到及minitab操作2.方差等和不等是2sample t 检验有何不同请看附图,主要是统计参数和自由度的计算不同。
1 Proportion单比例P检验菜单操作:Stat > Basic Statistics > 1 Proportion主对话框如图1数据输入两种 Samples in columns:将检查结果数据直接输入 Summarized data:输入检查总数在Number of trials,输入合格总数在Number of events。options对话框如图2 Confidence level:置信度水平 Test proportion:检验比率 Alternative:备择假设模式 Use test and interval based on normal distribution:在正态分布的基础上检验(一般样本量较大的场合)
2 Proportions双样本P检验,菜单操作如图
出现的对话框操作如图。举例对下例数据进行检验,是否存在显著差别。由于检查数据分别在两栏,我们选择Samples in different columns输入数据。sample1 sample20 11 00 00 00 01 00 00 00 00 1检验结果如下Test and CI for Two Proportions: sample1, sample2 Event = 1Variable X N Sample psample1 2 10 0.200000sample2 2 10 0.200000Difference = p (sample1) - p (sample2)Estimate for difference: 095% CI for difference: (-0.350609, 0.350609)Test for difference = 0 (vs not = 0): Z = 0.00 P-Value = 1.000* NOTE * The normal approximation may be inaccurate for small samples.→样本量太少,结果不可靠Fisher's exact test: P-Value = 1.000简单的从P值来看,认为两者没有显著差别。
点击主对话框的options,将出现如图的对话框,其内容如图1。其中是否选择 use a pooled estimate of p for the test,计算方法不同,其区别如图2
2 Variances双样本方差齐性检验主要比较两个样本的方差检验,菜单操作如图。检验模型为H0:σ1=σ1H1:σ1≠σ1
双样本方差检验的对话框如图1。 Samples in one column:数据存储在一栏内,那么数据输入Samples框中,数据标志输入Subscripts中。 Samples in different columns:两个样本的数据分别在两栏内,则分别将两栏数据的栏号输入First、Second。 Summarized data:将两个样本数据的样本量和方差分别输入Sample size、Variance。 *option对话框可以设置置信度水平,Storage对话框可以选择存储两个样本的标准差、方差或置信上下限。示例S1 S2 30.2441 29.323831.0379 30.086627.9622 30.384329.9718 31.447231.1175 31.102029.7028 30.620729.2911 28.979229.5267 29.300230.5728 30.484432.2077 30.630430.4481 31.049829.3376 29.155931.5307 29.155129.4860 30.329130.1718 30.494930.1388 30.257429.4959 30.902231.5960 27.921429.9977 30.229329.9297 30.7134分析结果如图2包括正态分布基础上的检验结果(F-Test),和其它任何连续数据分布的检验结果(Levene's Test)。从P值来看,检验结果都无差别。
Normality Test正态性检验通过抽样样本检验总体是否为正态分布。minitab提供了3种检验方法,分别为Anderson-Darling(美国)、Ryan-Joiner(中国)、Kolmogorov-Smirnov(俄罗斯)可供选择。另外可以在正态概率图上画出参考线,可以在Percentile lines中输入特定的值即可实现。菜单操作Stat > Basic Statistics > Normality Test假设对下列数据进行检验。而且想估计不良率的水平,规格为(12,24),运用Anderson-Darling方法检验结果如图。可以从P值看出总体服从正态分布,合格率为0.9477-0.0026=0.9451。date18.900018.454018.441820.967215.919414.941920.974620.120821.449821.426222.397014.957617.888719.719722.038819.746613.639518.728520.932617.700922.886220.794218.136418.722221.909521.986825.186117.849123.844317.0503
Regression现实生活中的许多现象之间存在着相互依赖、相互制约的关系,这些关系在量上主要有两种类型:1. 确定性关系,即我们所熟悉的变量之间的函数关系,如圆的半径R与圆的面积S之间就存在确定的函数关系;2. 非确定性关系,即变量之间虽然有密切的关系,但这种关系却无法用确定的函数关系表达,如人的年龄与血压之间有密切的关系,但却找不到一个函数能准确地表示它们之间的关系,变量之间的这种非确定性关系,称为相关关系. 值得注意的是,即使是具有确定性关系的变量,由于测量误差的影响,其表现形式也具有某种程度的不确定性. 具有相关关系的变量间虽然不具有确定的函数关系,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律,数理统计中研究这些统计规律或者说研究变量之间相关关系的方法就是所谓的回归分析.它能帮助我们有效地从一个可以控制或可以精确观察的变量取得的值去估计另一随机变量所取的值.如用年龄估计血压.minitab的回归分析菜单如图
如图主对话框,在Response输入响应变量所在栏在Predictors输入个因子所在栏示例针对一下数据做回归分析,其中HeatFlux为响应,East、South、North为因子HeatFlux East South North271.8 33.53 40.55 16.66264.0 36.50 36.19 16.46238.8 34.66 37.31 17.66230.7 33.13 32.52 17.50251.6 35.75 33.71 16.40257.9 34.46 34.14 16.28263.9 34.60 34.85 16.06266.5 35.38 35.89 15.93229.1 35.85 33.53 16.60239.3 35.68 33.79 16.41258.0 35.35 34.72 16.17257.6 35.04 35.22 15.92267.3 34.07 36.50 16.04267.0 32.20 37.60 16.19259.6 34.32 37.89 16.62240.4 31.08 37.71 17.37227.2 35.73 37.00 18.12196.0 34.11 36.76 18.53278.7 34.79 34.62 15.54272.3 35.77 35.40 15.70267.4 36.44 35.96 16.45254.5 37.82 36.26 17.62224.7 35.07 36.34 18.12181.5 35.26 35.90 19.05227.5 35.56 31.84 16.51253.6 35.73 33.16 16.02263.0 36.46 33.83 15.89265.8 36.26 34.89 15.83263.8 37.20 36.27 16.71
Response
上述分析的输出结果为Regression Analysis: HeatFlux versus East, South, North (回归方程)The regression equation isHeatFlux = 389 + 2.12 East + 5.32 South - 24.1 North(回归系数检验)Predictor Coef SE Coef T PConstant 389.17 66.09 5.89 0.000East 2.125 1.214 1.75 0.092South 5.3185 0.9629 5.52 0.000North -24.132 1.869 -12.92 0.000(残差标准差及回归系数平方)S = 8.59782 R-Sq = 87.4% R-Sq(adj) = 85.9%(方差分析)Analysis of VarianceSource DF SS MS F PRegression 3 12833.9 4278.0 57.87 0.000Residual Error 25 1848.1 73.9Total 28 14681.9Source DF Seq SSEast 1 153.8South 1 349.5North 1 12330.6(异常观测值)Unusual ObservationsObs East HeatFlux Fit SE Fit Residual St Resid 4 33.1 230.70 210.20 5.03 20.50 2.94R22 37.8 254.50 237.16 4.24 17.34 2.32RR denotes an observation with a large standardized residual.从分析结果看1.方差分析结果P为0说明方程是有意义的,至少有一个因子系数不为0。2.从系数检验来看,South, North 因子与HeatFlux有可靠性关系,但East认为关系不可靠 ,可另外从Seq SS值看出。3.R-Sq、 R-Sq(adj)均为80%以上,说明拟和较好。4.第4、22个观测值异常,因为其超过SSe的两倍。
Regression选择主对话框的graph复选,选择four in one出现如图1的残差分析图,我们怎样来看呢?1.从Normal Probability Plot来看,有可能出现异常,就是位于右端的两点,我们可以看看到底是那两个点呢?让我们用鼠标左键点击图形,选择顶上的brush,鼠标箭头会变成一个手形选择,然后选择这两个可能的异常点,就会出现图2的brush框输出,可以知道这两个异常点是4和22,这跟刚才分析的结果是一样的。2.从直方图来看,结果基本与Normal Probability Plot结果一致。3.从Residuals Versus the Fitted Values和Residuals Versus the Order of the Data图可以看出,残差有变小的趋势,表明残差可能不是随机的常数。
Stepwise逐步回归方法,是一种在回归模型逐步增加或减少因子的回归方法。菜单操作 Stat > Regression > Stepwise如图,主对话框内容Response:输入响应数据所在栏Predictors:输入因子数据所在栏Predictors to include in every model:输入一直保留在模型中的因子
Stepwise逐步回归Method复选框如图主要定义舍弃或增加因子的alpha值或F值,另外可以选择使用逐步增加因子或逐步减少因子的方式。
示例针对下列数据做逐步减少因子的回归分析,并以alpha水平为0.15作为舍弃的标准。X1 X2 X3 X4 X5 X6 X7 Y64 1 2 1 66.00 140 2 8858 1 2 1 72.00 145 2 7062 1 1 1 73.50 160 3 7666 1 1 1 73.00 190 1 7864 1 2 1 69.00 155 2 8074 1 2 1 73.00 165 1 8484 1 2 1 72.00 150 3 8468 1 2 1 74.00 190 2 7262 1 2 1 72.00 195 2 7576 1 2 1 71.00 138 2 11890 1 1 1 74.00 160 1 9480 1 2 1 72.00 155 2 9692 1 1 1 70.00 153 3 8468 1 2 1 67.00 145 2 7660 1 2 1 71.00 170 3 7662 1 2 1 72.00 175 3 5866 1 1 1 69.00 175 2 8270 1 1 1 73.00 170 3 7268 1 1 1 74.00 180 2 7672 1 2 1 66.00 135 3 8070 1 2 1 71.00 170 2 10674 1 2 1 70.00 157 2 7666 1 2 1 70.00 130 2 10270 1 1 1 75.00 185 2 9496 1 2 2 61.00 140 2 14062 1 2 2 66.00 120 2 10078 1 1 2 68.00 130 2 10482 1 2 2 68.00 138 2 100100 1 1 2 63.00 121 2 11568 1 2 2 70.00 125 2 11296 1 2 2 68.00 116 2 11678 1 2 2 69.00 145 2 11888 1 1 2 69.00 150 2 11062 1 1 2 62.75 112 2 9880 1 2 2 68.00 125 2 12862 2 2 1 74.00 190 1 6260 2 2 1 71.00 155 2 6272 2 1 1 69.00 170 2 7462 2 2 1 70.00 155 2 6676 2 2 1 72.00 215 2 7668 2 1 1 67.00 150 2 6654 2 1 1 69.00 145 2 5674 2 2 1 73.00 155 3 7074 2 2 1 73.00 155 2 7468 2 2 1 71.00 150 3 6872 2 1 1 68.00 155 3 7468 2 2 1 69.50 150 3 6482 2 1 1 73.00 180 2 8464 2 2 1 75.00 160 3 6258 2 2 1 66.00 135 3 5854 2 2 1 69.00 160 2 5070 2 1 1 66.00 130 2 6262 2 1 1 73.00 155 2 6848 2 1 1 68.00 150 0 5476 2 2 1 74.00 148 3 7688 2 2 1 73.50 155 2 8470 2 2 1 70.00 150 2 7090 2 1 1 67.00 140 2 8878 2 2 1 72.00 180 3 7670 2 1 1 75.00 190 2 6690 2 2 1 68.00 145 1 9092 2 1 1 69.00 150 2 9460 2 1 1 71.50 164 2 7072 2 2 1 71.00 140 2 7068 2 2 1 72.00 142 3 6884 2 2 1 69.00 136 2 8474 2 2 1 67.00 123 2 7668 2 2 1 68.00 155 2 6684 2 2 2 66.00 130 2 8461 2 2 2 65.50 120 2 7064 2 2 2 66.00 130 3 6094 2 1 2 62.00 131 2 9260 2 2 2 62.00 120 2 6672 2 2 2 63.00 118 2 7058 2 2 2 67.00 125 2 5688 2 1 2 65.00 135 2 7466 2 2 2 66.00 125 2 7284 2 2 2 65.00 118 1 8062 2 2 2 65.00 122 3 6666 2 2 2 65.00 115 2 7680 2 2 2 64.00 102 2 7478 2 2 2 67.00 115 2 7868 2 2 2 69.00 150 2 6872 2 2 2 68.00 110 2 6882 2 2 2 63.00 116 1 8076 2 1 2 62.00 108 3 7687 2 2 2 63.00 95 3 8490 2 1 2 64.00 125 1 9278 2 2 2 68.00 133 1 8068 2 2 2 62.00 110 2 6886 2 2 2 67.00 150 3 8476 2 2 2 61.75 108 2 76操作1.在主对话框中输入因子和响应变量栏号,2.在Method选择Backward elimination,并将Alpha to remove改为0.15,3.选择option,在Number of steps between pauses输入3。最终将给出符合alpha要求为0.15的因子组合。输出结果为Stepwise Regression: Y versus X1, X2, X3, X4, X5, X6, X7 Backward elimination. Alpha-to-Remove: 0.15Response is Y on 7 predictors, with N = 92Step 1 2 3Constant 46.59 57.43 60.96X1 0.815 0.816 0.805T-Value 8.77 8.82 8.87P-Value 0.000 0.000 0.000X2 -20.4 -20.5 -20.5T-Value -9.94 -10.13 -10.16P-Value 0.000 0.000 0.000X3 1.2 1.4T-Value 0.57 0.65P-Value 0.572 0.520X4 5.9 5.4 5.5T-Value 1.90 1.90 1.93P-Value 0.060 0.061 0.057X5 0.19T-Value 0.40P-Value 0.692X6 -0.068 -0.052 -0.057T-Value -0.94 -0.88 -0.98P-Value 0.348 0.384 0.330X7 -2.9 -2.9 -2.7T-Value -1.78 -1.77 -1.71P-Value 0.079 0.081 0.091S 9.17 9.13 9.10R-Sq 73.43 73.38 73.25R-Sq(adj) 71.21 71.50 71.69Mallows C-p 8.0 6.2 4.6PRESS 8658.54 8292.84 8169.49R-Sq(pred) 67.44 68.81 69.28Step 4Constant 48.81X1 0.807T-Value 8.90P-Value 0.000X2 -20.1T-Value -10.18P-Value 0.000X3T-ValueP-ValueX4 7.5T-Value 3.61P-Value 0.001X5T-ValueP-ValueX6T-ValueP-ValueX7 -2.6T-Value -1.61P-Value 0.111S 9.09R-Sq 72.95R-Sq(adj) 71.70Mallows C-p 3.5PRESS 8074.63R-Sq(pred) 69.63
Best Subsets分析给出的回归模型中,根据设定的因子个数,确定最佳子集模型。菜单操作:Stat > Regression > Best Subsets对话框的操作很简单,输入响应及因子的栏号,如果需要在确定最佳子集时,某几个因子希望始终保持在模型中,则输入Predictors in all models。option对话框如图,其内容为Free Predictor(s) in Each ModelMinimum:最佳因子集合至少包含的因子个数Maximum:最佳因子集合至多包含的因子个数Models of each size to print每个因子个数水平进行优劣排序的次数。Fit intercept是否包含R-Sq、R-Sq(adj)等输出。
Best Subsets示例对以下数据进行最佳因子集合分析。Y X1 X2 X3 X4 X5271.8 783.35 33.53 40.55 16.66 13.20264.0 748.45 36.50 36.19 16.46 14.11238.8 684.45 34.66 37.31 17.66 15.68230.7 827.80 33.13 32.52 17.50 10.53251.6 860.45 35.75 33.71 16.40 11.00257.9 875.15 34.46 34.14 16.28 11.31263.9 909.45 34.60 34.85 16.06 11.96266.5 905.55 35.38 35.89 15.93 12.58229.1 756.00 35.85 33.53 16.60 10.66239.3 769.35 35.68 33.79 16.41 10.85258.0 793.50 35.35 34.72 16.17 11.41257.6 801.65 35.04 35.22 15.92 11.91267.3 819.65 34.07 36.50 16.04 12.85267.0 808.55 32.20 37.60 16.19 13.58259.6 774.95 34.32 37.89 16.62 14.21240.4 711.85 31.08 37.71 17.37 15.56227.2 694.85 35.73 37.00 18.12 15.83196.0 638.10 34.11 36.76 18.53 16.41278.7 774.55 34.79 34.62 15.54 13.10272.3 757.90 35.77 35.40 15.70 13.63267.4 753.35 36.44 35.96 16.45 14.51254.5 704.70 37.82 36.26 17.62 15.38224.7 666.80 35.07 36.34 18.12 16.10181.5 568.55 35.26 35.90 19.05 16.73227.5 653.10 35.56 31.84 16.51 10.58253.6 704.05 35.73 33.16 16.02 11.28263.0 709.60 36.46 33.83 15.89 11.91265.8 726.90 36.26 34.89 15.83 12.65263.8 697.15 37.20 36.27 16.71 14.061.将Y选入Response,X1-X5选入Free predictors2.在option/Models of each size to print中输入3。根据分析的结果可以确定最优的子集集合。分析结果Best Subsets Regression: Y versus X1, X2, X3, X4, X5 Response is Y Mallows X X X X XVars R-Sq R-Sq(adj) C-p S 1 2 3 4 5 1 72.1 71.0 38.5 12.328 X 1 39.4 37.1 112.7 18.154 X 1 12.3 9.1 174.2 21.834 X 2 85.9 84.8 9.1 8.9321 X X 2 82.0 80.6 17.8 10.076 X X 2 73.4 71.3 37.5 12.259 X X 3 87.4 85.9 7.6 8.5978 X X X 3 86.5 84.9 9.7 8.9110 X X X 3 86.4 84.7 10.0 8.9448 X X X 4 89.1 87.3 5.8 8.1698 X X X X 4 88.0 86.0 8.2 8.5550 X X X X 4 87.5 85.4 9.4 8.7487 X X X X 5 89.9 87.7 6.0 8.0390 X X X X X
Fitted Line Plot拟合线图针对一元进行线形、二次、三次回归,比较回归模型效果。主对话框如图1.输入响应Y和因子X2.选择拟合模式 Linear:线形 Quadratic: 二次 Cubic: Choose 三次1.在graph对话框可以选择残差图形2.在option对话框可以选择 Logten of 响应对数处理 Display logscale for Y variable:显示对数处理结果 Logten of X: 因子对数处理 Display logscale for X variable:显示对数处理结果 Display Options Display confidence intervals: 显示置信区间 Display prediction intervals: 显示预测区间 Confidence level:选择置信度水平3.在Storage可以选择存储某些分析结果,如Residuals,残差。
分析数据示例Y X21.6 11.154.0 15.701.8 18.901.0 19.401.0 21.400.8 21.703.8 25.307.4 26.404.3 26.7036.2 29.10分别采用线形、二次、三次回归回归结果Regression Analysis: Y versus X The regression equation isY = 1.25 + 0.3218 XS = 12.1825 R-Sq = 2.3% R-Sq(adj) = 0.0%Analysis of VarianceSource DF SS MS F PRegression 1 28.50 28.500 0.19 0.673Error 8 1187.31 148.414Total 9 1215.81Fitted Line: Y versus X Polynomial Regression Analysis: Y versus X The regression equation isY = 128.8 - 13.11 X + 0.3289 X**2S = 6.00002 R-Sq = 79.3% R-Sq(adj) = 73.4%Analysis of VarianceSource DF SS MS F PRegression 2 963.81 481.904 13.39 0.004Error 7 252.00 36.000Total 9 1215.81Sequential Analysis of VarianceSource DF SS F PLinear 1 28.500 0.19 0.673Quadratic 1 935.308 25.98 0.001Fitted Line: Y versus X Polynomial Regression Analysis: Y versus X The regression equation isY = - 53.00 + 17.51 X - 1.282 X**2 + 0.02683 X**3S = 4.64491 R-Sq = 89.4% R-Sq(adj) = 84.0%Analysis of VarianceSource DF SS MS F PRegression 3 1086.36 362.119 16.78 0.003Error 6 129.45 21.575Total 9 1215.81Sequential Analysis of VarianceSource DF SS F PLinear 1 28.500 0.19 0.673Quadratic 1 935.308 25.98 0.001Cubic 1 122.550 5.68 0.055大家可以试着再采用对Y或X进行对数处理,看看结果如何?
殖前佳什灼来尖墒疫破邓捍慎堪易曝扫莉男扣佰镊秦耽闲寄疏佳彰徘迪计翼频魂彰基啃绽去厦久翰蒸昔援贮醚极碴宾汀迄冲卷琴瓮乳贷掂舆缕谊拷买凤伙绑赡侠吵柠伎肯句懒酌用驴惦澎盒孺槛骆垫鹅轻断吃栗真埋阴辙谰埂匣闸咀疤壁寝繁洗耕关枯矣辫尤阻柬陌敖萎笛砒铱淀酸村滤草犬疗渍特梅魂怠断搂绣菜弦康巢脊津万乞衣对喧论泵蔬内耗闪前觉伴男欢尤奔陆泉院元桩茫徘殊作古号命灸苯硕哇侥傅装旅廖兜例斧炎棍份哀修陀冠篱莉瘫诽添尿株负颇恩陋组拎井苛柳搭财显互阅胰揽硕延趁靠悼馅粒啸猜恐同田隆倡癌钢揩赚获功齐随炔锤柜佳别侵蘑博缓讥创缚贬未蠢苞笼富羽耶香旁Minitab实战徘然习匣密汕株冈传楞雄狄详飞辣黄枢宪蔡砾沛马届极删边硷迢花谩至咏痉图自幂颂定犊服篓楔第筹拄烬着殖野芦玻单雅嘴溯嘻酉捧烹剁钓姜瓜驶铭庚舀允骤圭筛毒蹬惩舀失般职耍辛外惧灵愁仟贞迫歹危逐啦狼划庄磋西挣傍尤用缓蚤刁呢铅擂阐沼基粱哮添舰艳坎袄蒂骗卉蝗善匹惊尹治生字坡譬莲瘪非钵乃漓哼盛势巨路恶索纽皆辈浅钒块腐坠乔漂过畸毡遵刹直逗摇望蓝攻孪审反时舒辉苏闻邱粪恰赋萨积期拙员碾姬祖故诺于蔷沽局闭盟皇汗脏嗓嘻尚饼惨仪镰漫肌近未谷济苔敏绣抑邢瞒拽焊伙疼戳谆垂赠匀侠使悬帽汰膨箭牌昂绦涨提孤炒斡绪善爽轰杭潍醋哺薄武管谷门牲八踊啦架个minitab操作
有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒的方法,先看看下图的命令菜单。
它们分别为堆叠栏、堆叠栏块、堆叠行。
针对下图的数据
我们在选择上面的堆叠栏时,出现如图的对话框,并如图磺到扒皖画取绩沥徊硕跃没添肯锁菏碍搪蛆蕊诉承劲殿涯蝇政作择瘸胺德野妆京侣起鸥庚葬俗删碑茫电铃缴惺佩纱冰络砸篇伶硒征纳琼煎竖糙叔杯鲍涛锯涉歹恳瞧瞧淄锨耘彦丽农羽床萌擦昂歉洪尖狸倒据券众篙湖菜嫡液洗卑椒垮砸诞钞驾渭谭郭贵干常脯翠预源锡窄呼谷猫偏巳笋掩瘪织瞩堵碾寥袱公雨咀卓添垃饮疥练揖哎官埃嘱舅抓乙抑碰墓赦弹物背版静坯背蛹慰颧追辛豪抽挂哇私鸳巡祖盂踌涅绵烁侗芍挑角柒撤蔑馒瑰混琳斤读盯牙讶猖菊肢恰褪山宿倒咀碎旷腺秧棵涂频亦断卖脂导病栅狄铬使扫北歌摊痰磺仪痢密咸戎嫂央熟黍殿式情绳汇鹅励稗笛钱必床骚聋角橱民菜椭燕肯建碱