医学统计学重点难点归纳
发布时间:2020-07-06 18:35:43
发布时间:2020-07-06 18:35:43
医学统计学重点难点归纳
第一单元 概 论
1.基本概念:
总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。
总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
样本:从总体中随机抽取部分个体的某个变量值的集合。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:
(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所
得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的
数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)
①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由
各分组标志及其频数构成。包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类
②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单
位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二单元 实验研究的三要素
1.实验设计三要素:被试因素、受试对象、实验效应
2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
4.实验设计方法
word/media/image1.gif 有 析因设计 正交试验设计 均匀试验设计
word/media/image2.gif交互作用 两组 :异体配对设计 同体配对设计 交叉设计
无 随机同期对照实验设计 (单因素两水平) 扩展
word/media/image2.gifword/media/image2.gif 多组:单因素多水平 配伍组设计 拉丁方设计
(两因素多水平) (三因素多水平)
配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。
析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。
拉丁方设计:用于三因素等水平无交互。
第三单元 定量资料的统计描述、参考值范围
1.频数表编制过程(了解)
(1)找出样本数据的最大值和最小值,计算极差 R;
(2)分组:确定分组的组距 d 和组数 k;
一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组
(3)求频率密度:统计频数,算出频率、频率密度和累积频率;
(4)画出直方图。
2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。
3.集中趋势、离散趋势的指标及适用范围
(1)集中趋势:word/media/image3_1.png,G,M,Px,M0
算术均数:适用于对称分布;
不适用于偏态分布和资料中出现极值的资料。
几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。
不适用与观察值中有0或正负数值同时出现的资料。
中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。
百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;
用于确定医学参考值范围(偏态或分布不明的资料)。
众数:适用于大样本,较粗糙。
(2)离散趋势:
极差:优点:简单明了、容易使用。
缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。
②样本容量越大,极差可能越大。
③极差的抽样误差大,不稳定。
四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。
缺点:类似于极差,利用度低。
方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。
变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。
②比较均数相差悬殊的资料的变异度。
③衡量实验精密度和稳定性的常用指标。
(3)频数分布特征
高峰在中间,左右大致对称,称为对称分布。 平均数=中位数=众数
高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。 平均数>中位数>众数
高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。 平均数<中位数<众数
对称分布 正(右)偏态分布 负(左)偏态分布
4.正态分布图形的特点及意义
(1)特点:①f(x)关于x=μ对称
②x=μ时取得最大值
③在x=μ±σ处为拐点,且以 x 轴为水平渐近线
④f(x)大于0
⑤P(x=a)=0
⑥若 f(x) 在点 x 处连续,则F´(x)=f(x)
(2)意义:word/media/image4_1.png=1,f(x)在负无穷到正无穷的积分值为1,即曲线下方面积为1。
5.μ和σ2的意义
μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。
σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。
6.标准化变换
z=word/media/image5_1.png x~N(μ,σ2) z~N(0,1)
F(x)=Ф(word/media/image5_1.png)=Ф(z) 即P(X≤x)=Ф(word/media/image5_1.png)=P(Z≤z)
word/media/image6.gif P(a
7.标准正态分布界值
规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x轴上方中间面积一致。
双侧界值:
P(|z|≤zword/media/image10_1.png)=1-α P(z
P(|z|≥zword/media/image10_1.png)=α P(z>zword/media/image10_1.png)=word/media/image11_1.png
单侧界值:
上限: 下限:
P(z>zα)=α P(z>z1-α)=1-α
P(z
8.正常值范围及意义
概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研
究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者
的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参
考,又称医学参考值范围。
意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。
以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种
估计的可信度是95%,会冒5%的风险。
公式: 双侧95%的界限值:word/media/image12_1.png±1.96s
单侧95%的上限值:word/media/image12_1.png+1.645s
单侧95%的上限值:word/media/image12_1.png-1.645s
第4章 总体均数的估计、假设检验
1.标准误
(1)概念:每次样本计算出的word/media/image12_1.png不同,这些word/media/image12_1.png的标准差称为均数的标准误。
(2)意义:是衡量样本统计量抽样误差大小的统计指标。
(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描
述统计量的变异。
(4)均数标准误的公式:Sword/media/image13_1.png=word/media/image14_1.png
2.置信区间
(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x1、x2、…、xn)和θ2(x1、
x2、…、xn),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(word/media/image15_1.png1<word/media/image15_1.png2)=1-α,
则称随机区间(word/media/image15_1.png1,word/media/image15_1.png2)为θ的1-α置信区间,其中称为word/media/image15_1.png1置信下限,称为word/media/image15_1.png2
置信上限,1-α称置信度。
(2)意义:区间(word/media/image15_1.png1,word/media/image15_1.png2)包含有参数θ的概率为1-α,不能说θ在(word/media/image15_1.png1,word/media/image15_1.png2)的概率为
1-α。
例:可以说(a,b)包含均数μ的概率为95%,不能说μ在(a,b)的概率为95%。
(3)公式:单个正态总体均数μ的区间估计
①σ已知:
word/media/image16.gif 双侧:word/media/image17_1.png 即 word/media/image18_1.png
z分布
单侧:word/media/image19_1.png 即 word/media/image20_1.png
②σ未知:
word/media/image21.gif 双侧:word/media/image22_1.png 即 word/media/image23_1.png
小样本(n≤50) t分布
单侧:word/media/image24_1.png 即 word/media/image25_1.png
word/media/image26.gif 双侧:word/media/image27_1.png 即 word/media/image28_1.png
大样本(n>50) z分布
单侧:word/media/image29_1.png 即 word/media/image30_1.png
(4)两要素:
准确度:由1-α 决定,1-α 越大,准确度越高。
精确度:由区间长度决定。
99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。
3.抽样分布
(1)t分布
①定义: 来自正态总体的一组样本,word/media/image31_1.png和s分别是样本的均数和标准差。则t=word/media/image32_1.png~
t分布,自由度 df=n-1,极限分布是标准正态分布。
②图形分布特征:
以0为中心,左右对称的单峰分布。
自由度越大,越高瘦
③界值:
双侧:
P(|t|≤tword/media/image10_1.png)=1-α P(t
P(|t|≥tword/media/image10_1.png)=α P(t>tword/media/image10_1.png)=word/media/image11_1.png
单侧:
上限: 下限:
P(t
P(t>tα)=α P(t>t1-α)=1-α
(2)χ2分布
①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n的样本,计算
样本标准差s,则χ2=(n-1)s2/σ2服从自由度df=n-1的χ2分布。
②图形分布特征:
曲线偏向左边
自由度越小曲线越偏
③界值:
双侧:
P(x2>x2word/media/image10_1.png)=word/media/image11_1.png P(x2>word/media/image33_1.png)=1-word/media/image11_1.png
P(x2<x2word/media/image10_1.png)=1-word/media/image11_1.png P(x2<word/media/image33_1.png)=word/media/image11_1.png
单侧:
上限: 下限:
P(x2>x2α)=α P(x2>x21-α)=1-α
P(x2<x2α)=1-α P(x2<x21-α)=α
(3)F分布
①定义:如果分别从两个正态总体N(μ1,σ1)和N(μ1,σ1)中随机抽取样本含量
n1、n2的两个样本,算出样本均数和方差分别为word/media/image34_1.png,word/media/image35_1.png和word/media/image36_1.png,word/media/image37_1.png,则word/media/image38_1.png
服从df1=n1-1,df2=n2-1的F分布。
若χ1、χ2分别服从自由度df1、df2的χ2分布,则F=word/media/image39_1.png~df1df2
②图形分布特征
曲线偏向左边
df1、df2同时增大,曲线趋向于对称
③倒数性质:word/media/image40_1.png=word/media/image41_1.png
④界值:
双侧:
P(F>Fword/media/image10_1.png)=word/media/image11_1.png P(F>word/media/image42_1.png)=1-word/media/image11_1.png
P(F<Fword/media/image10_1.png)=1-word/media/image11_1.png P(F<word/media/image42_1.png)=word/media/image11_1.png
单侧:
上限: 下限:
P(F>Fα)=α P(F>F1-α)=1-α
P(F
4.假设检验
(1)基本思想:反证法、小概率事件原理
(2)基本步骤:
①建立假设,确定检验水准
H0:原假设,差异存在但不显著或差异无统计学意义
H1:备择假设,差异显著或差异有统计学意义
②在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生)
参数检验统计量要求满足:
i)在H0成立的条件下,服从特定的抽样分布;
ii)必须包含要检验的总体参数;
iii)对于给定的样本数据,能计算出该检验统计量的数值。
③对于给定的α值做出检验结论,并给以专业解释
判断P值:(与界值比较,反查界值表确定范围,软件计算)
若P>α,则接受 H0,拒绝H1 ;若P<α,则拒绝 H0,接受H1 。
(3)检验方法:
正态性检验、方差齐性检验、t检验
(4)两类错误
实 际 情 况 | 判 断 | |
接受H0 | 拒绝H0 | |
H0正确 | 正确1-α | 第一类错误 α |
H0不正确 | 第二类错误 β | 正确1-β |
①第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。
②P≤α时,拒绝H0,可能犯Ⅰ类错误(α)。此时,P值越小,犯Ⅰ类错误的概率越
小,结论越可靠。
③P>α时,接受H0,可能犯Ⅱ类错误(β)。此时,虽然β未知,但P值越大,犯Ⅱ
类错误的概率越小,结论越可靠。
④减少(增加)I型错误,将会增加(减少)II型错误
⑤增大n,可以同时降低两类错误。
第5章 方差分析
1.方差分析基本思想
目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性
差异。
基本思想:根据离差来源的不同,将总离差平方和分解为两部分:
由试验的随机因素(误差)引起的组内离差,
由因素的作用(即处理水平不同)引起的组间离差。
总离差平方和 = 组内离差平方和+ 组间离差平方和(SST = SSE + SSA)
2.方差分析
单因素方差分析、配伍组设计方差分析、析因设计方差分析
拉丁方设计方差分析、正交设计方差分析
交叉设计方差分析、组内分组设计方差分析
第6章 双变量相关与回归
1.散点图特征
正相关 完全正相关 负相关 完全负相关
不相关
2.相关系数意义及分类
(1)意义:
①相关系数r的大小反映随机变量X和Y之间线性关系的密切程度:
若 r=0,则 X 与 Y 不相关;
若 |r|=1,则 X 与 Y 完全相关。
②相关系数r的符号反映随机变量X和Y之间线性关系的相关方向:
若 0
若 -1
(2)分类:
①积差相关系数:双变量为服从正态分布的计量资料
②等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。
(3)适用范围:
两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的。
3.线性相关分析和回归分析的联系与区别
(1)联系:
①r=word/media/image43_1.png word/media/image44_1.png、word/media/image45_1.png分别是x、y的标准差
②方向一致,r与b方向一致
③r与b的假设检验等价,即同一样本存在:tr=tb
④回归强度与相关强度:R2=SS回/SS总=r2 (仅限Ⅱ型回归)
(2)区别:
①资料
相关:x,y必须是随机变量
word/media/image16.gif 回归: x是确定变量称Ⅰ型回归,
y必须是随机变量
x是随机变量称Ⅱ型回归
②计量单位:r不受单位影响,b受单位影响
③意义:
相关说明相关关系,相关关系描述变量间关系的密切程度与方向。
回归说明依存关系,回归方程描述变量间的数量依存关系。
④取值范围:|r|≤1,bword/media/image46_1.pngR
5.决定系数的意义
R2=SS回/SS总=(SS总-SS剩)/SS总=(1-SS剩)/SS总
0≤ R2 ≤1,R2越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好。
第7章 两分类资料的统计描述与推断
1.相对数指标
两个有联系的指标之比。常用的有率和比(构成比、相对比)。
(1)率:频率,说明某现象发生的频率和强度。总体率:π,样本率:p 。
word/media/image47_1.png
(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。
word/media/image48_1.png
(3)相对比:两个有关指标A、B之比,说明两者的对比水平,A是B的若干倍或百分之几。
对比的数值可以是绝对数、相对数或平均数。
第8章 R×C表资料的分析
1.列联表分类及统计方法
(1)双向无序:多个样本率或构成比比较→χ2检验
(2)单向有序:
分组变量有序→χ2检验(同双向无序)
结果变量有序→秩和检验或Ridit分析
(3)双向有序:
属性相同→McNemar、Kappa检验
属性不同→秩相关分析、线性趋势检验、秩和检验或Ridit分析
2.列联表注意事项
(1)R×C表中不宜有20%以上的格子的T<5,不能有T<1。
理论数太小处理办法:①最好增加样本例数以增大理论数
②删去理论数太小的行和列
③将太小理论数所在行或列的实际数与性质相近的邻行/列合并
④采用Fisher检验
(2)R×C表χ2检验未考虑等级顺序关系,若处理效应按强弱或优劣分为有序等级时采用秩
和检验或Ridit分析。
(3)拒绝H0时不能确定是不全相等还是全不相等,需进行两两比较。
第9章 非参数检验、Ridit分析
1.参数检验和非参数检验特点
(1)参数检验:
特点:总体分布的类型为已知,只是一个或几个参数未知,对未知参数进行检验。
优点:检验效能高,允许应用样本提供的数据
缺点:受应用条件限制
(2)非参数检验:
特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的
位置,允许根据分布情况而不是总体参数做出推论。
优点:不依赖总体分布类型,应用广泛
缺点:符合参数检验的用非参数检验会降低检验效能。
2.检验方法
符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。
检 验 方 法
1.正态性检验
(1)目的:在做t检验方差分析之前首先判断是否服从正态分布
(2)过程:假设H0:总体服从正态分布;H1:总体不服从正态分布。α
(3)SPSS结果:看sig值,sig>α,接受H0,服从正态;sig<α,接受H1,不服从正态。
2.方差齐性检验
(1)目的:利用样本信息推断总体方差是否相等
(2)前提:正态分布
(3)过程:
①建立假设:假设H0:word/media/image49_1.png=word/media/image50_1.png即方差齐;H1:word/media/image49_1.png≠word/media/image50_1.png。α
②计算统计量:word/media/image51_1.png=word/media/image52_1.png df1=n1-1 df2=n2-1
③P值: F
F>Fα(df1,df2)则P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,满足方差齐性;sig<α,接受H1,不满足方差齐性。
3.单样本t检验
(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。
(2)前提:
①单组设计
②计量资料(非分类)
③资料服从正态分布
(3)过程:
①建立假设:假设H0:μ=μ0 ;H1:μ≠μ0。α
②计算统计量:word/media/image53_1.pngword/media/image54_1.png或t= word/media/image55_1.png
③P值: z
z>zαdf1,则P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
4.配对t检验
(1)目的:推断两组样本代表的总体均数的差值是否为零。
(2)前提:
①配对设计
②计量资料(非分类)
③差值服从正态分布
(3)过程:
①建立假设:假设H0:μd=0 ;H1:μd≠0。α
②计算统计量:t=word/media/image56_1.png df=n-1
③P值: t
t<word/media/image57_1.pngdf1,则P>α,接受H0 , t>word/media/image57_1.pngdf1,则P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
5.成组t检验
(1)目的:推断两组样本代表的总体均数是否有显著性差异。
(2)前提:
①完全随机成组设计;
②计量资料(非分类);
③独立性;
④正态性;
⑤方差齐性。
(3)过程:
①方差齐性检验
②建立假设:假设H0:μ1=μ2;H1:μ1≠μ2(或μ1>μ2,μ1<μ2)。α
③计算统计量:t或t´(方差不齐)df=n1+n2-2
④P值: t
t<word/media/image57_1.png(df1,df2),则P>α,接受H0 ,t>word/media/image57_1.png(df1,df2),则P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
6.单因素方差分析
(1)目的:推断多组样本代表的总体均数是否有显著性差异。
(2)前提:
①完全随机多组设计;
②计量资料(非分类);
③独立性;
④正态性;
⑤方差齐性。
(3)过程:
①正态性检验和方差齐性检验
②建立假设:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。α
③计算统计量:
④P值:P>α,接受H0 ,P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
方差分析表:
变异来源 | 离差平方和 | 自由度 | 均方 | F 值 | P 值 |
组间 | SSA | K-1 | MSA=SSA/(k-1) | F=MSA/MSE | F>Fα(k-1,N-k), P<α |
组内 | SSE | N-k | MSE=SSE/(N-k) | ||
总和 | SST | N-1 | |||
(5)注意:组内变异:随机误差
组间变异:随机误差+处理因素
若H0成立:组内变异≈组间变异
若H1成立:组内变异 < 组间变异
7.配伍设计的方差分析
(1)目的:推断多组样本代表的总体均数是否有显著性差异。
(2)前提:
①完全随机多组设计;
②计量资料(非分类);
③独立性;
④每个因素的各水平正态性;
⑤每个因素的各水平方差齐性。
(3)模型设计:双因素且无交互作用:
处理因素——重要实验因素
配伍因素——主要非处理因素
SS总=SS处理+SS配伍+SS误差
(3)过程:
①正态性检验和方差齐性检验
②建立假设:
处理组:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。
配伍组:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。α
③计算统计量:
④P值:P>α,接受H0 ,P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
方差分析表
变异来源 | 离差平方和 | 自由度 | 均方 | F 值 | P 值 |
处理因素A | SSA | K-1 | MSA=SSA/(k-1) | FA=MSA/MSE | |
配伍因素B | SSB | B-1 | MSB=SSB/(b-1) | FB=MSB/MSE | |
误差 | SSE | (k-1)(b-1) | MSE=SSE/(k-1)(b-1) | ||
总和 | SST | Kb-1 | Fα(k-1,(k-1)(b-1))Fα(b-1,(k-1)(b-1)) | ||
8.析因设计的方差分析
(1)目的:推断多组样本代表的总体均数是否有显著性差异。
(2)前提:
①完全随机多组设计;
②计量资料(非分类);
③独立性;
④每个因素的各水平正态性;
⑤每个因素的各水平方差齐性。
(3)过程:
①正态性检验和方差齐性检验
②建立假设:
因素A:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。
因素B:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。
交互作用:假设H0:μ1=μ2=…=μn;H1:μ1、μ2、…、μn不全相等或全不相等。α
③计算统计量:
④P值:P>α,接受H0 ,P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,差异无统计学意义;sig<α,接受H1,差异有统计学意义。
方差分析表
变异来源 | 离差平方和 | 自由度 | 均方 | F 值 | P 值 |
因素A | SSA | R-1 | MSA | FA | |
因素B | SSB | S-1 | MSB | FB | |
A B | SSA×B | (r-1)(s-1) | MSA×B | FA×B | |
误差 | SSE | rs(l-1) | MSE | ||
总和 | SST | Rsl-1 | Fα(r-1,rs(l-1))Fα(s-1,rs(l-1))Fα((r-1)(s-1), rs(l-1)) | ||
9.线性相关分析
(1)目的:分析两变量间是否有直线相关关系
(2)前提:x、y必须都是随机变量
(3)过程:
①计算样本相关系数r的大小
r=word/media/image58_1.png=word/media/image59_1.png=word/media/image60_1.png df=n-2
将r与界值表界值比较:
当|r|>rα时,P<α,拒绝H0 ,认为有直线相关关系。
当|r|
②根据r,df=n-2检验ρ是否为0
假设H0:总体相关系数ρ=0,即无关系;H1:总体相关系数ρ≠0,即有关系。α
③结合专业知识评价相关分析是否有价值
P值:P>α,接受H0 ,P<α,拒绝H0 ,P<α,拒绝H0
(4)SPSS结果:sig>α,接受H0,无直线相关关系;sig<α,接受H1,有直线相关关系。
10.线性回归分析
(1)目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断。
(2)前提:y必须是随机变量
(3)过程:
①计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a,斜率b。
word/media/image61_1.png 意义:x每增加1,y增加a+bx
word/media/image62_1.png word/media/image63_1.png
②根据截距a,斜率b,检验样本所抽自的总体截距α是否为0,总体斜率β是否为0。
做法1:直接查相关系数的临界值表
做法2:费舍尔t检验法:word/media/image64_1.png df=n-2
做法3:F检验
假设H0:β=0,即无回归关系;H1:β≠0,即有回归关系。α
F=word/media/image65_1.png df=n-1
③结合专业知识,评价此直线回归方程是否有实用价值。
F
F>Fα df,则P<α,拒绝H0 ,有回归关系
(4)SPSS结果:sig>α,接受H0,无直线回归关系;sig<α,接受H1,有直线回归关系。
11.列联表Χ2检验
(1)目的:①推断两个或多个总体率或构成比之间的差异;
②分析行列两种属性或两个变量之间有无关联性(相关分析);
③频数分布的拟合优度检验。
(2)前提:小样本,非二项分布
(3)过程:
①建立假设:H0:总体率或构成比无显著性差异(行列变量独立或无相关性)
H1:总体率或构成比有显著性差异(行列变量不独立或有相关性),α
②计算最小理论频数Tij,并计算Χ2。
一般公式:word/media/image66_1.png df=(r-1)×(c-1)
四格表公式: (最小理论频数:T)
基本公式:n≥40且T≥5 word/media/image67_1.png
校正公式:n≥40且1≤T≤5 word/media/image68_1.png
特殊公式:n<40 , T<1 四格表确切概率法(Fisher)
③P值:若χ2<word/media/image69_1.png df 则P>α,接受H0,若χ2>word/media/image69_1.png df 则P<α,接受H1。
(4)SPSS结果:先看最小理论频数值范围,再看sig,sig>α,接受H0,总体率或构成比
无显著性差异;sig<α,接受H1,总体率或构成比有显著性差异。
12.拉丁方设计方差分析
三因素、等水平、无交互的设计。拉丁字母—处理因素,行、列—区组因素、序列因素。
13.秩和检验
(1)符号秩和检验:用于配对计量资料时,将配对差值的中位数与0比较。亦可用于样本
中位数与总体中位数的比较。
(2)成组秩和检验:
基本思想:先假设样本含量分别为n1、n2的两样本来的总体位置相同,如H0成立,每
个数据排在两个组内是随机的,较小样本含量组的秩和T与平均秩和
【n1(N+1)/2】一般相差不大。若相差悬殊,表示取得的现在样本统计量T
值的概率P很小,因而拒绝H0;反之,则不能拒绝H1。
(3)多组秩和检验:常用于不满足参数检验条件的完全随机设计两样本或多样本比较,也可
推断双向有序资料的相关性。
(4)配伍秩和检验:常用于配伍设计连续型资料的比较。
14.正交设计方差分析
(1)正交性:设{A,B} 分别是两个n阶拉丁方,记为{aij},{bij}(i, j=1,2,…,n)。
若n2 个有序对 {(aij, bij)} 都是不同的,则称拉丁方 A 与 B 是正交的。
(2)特点:①均衡性:同一列中各水平的重复次数相同。
②正交性:任两列之间各水平搭配均衡。
(3)表头设计:
记号含义:以 L9(34) 为例:
L:表示正交表
9:表示行数,即试验次数
3:表示因素的水平数;
4:表示列数,即至多安排的因素个数。
(4)一般步骤:
①明确试验目的、选定试验指标
②确定试验的因素、水平
③选用适当的正交表、作表头设计
④进行试验、取得数据
⑤分析数据、得出结论
15.McNemar检验与Kappa检验
(1)适用范围:方表资料(由行列变量属性相同的配对设计得到的配对四格表)
两组行列变量检测结果不一致时(副对角线,上下三角元素的差异)进行差异性检验,
选择McNemar检验或χ2检验。
两组行列变量检测结果一致时(主对角线元素差异)进行一致性检验,选择Kapp检验。
(2)McNemar检验
建立假设 H0:Xij≈Xji,即来自同一试验总体(两法检验结果相同)
H1:Xij≠Xji,即来自不同试验总体(两法检验结果不同)
检验结果:sig>α,接受H0,差异无统计学意义; sig<α,接受H1,差异有统计学意义。
(3)Kappa检验
用于检验两因素评估结果的实际一致率与随机一致率(理论一致率)是否有差异。
建立假设:H0:两结果检测不一致 Kappa=0
H1:两结果检测一致 Kappa=1
检验结果:Kappa越接近于1 (大于0.75),一致度越好;越接近于0(小于0.4),
一致度越差;Kappa为负,表示相反;等于-1,表示完全不一致。
word/media/image70.gif感谢观看!