概率论及数理统计笔记部分
发布时间:2018-06-12 21:00:56
发布时间:2018-06-12 21:00:56
第一章 概率论的基本概念
word/media/image1.gif
word/media/image2.gif
word/media/image3.gif
word/media/image4.gif
性质:word/media/image5.gif
确定性现象:在一定条件下必然发生的现象。
随机现象:在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象。
1 随机试验
1. 可以在相同的条件下重复的进行;
2. 每次试验的可能结果不止一个,并且事先明确试验的所有可能结果;
3. 进行一次实验之前不能确定哪一个结果会出现。
具有上述三个特点的试验称为随机试验。
2 样本空间、随机事件
(一)样本空间
我们将随机试验E的所有可能结果组成的集合称为E的样本空间,记为S.样本空间的元素,即E的每个结果,称为样本点。
(二)随机事件
试验E的样本空间S的子集为E的随机事件,简称事件。在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。由一个样本点组成的单点集,称为基本事件。
样本空间S包含所有的样本点,它是S自身的子集,在每次试验中它总是发生的,S称为必然事件。空集word/media/image6.gif为不可能事件。
(三)事件间的关系与事件的运算
1. word/media/image7.gif, 事件B包含事件A。事件A发生必然导致事件B发生。
2. word/media/image8.gif称为事件A与事件B 的和事件。
word/media/image9.gif
1. word/media/image10.gif称为事件A的积事件,当且仅当A,B同时发生时,事件发生,也记作AB。
word/media/image11.gif
1. word/media/image12.gif称为事件A与事件B的差事件。
2. word/media/image13.gif互不相容的,或互斥的。
3. word/media/image14.gif, 则称事件A与事件B互为逆事件。对立事件word/media/image15.gif.
定律:
word/media/image16.gif
word/media/image17.gif
word/media/image18.gif
word/media/image19.gif
word/media/image20.gif
word/media/image21.gif
3 频率与概率
word/media/image22.gif
4 等可能概型(古典概型)
∙ 试验的样本空间只包含有限个元素;
∙ 试验中的每个基本事件发生的可能性相同。
word/media/image23.gif
word/media/image24.gif
超几何分布的概率公式(设有N件产品,其中有D件次品,今从中任取n件,其中恰有k件次品的概率是多少):
word/media/image25.gif
实际推断原理:概率很小的事件在一次试验中实际上几乎是不发生的。
5 条件概率
word/media/image26.gif
word/media/image27.gif
全概率公式
word/media/image28.gif
贝叶斯公式Bayes
word/media/image29.gif
word/media/image30.gif
重要术语及主题:
随机试验 样本空间 随机事件 基本事件 概率 频率 古典概型 A的对立事件word/media/image31.gif及其概率 两个互不相容时间的和事件的概率 概率的加法定理 条件概率 概率的乘法公式 全概率公式 贝叶斯公式 事件的独立性 实际推断原理
第二章 随机变量及其分布
1 随机变量
定义:设随机试验的样本空间为word/media/image32.gif是定义在样本空间S上的实值单值函数。称word/media/image33.gif为随机变量。
一般,若L是一个实数集合,将X在L上取值写成word/media/image34.gif。它表示事件word/media/image35.gif,即B是由S中使得word/media/image36.gif的所有样本点e所组成的事件。
word/media/image37.gif
For example:
将一枚硬币抛掷三次,观察出现正面和反面的情况,样本空间是
word/media/image38.gif
以X记三次投掷得到正面H的总数,那么,对于样本空间S中的每一个样本点e,X都有一个数与之对应。X是定义在样本空间S上的一个实值单值函数。它的定义域是样本空间S,值域是实数集合word/media/image39.gif。其中X即为随机变量。
2 离散型随机变量及其分布律
三种重要的离散型随机变量。
设随机变量X只可能去0与1两个值,他的分布律是:
word/media/image40.gif
对于一个随机试验,如果word/media/image41.gif
word/media/image42.gif
设试验E只有两个可能结果:A及word/media/image31.gif,则称E为伯努利(Bernoulli)试验,设word/media/image43.gif,此时word/media/image44.gif。将E独立重复的进行n次,则称这一串重复的独立试验为n重伯努利试验。
word/media/image45.gif
我们称随机变量X服从参数为n,p的二项分布,并记为word/media/image46.gif。
特别,当n=1时二项分布化为:
word/media/image47.gif
这就是(0-1)分布。
设随机变量X所有可能取的值为0,1,2…,而取各个值得概率为
word/media/image48.gif
其中word/media/image49.gif是常数,则称X服从参数为word/media/image50.gif的泊松分布,记为word/media/image51.gif。
泊松定理: 设word/media/image49.gif是一个常数,n是任意正整数,设word/media/image52.gif,则对于任一固定的非负整数k,有
word/media/image53.gif
以上公式揭示了泊松分布与二项分布的关系。
设X是一个随机变量,x是任意实数,函数
word/media/image54.gif
称为X的分布函数。
对于任意实数word/media/image55.gif,有
word/media/image56.gif
如果对于随机变量X的分布函数word/media/image57.gif,存在非负函数word/media/image58.gif,使对于任意实数x有
word/media/image59.gif
则称X为连续型随机变量,其中函数word/media/image58.gif称为X的概率密度函数,简称概率密度。
概率密度的性质:
1. word/media/image60.gif
2. word/media/image61.gif
3. word/media/image62.gif
4. 若f(x)在点x处连续,则有word/media/image63.gif
(一) 均匀分布word/media/image64.gif
word/media/image65.gif
(二) 指数分布
word/media/image66.gif
有趣的性质(无记忆性):word/media/image67.gif
(三) 正态分布word/media/image68.gif
word/media/image69.gif
其中word/media/image70.gif为常数,则称X服从参数为word/media/image71.gif的正态分布或高斯分布。
性质:
1. 曲线关于word/media/image72.gif对称,这表明对于任意word/media/image73.gif有
word/media/image74.gif
2. 当word/media/image72.gif时取到的最大值
word/media/image75.gif
3. word/media/image76.gif改变形状, word/media/image77.gif改变x轴最大值的位置。
特别,当word/media/image78.gif时称随机变量X服从标准正态分布,其概率密度和分布函数为:
word/media/image79.gif
word/media/image80.gif
word/media/image81.gif
引理:若word/media/image83.gif,则word/media/image84.gif.
尽管正态变量的取值范围是word/media/image85.gif,但它的值落在word/media/image86.gif内几乎是肯定的事,这就是人们说的word/media/image87.gif法则。
为了便于以后再数理统计中的应用,对于标准正态随机变量,引入word/media/image88.gif分位点。
设word/media/image89.gif,若word/media/image90.gif满足条件:
word/media/image91.gif
则称点word/media/image90.gif为标准正态分布的上word/media/image92.gif分位点。
5 随机变量的函数的分布
定理: 设随机变量X具有概率密度word/media/image93.gif又设函数g(x)处处可导且恒有word/media/image94.gif则word/media/image95.gif是连续型随机变量,其概率密度为:
word/media/image96.gif
其中word/media/image97.gif
重要术语及主题:
随机变量 分布函数 离散型随机变量及其分布律 连续型随机变量及其概率密度 伯努利试验 (0-1)分布 n重伯努利试验 二项分布 泊松分布 指数分布 均匀分布 正态分布 随机变量函数的分布
第三章 多维随机变量及其分布
1 二维随机变量
一般,设E是一个随机试验,它的样本空间是word/media/image98.gif,设word/media/image99.gif是定义在S上的随机变量,由他们构成的一个向量word/media/image100.gif,叫做二维随机向量或二维随机变量。
定义 设word/media/image100.gif是二维随机变量,对于任意实数word/media/image101.gif二元函数:
word/media/image102.gif
称为二维随机变量word/media/image100.gif的分布函数,或称为随机变量X和Y的联合分布函数。
word/media/image103.gif
对于二维随机变量word/media/image100.gif的分布函数word/media/image104.gif,如果存在非负的函数word/media/image105.gif使对于任意word/media/image101.gif有
word/media/image106.gif
则称word/media/image100.gif是连续型的二维随机变量,函数word/media/image105.gif称为二维随机变量word/media/image100.gif的概率密度,或称为随机变量word/media/image100.gif的联合概率密度。
按定义,概率密度word/media/image105.gif具有以下性质:
1. word/media/image107.gif
2. word/media/image108.gif
3. 设G是xOy平面上的区域,点word/media/image109.gif落在G内的概率为word/media/image110.gif
4. 若word/media/image105.gif在点word/media/image111.gif连续,则有word/media/image112.gif
2 边缘分布
边缘分布函数:word/media/image113.gif
对于连续型随机变量word/media/image100.gif,设它的概率密度为word/media/image105.gif,由于
word/media/image114.gif
故关于X的边缘概率密度为:
word/media/image115.gif
二维正态分布的两个边缘分布都是一维正态分布,并且都不依赖于参数word/media/image116.gif。
3 条件分布
定义 设word/media/image100.gif是二维离散型随机变量,对于固定的j,若word/media/image117.gif,则称
word/media/image118.gif
为在word/media/image119.gif条件下随机变量X的条件分布律。
定义 设二维随机变量word/media/image100.gif的概率密度为word/media/image105.gif,word/media/image100.gif关于Y的边缘概率密度为word/media/image120.gif。若对于固定的y,word/media/image121.gif,则称word/media/image122.gif为在word/media/image123.gif的条件下X的条件概率密度,记为
word/media/image124.gif
word/media/image125.gif
4 相互独立的随机变量
定义 设word/media/image126.gif分别是二维随机变量word/media/image100.gif的分布函数及边缘分布函数,若对于所有word/media/image101.gif有
word/media/image127.gif
则称随机变量X和Y是相互独立的。
word/media/image128.gif
对于二维正态随机变量word/media/image100.gif,X和Y相互独立的充要条件是参数word/media/image129.gif。
定理 word/media/image130.gif
5 两个随机变量的函数的分布
(一) word/media/image131.gif的分布
设word/media/image100.gif是二维连续型随机变量,它具有概率密度word/media/image105.gif,则word/media/image131.gif仍为连续型随机变量,其概率密度为
word/media/image132.gif
word/media/image133.gif
或
又若X和Y相互独立,设word/media/image100.gif关于word/media/image134.gif的边缘密度分别为word/media/image135.gif,则(5.1),(5.2)分别为:
word/media/image136.gif
word/media/image137.gif
这两个公式称为word/media/image138.gif的卷积公式,记为word/media/image139.gif,即
word/media/image140.gif
有限个相互独立的正态随机变量的线性组合仍然服从正态分布。
若word/media/image141.gif相互独立,且word/media/image142.gif服从参数word/media/image143.gif的word/media/image144.gif分布,则word/media/image145.gif服从参数为word/media/image146.gif的word/media/image144.gif分布,这一性质称为word/media/image144.gif分布的可加性。
(二) word/media/image147.gif的分布
word/media/image148.gif
word/media/image149.gif
又若X和Y相互独立,则
word/media/image150.gif
word/media/image151.gif
(三) word/media/image152.gif的分布
设X和Y相互独立。
word/media/image153.gif
word/media/image154.gif
word/media/image155.gif
重要术语及主题
二维随机变量word/media/image100.gif word/media/image100.gif的分布函数 离散型随机变量word/media/image100.gif的分布律 连续型随机变量word/media/image100.gif的概率密度 离散型随机变量word/media/image100.gif的边缘分布律 连续型随机变量word/media/image100.gif的边缘分布律 条件分布函数 条件分布律 条件概率密度 两个随机变量word/media/image100.gif的独立性 word/media/image156.gifZ=XY的概率密度 word/media/image152.gif的概率密度
第四章 随机变量的数字特征
1 数学期望
定义 离散型随机变量X的数学期望word/media/image157.gif;连续型word/media/image158.gif
数学期望简称期望,又称为均值。
定理 设Y是随机变量X的函数word/media/image95.gif,则word/media/image159.gif.
定理的重要意义在于当我们求E(Y)时,不必算出Y的分布律或概率密度,而只需利用X的分布律或概率密度就可以啦。
2 方差
定义word/media/image160.gif
word/media/image161.gif。
word/media/image162.gif
word/media/image163.gif
word/media/image164.gif
重要性质:
1. 设C是常数,则word/media/image165.gif
2. word/media/image166.gif
3. word/media/image167.gif
4. word/media/image168.gif
定理(契比雪夫(Chebyshev)不等式) 设随机变量X具有数学期望word/media/image169.gif方差word/media/image170.gif,则对于任意正数word/media/image171.gif,不等式
word/media/image172.gif
契比雪夫不等式给出了在随机变量的分布未知,而只知道期望和方差的情况下估计概率的界限。
3 协方差及相关系数
定义word/media/image173.gif记为word/media/image174.gif相关系数为word/media/image175.gif
word/media/image176.gif
当word/media/image177.gif时,称X和Y不相关。
word/media/image178.gif不想关知识就线性关系来说的,而相互独立是就一般关系而言的。二维正态分布时,不相关与相互独立是等价的。
4 矩、协方差矩阵
定义 设X和Y是随机变量,
若word/media/image179.gif存在,称它为X的k阶原点矩,简称k阶矩。
若word/media/image180.gif存在,称它为X的k阶中心矩。
若word/media/image181.gif存在,称它为X和Y的k+l阶混合矩。
若word/media/image182.gif存在,称它为X和Y的k阶混合中心矩。
显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心距,协方差Cov(X,Y)是X和Y的二阶混合中心距。
二维随机变量word/media/image183.gif有四个二阶中心距(设它们都存在),分别记为:
word/media/image184.gif
word/media/image185.gif
word/media/image186.gif
word/media/image187.gif
将它们排成矩阵的形式
word/media/image188.gif
这个矩阵称为随机变量word/media/image183.gif的协方差矩阵。
设n维随机变量word/media/image189.gif的二阶混合中心矩
word/media/image190.gif
都存在,则称矩阵
word/media/image191.gif
为n维随机变量word/media/image189.gif的协方差矩阵。由于word/media/image192.gif,因而上述矩阵是一个对称矩阵。
对于n维正态随机变量word/media/image189.gif的情况。引入列矩阵
word/media/image193.gif
n维正态随机变量word/media/image189.gif的概率密度定义为
word/media/image194.gif
其中C是word/media/image189.gif的协方差矩阵。
重要性质:
1. n维正态随机变量word/media/image189.gif的每一个分量都是正态随机变量;反之,若n维正态随机变量word/media/image195.gif都是正态随机变量,且相互独立,则word/media/image189.gif是n维正态随机变量。
2. n维随机变量word/media/image189.gif服从n维正态分布的充要条件是word/media/image195.gif的任意的线性组合
word/media/image196.gif
服从一维正态分布(其中word/media/image197.gif)
3. 若word/media/image189.gif服从n维正态分布,设word/media/image198.gif是word/media/image199.gif的线性函数,则word/media/image200.gif也服从多维正态分布。
这一性质称为正态变量的线性变换不变性。
4. 设word/media/image189.gif服从n维正态分布,则word/media/image195.gif相互独立与量量不相关是等价的。
重要术语及主题
数学期望 随机变量函数的数学期望 数学期望的性质 方差 标准差 方差的性质 标准化的随机变量 协方差 相关系数 相关系数的性质 X,Y不相关 切比雪夫不等式 集中重要分布的数学期望和方差 矩 协方差矩阵
第五章 大数定律及中心极限定理
大数定律是叙述随机变量序列的前一些项的算术平均值在某种条件下收敛到这些项的均值的算术平均值;中心极限定理则是确定在什么条件下,大量随机变量之和的分布逼近与正态分布。
1 大数定律
弱大数定理(辛钦大数定理)设word/media/image201.gif是相互独立,服从同一分布的随机变量序列,且具有数学期望word/media/image202.gif,作前n个变量的算数平均word/media/image203.gif,则对于任意word/media/image204.gif,有
word/media/image205.gif
又可叙述为设word/media/image201.gif是相互独立,服从同一分布的随机变量序列,且具有数学期望word/media/image202.gif,则序列word/media/image206.gif以概率收敛于word/media/image77.gif,即word/media/image207.gif。
伯努利大数定理 设word/media/image208.gif是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数 word/media/image204.gif,有
word/media/image209.gif
word/media/image210.gif
2 中心极限定理
定理一(独立同分布的中心极限定理) 设随机变量word/media/image211.gif相互独立,服从同一分布,且具有数学期望和方差:word/media/image212.gif则随机变量之和word/media/image213.gif的标准化变量:
word/media/image214.gif
的分布函数word/media/image215.gif对于任意x满足
word/media/image216.gif
这就是说当n充分大时,有
word/media/image217.gif
word/media/image218.gif
这就是说,当n充分大时近似地服从均值为word/media/image77.gif,方差为word/media/image219.gif的正态分布,这一结果是数理统计中大样本统计推断的基础。
定理二(李雅普诺夫(Lyapunov)定理)设随机变量word/media/image211.gif相互独立,它们具有数学期望和方差
word/media/image220.gif
word/media/image221.gif
若存在正数word/media/image222.gif,使得当word/media/image223.gif时,
word/media/image224.gif
则随机变量之和word/media/image213.gif的标准化变量
word/media/image225.gif
的分布函数word/media/image215.gif对于任意x满足
word/media/image226.gif
定理二表明,在定理的条件下,随机变量
word/media/image227.gif
当n很大时,近似地服从正态分布N(0,1)。这就是说,无论各个随机变量服从什么分布,只要满足定理条件,那么他们的和当n很大时,就近似地服从正态分布。
定理三(棣莫佛-拉普拉斯(De Moivre-Laplace)定理) 设随机变量word/media/image228.gif服从参数为word/media/image229.gif的二项分布,则对于任意x,有
word/media/image230.gif
这个定理表明,正态分布是二项分布的极限分布。当n充分大时,我们可以利用(2.5)式来计算二项分布的概率。
重要术语及主题
依概率收敛 伯努利大数定理 辛钦大数定理 独立同分布的中心极限定理 李雅普诺夫中心极限定理 棣莫弗-拉普拉斯中心极限定理
第六章 样本及抽样分布
数理统计的内容包括:如何收集、整理数据资料;如何对所得的数据资料进行分析、研究,从而所研究的对象性质、特点作出推断。
1 随机样本
我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目也不一定是有限的,每一个可能观察值称为个体。总体中所包含的个体的个数称为总体的容量。容量为有限的称为有限总体,容量为无限的称为无限总体。有些有限总体容量很大可以看成无限总体。一个总体对应于一个随机变量X。
定义 设X是具有分布函数F的随机变量,则称word/media/image231.gif是具有同一分布函数F的、相互独立的随机变量,则称word/media/image231.gif为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的观察值word/media/image232.gif称为样本值,又称为X的n个独立的观察值。
2 直方图和箱线图
频率直方图:
定义 设有容量n的样本观察值word/media/image232.gif,样本p分位数word/media/image234.gif,它具有以下性质:1至少有np个观察值小于或等于word/media/image235.gif;2至少word/media/image236.gif个观察值大于或等于word/media/image235.gif。
当word/media/image237.gif时,0.5分位数word/media/image238.gif也记为word/media/image239.gif,称为样本中位数。0.25分位数称为第一四分位数;0.75分位数记为第三四分位数。
箱线图特别适用于比较两个或两个以上数据集的性质。在数据集中某一个观察值不寻常的大于或小于该数据集中的其他数据,称为疑似异常值。
第一四分位数与第三四分位数之间的距离:word/media/image241.gif,称为四分位数间距。若数据小于word/media/image242.gif,就认为它是疑似异常值。
3 抽样分布
样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是不针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断。
定义 设word/media/image231.gif是来自总体X的一个样本,word/media/image243.gif是word/media/image231.gif的函数,若g中不含未知参数,则称word/media/image243.gif是一统计量。
样本平均值
word/media/image244.gif
样本方差
word/media/image245.gif
样本标准差
word/media/image246.gif
样本k阶(原点)矩
word/media/image247.gif
样本k阶中心矩
word/media/image248.gif
经验分布函数 我们还可以作出与总体分布函数word/media/image57.gif相应的统计量——经验分布函数。它的作法如下:设word/media/image231.gif是总体F的一个样本,用word/media/image249.gif表示word/media/image231.gif中不大于x的随机变量的个数。定义经验分布函数word/media/image215.gif:
word/media/image250.gif
统计量的分布称为抽样分布。
1. word/media/image251.gif分布
设word/media/image231.gif是来自总体N(0,1)的样本,则称统计量
word/media/image252.gif
服从自由度为n的word/media/image253.gif分布,记为word/media/image254.gif。此处自由度是指(3.1)式有段包含独立变量的个数。
word/media/image255.gif分布的概率密度为
word/media/image256.gif
word/media/image257.gif
word/media/image258.gif
word/media/image259.gif
word/media/image253.gif分布的分位点 对于跟定的正数a,0
word/media/image261.gif
的点word/media/image262.gif为word/media/image263.gif
费希尔(R.A.Fisher)证明,当n充分大时,近似地有
word/media/image264.gif
其中word/media/image265.gif是标准正态分布的上a分位点。
2. t分布
设word/media/image266.gif,且X,Y相互独立,则称随机变量
word/media/image267.gif
服从自由度为n的t分布,记为word/media/image268.gif。
t分布又称学生(Student)氏分布。t(n)的概率密度函数为
word/media/image269.gif
在n>45时,对于常用的a的值,就用正态近似word/media/image271.gif。
3. F分布
设word/media/image272.gif,且U,V相互独立,则称随机变量
word/media/image273.gif
服从自由度为word/media/image274.gif的F分布,记为word/media/image275.gif。
word/media/image276.gif分布的概率密度为
word/media/image277.gif
重要性质:word/media/image279.gif
4. 正态总体的样本均值与样本方差的分布
定理一 设word/media/image231.gif是来自正态总体word/media/image280.gif的样本,word/media/image281.gif是样本均值,则有
word/media/image282.gif
定理二 设word/media/image231.gif是来自正态总体word/media/image280.gif的样本,word/media/image283.gif是样本均值和样本方差,则有
word/media/image284.gif
定理三 设word/media/image231.gif是来自正态总体word/media/image280.gif的样本,word/media/image283.gif是样本均值和样本方差,则有
word/media/image285.gif
重要术语及主题
总体 简单随机样本 统计量 word/media/image287.gif分布、t分布、F分布的定义及它们的密度函数图形轮廓上a分位点 word/media/image279.gif 小结中关于样本均值、样本方差的重要结果
第七章 参数估计
1 点估计
设总体X的分布函数word/media/image288.gif的形式为已知,word/media/image289.gif是待估参数。word/media/image231.gif是X的一个样本word/media/image232.gif是相应的一个样本值。点估计问题就是要构造一个适当的统计量word/media/image290.gif作为未知参数word/media/image289.gif的近似值。我们称word/media/image290.gif为word/media/image289.gif的估计量,称word/media/image290.gif为word/media/image289.gif的估计值。在不致混淆的情况下统称估计量和估计值为估计,并简记为word/media/image291.gif。
1. 矩估计法
一般可通过计算期望和方差可得出结果。word/media/image292.gif
2. 最大似然估计法
若总体X属离散型,其分布律word/media/image293.gif的形式为已知,word/media/image294.gif为待估参数,word/media/image295.gif是word/media/image294.gif可能取值的范围。设word/media/image231.gif是来自X的样本,则word/media/image231.gif的联合分布律为
word/media/image296.gif
又设word/media/image232.gif是相应于样本word/media/image231.gif的一个样本值。易知样本word/media/image231.gif取到观察值word/media/image232.gif的概率,亦即事件word/media/image297.gif发生的概率为
word/media/image298.gif
这一概率随word/media/image294.gif的取值而变化,它是word/media/image294.gif的函数,Lword/media/image299.gif称为样本的似然函数(注意,这里word/media/image232.gif是已知的样本值,它们是常数)。取word/media/image291.gif使
word/media/image300.gif
这样得到的word/media/image291.gif与样本值word/media/image232.gif有关,常记为word/media/image301.gif,称为参数word/media/image294.gif的最大似然估计值,而相应的统计量word/media/image302.gif称为参数word/media/image294.gif的最大似然估计量。
若参数word/media/image294.gif可微,这是word/media/image291.gif可从方程
word/media/image303.gif
解得。又因word/media/image304.gif与word/media/image305.gif在同一word/media/image294.gif处取到极值,因此,word/media/image294.gif的最大似然估计word/media/image294.gif也可以从方程
word/media/image306.gif
求得,而从后一方程求解往往比较方便。(1.6)称为对数似然方程。
最大似然估计法也适用于分布中含多个未知参数word/media/image307.gif的情况,这时,似然函数L是这些未知参数的函数。分别令
word/media/image308.gif
word/media/image309.gif
对数似然方程(1.6)或(1.7)除了一些简单情况外,往往没有有限函数形式的解,这既需要用数值方法求近似解。常用的算法是牛顿拉佛森(Newton-Raphson)算法。
2 基于截尾样本的最大似然估计
定时截尾样本:在固定时间内共有m个产品失效,m是一个随机变量。
定数截尾样本:在达到m个产品失效,其中word/media/image310.gif是随机变量。
3 估计量的评选标准
1. 无偏性
若估计量word/media/image311.gif的数学期望word/media/image312.gif存在,且对于任意word/media/image313.gif有
word/media/image314.gif
则称word/media/image315.gif是word/media/image294.gif的无偏估计量。word/media/image316.gif称为系统误差。无偏估计的实际意义就是无系统误差。
2. 有效性
设word/media/image317.gif与word/media/image318.gif都是word/media/image294.gif的无偏估计量,若对于任意word/media/image313.gif有
word/media/image319.gif
且至少对于某一个word/media/image313.gif上式中的不等号成立,则称word/media/image320.gif有效。
3. 相合性
设word/media/image311.gif为参数word/media/image294.gif的估计量,若对于任意word/media/image313.gif,当word/media/image223.gif时word/media/image302.gif依概率收敛于word/media/image294.gif,则称word/media/image315.gif是word/media/image294.gif的相合估计量。
即,若对于任意word/media/image313.gif都满足:对于任意word/media/image321.gif
word/media/image322.gif
则称word/media/image315.gif是word/media/image294.gif的相合估计量。
4 区间估计
置信区间 设总体X的分布函数word/media/image288.gif含有一个未知参数word/media/image323.gif,对于给定值word/media/image324.gif,若由来自X的样本word/media/image231.gif确定的两个统计量word/media/image325.gif和word/media/image326.gif,对于任意word/media/image313.gif满足
word/media/image327.gif
则称随机区间word/media/image328.gif是word/media/image294.gif的置信水平为word/media/image329.gif的置信区间,word/media/image330.gif和word/media/image331.gif分别称为置信水平在word/media/image329.gif的双侧置信区间的置信下限和置信上限,word/media/image329.gif称为置信水平。
5 正态总体均值与反差的区间估计
6 (0-1)分布参数的区间估计
7 单侧置信区间
重要术语及主题
矩估计量 最大似然估计量 估计量的评选标准:无偏性、有效性、相合性
参数word/media/image294.gif的置信水平为为word/media/image329.gif的置信区间
word/media/image332.tiff
第八章 假设检验
1 假设检验
显著性水平word/media/image88.gif,检验统计量word/media/image333.gif
在显著性水平word/media/image88.gif下,针对word/media/image334.gif检验word/media/image335.gif:word/media/image336.gif。word/media/image335.gif称为原假设或零假设,word/media/image334.gif称为备择假设。
当检验统计量取某个区域C中的值时,我们拒绝原假设word/media/image335.gif,则称区域C为拒绝域,拒绝域的边界点称为临界点。
第word/media/image337.gif类错误:在假设word/media/image335.gif实际上为真时,我们可能犯拒绝word/media/image335.gif的错误。
第word/media/image338.gif类错误:word/media/image335.gif实际上不真时,我们也有可能接受word/media/image335.gif。
显著性检验 双边备择假设 双边假设检验 右边检验 左边检验 单边检验
2 正态总体均值的假设检验
(一) 单个总体word/media/image280.gif均值word/media/image77.gif的检验
1. word/media/image339.gif已知,关于word/media/image340.gif的检验(Z检验)
2. word/media/image339.gif未知,关于word/media/image340.gif的检验(t检验)
(二) 两个正态总体均值差的检验(t检验)
(三) 基于成对数据的检验(t检验)
3 正态总体方差的假设检验
4 置信区间与假设检验之间的关系
5 样本容量的选取
6 分布拟合检验
7 秩和检验
8 假设检验问题的p值检验法
第九章 方差分析及回归分析
1 单因素试验的方差分析
在试验中,我们将要考察的指标称为试验指标。影响试验指标的条件为因素。因素可分为两类,一类是人们可以控制的,一类是人们不能控制的。因素所处的状态称为该因素的水平。如果在一项试验的过程中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验。
3 一元线性回归
回归分析是研究相关关系的一种数学工具,它能帮助我们从一个变量取得的值去估计另一变量所取的值。
第十章 bootstrap方法
1 非参数bootstrap方法
设总体的分布F未知,但已经有一个容量为n的来自分布F的数据样本,自这一样本按放回抽样的方法抽取一个容量为n的样本,这种样本称为bootstrap样本或称为自助样本。相继的、独立的自原始样本中取很多个bootstrap样本,利用这些样本对总体F进行统计推断,这种方法称为非参数bootstrap方法,又称自助法。这一方法可以用于当人们对总体知之甚少的情况。
(一) 估计量的标准差的bootstrap估计
估计量word/media/image291.gif的标准差word/media/image341.gif也称估计量word/media/image291.gif的标准误差。
(二) 估计量的均方误差及偏差的bootstrap估计
(三) Bootstrap置信区间
(四) 用bootstrap-t法求均值word/media/image77.gif的bootstrap的置信区间
2 参数bootstrap方法
第十一章 在数理统计中应用Excel软件
第十二章 随机过程及其统计描述
1 随机过程的概念
设T是一无限实数集,我们把依赖于参数word/media/image342.gif的一族(无限多个)随机变量称为随机过程,记为word/media/image343.gif,这里对每一个word/media/image342.gif,word/media/image344.gif是一随机变量,T叫做参数集。我们常把t看作为时间,称word/media/image344.gif为时刻t时过程的状态,而word/media/image345.gif说成是word/media/image346.gif时过程处于状态x。对于一切word/media/image342.gif,word/media/image344.gif所有可能取得一切值得全体称为随机过程的状态空间。
对随机过程word/media/image343.gif进行一次实验(即在T上进行一次全程观测),其结果是t的函数,记为word/media/image347.gif,称它为随机过程的一个样本函数或样本曲线。所有不同的试验结果构成一族(可以只包含有限个结果)样本函数。
随机过程可以看作是多维随机变量的延伸,随机过程与其样本函数的关系就像数理统计中总体和样本的关系一样。
2 随机过程的统计描述
(一) 随机过程的分布函数族
给定随机过程word/media/image343.gif,对于每一个固定的word/media/image342.gif,随机变量word/media/image344.gif的分布函数一般与t有关,记为
word/media/image348.gif
称它为随机过程word/media/image343.gif的一维分布函数,而word/media/image349.gif称为一维分布函数族。
N维分布函数族
word/media/image350.gif
柯尔莫哥洛夫定理:有限维分布函数族,即word/media/image351.gif,完全的确定了随机过程的统计特性。
(二) 随机过程的数字特征
均值函数:word/media/image352.gif。注意,word/media/image353.gif是随机过程的所有样本函数在时刻t的函数值的平均值,通常称这种平均为集平均或统计平均。
word/media/image353.gif表示了随机过程word/media/image344.gif在各个时刻的摆动中心。
均方值函数:word/media/image354.gif
方差函数:word/media/image355.gif
方差函数的算术平方根word/media/image356.gif称为随机过程的标准差函数。
自相关函数,相关函数:word/media/image357.gif
自协方差函数,协方差函数:word/media/image358.gif
如果对每一个word/media/image342.gif,随机过程word/media/image343.gif的二阶矩word/media/image359.gif都存在,则称它为二阶矩过程。
(三) 二维随机过程的分布函数和数字特征
设word/media/image360.gif是依赖于同一参数word/media/image342.gif的随机过程,对于不同的word/media/image342.gif,word/media/image361.gif是不同的二维随机变量,我们称word/media/image362.gif为二维随机过程。
N+m维分布函数,n+m维联合分布函数。
3 泊松过程及维纳过程
第十三章 马尔科夫链
1 马尔科夫过程及其概率分布