实验数据的处理分析剖析

发布时间:2018-10-18 01:14:40

实验数据的处理方法

【摘要】物理学是一门实验的科学,物理学中的新概念、新规律的发现都依赖于反复的实验。而处理实验数据时,需选择适当的实验数据处理方法,才能较准确、客观的反映实验结果,减小误差。本文介绍了实验数据处理中涉及到的一些基本概念,重点综述了物理实验中常用的数据处理方法。并指出了各自适用的条件及优缺点。

【关键词】 误差;数据处理;作图法;最小二乘法;逐差法

AbstractPhysics is an experimental science, New concepts in physics, the discovery of new rules rely on trial and error, The experimental data processingNeed to select the appropriate treatment of the experimental dataTo more accurately reflect the objective resultsReduce errors. This article describes the experimental data processing involved in some of the basic concepts Summary of experiments focused on the physical data processing methods commonly used. And pointed out the advantages and disadvantages of each applicable condition.

Keywords: Error; Data ProcessingMappingLeast squaresBy subtraction

【引言】 数据处理是指由实验测得的数据, 必须经过科学的分析和处理, 才能揭示出各物理量之间的关系。我们把从获得原始数据起到得出结论为止的加工过程称为数据处理。正确的处理实验记录的数据,对我们科学的了解被测量或研究对象的客观规律,选择恰当的实验数据处理方法,最大限度的减小误差让实验数据无限接近理想条件下的结果,这是实验数据处理的意义所在。在这方面研究的文献有很多,例如费业泰的《误差理论与数据处理》等。要对实验结果进行分析,根据不同的实验方法,我们可以采用不同的数据处理方法,常用的有作图法、最小二乘法、逐差法等。本文将分别对这些方法进行了介绍。

一、实验数据处理中涉及到的基本概念

对实验结果进行半定量分析,需要借助许多评价参量,这里涉及到许多表征实验数据好坏及数据离散程度的基本概念,特别是描述处理后数据的可靠性的参量,尤其具有重要意义。以下将对一些重要概念进行介绍。

1 .真值及约定真值

真值有多种定义,如被测量本身所具有的真实大小称为真值。[1]如果实验已消除系统误差,只存在偶然误差。则无穷多个观测值得平均值,就是被测物体的真值。[2]正在研究某量时所处的条件下严格的确定的量值。[3]由此可见,真值是客观存在的,但也还是一个理想的概念,通常是不可确切知道的。

约定真值被认为是非常接近真真值的,它们之间的差别可忽略不计,无系统误差条件下的算术平均值、标称值、校准值、理论值、公认值等均可作为约定真值来使用。

2.影响量和干扰量

影响量不是测量的对象,但却影响被测量的量值或仪器示值,它通常是一种与待测的量有一定函数关系的另一种性质的量[9]。例如在测量电阻时,由于多数材料的电阻随温度改变,因此在测量电阻时温度在影响着电阻值的测量结果,但它却不是测量对象,所以温度就是电阻测量中的影响量。影响量在测量结果中带来的影响可以在测出影响量的大小后,按其函数关系从测量结果中加以消除。

干扰量是一种与待测的量没有必然联系的外界强行渗入量。例如拍摄全息照片时外界的振动,探测器的噪声,都会影响测量工作造成干扰,这样的一些量称为干扰量[9]。为了保证测量的准确度,在安排测量条件时,要消除影响量和最大限度减小干扰量。

3.精度

反映测量结果与真实结果接近程度的量,称为精度,它与误差的大小相对应,因此可用误差的大小来表示精度的高低,误差小则精度高,误差大则精度高低。

精密度:它反映测量结果中随机误差的影响程度

准确度:它反映测量结果中系统误差的影响程度

精确度:它反映测量结果中系统误差和随机误差综合的影响程度,其定量特征可用测量的不确定度(或极限误差)来表示。[4]用一种打靶的例子,可以更好的理解和掌握,如下图:

a)精密度高、准确度低 b)准确度高、精密度低 c)精确度高

4.误差

测量值减去真值为测量值的误差,即:

测量值-真值=误差

上述误差亦称绝对误差,假设测量值为x,真值为a,误差为,则有误差=x-a

a的比值=/a称为相对误差。对误差的来源可以概括为四个方面[4]1测量装置误差,这里面分三个方面来说,a,标准量具误差:以固定形式复现标准量具的器具,如标准量块、标准先问吃、标准电池、标准电阻、标准砝码等,它们本身体现的量值,不可避免的都还有误差。b,仪器误差:凡用来直接或间接将被测量和已知量进行比较的仪器设备,称为仪器或仪表,如天平、压力表、温度计等,它们本身都具有误差。c,附件误差:仪器的附件及附属工具,如测长仪的标准环规,千分尺的调整量棒等的误差,也会引起测量误差。2,环境误差:由于各种环境因素与规定的标准状态不一致而引起的测量装置和被测量本身的变化所造成的误差,如温度、适度、气压、振动、照明、重力加速度等所引起的误差。通常仪器仪表在规定的正常工作条件所具有用的误差,而超出此条件时所增加的误差称为附加误差。3,方法误差:由于测量方法不完善所引起的误差,如测量一个轴的直径,因近似数取值的不同,将会引起误差。4,人员误差:由于测量者受分辨能力的限制或是崛起变的生理变化,固有习惯引起的读数误差,以及实验室的疏忽等所引起的误差。总之,在计算测量结果的精度时,对上述四个方面的误差来源,必须进行全面的分析,力求不遗漏,不重复,特别是对误差影响较大的哪些因素。

4.1 系统误差

先看两个例子[51)用一个2.50—1A的安培计测一回路的电流强的I0.73A,而用另一个0.50—1A的安培计测同一回路电流为0.716A;2)用一天平称一物体的质量,物体在左盘,砝码在右盘,平衡时测量值为74.2519g,物体与砝码交换后则为74.2501g;(1)是由于仪器自身误差的问题,(2)是由于天平左右臂长不完全相等引入的系统误差,可将物体放在天平左、右盘上各称一次取平均值去消除。

上述各项测量值的差异在重复测量时依然不变,这表示其误差的符号和大小是恒定的,此类误差称为系统误差。对系统误差的研究主要是:

(1) 探索系统误差的来源,设计实验方案消除或消减该项误差。

(2) 估计残存系统误差的可能的范围。[5]

4.2偶然误差

在同一条件下,对同一物理量进行重复测量,各次测量值一般不完全相同,这是由于测量时存在的偶然误差。一个测得值的偶然误差是多项偶然因素综合作用的结果,在测量前不能得知测得值将偏大或偏小。

这里以测单摆周期的实验为例:用手控制数字毫秒计,测量一摆的周期共100次,测量值的大小变化不定,似乎没有规律,其实这种偶然现象服从统计规律。现将测得值分布的区域分为9个区间,统计各区间内测量的个数,以测量值为横坐标, /N为纵坐标(N为总数)作统计直方图,图2[5]是一次实验的结果。从图上可以看出,比较多的测量值集中在分布区域的中部,而区域的左右两半的测量值个数都接近一半,由此可以设想被测量的真值就在数据比较集中的部分。

在上述测量之后,用光电门控制一台数字毫秒计去测同一个摆的周期,测10次,测量值分布在1.866s1.868s的小区域中,由于此时的偶然误差显著小于前者,可将光电控制测量的平均值作为手控测量的近真值,对于测量值的偶然误差作如下的统计,取=1.8670s,则

-<0ε0 48%

-0ε>0 52%

多次测量均有同上相似的结果,因而得出如下几点认识:

(1) 每次测量的偶然误差是不确定的。

(2) 出现正号或负号偶然误差的机会相近。

(3) 出现绝对值小的偶然误差的机会多一些。

5 .算术平均值与标准偏差

5.1 算术平均值

n次测量值…,的误差为,真值为a,则

(-a)+( -a)+…+(-a)= ++…+

将上式展开整理后,两侧除以n,得

(++…+)-a= (++…+)

它表示算术平均值的误差,等于各测量值误差的平均值,假如各测量值的误差只是偶然误差,而偶然误差有正有负,相加时可抵消一些,所以n越大,算术平均值越接近真值。因此可以用算术平均值作为被测量真值的最佳估计值。

又当测量值的误差中包含有已知的系统误差,则相加时它们不能抵消,这时应当用算术平均值加上修正值为被测量真值的最佳估计值(修正值与系统误差绝对值相同,符号相反)。

5.2 标准偏差

具有偶然误差的测量值将是分散的,对分散的情况的定量表示用标准偏差s,它的定义是为 s=

n为测量值个数。例,比如有如下两组数值:

两组数值都在2.13.7之间,平均值都是2.9,计算标准偏差为=0.497≈0.50

=0.557≈0.56,可以看出A组数比较像中间集中,B组数则稍差,表现除它们分散上的差异。

6.有效数字

在做实验时总要记录很多的数据,并对数据进行计算或处理,但在记录时应取几位,计算后应保留几位,这是实验数据处理的重要问题,必须有一个明确的认识。实验时处理的数值,应能反应出被测量的实际大小的数值,即记录与运算后保留的应为能传递出被测量实际大小信息的全部数字,这样的数字称为有效数字。例如用一最小分度1mm的尺,测得一物体的长度为7.62cm,其中76是准确度出来的,最后一位数字2是估读的,并且仪器本身也将在这一位出现误差,即这一位不一定是2,只是近似的,但是还是一位有效数字。在实际取舍时按照实验条件以及题目要求为参考。

使用有效数字规则时的注意事项:[5]1)物理公式中的有些数值,不是实验测量值。例如,测量圆柱体的直径d和长度l求体积V的公式中的不是测量值,在确定V的有效数字位数时不必考虑的位数。(2)对数运算时,首数不算有效数字。(3)首位数是89m位数值在乘除运算中,计算有效数字时,可多算一位。(4)有多个数值参加运算时,在运算中途应比按有效数字运算规则规定的多保留一位,以防止由于多次取舍引入计算误差,但运算最后仍应舍去。(4)数值的修约规则:开始要舍去的第一位数是1234时就舍去;是6789时在舍去时进1要舍去的一位是5,而保留的最后一位是奇数,则舍去51,是偶数则舍去5不进位,但是5的下一位不是0是仍然要进位。[5]

二、物理实验中常用的数据处理与分析方法

实验数据处理的方法有很多,对不同的实验记录数据要选择不一样的数据处理方法,以下介绍几种常用的实验数据处理方法,并最后对各自的优缺点进行总结。

1. 列表法

把数据按一定规律列成表格,可使物理量之间的一一对应关系简明、醒目,也有助于发现实验中的规律。列表时应注意:(1)表格设计合理、简单明了,便于观察。(2)各栏目中均应注明物理量的名称和单位。(3)各量排列顺序尽量与测量数据顺序一致,用有效数字填写。特殊需要可以采用其他规律[7]。这种方法在实验室常用到,如果将实验要记录的数据在表格中一一罗列出来,这样清晰明了,在处理数据是一目了然。如表[2]

2. 分组计算法

设变量xy间存在y=a+bx的直线关系,由于测量存在误差,对n次测量有

式中表示测量误差。现在将n组测量分为前后两部分,从中取对应的两组:

略去误差项,解出ab的近似值:

这样可的,再求。如n为奇数,中间数可公用。

3.最小二乘法[5]

假设变量xy间存在直线关系y=a+bx,参量ab分别为y轴截距和斜率,当将测量值带入此式时,由于存在测量误差,引入误差项后有 ,对n次测量,可有

由于n个方程中有n+2个未知数,所以不能从解联立方程组求出ab值。设y为等精度测量值,最小二乘法原理指出,满足极小值条件下求出的参量ab之值为最佳拟合值,即从 解此联立方程组,得

则由,又可得出

为了反映变量x、y间的线性关系的密切程度,常用关联系数r来描述,其估算式为

从理论上讲,r>0就应该承认xy之间存在一定的相关关系,但是由于值是从较少的数据中求出的,根据数理统计理论,对于一定的n值,要在大于某一临界值时,才可以认为存在线性相关关系。下表给出了各n值的值。

可以证明参量的标准偏差y的标准偏差之间的关系为

结合二式,

4 . 作图法

研究两个变量的关系就是用曲线或函数式将二个变量的联系变现出来。那么首先在这里先介绍实验图线的描绘。常用直角坐标纸为方格纸,制图线时需注意的问题:

(1)标的横轴为自变量,纵轴为因变量。一般是以被测量为变量,但有时为了使获得的图线是一条直线,而将被测量做某种变换后的数值做变量。这种变换不仅是由于直线便于描绘,更重要的是直线的斜率和截距所包涵的物理内容是我们所需要的。

(2)标的原点,不一定要和变量的零点一致,若变量x的变化范围是从ab,则将坐标原点在取在a的附近即可。因为有时ax的零点很远,如果将原点取在x的零点出,则坐标纸上将出现很大的空白区域,白白浪费了坐标纸。

(3)标轴的分度要和测量的有效数字位数对应,坐标纸的一小格表

示为被测量的最后一位的一个单位、两个单位或五个单位比较好,要避免用一小格表示三、七或九个单位。因为那样不仅坐标点和读数都不方便,也容易出现错误。

(4)y轴二变量的变化范围(a—b)(c—d),表现在坐标纸上的长

度应该相差不大,最多也不要长过一倍。注明xy轴代表的测定量及单位,按测量数据标出坐标点。

4.1在我们讨论变量间的函数关系,这类问题有两种不同的情况:

1)已知两个变量函数关系的形式,但是其中有位置参量;

如果两个变量xy之间是直线关系,即 y=a+bx 则可用n组测量值

作图,所得直线的截距即参量a,斜率是参量b。但是实验中两个变量的关系往往不是直线,例如,弹簧振子的振动周期T和所负载m的关系为 式中为弹簧自身的重量,ck是待定参量。测量不同m对应的T,可以作T—m图线,图3为一例。由于它是曲线,因而无法从图上得出待定参量值。改换变量,将函数关系转变为直线关系,对此周其公式可以改成 ,他表示m间为直线关系,作--m直线(图4),从图上求出截距a,斜率b,则a= b= 由此可求出kc值。即对于非线性函数,要通过变换变量使之成为线性函数,再用作图法求出截距和斜率,进而确定待定参量。

非线性函数如何变换要看函数的形式,例如:

word/media/image82_1.png

上列式中的括号[]为变换后的变量。

2)两个变量函数关系的形式尚未知时

首先用测量值作图,如果得一直线,则从图上求出截距和斜率,函数关系就完全确定了;当得到的是曲线时,就要分析曲线的形式,参照已知的函数曲线,给出假定的函数式,再用上述(1)中处理非线性函数的方法,使之线性化,但这样做不一定一次就成功,可能要反复几次才可得出较好的结果[4]

通过电阻伏安特性研究的实验为例,对作图法和最小二乘法进行比较,其公式为,式中U为电压,I为电流,R微电阻,测量数据见表4,用所测量的结果画图如图(5)。

在直线上取两点,A0.600,0.223)、B1.500,0.553,利用作图法进行处理,求得斜率,求值的标准偏差,由于=0.367,所以作图法拟合直线为I=0.367U,将表4中的U代入得表5

I的偏差的标准偏差

下面再估算读取数据时产生的误差.由于坐标纸最小分格之间人眼无法辨别具体数据,因此存在视觉误差

推出:,假设每次读取的误差相同,且为坐标纸最小分格的一半则=0.005 =0.0025代入数据得:

可见作图法在图上读取数据时的误差是较大的。若坐标分度值取得不当,求斜率时,从直线上取的两点距离较近的话,产生的误差就更大。

利用最小二乘法处理数据,求斜率值,由=1.0736 =1.2356 =1.1526 =0.395 =0.4546 =0.424,得:

。求值的标准偏差,由=0.37得到最小二乘法拟合曲线为I=0.37U,将表4中的U代入的表6

6 数据列表

I的偏差

的偏差

小结: =0.3670.01 =0.3670.007,即最小二乘法拟合的直线较精确。

5 .逐差法

逐差法是为了减小系统误差,而在实验数据处理当中常用的一种方法。当实验中的两个物理量满足正比例关系时,依次记录改变相同的量时的值、或者某一研究对象随实验条件周期性变化时,依次记录研究对象达到某一条件(如峰值﹑固定相位等)时的值、逐项逐差再求平均[8]。但是实验数据的个数却对逐差法有着影响,是偶数对数据(n=2m)时,我们会很容易地算出斜率;当是奇数对数据(n=2q-1)时需要将中间数据对(n=q)舍弃,例如11对数据(n=11,q=6,m=n/2=5.5)应将第对6数据舍弃,当然也可以舍弃第一对数据或最后一对数据,这样可以减小误差。这样做可以充分利用数据,具有对实验数据取平均和减少随机误差的效果。另外,还可以对实验数据进行逐次相减,这样可验证被测量之间的函数关系,及时发现数据差错或数据规律。

总结:

本文阐述了物理实验中一些常用的概念,实验数据的处理方法。着重讲述了

列表法、作图法、最小二乘、逐差法。结果表明列表法只显示出物理量之间的对应关系;作图法可把一系列数据之间的关系或其变化情况直观地表示出来。作图法是研究物理量之间的变化规律,找出对应的函数关系,求出经验公式的最常用方法之一。作图法有多次测量取平均的效果,并易于发现测量中的错误,还可以把复杂的函数关系简化;用作图法处理数据虽有许多优点,但它是一种粗略的数据处理方法。不同的人,用同一组数据作图,由于在拟合直线(或曲线)时,有一定的主观随意性,因而拟合出的直线(或曲线)往往是不一样的。由一组实验数据找出一条最佳的拟合直线(或曲线),更严格的方法是最小二乘法;逐差法也是一种常用的数据处理方法,特别是当自变量与因变量成线性关系,而自变量为等间距变化时,用逐差法处理更具有独特的优点。

【致谢】 在本次论文的的选题、准备、写作过程中得到了尹跃洪老师的细心指导和热情鼓励,这篇论文中他倾注了很多的心血和汗水,老师严谨的治学态度让我受益匪浅,在这里由衷的感谢尹老师对我的帮助。衷心地感谢在百忙之中评阅论文和参加答辩的各位老师、教授。

【参考文献】

[1] 金麟孙.仪器计量误差理论[M].上海科技出版社,1983.12-15

[2] 李惕碚.实验的数学处理[M].科学出版社,1981

[3] BIPM-IEC-ISO-OIML.国际通用计量学基本名词.中国计量出版社,1984

[4] 费业泰.误差理论与数据处理-5[M].北京.机械工业出版社,2004.3-6

[5] 杨述武.普通物理实验-3版力学及热学部分[M].北京.高等教育出版社,2000.5-19

[6] 杨述武.普通物理实验-3版电磁学部分部分[M].北京.高等教育出版社,2000.5-12

[7] 滕敏康.实验误差与数据处理[M].南京大学出版社,1989.34

[8] 张丽.物理实验常见数据的处理方法[J].赤峰学院学报,2008.24(6):18-19

[9] 李化平.物理测量的误差评定[M].高等教育出版社,1993.1-3

实验数据的处理分析剖析

相关推荐