基于机器学习的水质评价方法研究

发布时间:2023-02-01 18:18:25

2019年第(总第193期)INFORMATION&COMMUNICATIONS2019(Sum.No193)基于机器学习的水质评价方法研究伟,刘志芳,张毓福(六盘水师范学院数学与信息工程学院,贵州六盘水553004摘要:随着社会工业化进程的加快,水污染问题日益突显,对水质做出科学的评价变得十分必要。提出一种将数字图像处理技术和机器学习相结合的方法,采用数字图像处理技术提取水样图像颜色矩特征,利用机器学习的支持向量机构建水质评价分类模型,并对SVM模型进行参数优化,实验证明该方法对水质评价的效果较好。关键词:水质评价;数字图像处理;机器学习;支持向量机;SVM模型中图分类号:TP391文献标识码:A文章编号:1673-1131201901-0097-02ResearchonwaterqualityevaluationmethodbasedonmachinelearningLiwei,LIUZhifang,ZhangYufu(Schoolofmathematicsandinformationengineering,LiupanshuiNormalUniversity,Liupanshui,Guizhou553004,ChinaAbstractWiththeaccelerationofsocialindustrialization,theproblemofwaterpollutionhasbecomeincreasinglyprominent.Itisnecessarytomakeascientificevaluationofwaterquality.Amethodcombiningdigitalimageprocessingtechnologywithmachinelearningisproposed.Thecolormomentfeatureofwatersampleimageisextractedbydigitalimageprocessingtech-nology.Theclassificationmodelofwaterqualityevaluationisbuiltbymachinelearningsupportvectormachine.TheparametersofSVMmodelareoptimized.Theexperimentprovesthatthemethodiseffectiveinwaterqualityevaluation.Keywords:waterqualityassessment;digitalimageprocessing;machinelearning;supportvectormachines;theSVMmodel随着社会城市化的发展和工业化进程的加快,水污染问题已经成为制约我国可持续发展的重要因素。对水质做出科学的评价,对防止和治理水污染是一项既重要又迫切的任务[1]水质评价方法主要有综合指数法、基于熵权的水质评价法[2][3]和人工神经网络评价法等。这些方法在水质评价时各有优点,但是也有其应用层面的限制。有经验者可通过观察水的颜色来判断水质,但存在主观性的偏差使观察结果可重复性降低。随着数字图像处理技术[4]的发展,使水质在线自动评价成为可能。本文提出将数字图像处理技术和机器学习算法相结合的方法,首先利用数字图像处理技术来提取拍摄的水样图像特征,再利用机器学习算法构建水质评价分类模型,进而得出水质类别的评价结果。该方法相对于其它水质评价方法更加迅速,也更加便于应用。话单合并对于包含多组计费要素的话单处理过程中,需对指定计费要素字段值相同的组进行合并输出;IndexDataMap:利用索引来加速筛选查询的DataMap97
信息通信1水质评价原理通过拍摄采集得到水样图像,由于水样图像数据维度很大不容易分析,因此需要提取水样图像特征。图像特征主要包括颜色特征、纹理特征和形状特征等,其中颜色特征更加稳健,拥有更强的鲁棒性。本文使用颜色矩来提取水样图像特征,建立水样图像与图像特征的数据信息关系。在提取水样图像特征的同时,由有经验的专家对水样图像进行分类,建立水样数据与水质类别的专家样本库,得到水样图像与水质类别的映射关系,来构建水质分类评价模型,且不断调整系数来优化分类模型。最后,利用训练好的水质分类模型应用到水样图像,可以实时自动评价出该水样的水质类别。其中,专家按水色进行水质分类信息如表1所示。1按水色进行水质分类信息基于机器学习的水质评价过程如图1所示,主要步骤有:对两个数据集进行预处理,提取颜色矩特征;利用专家样本构建评价模型;1水质评价过程2水样图像预处理首先对拍摄采集的水样图像进行切割,得到统一像素大小的水样图像,然后再进行特征提取。水样图像的一阶颜色矩采用一阶原点矩,反映图像整体的明暗层度,计算公式如下:1式中,Ei表示第i个颜色通道的一阶颜色矩,pij表示第j像素的第i个颜色通道的颜色值。二阶颜色矩采用二阶中心距的平方根,反映图像颜色的分布范围,计算公式如下:2式中,398李伟等:基于机器学习的水质评价方法研究式中,si表示第i个颜色通道的三阶颜色矩,Ei表示第i颜色通道的一阶颜色矩。3水质评价模型构建对提取颜色特征后的样本进行抽样,抽取其中的2/3作为训练样本来构建水质评价模型,剩余的1/3作为测试样本用于水质评价检验。本文构建水质评价模型时,采用机器学习的支持向量机来构建水质评价模型,并优化SVM模型参数。SVM模型有训练样本数据和建模参数的两部分的输入,由于样本数据作为输入是颜色矩,其取值范围都在01之间,接输入到SVM模型时区分度很小,因此需要改进SVM模型特征输入,将所有特征统一扩大k倍以来提高区分度。经过实验测试,将输入特征值都乘以30后区分度最好。本文使用Python来编写实验程序,其关键代码如下:fromsklearnimportsvmmodel=svm.SVC(train=data[:,:]*30test=data[:,:]*30model.fit(train,train4实验分析将所有测试样本数据输入到已经构建好的水质评价模型,处理后预测得到水质类型。水质评价的混淆矩阵如表2所示,分类的准确率达到了96%,说明构建的水质评价模型对于新增的水质样本的分类评价效果较好,因此该模型可以应用到水质自动评价系统,以来实现对水质快速准确的评价。2水质评价的混淆矩阵5结语本文采用数字图像处理技术和机器学习算法相结合的方法,来实现对水质的分类评价,并通过实验证明分类模型的评价效果较好。该方法相对于其它水质评价方法,具有独特的优势,可以快速准确的得到水质的评价结果。参考文献:[1]姜建军.以人为本切实加强地下水饮用水源的保护[R].:2005中国饮用水行业高层论坛,2005.[2]邹国平,彭梅香.数据挖掘技术在水质评价中应用研究[J].计算机仿真,2012,29(1:148-151.[3]王冬生,李世华,周杏鹏.基于PSO-RBF神经网络模型的原水水质评价方法及应用[J].东南大学学报:自然科学版,2011,41(5:1019-1023.[4]孙正.数字图像处理技术及应用[M].北京:机械工业出版社,2016.基金项目:贵州省教育厅青年科技人才成长项目(黔教合KY[2016]267号)六盘水市科技计划项目52020201525作者简介:李伟1985-男,山东聊城人,讲师,主要从事数据挖掘、计算机科学与技术研究。

基于机器学习的水质评价方法研究

相关推荐