打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
废旧铅酸蓄电池的X射线图像识别分类研究


杨金堂1,林孝毅1,杨正群2,柯昌美1

(1.武汉科技大学 机械自动化学院,湖北 武汉 430081;2.襄阳远锐资源工程技术有限公司,湖北 襄阳 441000)

摘 要:为提高废旧铅酸蓄电池回收效率和金属回收质量,提出采用自动化手段分类废旧铅酸蓄电池。针对该识别分类问题,首先将主成分分析法、线性判别分析法应用于废旧铅酸蓄电池的X射线图像的特征提取。通过支持向量机对提取的训练集图像特征向量进行训练,分别对测试集的图像数据进行分类实验,并对比了不同数量的训练集和不同特征空间维度下各种方法的识别率。实验结果表明,主成分分析法、线性判别分析法可用于废旧铅酸蓄电池X射线图像的识别,并且随着训练集与测试集样本量的增加,二次线性判别分析法表现出较为稳定的识别率。

关键词:主成分分析法;线性判别分析法;支持向量机;废旧铅酸蓄电池

1 引言

工业的高速发展,使得铅酸蓄电池的使用量与使用范围越来越大,与此同时,报废的铅酸蓄电池数量也在与日俱增,而随着国家对资源再生技术的重视,废旧蓄电池资源回收利用技术也在加快改进。铅酸蓄电池的主要由极柱、极群组、汇流条等部分组成,通常情况下,铅酸蓄电池的汇流条与极柱部分主要含有铅锑合金,而网栅主要含有铅钙合金[1]。由于在回收工艺中的冶炼过程需要对铅钙以及铅锑熔铸去渣,常常对锑、锡、硒等贵重金属产生不必要损失,也不利于铜铁的去除,所以选择把废旧铅酸蓄电池中主要含有的铅钙合金以及铅锑合金的两部分分开进行处理。考虑到铅酸蓄电池的自身结构以及汇流条根部是汇流条与网栅连接部分,也是电池结构中较薄弱处,所以将切割高度定在汇流条的根部。而由于人力切割蓄电池的精度和效率较低,并且废旧铅酸蓄电池中的稀硫酸对工人身体健康有较大危害,因此采用自动化系统提高处理效率具有重要的意义。

考虑近年来识别技术在工程领域的快速发展以及铅酸蓄电池的结构特点,提出利用铅酸蓄电池的X射线影像,结合图像识别技术实现废旧铅酸蓄电池分类识别,铅酸蓄电池X射线图像,如图1所示。当前国内外图像识别方法主要有:(1)对研究图像提取特征信息并采用分类器进行训练识别[2];(2)将经过预处理后的图像采用kNN算法进行识别;(3)提取预处理后图像的感兴趣区域,采用模板匹配算法识别。以上算法虽然被广泛地应用于各行各业,但仍存在不足的地方。诸如模板匹配算法虽然识别效果不错,但是抗干扰能力较差;神经网络算法虽然自学能力强,识别率较高,但是容易陷入局部极小值中;kNN算法虽然原理直观简单,但是计算维度高效率低。

分别运用计算效率较高的主成分分析法、二次线性判别分析法,PCA+LDA算法对6种常用的铅酸蓄电池的X射线成像图进行特征提取,并通过支持向量机对废旧铅酸蓄电池的X射线图进行识别分类。实验对比了三种方法在不同情况下的识别率,并根据实验结果对提出的三种方法进行了分析评价。

2 废旧铅酸蓄电池X射线图像特征提取

2.1 主成分分析法

主成分分析法(PCA)的原理是将数据特征投影为少数综合特征[2]的一种统计分析方法。它采取一种降维的方式,找出几个主要的特征向量来替代原来的大量特征,使这些主要的特征向量能最大地反映出原信息,同时使得数据之间彼此互不相关,而由此产生的新变量则称之为主成分。

PCA算法[3-4]能够有效地压缩数据进行特征提取,可以将高维度的数据分解为低维度,PCA算法对数据的处理步骤如下:

(1)样本矩阵获取

假定N张大小为m×n的铅酸蓄电池X射线图像,将每张图像的列向量首尾串接成大小为m×n的列向量,那么N张图像数据可以构成(m×n)×N的矩阵。令 M=(m×n),则样本数据的矩阵为X=[X1,X2,…,XN],其中 XN=[X1,N,X2,N,…,XM,NT

(2)样本均值计算

将样本矩阵的数据均值化,可将原始数据中的量纲和数据量级消除,使得获取的主成分更具代表性,由式(1)可得原始样本数据的均值:

(3)构建协方差矩阵

根据概率论的定义,协方差矩阵Cx与数据的均值有关,可根据式(2)近似计算获取:

式中:E—数据的数学期望运算。式(3)中单个元素的协方差矩阵:

当下标 i=j时,σ1,1,σ1,1,…,σM,M,是协方差矩阵中各变量间的方差,而在非对角线元素上,下标 i≠j,σi,j是变量 xi与 xj间相关程度的协方差。

(4)计算特征值及其特征向量

由特征值分解,可得协方差矩阵 Cx的特征值 λ1,λ2,…,λM以及相应的特征向量[v1,v2,…,vM],并对协方差矩阵的特征值以及相应的特征向量进行降序排列。通过式(4)得到相应的标准正交投影向量[u1,u2,…,uM],最后从获取的正交投影向量选取前k个作为图像数据的主成分。

2.2 线性判别分析法

线性判别分析法(LDA)[5]是以提高数据样本在子空间中的可分性为目标,其基本思想就是把高维的模式样本映射到最佳特征空间中去,实现降低特征空间维度并获得相关分类信息的目标。样本在投影空间中不同类别数据间距离最大,而相同类别中数据距离最小,因此可使得类间可分离性达到最优。线性判别分析法算法的计算步骤如下:

(1)样本均值

假定有N张铅酸蓄电池的X射线成像图,每张图像为(m×n)维数据 xi,其组成的训练样本集{x1,x2,…,xN}分别属于 ω1,ω2,…,ωc这c个不同的类别,其中类ωi的样本数目为ni,则类ωi的样本数据的均值mi为:

所有样本的均值为:

(2)离散度计算

设Sw为样本数据的类内离散度,Sb为样本数据的类间离散度,则

(3)求解最优映射向量

LDA算法的分类特性在于,希望数据经过LDA算法运算后,可使得所分的类间距离最大,而类内距离最小,这样才能具有较好的分类效果。那么,这就需要求得一个最优映射向量W,使得子空间J能通过Fisher准则求得,即:

式(9)对W求偏导,令W为0,求得极大值,则最终得到投影向量W*是矩阵

的最大特征值对应的特征向量构成的。

(4)映射样本数据

将训练样本xi向LDA子空间J做映射,那么有yi=W*Txi,即获得的向量yi就是xi的LDA特性。

3 SVM(支持向量机)简介

支持向量机是文献[6-7]提出的一种基于结构风险最小化准则的机器学习方法,它比传统的方法拥有更强的推广能力。它还具有解决小样本、高维数以及非线性等实际问题的特点。

对于非线性可分的问题,SVM将输入向量由低维空间投影到高维空间,来实现样本数据分类。分类过程中,只需调用合适的核函数K(x,xi[8],则可避免求解非线性映射函数具体形式,也解决了在高维空间计算所带来的“维数灾难”问题。常用的核函数有:多项式函数、径向基RBF函数、S形函数,在这三种核函数中,径向基RBF函数对于高维、低维、大样本、小样本等情况都适用。因此本实验选用径向基RBF函数作为SVM的核函数来进行铅酸蓄电池的识别分类。SVM最初是用于二分类问题的方法,由于铅酸蓄电池具有多种类型,因此需要将SVM扩展到多分类问题。具体的识别流程,如图2所示。图像经过预处理后,所有图像维度一致,并分为训练集和测试集两部分,将两部分图像分别经三种方法特征提取后,需要通过归一化将数据权重统一至(0,1),再由SVM对处理后的数据进行分类。

图2 识别流程图
Fig.2Flow Chart of Identification

4 识别分类实验结果与分析

4.1 铅酸蓄电池的数据集处理

实验选用6类常用的铅酸蓄电池的X射线图像作为数据集,由于采集的原始图像尺寸为(986×256)像素并且铅酸蓄电池影像的长宽不一,为减小数据维度且能完整的获取所有类型电池的图像,统计所有X射线图像中的铅酸蓄电池影像的像素尺寸,发现所有影像的长宽分别小于460个像素和230个像素,因此采用460×230像素窗口对数据集中的图像进行截取,实验中采集的部分样本图像,如图3所示。

实验环境采用MATLAB进行编程。本数据集共有108张经过预处理后的图像(每类蓄电池18幅,图像大小均为(460×230)像素),且对数据集内图像分类编号便于区分,每张图像数据可构成样本矩阵的列向量为105800维。由于处理对象是废旧铅酸蓄电池,在回收和运输过程中,蓄电池往往存在一定程度的挤压变形,因而实际成像的效果会存在一些差异。实验中训练集大小和测试集大小需保持一致,分别选取每类蓄电池图像(5~9)张作为训练集,选取剩下的(5~9)张作为测试集,用来检测该方法识别率。

图3 实验中采集的部分样本图像
Fig.3Images of Sample Collected in the Experiment

4.2 识别实验及分析

分别采用PCA、PCA+LDA、二次LDA(在LDA初始值上再进行一次LDA)对训练集图像进行特征提取,并通过网格搜索法[9-10]对训练集数据进行交叉验证,获取精度最高的RBF核的参数gamma以及惩罚系数C,最优gamma=0.0078125,C=0.03215,其交叉识别率为95%。废旧铅酸蓄电池图像的识别界面,如图4所示。由表1可以看出,在特征维数为10,训练样本数量较小时,PCA特征提取方法的铅酸蓄电池识别率较高,但随着每类电池图像的样本数的上升,PCA特征提取方式逐渐下降,而二次LDA却随着样本数目的增加,识别率由最初的83.3%提升至90%以上。PCA+LDA特征提取方式,首先对识别图像采取降维处理,再对主成分进行LDA的特征提取,随着样本数的增加,其识别率有所下降,但相对于PCA算法要高。

图4 废旧铅酸蓄电池识别界面
Fig.4Used Lead-Acid Batteries Recognition Interface

表1 特征维数相同时各征提取方法识别结果
Tab.1Recognition Results of Methods in the Same Dimension

样本数/每类56789PCA 96.7% 94.4% 91.4% 90% 86.7%二次LDA 83.3% 83.3% 88.6% 92.5% 92.5%PCA+LDA 96.7% 94.4% 91.4% 92.5% 88.9%

在训练集样本为5时,特征维数与铅酸蓄电池图像的识别率的关系,当维数大于15后,测试集的识别率趋于固定,如图5所示。说明各种方法提取的前15维特征对铅酸蓄电池图像之间区分占有较大比例,其中由于二次LDA方法在原始的LDA方法上对测试集再一次进行了运算,不仅实现了降维过程,而且使得测试集数据之间的类间离散度增大,而类内离散度更为紧密,因此分类结果较其他两种方法更好。

图5 特征维数与蓄电池识别率的关系
Fig.5The Relationship Between Feature Dimension and Recognition Rate of the Battery

5 结论

实验对比了PCA,PCA+LDA,二次LDA算法在不同特征空间维度以及不同样本数目下的识别率。在样本数量不变的情况下,特征维数仅在一定范围内对三种特征提取法的识别有影响。但随着图像样本的增加,PCA算法的识别率有所下降,体现了该算法面对图像样本数量增加时,去除相关性能力的弱化。而由于LDA算法强调不同图像数据中的差别,增大不同类别数据间的离散度并减小同类数据间离散度,因此在样本量增加的情况下,PCA+LDA算法的识别率高于PCA算法,而二次LDA算法高于PCA+LDA算法。这也说明,相比PCA算法,LDA算法去除了与分类无关的某些因素。

参考文献

[1]谈大伟.废旧铅酸电池回收预处理锯切系统的研究[D].武汉:武汉科技大学,2013:1-4.(Tan Da-wei.The study of sawing system for used lead-acid batteries’s recycling pretreatment[D].WuHan:Wuhan University of Science and Technology,2013:1-4.)

[2]华顺刚,周羽,刘婷.基于PCA+LDA的热红外成像人脸识别[J].模式识别与人工智能,2008(2):160-164.(Hua Shun-gang,Zhou Yu,Liu Ting.Thermal infrared face image recognition based on PCA and LDA[J].Pattern Recognition and Artificial Intelligence,2008(2):160-164.)

[3]唐琎,刘波,蔡自兴.基于二维主成分分析的交通标志牌识别[J].计算机科学,2010(11):287-288.(Tang Jin,Liu Bo,Cai Zi-xing.Traffic sign recognition based on two-dimensional principal component analysis [J].Computer Science,2010(11):287-288.)

[4]韩鸿哲,王志良,刘冀伟.基于线性判别分析和支持向量机的步态识别[J].模式识别与人工智能,2005(2):160-164.(Han Hong-zhe,Wang Zhi-liang,Liu Ji-wei.Gait recognition based on linear discriminant analysis and support vector machine[J].Pattern Recognition and Artificial Intelligence,2005(2):287-288.)

[5]潘越,方向忠,王慈.人脸图像信息可用性影响因素的研究分析[J].电视技术,2015(7):86-90.(Pan Yue,Fang Xiang-zhong,Wang Ci.Image validity analysis for face recognition[J].Video Engineering,2015(7):86-90.)

[6]Vladimir N.Vapnik.The Nature of Statistical Learning Theory[M].New York:Springer-Verlage,1995.

[7]陆光,满庆丽,徐然.基于SVM的多特征融合的天牛图像识别[J].森林工程,2012(4):21-25.(Lu Guang,Man Qing-li,Xu Ran.SVM-based multi-feature fusion longicorn image recognition[J].Forest Engineering,2012,28(4):21-25.)

[8]杨大鹏,高向东,刘红.基于纹理特征的道路行人识别研究[J].机械设计与制造,2012(1):182-184.(Yang Da-peng,Gao Xiang-dong,Liu Hong.Study on pedestrian recognition based on texture feature[J].Machinery Design&Manufacture,2012(1):182-184.)

[9]吴峰,陈后金,姚畅.基于网格搜索的PCA-SVM道路交通标志识别[J].铁道学报,2014(11):60-64.(Wu Feng,Chen Hou-jin,Yao Chang.Traffic sign recognition based on PCA-SVM with grid search[J].Journal of the China Railway Society,2014(11):60-64.)

[10]舒双宝,罗家融,徐从东.一种基于支持向量机的人脸识别新方法[J].计算机仿真,2011,28(2):280-283.(Shu Shuang-bao,Luo Jia-rong,Xu Cong-dong.A new method of face recognition base on support vector machine[J].Computer Simulation.2011,28(2):280-283.)

The Study of X-Ray Image Recognition and Classification of Used Lead-Acid Batteries

YANG Jin-tang1,LIN Xiao-yi1,YANG Zheng-qun2,KE Chang-mei1
(1.College of Machinary and Aotumation,Wuhan University of Science and Technology,Hubei Wuhan 430081,China;2.Xiangyang Yuanrui Resources Engineering Technology Co.,Ltd.,Hubei Xiangyang 441000,China)

Abstract:In order to improve recycling efficiency of used lead-acid and recycling quality of metal,the automated method to classify used lead-acid was proposed.According to the recognition classification problem,first,used PCA and LDA to extract feature of X-ray image about used lead-acid batteries.Then,trained the extracted image feature vectors of the training set by SVM and identified test set in the classification experiment,finally,compared the recognition rate in different numbers of train data and different feature space dimensions.The result shows that PCA and LDA could be used to recognition of X-ray images about used lead-acid batteries,and with the increasing of number of test data and the train data,the Secondary LDA showed more stable than others in recognition.

Key Words:PCA;LDA;Support Vector Machines;Used Lead-Acid Batteries

中图分类号:TH16;TM912;TP391

文献标识码:A

文章编号:1001-3997(2017)10-0156-03

来稿日期:2017-04-08

基金项目:废旧铅酸蓄电池综合利用新工艺项目—湖北省科技支撑计划(2015BCA305);

石煤提钒清洁生产成套设备研发及中试—湖北省科技支撑计划(2015BCA286)

作者简介:杨金堂,(1964-),男,湖北武汉人,博士研究生,教授,主要研究方向:机电系统计算机建模及仿真;

林孝毅,(1990-),男,湖北武汉人,硕士研究生,主要研究方向:机电系统模式识别

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps
数据降维算法-从PCA到LargeVis
算法工程师养成记(附精选面试题)
通过机器学习算法速查表,快速选择合适的机器学习算法(下)
LDA, PCA机器学习分类
常见的特征提取算法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服