分类号 TP391 密级
U D C 学号 01041030
长沙理工大学硕士学位论文
基于遗传BP算法的神经网络在
桩基检测中的应用
研 究 生 姓 名 戎 丽 霞
培 养 单 位 计算机与通信工程学院
指导教师姓名、职称 王英健 副教授
学 科 专 业 计算机应用技术
研 究 方 向 智 能 控 制
论 文 提 交 日 期 2004年5月10日
Neural Network Based Genetic-BP Algorithm
Applying to Stake Base Diagnose
by
RONG Lixia
A thesis submitted in partial satisfaction of the
Requirements for the degree of
Master of Engineering
in
Computer Application Technology
in
Changsha University of Science & Technology
Supervisor
Professor Wang Yingjian
May, 2004
摘要
故障检测与诊断技术在近几十年得到飞速的发展,神经网络和遗传算法在故障检测与诊断中有着成功的应用,并且两者的结合在故障检测与诊断技术中有着广阔的应用前景。桩基检测属于工程问题,用于桩基完整性检测的方法主要是时域和频域分析法,对结果的分析需要依靠技术人员的工程经验,而且由于桩--土体的复杂性,传统的方法遇到了很大的困难。因此需要尝试新的方法,本文将神经网络与遗传算法相结合来检测桩基完整性,为桩基完整性检测开辟了一个新途径。
本文阐述了桩基检测中遗传BP神经网络的基本设计思想和算法实现过程,在遗传BP神经网络中将遗传算法与BP算法结合来训练神经网络的结构和权值。由于神经网络的结构不同,在遗传算法中采用小生境技术,将群体分为主群体和小群体,主群体中含有不同网络结构的个体,小群体中的个体网络结构是相同的,采用小群体可以防止优秀个体早期退化。文中提出了小生境技术中初始群体的设计思想和算法实现过程。
特征提取是信号识别与分类中的重要一环,对提高系统的准确性、改善系统性能起着关键的作用。特征提取的方法有很多,利用小波包变换对信号进行特征提取是近年来发展起来的一种新的特征表示手段,在许多领域中已获得了成功的应用。对于桩基检测信号,本文用基于最优小波包基的特征提取方法。文中提出了基于熵规则的最优小波包基选择策略,并且给出了对于所有的训练样本的小波包最优基选择的具体实现方法。用此方法提取故障的特征,可以减少输入向量的维数,并且有利于故障类型的识别和分类。
将本文提出的方法应用于实际桩基信号的完整性检测中,对于几种模型桩的桩基故障,本文的方法都能给出正确的识别结果,实验结果表明了该方法的有效性,检测准确率达到了预期的效果。因此本文的故障诊断方法在工程实际中有着广阔的应用前景,对于解决实际问题有着重要的意义。
关键词:
BP神经网络;遗传算法;小生境技术;故障诊断;小波包分析;特征提取;桩基检测
ABSTRACT
In the previous decade, FDD(Fault Detection and Diagnosis) has greatly developed. ANN(Artificial neural network) and GA(Genetic Algorithm) has successful applications in FDD, and the combine of ANN and GA has wide foreground in applications. Defect of pile is a problem of engineering, the method of integrity defect of pile are time-field and frequency-field analysis, which have to depend on the experience of engineers and has many difficulties in defect of pile. So in this paper , a new method that the combine of ANN and GA is applied to defect of pile.
In this paper, the processing of neural network based Genetic-BP algorithm in defect of pile is introduced, and it be used to search the structure and weight of the network. In genetic algorithm, niche technology is applied because the structure of network is difference, which can avoid the early degenerate of good network. The algorithm design of originality colony is given in niche technology in this paper. The colony has two parts, one is main colony, in which the structures of network are different, another is small colony that the structures of network are same.
Feature extraction plays an important role for improving accuracies in signal classification and recognition. Extracting features by wavelet packets is new way for signal representation developed these years, and great success has been achieved in many fields. For the signal of defect of pile, the method of feature extraction based on best wavelet packer bases is used. In this paper, the algorithm of best bases search based on Shannon is given, and the method of best bases search for all training sets is given. Extracting features by the method of this paper is effective for classification and recognition of faults.
The methods of feature extraction and fault diagnosis in this paper are applied to practical integrity defect of piles, and give correct diagnose results for some typical pile faults. The results of Experiment testified the effective of this method. So the method for faults diagnose in this paper has wide application foreground, and has important signification to settling fact problem.
Key words:
BP neural network; genetic algorithm; niche technique; faults diagnose; wavelet packet analysis; feature extraction; defect of pile
目 录
I摘要
IIABSTRACT
1第一章 绪论
桩基检测
故障诊断的方法
神经网络在故障诊断中的应用
神经网络的发展与应用
神经网络在故障诊断中的应用概况
小波分析在故障诊断中的应用概况
遗传算法在故障诊断中的应用概况
本文完成的主要工作
10第二章 BP神经网络和遗传算法的基本理论
BP神经网络
反向传播网络模型与结构
BP算法
BP网络的设计
BP网络的限制与不足
遗传算法
概述
经典遗传算法
应用GA的几个要点
20第三章 基于最优小波包基的特征提取
小波包分析
小波包的定义
小波包的性质
小波包的空间分解
小波包算法
最优小波包基的选择
最优小波包基的概念
最优小波包基的快速搜索法
基于熵准则的小波包基选择
用小波包最优基分解提取信号特征
29第四章 遗传BP神经网络的设计
概述
神经网络的选取
神经网络权值的选取
神经网络结构设计
本文的神经网络设计方法
编码表示
选择策略
遗传操作
群体设计
适值函数
遗传BP算法的步骤
37第五章 遗传BP神经网络在桩基检测中的应用
概述
基于神经网络的桩基完整性检测的设计思路
样本的采集
基本原理
影响因素
采样信号特征
神经网络设计
样本的选择
桩基信号的特征提取
输入输出节点的确定
本文方法的识别结果及分析
遗传神经网络识别结果以及与本文方法的对比
总结
46全文总结
48致谢
49参考文献
53附录(攻读硕士学位期间发表论文)
第一章 绪论
桩基检测
桩基检测属于工程问题,通常是用动测法对桩身进行检验,然后对动测数据进行分析,以判断桩身存在哪种缺陷。对动测数据进行分析的方法很多,就其原理而言主要有时域分析和频域分析法,但这些方法对于结果的解释主要还是依靠测试人员的工程经验,有时对于同一种测试数据,不同背景的人做出的判断可能有相当大的出入,亦即由于桩--土体本身的复杂性,传统的处理方法遇到了极大的困难。因此,我们需要尝试新的比较实用的方法,为桩基检测开辟新的途径。目前比较实用的方法是神经网络分析法,但是人们对这方面的讨论还不多,很多理论和知识还不完善。桩基完整性检测也属于一类故障诊断问题,本文将其作为故障识别和分类问题来讨论。
故障诊断的方法
故障检测与诊断是控制科学的重要组成部分,作为一种交叉性科学领域,它与容错控制、鲁棒控制、自适应控制、智能控制等多种技术密切的联系。故障检测与诊断技术在过去的十几年里得到了飞速发展,一些新的理论与方法,如:主元分析、遗传算法、小波变换、神经网络、模糊系统、模式识别、自适应理论、非线性理论等都已经在这里得到了成功的应用。
故障诊断的方法按照通常的分类方法可以分为基于解析模型的方法、基于信号处理的方法和基于知识的方法三大类。
基于解析模型的方法是最早发展起来的,此方法需要建立被诊断对象的较为精确的数学模型。由于系统的运动方程采用参数矢量表示,这种参数实际上代表了系统的指标,所以根据系统参数的估计值与其正常值之间的偏离数值,可以判断系统的故障状态。进一步,它又可以分为参数估计方法、状态估计方法和等价空间方法。这种方法在最近20年中得到了广泛的应用。然而以往的研究大都局限于线性系统,因为非线性系统的故障诊断的难点在于数学模型很难建立,参数估计方法比状态估计方法更适合非线性系统。
当难以建立诊断对象的解析数学模型时,基于信号处理的方法是非常有效的,因为这种方法回避了抽取对象的数学模型的难点。而直接利用信号模型,如相关函数、高阶统计量、频谱和自回归滑动平均过程,以及热门的小波分析技术。但是,避开对象数学模型,是这种方法的优点,也是它的缺点。
基于知识的方法与基于信号处理的方法类似,也不需要系统的定量数学模型,但它克服了后者的缺点,引入了诊断对象的许多信息,特别是可以充分的利用专家诊断知识等,所以是一种很有前途的方法,尤其是在非线性系统领域。
神经网络是近年来出现的一种新的方法,它具有自学习和能拟和任意连续非线性函数的能力,以及其并行处理、全局作用的能力,使得它在处理非线性问题时具有很大的优势。另外,遗传算法是基于自然选择和基因遗传学原理的搜索算法,可获得全局最优解。将两种方法结合起来有着巨大的应用前景。
神经网络在故障诊断中的应用
神经网络的发展与应用
什么是神经网络
人工神经网络是指模拟人脑神经系统的结构和功能,运用大量的处理部件,由人工方式构造的网络系统。
神经网络理论突破了传统的、串行处理的数字电子计算机的局限,是一个非线性动力学系统,并以分布式存储和并行协同处理为特色,虽然单个神经元的结构和功能极其简单有限,但是大量的神经元构成的网络系统所实现的行为却是极其丰富多彩的。
人工神经网络研究的历史及其应用
神经网络的研究已有五十多年的历史,但其发展是不平衡的,它的兴衰还与“人工智能走什么路”这一争议问题有关。由于其结构的复杂性,起始阶段进展不快,并一度陷入低谷,但仍有不少有识之士在极其艰难的条件下坚持研究,使研究工作始终没有中断,并在模型建立等理论方面取得了突破性的成果。时至今天,人工神经网络成了信息领域的热门研究课题。
1.第一阶段—初始发展期(20世纪40年代~20世纪60年代)
早在1943年,美国心理学家McCulloch和数学家Pitts联合提出了形式神经的数学模型,即M-P模型,从此开创了神经科学理论研究的新纪元。M-P模型能够完成有限的逻辑运算。1944年,心理学家Hebb提出了改变神经元间连接强度的Hebb规则,他们至今仍在各种神经网络模型中起着重要的作用。1957年,计算机科学家Rosenblatt用硬件完成了最早的神经网络模型,即感知器(Perception),并用来模拟生物的感知和学习能力。1962年,电机工程师Windrow和Hoff提出了自适应线性元件Adaline,它是一个连续取值的线性网络,在信号处理系统中用于抵消通讯中的回波和噪声,应用十分广泛。
2.第二阶段—低谷期(20世纪60年代末~20世纪70年代末)
1969年,人工智能之父Minsky和Papert发表的《感知器(Perception)》一书指出,感知器无科学价值可言,连XOR逻辑分类都作不到,只能作线性划分。由于Minsky在学术界的地位和影响,故其后若干年内,这一研究方向处于低潮。另一方面,传统的冯诺依曼电子数字计算机正处在发展的全盛时期,整个学术界都陶醉在成功的喜悦之中,从而掩盖了新型计算机发展的必然。
尽管如此,在此期间仍然有不少有识之士不断努力,在极端艰难的条件下致力于这一研究,为神经网络的发展奠定了理论基础。Boston大学的Grossberg和Carpenter提出了自适应共振理论ART网络。芬兰的Heisinki大学的Kohonen提出了自组织映射网络。日本大坂大学的Fukushima提出了神经认知机网络模型。日本东京大学的Amari对神经网络进行了数学理论的研究。
3.第三阶段—兴盛期(20世纪80年代以后)
20世纪70年代末期,研究和试图模拟听觉的人工智能专家首先遇到挫折,人们习以为常的知识难以教给计算机。计算机的设计者和制造商也发现前面有不可逾越的线路微型化的物理极限,人们才开始思考冯诺依曼机到底还能走多远。同时,VLSI、脑科学、生物学、光学的迅速发展也为人工神经网络的发展打下了基础。
1982年,加州大学的物理学家Hopfield提出了Hopfield网络模型,并用电路实现。1985年,Rumelhart提出了BP算法,把学习的结果反馈到神经网络的隐层,来改变权系矩阵,它是迄今为止最普遍的网络。Hinton等人提出了Boltman机模型。1988年,蔡少堂提出了细胞神经网络模型。
近年来,神经网络理论引起了美国、欧洲与日本等国科学家和企业家的巨大热情。新的研究小组、实验室、风险公司等与日俱增,世界各国也正在组织和实施与此有关的重大研究项目。如美国DARPA计划、日本HFSP计划、法国尤里卡计划、德国欧洲防御计划和前苏联高技术发展计划等。1986年4月,美国物理学会在Snowbirds召开了国际神经网络学术会议。1987年6月,IEEE在San Diego召开了国际神经网络学术会议,并成立了国际神经网络学会。1988年起,IEEE和国际神经网络学会每年召开一次国际会议。1990年3月,IEEE神经网络会刊问世。
神经网络理论的应用也已经渗透到各个领域,并在智能控制、模式识别、计算机视觉、自适应滤波、信号处理、非线性优化、语音识别、知识处理、传感技术与机器人等方面取得了令人鼓舞的进展。神经网络代表一种新的主义,即连接主义,用于解决诸如知识表达、推理学习、联想记忆、乃至复杂的社会现象,如混沌,社会演变等复杂系统的统一模型,它将预示着一个新的工业的到来。
神经网络在故障诊断中的应用概况
故障诊断是近40年来发展起来的一门新学科。它是适应工程实际需要而形成的各学科交叉的综合学科。
基于神经网络的故障诊断问题可以看成模式识别。通过对一系列过程参量进行测量,然后用神经网络从测量空间影射到故障空间,实现故障诊断。
人工神经网络之所以适合于故障诊断,有以下三个原因:
1)训练过的神经网络能存储有关过程的知识,能直接从定量的、历史故障信息中学习。可以根据对象的正常历史数据训练网络,然后将此信息与当前测量数据进行比较,以确定故障。
2)人工神经网络具有滤除噪声及在有噪声情况下得出正确结论的能力,可以训练人工神经网络来识别故障信息,使其能在噪声环境中有效的工作,这种滤除噪声的能力使得人工神经网络适合在线故障检测和诊断。
3)人工神经网络具有分辨原因及故障类别的能力。
国外的研究发展状况
神经网络用于故障诊断起源于80年代末期。1989年美国珀杜大学的Venkat Venkatasubramanian和King Chan等人将人工神经网络用于故障诊断中[7],并与基于知识的专家系统进行了比较。他们诊断的设备是一个流化态催化裂化单元的故障,确定了18种征兆(输入节点)和13种故障类型(输出节点),隐层有5~27个节点。所用的算法是反向传播算法,获得了理想的结果;它能正确的确定94%~98%的故障原因。美中不足的是训练时间太长,并且训练时输入的数据不是实时的;人工神经网络映射连续变量比映射布尔量要困难得多,尽管存在这些局限性,但他们仍是第一次将人工神经网络成功的应用于模式匹配和故障诊断中。
同年,日本庆应义塾大学的Kajior、Watanabe等人将神经网络用于诊断化工过程的初期故障[8]。他们认为人工神经网络通过联想记忆有学习和存储故障信息的能力,并且具有联想诊断过程故障的能力。网络可以从稳态过程变量数值中学习到故障知识,这些参量既有正常状态下采集的也有故障状态下采集的,用来表示故障的程度。提出了一个两级多层神经网络用于故障诊断,一级网络用于识别含有噪声的故障,一旦识别出故障,二级就来估算故障的程度,这样可以诊断出早期故障。
美国德克萨斯大学的Hoskins和Himmelblau等人应用人工神经网络进行故障诊断[9]时采用连续变量作为输入,但其工作的一个限制是只适合于稳态系统。诊断的对象是3个等温连续搅拌釜反应器,Hoskins和Himmelblau等人用人工神经网络识别6种可能的故障。他们根据一个标量决策函数采用人工神经网络对输入模式进行分类;采用BP算法,讨论了隐层节点数对学习效率的影响。当训练集中只有6个输入模式时,人工神经网络的误诊断率仅为20%;有12个模式时,系统的诊断正确率为100%。
1990年,Naidu等人用人工神经网络进行传感器故障检测[10],传感器故障检测的最主要问题是对过程的正确模拟。对一个复杂的非线性过程,这一任务非常困难。Naidu等人试图用人工神经网络来区分由传感器故障引起的模式和由过程--模型不匹配、噪声及扰动引起的模式。结果表明:人工神经网络对传感器故障的预测准确性比其它方法高,原因是人工神经网络能抓住非线性问题,另外人工神经网络能够在线进行训练,训练好后,它所需要的计算时间要少于其它算法。
Yao和Zafiriou等人进一步扩展了这种采用人工神经网络的故障检测方法[11],他们采用的是所谓的局部区域网络(local receptive-field network,LRFN),并展示了一种去除网络多余节点,提高效率的方法。该网络只有一层,同时采用有监督和无监督学习方法训练。
基于这一工作,局部接收区域网络展示了在线进行传感器故障检测的希望。首先,网络能够准确的检测出故障,效果优于Naidu等人的反向传播网络;其次,局部接收区域网络与任何人工神经网络一样可以离线训练,然后用于在线服务。
1990年美国宾夕法尼亚大学的Ungar等人探索了采用自适应人工神经网络进行故障诊断和过程控制[12]。自适应人工神经网络可用于故障识别系统,采用基于Widrow-Hoff规则的BP算法,以连接强度表示输入(报警和传感器测量结果)和输出(故障、传感器故障或控制系统故障)之间的关系。这个系统是一个能够象线性相关性一样学习非线性和逻辑关系的模式识别器。对一个小模拟化工厂进行诊断,用加入了噪声的定性(报警)和定量(传感器)数据进行网路学习,非线性网络学习的重要性在于要求有足够灵敏度的特征数据和优化报警阈值问题。
麻省理工学院的James 和Mark 等人采用径向偏置函数即高斯密度函数:
代替Sigmoid函数:
结果表明,采用径向基函数可以使:
1)人工神经网络的泛化能力加强,能更好的处理训练数据以外的测试实例。
2)人工神经网络能估计测试实例与原来的分类器的接近程度。
3)训练速度加快。
1991年北卡罗来纳州立大学的和等人用人工神经网络对交流感应电动机进行了故障诊断[13]。他们认为交流感应电动机的初期故障如果检测不出来,则可导致整个机器损坏,超过的大电机的早期故障检测法用于中小型感应电机上造价太高或不实用。为此他们建立了一种基于高序神经网络的中小型感应电动机初期故障诊断法,这种方法避免了传统初期故障诊断法中存在的一些问题。该方法利用了一些可靠的信息,如转子速度和定子电流等。神经网络的设计是在实验室的一个552W永磁感应电动机上实时进行的,计算结果表明,基于神经网络的初期故障检测仪的识别准确率超过95%,适合现场应用。
Time Sorsa等人论述了过程自动化领域的神经网络诊断法,他们认为几种结构的神经网络比基于模型的方法和专家系统更适合于故障诊断,并指出双曲正切多层感知器网络单元最适合故障诊断。将其用于热交换器--连续搅拌反应器系统,系统有14个含有噪声的测量结果和10种故障,该网络经3000次学习后能将故障正确的检测并分类,并用主分量分析法描述故障诊断问题。
1994年Kajior、Watanabe等人用混合神经网络诊断多故障[14],采用HANN的一种新型网络进行故障诊断,HANN将大量的模式分为很多小的子集以便网络能够更有效的对故障进行分类。它的优点是即使网络是用单故障训练的,但对没学过的多故障也可以检测,并在反应器中得到了应用。
国内的研究状况
我国也有一些学者对神经网络在旋转机械故障诊断中的应用进行了探讨,取得了一定的成果。东北大学虞和济教授对机械设备故障诊断的人工神经网络法进行了深入的研究[5][15],建立了旋转机械神经网络分类系统并得到了应用,取得了满意的效果。西安交通大学的屈梁生教授等较早地利用人工神经网络对大型旋转机械的各种故障进行了全面的研究[16],研究了如何从现场故障信号中提取故障特征并将全息诊断法用于神经网络诊断系统中。东南大学的钟秉林等也就神经网络对给定知识的表达、联想、记忆能力及网络结构进行了研究[17]并指出神经网络在机械故障诊断中显示了极大的应用潜力。张炜等一批科技工作者对旋转机械故障诊断中的神经网络算法进行了研究[18],采用动态学习算法,引入控制因子,结果表明这种改进提高了BP网络的收敛速度,改善了网络的性能,具有实际应用意义。建立了基于概率神经网络的大机组快速响应诊断系统,其收敛速度为BP网络的2万倍;实现了对大机组常见故障快速、简捷、自动的智能化诊断并减少了对专家的依赖;研制出实用的“傻瓜”式智能诊断软件,已投入使用。此外还有人就神经网络用于设备故障诊断的各种问题进行了研究并均取得了一定的结果。
小波分析在故障诊断中的应用概况
在故障诊断中,故障信号往往含有大量的时变、突发性质的成分,传统的信号分析方法如Fourier变换无能为力,不能有效的提取故障的特征。而且在故障诊断领域,我们经常会遇到非平稳信号,应用Fourier变换也不能得到有效的结果。小波变换作为一种时频分析方法,它在时频两域都具有表征信号局部特征的能力,特别适宜于非平稳信号的处理,从而为故障诊断技术提供了良好的技术支持。近年来,许多学者对小波变换在故障诊断方面的应用进行了研究,取得了大量有价值的成果。
小波分析在故障诊断中主要用于故障信号的特征提取。张静远等讨论了四种基于小波变换的特征提取方法[19]:基于小波变换的模极大值特征、基于小波分解的能量特征、基于小波包分解的熵特征以及基于适应性小波网络的特征提取方法,阐述了各方法的基本原理和实现过程。陈长征、虞和济等人提出了基于小波分析的机械故障特征提取方法[20],通过对奇异故障信号的检测、信噪分离和信号频带分析来提取故障特征,这种方法提取的故障信息应用在神经网络等其他故障诊断方法中可以更准确、更全面的诊断故障。周维忠等提出了一种基于小波系数聚类的特征提取方法[21],克服了样本抽样数目较大时神经网络结构复杂的问题。而且沈国重、黄艳芳等将小波变化和神经网络结合起来进行故障诊断[22][23]。
小波分析可以对信号进行有效的时频分解,但由于其对尺度是按二进制变化的,所以在高频频段其频率分辨率较差,而在低频频段其时间分辨率较差,即对信号的频带进行等间隔划分。小波包分析能够为信号提供一种更加精细的分析方法,它将频带进行多层次划分,对小波分解没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应的选择相应的频带,使之与信号频谱相匹配,从而提高了时频分辨率。基于此,王首勇、张晓文等提出了基于小波包变换的特征提取方法[24][25][26]。用小波包进行特征提取,为了更有效的提取信号的特征,需要提取小波包的最优基,等讨论了小波包最优基的提取方法[27][28]。并且黄艳芳、何福顺、杨洁明等将小波包分析与神经网络的故障诊断系统结合起来[29]。
遗传算法在故障诊断中的应用概况
遗传算法在故障诊断中的应用刚刚起步,公开发表的文献不多,但是在基于神经网络的故障诊断中,遗传算法用于神经网络的辅助设计发挥着很大的作用。由于遗传算法具有全局寻优的能力,在神经网络的设计中得到越来越广泛的应用。
用遗传算法设计神经网络主要是神经网络结构和权值的设计,在固定网络结构时只需要在学习的过程中优化网络的权值,这种方法比较简单。因为对于一个故障诊断问题,神经网络的结构不容易确定,因此需要对网络的结构和权值共同设计,、Mamezzo、黎明等给出了用遗传算法优化神经网络结构和权值的方法[30][31][32],并且张敏等给出了结构和权值的一种新的实数编码方案[33],使遗传操作变的简单易行。但由于遗传算法往往找到的是全局次优解,而BP算法找到的是局部最优解,因此我们考虑将遗传算法与BP算法结合起来训练神经网络,以得到全局最优解,熊凌等将BP算法作为遗传算法的一个算子引入到遗传算法中[34],收到了很好的效果。又因为在遗传算法中交叉和变异概率的选取一般是靠经验来选取,相对比较困难,郭晓婷等提出了自适应选择交叉和变异概率的遗传算法[35]。
同时人们将遗传算法和神经网络结合起来用于故障诊断和模式识别,将雄伟、Hozumi、沈敏等分别讨论了其在故障诊断和模式识别中的应用[36][37][38]。
本文完成的主要工作
在广泛阅读故障诊断、桩基检测、遗传算法、小波分析和神经网络的相关文献的基础上,针对现有桩基完整性检测领域中的欠缺之处,本文提出基于遗传BP神经网络的桩基检测方法,并且将其应用于实际的桩基检测中,实验证明了此方法在桩基检测领域有着广阔的应用前景。本文主要完成以下工作:
1)提出基于熵规则的最优小波包基的提取,然后用此最优基分解来提取桩基信号的特征,能够有效的提取桩基信号特征,对其进行有效的判别。
2)分析以往神经网络的设计方法,提出基于遗传BP算法的神经网络设计方法,在遗传算法中针对网络结构的不同采用小生境技术,防止优秀个体早期退化,此方法提高了网络的训练速度和精度,有效的搜索网络的全局最优解,提高了网络的范化能力。
3)将本文所设计的遗传BP神经网络应用于桩基完整性检测中,来判别桩基所存在的故障,解决工程中的实际问题。
4)结合研究过程中的体会,为进一步的研究提供具体和重要的研究方向。
第二章 BP神经网络和遗传算法的基本理论
BP神经网络
反向传播网络模型与结构
反向传播网络(Back-Propagation Network,简称BP网络)是对非线性可微分函数进行权值训练的多层前向网络。在人工神经网络的实际应用中,80%~90%的人工神经网络模型是采用BP网络或它的变化形式,它主要用于以下几个方面:(1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数;(2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来;(3)分类:把输入矢量以所定义的合适方式进行分类;(4)数据压缩:减少输出矢量维数以便于输出或存储。可以说,BP网络是人工神经网络中前向网络的核心内容,体现了人工神经网络最精华的部分。在人们掌握反向传播网络的设计之前,感知器和自适应线性元件只能适用于对单层网络模型的训练,只是在BP网络出现以后才得到了进一步拓展。
一个具有r个输入和一个隐含层的神经网络模型结构如图所示:
i=1,2,…,s1; j=1,2,…,r; k=1,2,…,s2
图 具有一个隐含层的神经网络模型结构图
感知器和自适应线性元件的主要差别在激活函数上:前者是二值型的,后者是线性的。反向传播网络具有一层或多层隐含层,除了在多层网络结构上与感知器和自适应线性元件的模型有不同外,其主要差别还表现在激活函数上。反向传播网络的激活函数必须是处处可微的,所以它就不能采用二值型的阈值函数{0,1}或符号函数{-1,1},反向传播网络经常使用的是S型激活函数。此种激活函数常用对数或双曲正切等一类S形状的曲线来表示,如对数S型激活函数关系为:
()
而双曲正切S型曲线的输入/输出函数关系为:
()
图所示的是对数S型激活函数的图形。可以看到是一个连续可微的函数,它的一阶导数存在。对于多层网络,这种激活函数所划分的区域不再是线性划分,而是由一个非线性的超平面组成的区域。它是比较柔和、光滑的任意界面,因而它的分类比线性划分精确、合理,这种网络的容错性较好。另外一个重要的特点是由于激活函数是连续可微的,它可以严格利用梯度法进行推算,它的权值修正的解析式十分明确,其算法被称为误差反向传播法,也简称BP算法,这种网络也称为BP网络。
(a)对数S型激活函数 (b)带有偏差的双曲正切S型激活函数
图 BP网络S型激活函数
因为S型函数具有非线性放大系数功能,它可以把输入从负无穷大到正无穷大的信号变换成-1到1之间输出,对较大的输入信号,放大系数较小;而对较小的输入信号,放大系数则较大,所以采用S型激活函数可以处理和逼近非线性的输入/输出关系。
不过,如果在输出层采用S型激活函数,输出则被限制到一个很小的范围了,若采用线性激活函数,则可使网络输出任何值。所以只有当希望对网络的输出进行限制,如限制在0和1之间,那么在输出层应当包含S型激活函数,在一般情况下,均是在隐含层采用S型激活函数,而输出层采用线性激活函数。
BP算法
BP网络的产生归功于BP算法的获得。BP算法属于算法,是一种监督式的学习算法。其主要思想为:对于q个输入学习样本:,已知与其对应的输出样本为:。学习的目的是用网络的实际输出与目标矢量之间的误差来修改其权值,使(n=1,2,…,q)与期望的尽可能的接近,即:使网络输出层的误差平方和达到最小。它是通过连续不断的在相对于误差函数斜率下降的方向上计算网络权值和偏差的变化而逐渐逼近目标的。每一次权值和偏差的变化都与网络误差的影响成正比,并以反向传播的方式传递到每一层的。
BP算法由两部分组成:信息的正向传递与误差的反向传播。在正向传播的过程中,输入信息从输入经隐含层逐层计算传向输出层,每一层神经元的输出作用于下一层神经元的输入。如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。
为了明确起见,现以图所示两层网络为例进行BP算法推导。
k=1,2,…,s2; i=1,2,…,s1; j=1,2,…,r
图 具有一个隐含层的简化网络图
设输入为P,输入神经元有r个,隐含层内有s1个神经元,激活函数为F1,输出层内有s2个神经元,对应的激活函数为F2,输出为A,目标矢量为T。
1)信息的正向传递
(1)隐含层中第i个神经元的输出为
, ()
(2)输出层第k个神经元的输出为
, ()
(3)定义误差函数为
()
2)利用梯度下降法求权值变化及误差的反向传播
(1)输出层的权值变化
对从第i个输入到第k个输出的权值有:
()
其中:
()
同理可得:
()
(2)隐含层权值变化
对从第j个输入到第i个输出的权值,有:
()
其中:
, ()
同理可得:
()
BP网络的设计
在进行BP网络的设计时,一般应从网络的层数、每层中的神经元个数和激活函数、初始值以及学习速率等几个方面来进行考虑。下面讨论一下各自选取的原则。
1)网络的层数
理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。这实际上已经给了我们一个基本的设计BP网络的原则。增加层数主要可以更进一步地降低误差,提高精度,但同时也使网络复杂化,从而增加了网络权值的训练时间。而误差精度的提高实际上也可以通过隐含层中的神经元数目来获得,其训练效果也比增加层数更容易观察和调整。所以一般情况下,应优先考虑增加隐含层中的神经元数。
另外还有一个问题:能不能仅用具有非线性激活函数的单层网络来解决问题呢?结论是:没有必要或效果不好。因为能用单层非线性网络完美解决的问题,用自适应线性网络一般也能解决,而且自适应线性网络的运算速度还更快。而对于只能用非线性函数解决的问题,单层精度又不够高,也只能增加层数才能达到期望的结果。这主要还是因为一层网络的神经元数被所要解决的问题本身限制造成的。对于一般可用一层解决的问题,应当首先考虑用感知器或自适应线性网络来解决,而不采用非线性网络,因为单层不能发挥出非线性激活函数的特长。
输入神经元数可以根据需要求解的问题和数据所表示的方式来确定。如果输入的是电压波形,那么可根据电压波形的采样点数来决定输入神经元的个数,也可以用一个神经元,使输入样本为采样的时间序列。如果输入为图像,则输入可以用图像的像素,也可以为经过处理后的图像特征来确定其神经元个数。总之问题确定后,输入与输出层的神经元数就随之确定了。在设计中应当注意尽可能的减少网络模型的规模,以便减少网络的训练时间。
2)隐含层的神经元数
网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元数的方法来获得。这在结构实现上,要比增加更多的隐含层要简单的多。那么究竟选取多少个隐含层节点才合适?这在理论上并没有一个明确的规定。在具体设计时,比较实际的做法是通过对不同神经元数进行训练对比,然后适当的加上一点余量。
3)初始权值的选取
由于系统是非线性的,初始值对于学习是否达到局部最小、是否能够收敛以及训练时间的长短的关系很大。如果初始权值太大,使得加权后的输入和n落入了S型激活函数的饱和区,从而导致其导数非常小,而在计算权值修正公式中,因为,当时,则有。这使得,从而使得调节过程几乎停顿下来。所以,一般总是希望经过初始加权后的每个神经元的输出值都接近于零,这样可以保证每个神经元的权值都能够在它们的S型激活函数变化最大之处进行调节。所以,一般初始权值在(-1,1)之间的随机数。另外,为了防止上述现象的发生,威得罗等人在分析了两层网络是如何对一个函数进行训练后,提出一种选定初始权值的策略:选择权值的量级为,其中s1为第一层神经元数目。利用他们的方法可以在较少的训练次数下得到满意的训练结果,其方法仅需要使用在第一隐含层的初始值的选取上,后面层的初始值仍然采用随机取数。
学习速率决定每一次循环训练中所产生的权值变化量。大的学习速率可能导致系统的不稳定;但小的学习速率导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围在~之间。
和初始权值的选取过程一样,在一个神经网络的设计过程中,网络要经过几个不同的学习速率的训练,通过观察每一次训练后的误差平方和的下降速率来判断所选定的学习速率是否合适。如果下降很快,则说明学习速率合适,若出现振荡现象,则说明学习速率过大。对于每一个具体网络都存在一个合适的学习速率。但对于较复杂网络,在误差曲面的不同部位可能需要不同的学习速率。为了减少寻找学习速率的训练次数以及训练时间,比较合适的方法是采用变化的自适应学习速率,使网络的训练在不同的阶段自动设置不同学习速率的大小。
4)期望误差的选取
在设计网络的训练过程中,期望误差值也应当通过对比训练后确定一个合适的值,这个所谓的“合适”,是相对于所需要的隐含层的节点数来确定,因为较小的期望误差值是要靠增加隐含层的节点,以及训练时间来获得的。一般情况下,作为对比,可以同时对两个不同期望误差值的网络进行训练,最后通过综合因素的考虑来确定采用其中的一个网络。
BP网络的限制与不足
虽然反向传播法得到广泛的应用,但它也存在自身的限制与不足,其主要表现在它的训练过程的不确定上。具体说明如下:
1)需要较长的训练时间
对于一些复杂的问题,BP算法要进行几小时甚至更长时间的训练。这主要是由于学习速率太小所造成的。可采用变化的学习速率或自适应的学习速率来加以改进。
2)完全不能训练
这主要表现在网络出现的麻痹现象上。在网络的训练过程中,当其权值调得过大,可能使得所有的或大部分神经元的加权总和偏大,这使得激活函数的输入工作在S型转移函数的饱和区,导致其导数非常小,从而使得对网络权值的调节过程几乎停顿下来。通常为了避免这种现象的发生,一是选取较小的初始权值,另外,采用较小的学习速率,但这又增加了训练时间。
3)局部极小值
BP算法可以使网络权值收敛到一个解,但它并不能保证所求为误差超平面的全局最小解,很可能是一个局部极小解。这是因为BP算法采用的是梯度下降法,训练是从某一起始点沿误差函数的斜面逐渐达到误差的最小值。对于复杂的网络,其误差函数为多维空间的曲面,就像一个碗,其碗底是最小值点。但是这个碗的表面是凹凸不平的,因而在对其训练过程中,可能陷入某一小谷区,而这一小谷区产生的是一个局部极小值。由此点向各方向变化均使误差增加,以至于使训练无法逃出这一局部极小值。
遗传算法
概述
遗传算法是一类模拟生物界自然选择和自然遗传机制的随机化搜索算法,由美国教授于1975年提出。它是利用某种编码技术作用于称为染色体的二进制数串,其基本思想是模拟由这些串组成的种群的进化过程,通过有组织的、然而是随机的信息交换来重新组合那些适应性较好的串。遗传算法对求解问题的本身一无所知,它所需要的仅是对算法所产生的每个染色体进行评价,并根据适应性来选择染色体,使适应性好的染色体比适应性差的染色体有更多的繁殖机会。遗传算法尤其适用于处理传统搜索方法难以解决的复杂的非线性问题,可广泛用于组合优化、机器学习、自适应控制、规划设计和人工生命等领域,是21世纪有关智能计算中的关键技术之一。
遗传算法的中心问题是鲁棒性,所谓鲁棒性是指能在许多不同的环境中通过效率及功能之间的协调平衡以求生存的能力。人工系统很难达到如生物系统那样的鲁棒性。遗传算法正是吸取了自然生物系统“适者生存”的进化原理,从而使它能够提供一个在复杂空间中进行鲁棒搜索的方法。遗传算法具有计算简单及功能强的特点,它对于搜索空间基本上不需要什么限制性的假设(如连续、导数存在及单峰)。
经典遗传算法
Darwin的进化论认为每一事物的每个个体的基本特征被后代所继承,但后代又不完全同于父代,这些新的变化,若适应环境,则被保留下来。在某一环境中也是那些更能适应环境的个体特征能被保留下来,这就是适者生存的原理。Mendel的遗传学说认为遗传是作为一种指令遗传码封装在每个细胞中,并以基因的形式包含在染色体中,每个基因有特殊的位置并控制某个特殊的性质,基因杂交和基因突变可能产生对环境适应性强的后代,通过优胜劣汰的自然选择,适应值高的基因结构就保存下来。GA将问题的求解表示成“染色体”(用计算机编程时,一般是用二进制码串表示),从而构成一群“染色体”。将它们置于问题的“环境”中,根据适者生存的原则,从中选择出适应环境的“染色体”进行复制,即再生,通过交叉、变异两种基因操作产生出新的一代更适应环境的个体,求得问题的最优解。
遗传算法的出发点是一个简单的群体遗传模型,该模型基于如下假设:
1)染色体(基因型)由一固定长度的字符串组成,其中的每一位有有限数目的等位基因。
2)个体由有限数目的基因组成。
3)每一基因型有一相应的适应度,表示该基因型生存与复制的能力。适应度为大于零的实数,适应度越大表示生存能力越强。
以下设字符串的长度为1,等位基因数为2,用0和1表示。则基因型可表示为:
其中,i=1,2,…,l。群体中有n个基因型,用表示第j个,j=1,2,…,n。各基因型均具有相应的大于零的适应度。
下面定义四个遗传算子。
交叉(Crossover)
交叉是在两个基因型之间进行的,指其中的部分内容进行了交换。例如有两个串
若在位置i交换,则产生两个新的串
其中,是随机产生的。交叉是最重要的遗传算子,对搜索过程起决定作用。
变异(Mutation)
若基因型中某个或某几个位置上的等位基因从一种状态跳变到另一种状态(0变为1或1变为0),则称该基因型发生了变异。其中变异基因是随机的。
复制(Reproduction,也称Selection)
按(是的适应度,即的对象函数值,是种群的适应度之和,N为种群数目)决定第i个个体在下一代中应复制其自身的数目。再生意味着适应度越高的个体,在下一代中复制自身的个数越多。
设群体由n个串组成,第i个串的适应度为,则遗传算法由以下基本步骤组成:
1)令k=0,随机产生n个串,构成初始群体;
2)计算各串的适应度,i=1,2,…,n;
3)以以下步骤产生新群体,直到群体中串的总数达到n:
以概率,,从群体中选出两个串,;
以概率对,进行杂交,得到新的串,;
以概率使,中的各位变异。
4)k=k+1,返回2)。
应用GA的几个要点
1)如何将问题描述成串的形式,即问题编码。
在参数优化等问题中,一般将各参数用二进制编码,构成子串,再将子串拼接起来构成“染色体”串。但是不同的串和不同的码制,对问题的求解和GA的收敛时间会有很大影响。对于复杂问题如变结构控制器,神经网络等,如何将问题描述成串的形式就不那么简单,而且同一问题可以有不同的编码方式,如实数编码,二维结构等。
2)如何确定对象函数。
对象函数用于评价各串的性能。函数优化问题可直接将函数本身作为对象函数。复杂系统的对象函数一般不那么直观,往往需要研究者自己构造出能对解的性能进行评价的函数。
3)确定GA算法本身的参数。
种群数目N:种群数目影响GA的有效性。N太小,GA会很差或根本找不出问题的解,因为太小的种群数目不能提供足够的采样点;N太大,会增加计算量,使收敛时间增长。一般种群数目在30到160之间比较合适。
交叉概率:控制着杂交操作的频率,太大,会使高适应值的结构很快被破坏掉;太小搜索会停止不前,一般取到。
变异概率:是增大种群多样性的第二个因素,太小不会产生新的基因块;太大,会使GA变成随机搜索,一般取到。
第三章 基于最优小波包基的特征提取
小波包分析
短时傅里叶变换对信号的频带划分是线性等间隔的。多分辨分析可以对信号进行有效的时频分析。但由于其尺度是按二进制变化的,所以在高频频段其频率分辨率较差,而在低频频段其时间分辨率较差,即对信号的频带进行指数等间隔划分(具有等Q结构)。小波包分析(Wavelet Packer Analysis)能够为信号提供一种更为精细的分析方法,它将频带进行多层次划分,对多分辨分析没有细分的高频部分进一步分解,并能够根据被分析信号的特征,自适应的选择相应频带,使之与信号频谱相匹配,从而提高了时频分辨率,因此小波包具有更广泛的应用价值。
关于小波包分析的理解,我们在这里以一个三层的分解进行说明,其小波包分解树如图所示:
图中,A表示低频,D表示高频,末尾的序号数表示小波包分解的层数,分解具有关系:S=AAA3+DAA3+ADA3+DDA3+DAD3+ADD3+DDD3。
图 小波包分解树
小波包的定义
在多分辨分析中,表明多分辨分析是按照不同的尺度因子j把Hilbert空间分解为所有子空间的正交和的。其中,为小波函数的闭包(小波子空间)。现在,我们希望进一步对小波子空间按照二进制分式进行频率的细分,以达到提高频率分辨率的目的。
一种自然的做法是将尺度空间和小波子空间用一个新的子空间统一起来表征,若令
()
则Hilbert空间的正交分解即可用的分解统一为
()
定义子空间是函数的闭包空间,而是函数的闭包空间,并令满足下面的双尺度方程:
()
式()中,即两系数也具有正交关系。当n=0时,以上两式直接给出
()
与在多分辨分析中,和满足双尺度方程:
()
相比较,和分别退化为尺度函数和小波基函数。式()是式()的等价表示。把这种等价表示推广到(非负整数)的情况,即得()式的等价表示为
; ()
定义(小波包):由式()构造的序列{}(其中)称为由基函数确定的正交小波包。当n=0时,即为()式的情况。
由于由唯一确定,所以又称为关于序列{}的正交小波包。
小波包的性质
定理:设非负整数n的二进制表示为
或1 ()
则小波包的傅里叶变换由下式给出
EMBED ()
式中
()
()
定理:设是正交尺度函数的正交小波包,则,即构成的规范正交基。
小波包的空间分解
令是关于的小波包族,考虑用下列方式生成子空间族。现在令n=1,2,…;j=1,2,…,并对()式作迭代分解,则有
,
…
因此,我们很容易得到小波子空间的各种分解如下:
()
空间分解的子空间序列可写作,;l=1,2,…,j;j=1,2,…。子空间序列的标准正交基为。容易看出,当l=0和m=0时,子空间序列简化为,相应的正交基简化为,它恰好是标准正交小波族。
若n是一个倍频程细划的参数,即令,则我们有小波包的简略记号,其中,。我们把称为具有尺度指标j、位置指标k和频率指标n的小波包。将它与前面的小波作一比较知,小波只有离散尺度j和离散平移k两个参数,而小波包除了这两个离散参数外,还增加了一个频率参数。正是这个频率参数的作用,使得小波包克服了小波时间分辨率高时频率分辨率低的缺陷。于是,参数n表示函数的零交叉数目,也就是其波形的振荡次数。
定义(小波库)由生成的函数族(其中;)称为由尺度函数构造的小波库。
推论对于每个j=0,1,2,…
()
这时,族
;且 ()
是的一个正交基。
随着尺度j的增大,相应正交小波基函数的空间分辨率愈高,而其频率分辨率愈低,这正是正交小波基的一大缺陷。而小波包却具有将随j增大而变宽的频谱窗口进一步分割变细的优良性质,从而克服了正交小波变换的不足。
小波包可以对进一步分解,从而提高频率分辨率,是一种比多分辨分析更加精细的分解方法,具有好的时频特性。
小波包算法
下面给出小波包的分解算法和重构算法。设,则可表示为
()
小波包分解算法 由求与
()
小波包重构算法 由与求
()
最优小波包基的选择
最优小波包基的概念
由双尺度方程
()
所定义的函数集合为由确定的小波包,而从小波包,,中抽取的能组成的一组正交基就称为的一个小波包基。显然对一个信号的小波包分解可以用很多种小波包基来实现,不同的小波包基对信号有不同的分解结果,其结果所能反映出信号特性的程度也不一样。因此,人们希望找到一个最优的小波包基,以便能最有效的表达信号的特性。
首先给定一个序列的信息花费函数M,然后在所有小波包基中寻找使M最小的基。对于一个给定的序列来说,从实际应用上讲,这样一个信息花费函数M应当能描述该序列的集中度或者能说明为了准确描述该序列所需要的小波包分解系数的个数。因此,当所有的系数值都相差不大时,M就比较大,而当大部分的系数均可忽略不计,只有少数几个系数比较大时,那么M就比较小,因此这少数几个系数就集中的体现了隐含在该序列中的信息。信息花费函数就集中体现了隐含在该序列的任何实函数,而最常用的是那些能测得集中度的可加性的花费函数,可加性是指,如果满足
, ()
则称M为一可加性的信息花费函数。
若信息花费函数M已选定,而是可分空间V中的数据序列或矢量。若从小波包基库中选出的某一正交基为B,而Bx是用B展开x时的系数序列<B,x>,如果M(Bx)是最小的,则B为“信息花费函数最小”意义下的最优基。
从小波包库中抽取的能组成中的一组正交基称为一个小波包基。不同的小波包具有不同的性质,反映不同的信号特征。对于某一特定信号,选择一个“最优度量准则”下性质好的最优基进行分解,使展开系数之间的差异明显,能用尽可能少的数据反映尽可能多的信息。若刻画信号的分解系数携带的信息几乎相同(能量集中特性差),会使权值接近而难以取舍;若系数间主次差别分明,则易于舍弃非关键信息,又不影响信号的重构。最优基的选择能使分解系数之间彼此有较大差异而信息损失又很小,为信号处理中的特征提取提供一个较好的分解和重构途径。
最优小波包基的快速搜索法
从小波包基库中选取最优基的算法一般是采用一种自底向顶的搜索算法。用表示按二进制间隔划分的标准正交基,对于k=0只有单个基,自然就是最优基,对于某一k值,假设对所有选定基;对于,选取基,使信息花费函数M最小。令和分别表示x以基展开和以基展开的熵值,逐步搜索过程按下式进行
()
具体计算时,可按以下步骤进行:
1)对于序列x,进行归一化处理,确定所要选择的小波包函数以及分解层数N,进行N层小波包分解,并计算出各节点的熵值;
2)对最底层的各节点作标记,而对其他各层的节点不作标记;
3)每一层共有个节点,从左至右每两个节点构成一组,由下往上进行相邻两层的下一层每组的两个节点之和与上一层对应节点的熵值比较;
4)若下一层的两个节点的熵和大于等于上一层对应节点的熵值,则对上一层的该节点作标记,而去掉下一层的该两个节点(当“下一层”处于中间某层时,还要去掉由该两个节点分解所得到的所有子节点)的标记。否则,以下一层该两个节点的熵值之和取代上一层的该节点的熵值,但不处理标记;
5)从上往下对相邻两层按上述过程逐层进行比较,直至对所有层均处理完毕。被作上标记的所有的节点所对应的小波包函数即是搜索到的最优小波包基。
基于熵准则的小波包基选择
对于c个模式类在某些情况下,当每个类别具有同样的均值或均值非常接近时,,但方差提供了分类信息。如果各类特征矢量某一分量的方差很接近,则这一分量包含的分类信息就少,某一分量的方差相差越大,可分性就越好。因此可用各类特征矢量分量的方差分散度来度量该分量对分类的重要性。熵可用来作为分散度的度量。
设类特征矢量的第l个分量的方差为,归一化后的方差为 ()
因而 ()
表征第l个分量可分性的熵准则为 ()
由式()可以看出,当第l分量的相等时,达到最大值,可分性最差,而当各相差越大,越小,可分性越好。
以以上准则选择小波包分解最优基,具体计算步骤如下:
1)设c个模式类的训练样本集为,为中第k个m维样本矢量,为类的样本数。对进行小波包分解,分解级数j=1,2,…,L。第j级中的第n个小波包子空间为。
2)按式()计算第n个小波包子空间对应的。越小,对应的该特征分量可分性越好。该子空间对分类越有利,对每个子空间,按上述方法可得到一个对应的。
3)在小波包库中找出使为最小值的小波包基,即最优基。该小波包基中所有m个小波包系数对应的值为。对排序后为。
4)对待分类或识别的模式按所选择的最优基进行WPT,并选择与对应的一组WP系数作为特征矢量。
用小波包最优基分解提取信号特征
特征提取是模式识别或分类中的核心问题,它直接影响到分类器的设计和性能。如果不同类别的特征差别较大,就比较容易设计出好性能的分类器。所以对识别或分类来说关键不在于完整的描述模式,而是提取模式中有效的分类特征。所谓有效分类特征就是不同模式类差别较大的特征。但这些特征在原始特征域通常不易被观察或检测。特征提取就是通过变换(通常是线性变换)的方法,使这些重要的特征在变换域显示出来,去掉对分类无意义的信息,这样把原始的高维空间变为低维的特征空间。一般被识别或分类的模式都是非平稳或时变信号模式,通常包含长时低频和短时高频不同尺度的信号。用于分类的特征往往包含在局部的时频信息中,用一般的变换方法很难提取这些信号的重要特征。
小波包变换对信号具有任意的多尺度分解形式,小波包库包含了丰富的小波包基,不同的小波包基具有不同的性质,反映不同的信号特征,能够提供其他变换所不能提供的信号的重要特征。因此根据类别可分性准则,选择一个最优的小波包基,提取有效的分类特征是可能的。
从理论上讲,信号经小波包分解后,其小波包系数即可作为信号的特征表示。然而,小波包分解同小波变换一样缺乏平移不变性,即信号波形完全相同,但相位不同时,得到的小波包分解系数会产生很大的差异,因此这样做将导致模式分类的结果很不准确。除此之外,信号经多级小波包分解后,得到的变换系数数量将非常庞大,这势必使得特征空间的维数很高,不仅计算量大,而且严重降低了分类器的性能。考虑到小波包变换同时是将尺度平面不断分割变细的过程,因而一种简单的方法就是计算每个尺度下的功率(在分解的二叉树中体现为每个节点的能量值,或某个尺度下分解系数的平方和)或能量,以此作为模式类的特征。这样做不仅可以降低输入特征的维数,而且能够大大增强分类性能的鲁棒性。
采用分尺度能量作为不同模式类的分类特征,主要是基于如下的假设,对不同的模式类,信号的能量都能够单独聚集在一起。这样,在对信号进行小波包分解的过程中,就可以同时计算每个二叉树节点上的小波包分解系数平方和,并由此得到一组特征向量,作为分类器的输入。
然而还有一个问题值得注意,小波包分解是对尺度轴作等间隔划分,如果计算每个尺度上的信号能量,将难以获得信号的最佳表示。由于不同应用中的信号特征各异,因而用于表示信号的最优小波包基也应该各不相同。正因如此,在采用小波包变换进行信号分类时,往往先按照某种指标搜索信号的最优基表示,然后计算按照这种最优基分解得到的不同尺度上的能量值,作为分类模式的特征表示。
选择信号的最优小波包基就是根据类别可分性准则(本文采用熵准则),由给定的训练样本进行小波包分解后,按上述准则选择小波包基,把该小波包基变换对应的具有最大可分性的部分小波包系数作为特征矢量。
第四章 遗传BP神经网络的设计
概述
如何针对一个具体的故障诊断问题设计神经网络,目前无规律可寻。各种神经网络系统的设计主要是根据设计者的经验和反复试验来进行的。这样不仅设计效率低,而且还不能保证设计出的神经网络结构和权值等参数的组合是优化的,从而造成资源的大量浪费和网络性能的低下,这种状况极大的限制了神经网络的发展和应用。造成这种结果的主要原因是神经网络系统的设计是一个高度复杂的问题,它体现在如下几个方面:
1)神经网络系统是与应用问题本身密切相关的,解决某一类问题的神经网络很难不加改变的来解决其他领域的问题。
2)由于神经网络可能的节点数和连接数都是无界的,于是存在的神经网络数量是无限的,即搜索空间是无限大的。
3)由于神经网络参数的微小变化可能导致网络性能的完全不同,所以参数对网络性能的影响是不连续的,而且节点和连接数的变化都是离散的,因此参数空间是非常凸的。
4)神经网络参数组合也可能表现出类似的网络状态,即搜索空间是多峰的。
5)训练集合对网络性能的影响是滞后的和带有噪音的,因此需要对网络性能实行在线评估。
由于以上原因,用传统的搜索方法进行神经网络的设计带有很大局限性,而用遗传算法辅助神经网络的设计已被认为是最有前途的方法。
因为小波包分解的结果是一种时频表示方式,因而没有一种比较简单的特征量来表征信号和故障之间的对应关系。实际上,小波包分解中提取的信号的特征是由多个特征元素组成的一个向量,它和故障之间的对应关系是一种复杂的非线性映射,用常规的方法不易实现。人工神经网络在这方面具有得天独厚的条件,是一种理想的分类器。
近年来,人工神经网络在故障诊断技术中的应用成了热门研究课题,国内外学者在这个领域取得了一定的成果,但总的说来,人工神经网络技术用于故障诊断中其诊断的准确性,对多故障的同时诊断以及神经网络结构的确定等方面的研究还处于初级阶段,这些因素限制了神经网络的实际应用,因此如何确定一个神经网络使其对故障能进行精确的诊断是有待研究的课题。
神经网络的设计主要集中在网络权值的选取和神经网络结构的确定两个方面,神经网络设计的好坏直接关系着故障诊断的准确性。
神经网络的选取
在各种神经网络模型中,多层感知器是故障诊断中非常重要的网络,它所用的学习算法是一种有导师的算法--误差反向传播算法,简称BP学习算法。它类似于生物神经网路的信息处理和模式分类的自学习特性。多层感知器包含非线性处理单元,具有极强的分类能力,从它分流出多种前馈网络形式。应用BP算法的多层感知器网络是目前神经网络研究的重点之一,并且已被大量应用于模式识别、过程控制、故障诊断及专家系统等领域。因此本文采用多层前馈网络对桩基信号进行故障检测。
神经网络权值的选取
神经网络权值的选取,是神经网络在学习过程中对权值不断修正的过程,神经网络的学习算法有很多。在诸多的学习算法中,BP算法(Backpropagation Algorithm)是目前使用最为普遍的网络学习算法,其主要思想是从后向前(反向)逐层传播输出层的误差,以间接算出隐层误差。由于其权值修正过程是基于梯度法的,因此存在着收敛速度慢、可能陷入局部极小点等弱点。一般而言,可以采取动态调整确定学习步幅,自适应改变惯性系数等措施来加快BP算法的收敛速度,基于此人们提出了一系列BP改进算法,都取得了一定的效果,但他们都是基于梯度下降法的寻优方法,不可能完全摆脱局部收敛。而为了克服局部收敛,则必须彻底摆脱依赖梯度信息来指导权值调整方向这种方式。
遗传算法是根据达尔文的自然生物进化思想,将其灵活运用到优化运算领域而产生的一种寻优算法,用此方法对神经网络的权值进行训练,可以实现网络的全局寻优,并且加快了搜索过程,为神经网络的设计提供了一种强有力的方法。但它完全依赖概率随机进行的寻优操作虽避免了陷入局部极小点,但在有限次寻优后一般只能得到全局范围的次优解,不易获得最优解。
结合BP算法和遗传算法的优点,提出的一种遗传BP算法,既提高了训练速度,又避免了网络陷入局部最优解,对训练网络的权值可以收到很好的效果。
神经网络结构设计
神经网络结构的设计主要是确定输入网络层数和输出节点及隐层节点的个数,对神经网络结构的确定最初的方法是实验试凑法,但这种方法比较费时。后来经过研究提出了一些设计神经网络结构的方法,主要有增补算法、消减算法和遗传算法。增补算法和消减算法是基于梯度的“爬山”和“下山”法,此方法极易陷入结构的局部极小点,且搜索空间也只是整个结构空间中一个极小的子空间。因此,由这两类方法难以得到优化合理的网络结构。
网络结构优化设计可形式化为一结构空间的优化。该空间中每一点代表一结构,给定结构的性能判据,如最低网络训练误差、最低网络复杂度等。则在结构空间中将形成一结构性能曲面,结构的优化设计即为搜索该曲面最高点的优化过程。该曲面一般具有无界性、离散性、多态性、非可微、复杂、含噪声、伪真等特性。显然,遗传算法正适合这类问题的优化求解。
以上提到的网络权值和结构的训练方法是结构和权重分离的进化策略,其存在的主要问题是适应度评价时存在噪声,所得出的适应度不能真实反映个体的进化质量。适应度评价存在噪声的根本原因是基因型结构个体与显型网络个体间是一对多的映射关系。无权重信息的结构进化设计中个体适应度的准确评价是困难的,克服这一问题的有效方法是对网络结构和权重同时进行进化,即将结构信息和权重信息同时编码,使基因型网络个体与显型网络个体间呈现一一对应关系,以消除适应度评价噪声,从而提高个体进化效率和进化质量。因此本文将网络权值和结构编码成一个基因串,对网络结构和权值同时进行训练,以得到对故障诊断最有利的网络结构。
本文的神经网络设计方法
多层神经网络性能的优劣与隐层数及隐层单元数密切相关,因此对于不同的故障诊断问题,神经网络结构的选取是不同的。对于一个一定的故障诊断问题网络的输入输出节点是已知的,因此网络结构主要是由网络层数和隐层节点的个数来确定。网络的层数可由映射存在定理确定,这个定理是:“给定任一连续函数。这里U是闭单位区间[0,1],f可以精确的用一个三层感知器网络实现。”。任意连续函数可由一个三层感知器网络逼近。因为只有一个隐层的神经网络能够以期望的精度逼近非线性函数,对于一般的故障诊断问题,具有一个隐层的三层感知器已经够用了。
因此本文采用的网络是三层BP网络,BP网络就是前馈多层神经网络,它是由若干个神经元以一定的连接方式组成的非线性系统。可以模拟复杂的、但不能用确定的数学公式表达的非线性函数关系,这个函数关系是通过节点间连接权和节点阈值的综合运算来实现的,其网络结构如图所示:
因此本文神经网络设计问题主要是隐层神经元个数以及网络权值的选取。综合神经网络设计的所有方法,分析它们的优缺点,本文采用将遗传算法和BP算法结合起来对神经网络的结构和权值同时进行优化,并且将BP算法作为一个遗传算子融入到遗传操作的过程中,在遗传的过程中采用小生境技术,将不同结构的神经网络组成不同的小群体进行遗传操作,加快了神经网络的结构和权值的优化速度,提高了全局寻优能力,防止陷入局部最优。其具体实现如下:
图前馈多层神经网络
编码表示
因为要对神经网络的结构和权值同时进行训练,在训练过程中不仅要调整神经网络的权值还要调整神经网络的拓扑结构。对神经网络拓扑结构的调整,也即对隐层节点个数的调整,涉及到两方面的问题:一个是增加(删除)一个隐层节点,将意味着增加(删除)n+m(n为输入节点个数,m为输出节点个数)个与该隐节点的连接权;另一个是增加(删除)一个隐层节点,应该相应的增加(删除)该隐层节点的阈值。因此在神经网络的编码中,将一个隐层节点所涉及到的这两方面数据编码在一起形成一个域,使增加(删除)一个隐层节点的操作映射为在染色体上增加(删除)一个相应的域,从而使交叉、变异等有关的遗传操作可以很容易的实现。因此我们把编码串分为三部分:第一部分表示神经网络隐层节点的个数,只有一个编码;第二部分表示输出层的阈值,共有m个编码;第三部分是隐层节点的阈值及与输入输出节点的连接权,这一部分又由若干个域构成,每个域内反映的是某个隐层节点的阈值及该隐层节点所对应的所有连接权值。由于隐层节点个数、节点阈值、连接权值都为数值,所以这里采用实数编码,将隐层节点个数、节点阈值、连接权值按一定的顺序连为一个长串,形成个体编码。由于隐层节点个数没有预先定义,因此全局优化编码串的长度是可变的,即染色体是变长的,随着网络结构的变化而不断变化的。编码表示如表所示:
表 神经网络结构及权值编码表示
隐层节点个数
输出点阈值
第一个隐层节点的阈值及与其它层节点的连接权
……
最后一个隐层节点的阈值及与其它层节点的连接权
t
…
(1,1), … , (n,1)
(1,1), … , (1,m)
……
(1,t), … , (n,t)
(t,1), … , (t,m)
选择策略
采用赌轮选择。并采用最优个体保留的原则进行复制,对每相连两代中得到的最优个体进行比较,若后代的最优个体不及前代的最优个体,则以前代的最优个体来代替后代的最差个体,这样达到最优繁殖。
遗传操作
1)交叉算子
采用单点交叉,在群体中按照一定的概率选择两个个体,将两个个体的部分编码互相交换。若交叉位在第一位,则要相应的增加(删除)隐节点的阈值及其与其相连接的权值,也就是在编码的第三部分增加(删除)相应的域。
2)变异算子
按变异概率随机选择变异个体,变异位置的确定采用随机的方法产生。变异时,将一个随机数加到原编码上。如果变异位在第一位(即隐节点的个数发生变异),处理方法同上面的交叉操作。
3)BP算子
一般情况下,人们研究遗传算法和神经网络(BP网络)相结合的方法,都是先用遗传算法找到一个优化后的神经网络结构或者是神经网络权值,然后再用神经网络BP算法进一步寻优。这种算法把遗传算法和BP算法相对孤立起来,找到全局最优解,其实质是两种方法的简单叠加。在本文中将BP算法应用到遗传算法中,增加了一种遗传操作,这种操作对遗传算法中每代适应值满足一定条件的个体进行BP训练,得到新的个体,称之为BP算子。本文中只对最优个体进行一定步数的BP训练。
群体设计
由于是对网络的结构和权值同时进行训练,网络的隐节点数是可变的,因此群体中个体的编码串是不等长的。由于不同结构的神经网络进化的情况不同,如隐层节点数多的网络前期进化较快,而使种群的多样性退化,所以可以采用小生境技术(niche)(小生境技术就是将每一代个体化分为若干类,每个类中选出若干个适应度较大的个体作为一个类的优秀代表组成一个种群,再在种群中以及不同种群之间通过杂交和变异产生新一代个体群)以使选择更有长期的意义。主群体中的每个个体都来自一个小群体,在一个小群体中,所有的个体都有相同的网络结构,不同的连接权值,不同小群体的个体在自己的小群体内部进化,而小群体中优秀的个体则有机会作为主群体中的一个个体被交差、变异等,然后再回到原先的小群体进行下一次的小群体内部进化。因而在整个算法中群体种类有两种,一是主群体,主群体中有多种网络结构的个体,二是小群体,每个小群体中的所有个体有相同的网络结构。
文中的算法是以主群体的进化为主线的,小群体主要有以下的作用:
1)使不同结构的网络都能更充分地进化。
2)使各种结构的个体更公平的竞争,主群体中的个体都是某一小群体的优秀个体,是经过一定代数演化的结果。防止真正需要的个体早期退化。
主群体的进化与小群体的进化是既相互独立又相互联系的,图描述了它们初始群体的生成,图则描述了它们在算法中的关系,是本文算法的基本实现过程。图中的a、b、c表示隐含层节点的个数,图中的n表示小群体的个数。
适值函数
将由码串表示的每个个体反编码为相应的神经网络,然后输入所有训练样本,计算神经网络的输出与期望输出之间的均方误差,将此误差与1的和的倒数作为
此个体的适应度:
fitness =
其中K为训练样本总数,M为输出节点个数,为输入第j个训练样本时神经网络的实际输出,为期望输出。
图 初始群体生成示意图
图 主群体与小群体的进化关系
遗传BP算法的步骤
1)随机产生初始种群,其中每个个体中隐节点个数用十进制整数表示,阈值和权值的初始值范围为[-10,10],用十进制浮点数来表示;
2)计算初始群体中每个个体的适应度;
3)初始群体中选择隐节点数相同的个体组成不同的小群体;
4)对每个小群体进行m次进化,进化过程遵循一般的遗传算法(进行相应的选择、交叉和变异操作,繁殖过程采用最优个体保留策略),然后在每个小群体中选择优秀个体来组成主群体;
5)对主群体中的个体按照上面所介绍的遗传算子分别进行交叉和变异操作,然后选出其中优秀的个体进行BP训练;
6)计算主群体中每个个体的适应度;
7)如果达到了预先设定的进化代数或网络的均方误差达到了给定的值,则算法结束。否则将主群体中的个体返回到相应的小群体,然后转步骤4)。
第五章 遗传BP神经网络在桩基检测中的应用
概述
桩基属于隐蔽工程。施工结束后通常采用动测法来检测桩身的完整性,即判别桩身是否有裂纹、缩颈、混凝土离析和夹泥等质量问题。桩基完整性检测是指利用仪器对桩中的裂纹、缩颈、混凝土离析、夹泥等缺陷进行测试。其测试方法通常可分为有损试验和无损检测。
在无损检测中,由于桩身缺陷的不可见性,故通常采用声脉冲反射波法。该方法是用一手锤在桩顶激发出一声脉冲,当声脉冲沿桩身向下传播时,如遇到波阻抗(桩身中的缺陷会引起波阻抗的变化)变化的截面将会发生反射,也就是缺陷处产生反射波。由此可见,桩顶反射波信号中包含了反映桩中缺陷的大量信息,这样就可以利用在桩顶接收到的反射波信号识别缺陷出现的位置、缺陷的类型及其严重程度等。如何正确认识和理解桩顶反射波信号,对于合理解释试验结果和对桩基完整性作出正确评价是非常重要的。
目前用于桩基动测数据分析的方法较多,就其原理而言,不外乎采用时域分析或频域分析法。其中,时域分析考察的是以时间为横坐标的桩身波动曲线,虽然可以据理论分析写出其传递函数及桩头的位移方程,但几乎无法确定函数中若干系数的取值。而频域分析是应用FFT(快速傅立叶变换)和谱分析来研究其特征,虽然能得出更多的分析结果,但是对于结果的解释主要还是利用测试人员的工程经验。有时对于同一种测试数据,不同背景的人做出的判断可能有相当大的出入。亦即由于桩--土体本身的复杂性,传统的信号处理方法遇到了极大的困难,由于过多的依赖于经验而降低了其可靠性。为了有效地减少桩基检测中的误差,人们需对用反射波法测桩作更加深入的研究,以寻找更有效的检测途径。
小波分析方法既是应用数学的一个新兴分支,又是处理信号的一个强有力的工具,用神经网络对故障类型的识别和分类在故障诊断领域也已经得到了成功的应用。因此,在探讨桩基完整性检测智能化、自动化过程中,我们考虑用小波分析与神经网络相结合的方法来处理桩基完整性检测问题,为桩基完整性检测开辟新的途径。
在本章中用第四章所介绍的遗传BP算法来设计神经网络,用第三章介绍的特征提取方法提取桩基信号的特征,然后将其应用于桩基完整性检测中。
基于神经网络的桩基完整性检测的设计思路
基于神经网络的一些特点,基于神经网络的桩基识别的基本过程为:桩基信号—预处理(取采样点、去噪)—基于小波包最优基分解的特征提取 —用信号样本训练神经网络—判别。即首先对桩基动测信号进行预处理,然后用小波包最优基分解来提取信号的特征,然后建立适当的神经网络,又对于已知缺陷的信号的特征来训练设计好的神经网络,通过训练后的网络就可以在自动处理数据的基础上对桩基中的缺陷进行识别,而不需要检测人员的参与,实现了桩基检测的智能化并且减少了人为因素所带来的误差,能够更加准确的对桩基故障信号进行检测。其具体实现过程如图所示。
图 桩基完整性检测流程图
样本的采集
基本原理
本文的样本数据是利用RS-1616K(P)测桩仪对模型桩进行试验而测得的。其依据是反射波法,反射波法是以手锤或力棒等激震装置撞击桩顶,产生一纵向应力波信号沿桩身传播,由传感器拾取桩身缺陷及不同界面的反射信号。
反射波理论是建立在一维应力波理论上,将桩视为一维杆体,但由于桩周土阻力、桩身波阻抗等多种因素的干扰,在检测过程中要采取措施排除这些干扰。
影响因素
桩头处理:反射波法测试的信号是由耦合在桩顶的传感器接收到的信号响应。在测试前应凿除桩顶浮浆,暴露出坚硬、新鲜的混凝土。特别是锤击点和传感器安装点要坚实、平整,如果敲击点不能满足上述要求,能量在小范围内迅速耗散而致桩身不能够被激震,也就无法探测缺陷。
传感器的安装:传感器的安装对测试结果影响较大,传感器越轻与桩面耦合越好,与桩之间接触刚度越大,传递性能越好,测试信号也越接近于被测桩体表面的质点振动。
激震方式:激震技术是反射波法完整性检测的重要环节,高频率的脉冲波可提高缺陷处的分辩率,对桩身浅部缺陷的探测有利,但高频波易衰减,不易获取长桩的桩底反射;低频率脉冲波较有利于桩底反射,但降低桩身上部缺陷的分辩率,所以在检测过程中应根据不同的目的选用不同材质、不同重量的激震锤。
采样信号特征
桩基信号故障中比较典型的有缩颈、扩颈、裂缝、离析、沉渣等,对应于各种类型的故障,对其特征分析如下:缩颈故障波形与初始波形同相,波形规则;扩颈故障波形与初始波形反相,波形规则;断裂桩的反射波形尖锐,能量强,与初始波形相位相同;离析桩第一个反射波与初始波形同相,后续波形杂乱,波形能量小,不规则。
由于在工程实际中每种桩不只是存在一种故障,有的桩中有可能存在两种或者两种以上的故障,因此本文所用的模型桩中每个桩中都存在一种以上的故障,本文所用模型桩共有六种类型,第一种类型是完整桩,第二种类型含有缩颈、扩颈和裂缝三种故障,第三类包含一个缩颈和两个扩颈故障,第四类包含缓缩和扩颈两种故障,第五类包含扩颈和缩颈两种故障,第六类是含有裂缝的故障桩。对应于以上六种类型的模型桩,通过实验测得的反射波波形如图所示:
图 类型一
图类型二
图 类型三
图 类型四
图 类型五
图 类型六
图 各类型桩的检测信号
神经网络设计
样本的选择
对以上六种类型的桩进行试验选取一定数量的信号样本作为实验样本,对于完整桩选取5个样本,其它五种类型各选取10个样本,将所有样本中的44个用来进行网络训练,其它11个作为测试样本。
桩基信号的特征提取
在所有的学习和测试样本中,采样点均取512,对所有的样本首先要去除信号的噪声,去除不必要的干扰,当信号的幅值较大时,还可对其进行归一化处理。然后对所有的学习样本进行小波包分解,按照节所提出的基于熵准则的方法提取信号的最优小波包基,根据最优基来提取所有样本的故障特征,在本文中提取了桩的20个特征来进行网络学习和故障的识别。
输入输出节点的确定
图 用于桩基监测的网络结构图
由上一节特征的提取可以知道神经网络的输入节点有20个,输出节点由桩基缺陷类型的编码来确定。本文对以上六种类型的桩进行检测,对应于不同的类型,其编码分别设为:100000,010000,001000,000100,000010和000001,即对应于每一种情况,网络对应有一个代码输出,因此本文的神经网络的输出节点有6个。输入输出节点确定以后,根据第四章所提出神经网络学习算法,把所有的学习样本输入到神经网络进行训练,可以得到隐层节点的个数为25。因此本文中用于桩基检测的神经网络的结构为20-25-6,如图所示。
本文方法的识别结果及分析
将11个待测试样本经过小波包分解后提取故障特征,然后输入训练好的神经网络进行识别,识别结果如表所示。
表 本文方法对待测样本的识别结果及判断情况
类型
已知代码
识别结果
判断
类型一
100000
正确
类型二
010000
正确
类型二
010000
正确
类型三
001000
正确
类型三
001000
正确
类型四
000100
正确
类型四
000100
正确
类型五
000010
正确
类型五
000010
正确
类型六
000001
正确
类型六
000001
正确
由识别结果可以看出,本文所设计的人工神经网络显示了极强的识别能力,识别精度比较高,就本文测试样本来说识别率达到了100%,得到了令人满意的识别结果。而且识别结果的好坏还与测试仪器以及测试地点的不同而有所不同,即使有所偏差,也可能是因为地质和工艺因素的差异而造成的,因此在判断时要排除各种外界的干扰因素,以达到最好的识别效果。
遗传神经网络识别结果以及与本文方法的对比
本文所用方法对桩基故障类型进行了很好的识别,为了说明本文所用方法的优越性,将本文方法与传统的遗传神经网络进行对比。
表给出了用传统遗传神经网络对上述样本的识别结果,结果表明此方法的识别率虽然也比较高,但识别精度不如采用小生境技术的遗传BP神经网络的识别精度高,而且从遗传算法和采用小生境技术的遗传BP算法对神经网络优化过程,如表所示进化代数,以及图和图的误差曲线图可以看出采用小生境技术的遗传BP算法对神经网络的优化要快,为了能更好的说明这一点,图给出了两种方法的误差曲线对比,在图中能够明显看到本文方法的优越性,图中实线是小生境遗传BP算法的误差,虚线表示传统遗传算法的误差。
表 遗传神经网络对待测样本的识别结果及判断情况
类型
已知代码
识别结果
判断
类型一
100000
正确
类型二
010000
正确
类型二
010000
正确
类型三
001000
正确
类型三
001000
正确
类型四
000100
正确
类型四
000100
正确
类型五
000010
正确
类型五
000010
正确
类型六
000001
正确
类型六
000001
正确
表遗传算法与遗传BP算法的对比
误差精度
进化代数
遗传算法
515
遗传BP算法
276
小生境遗传BP算法误差曲线图
传统遗传算法误差曲线图
两种方法的误差曲线对比
总结
本文所用的遗传BP神经网络对桩基故障类型进行了很好的识别,而且将本文方法与传统遗传神经网络进行对比,试验结果证明了本方法的优越性和有效性,并且本文所作的小波分析与神经网络结合用于桩基检测有着广阔的应用前景,具有实际的应用价值。
本文所用方法能够对多故障的模型桩进行识别和分类,如果实验样本中含有单种故障类型,用本文的方法同样可以进行分类识别。本文目前所作的工作实现了故障类型的识别和分类,对于一个桩中含有多种故障的情况,只能对其进行种类的划分,还不能对各种故障进行一一的识别,此工作有待于以后进一步研究,而对故障类型进行定位也是以后需要研究的一个方面,实现故障类型的定位对于工程施工质量将有着非常重要的意义。
全文总结
桩基是一种工程问题,在工地现场采集的桩基信号,由于人为的因素,单纯用肉眼凭借经验很难对桩的完整性作出准确的判断,因此人工神经网络法是一种不依赖于操作者的经验,能在现场进行快速识别的有效方法。神经网络可以解决用传统手段难以辨析的工程技术问题,并且其判别系统的安装简便、易行,可在工程实际中推广应用。
本文将遗传算法和BP算法结合起来,进行神经网络的设计,并且针对具体的网络结构在训练过程中可变的这一特点,在遗传算法中采用小生境技术,防止优秀个体的早期退化,实现对网络的全局寻优。并且将其与小波包分析结合起来应用于桩基完整性检测中,实验结果证明了此方法的正确性与有效性。并且本文所用的基于最优小波包基的特征提取能够有效的提取桩基信号的特征,有利于网络的训练和故障模式识别。在本文中神经网络的优化过程中前期和后期进化较快,而在训练的中期进化较慢,出现此种情况有可能与遗传算法中种群的选取以及遗传操作中交叉和变异概率的选取有关,可以对其进行进一步的探讨。
而且本文方法实现了对桩基故障信号故障类型的识别和分类,可以对含有多种故障类型的桩基信号进行识别。此工作虽然对桩基完整性检测有着一定的应用价值,对解决实际问题有着一定的意义,但是由于桩基工程的复杂性和一些外在因素的影响,要实现桩基的完整性检测,本文所作的工作还有所欠缺,为了能够满足实际的需要,我们还有必要进行进一步的深入研究。
针对应用神经网络进行桩基完整性检测中存在的问题,以后的工作可以在以下几个方面进行:
1)通过大量对比研究,搞清楚在不同地质、工艺条件下神经网络的适应性及识别能力的变化,从而为合理的选用神经网络结构和进一步发展系统积累大量的实际数据资料。
2)进一步研究神经网络的设计过程,研究输出信息的表达形式,以及故障特征的提取问题,实现多故障中各个故障的识别以及故障类型的定位,将对实际的桩基检测工程有着重要的意义。
3)将神经网络的学习程序与桩基信号采集的动侧仪器融为一体,构成一个完整的系统,可以通过这个系统来进行离线的和在线的学习,实现大批量数据的学习和识别,最终实现全自动化判别。
因此本文所作的工作是比较有实用价值的,对其进行完善将会有实际的应用价值,有待进一步研究。
致谢
二十一世纪是信息化的时代,科学技术的发展日新月异。从1948年维纳奠基性著作《控制论》发展至今半个多世纪以来,伴随着科学技术的迅速发展,控制理论从景点控制理论发展到现代控制理论,从线性系统理论发展到非线性系统理论,由于面对现代日益复杂的被控对象的高度非线性、时变性及不确定性等问题,而再到智能控制理论,知识的更新一日万里。
在研究生学习的三年期间以及论文的完成过程中,本人无论在基础理论方面还是在科研水平上都取得了长足的进步。这一些都离不开导师王英健教授认真细致的指导。王老师对我不仅在学业上言传身教,孜孜不倦,而且在生活上也是关怀备至。正是王老师渊博的知识、严谨的治学态度、细致入微的教导,鼓舞我不断探索、不断进步,并顺利完成了本文的研究工作。在此,谨向导师王英健教授致以我最崇高的敬意和最衷心的感谢!
在研究生学习和论文撰写期间,计算机与通信工程学院领导和老师都给予了我极大的支持和倾心的帮助,还有路桥学院吴军老师为我提供本文所需的实测数据。谨此致以最崇高的敬意和最衷心的感谢!同时,也衷心的感谢研究生部所有领导和老师的关心和帮助。在三年的研究生学习期间,我的家人和朋友在生活和学习上都给予了我极大的支持和帮助,在此表示衷心的感谢!
本文在某些方面难免存在不足之处,请各位老师、专家批评指正。谢谢!
姓名:戎丽霞
日期:2004年5月
参考文献
[1] 边肇祺,张学工等.模式识别.北京:清华大学出版社,1999
[2] 胡昌华,张军波,夏军等.基于MATLAB的系统分析与设计--小波分析.西安:西安电子科技大学出版社,1999
[3] 徐章遂,房立清,王希武等.故障信息诊断原理及应用.北京:国防工业出版社,2000
[4] 阎平凡,张长水等.人工神经网络与模拟进化计算.北京:清华大学出版社,1999
[5] 虞和济,陈长征,张省等.基于神经网络的智能诊断系统.北京:冶金工业出版社,2002
[6] Bornholdt Sand Graudenz D.General Asymmetric Neural Networks and Structure Design by Genetic Algorithm.Neural Networks,1992(5):327~334
[7] Venkat Venkatasubramanian,King Chan.A Neural Network Methodology for Process Fault Diagnosis.Journal of AIChE,1989,35(12):1993~2002
[8] Kajior Watanabe,et al. Incipient Fault Diagnosis of Chemical Processes via Artificial Neural Networks. Journal of AIChE,1989,3(11):1803~1812
[9] Hoskins .,Kaliyur and David .Fault Diagnosis in Complex Chemical Plants Using Artificial Neural Networks.Journal of AIChE,1991,37(1):137~141
[10]Naidu,.,,et al.Use of Neural Networks for Sensor Failure Detection in a Control System.IEEE Control Systems Magazine,1990,49(2):225~231
[11]Yao,.,and .Control System Sensor Failure Cetection via Networks of Localized Receptive Fields.American Control Conf.,San Diego,CA,June(1990)
[12]Ungar ,et al.Adaptive Networks for Fault Diagnosis and Process Control.Computer ,1990,14(4/5):361~572
[13]Mo-yuen Chow.A Neural Networks Approach to Real-Time Condition Monitoring of Induction Motor.IEEE Transactions on Industrial Electronics,1991,38(6):448~453
[14]Kajior Watanabe,et al.Diagnosis of Multiple Simultaneous Fault via Hierarchical Artificial Neural Networks.Journal of AIChE,1994,40(5):839~848
[15]虞和济,机械设备故障诊断的人工神经网络识别法.机械强度,1995,17(2):48~54
[16]屈梁生,孟建.机械故障诊断技术与当代前沿科学.第八届全国设备诊断会议论文集(武汉),1995:9~34
[17]颜廷虎,钟秉林,黄仁.BP神经网络在旋转机械故障诊断中的应用.东南大学学报,1993,23(5):16~20
[18]张炜等.旋转机械故障诊断中的神经网络改进算法研究.振动工程学报,1996,9(1):31~37
[19]张静远,张冰,蒋兴舟.基于小波变换的特征提取方法分析.信号处理,2000,16(2):156~162
[20]陈长征,张省,虞和济等.基于小波分析的机械故障诊断特征提取研究.机械强度,2001,23(2):161~164
[21]周维忠,冯心海,孙国基.基于小波系数聚类的特征提取分类方法.计算机研究与发展,2001,38(8):982~987
[22]Kalayci T,Ozdamar O,Erdol N.The use of wavelet transform as preprocessor for the neural network detection of EEG spike.In:Proc IEEE Southeast Conference,Singapore 1994,1~3
[23]沈国重,陈章位,方志宏等.基于小波变换预处理的一种神经网络故障诊断方法的研究.中国机械工程,1999,10(11):1253~1255
[24]G Savevarsson,J R Sveinsson,J A Benediktsson.Wavelet-Package Transformation as a Preprocessor of EEG Waveforms for Classification[C].In:Proc of 19th International Conference on EMBS,1997:1305~1380
[25]王首勇,朱光喜,唐远炎.应用最优小波包变换的特征提取方法.电子学报,2002,31(7):1035~1038
[26]张晓文,杨煜普,徐晓鸣.基于最佳小波包基分解的特征表示.计算机工程与应用,2003(6):97~99
[27].Orthonormal Entropy-based algorithm for Best Bases Selection.IEEE Trans. on Info. Theory,1992,38(2),713~718
[28]Saito N.Local Feature Extration and its Applications Using a Library of Bases[D].PhD thesis,Yale University,1994:7~12
[29]黄艳芳,何福顺,杨洁明.基于小波包预处理的神经网络故障模式识别的研究.煤矿机械,2002(5):18~20
[30]Koza J R,Rice J P.Genetic generation of both the weights and architecture for a neural network.International Joint Conference on Neural Networks,IJCNN-91-Seattle,1991:397~404
[31]Maniezzo V.Genetic evolution of the topology and weight distribution of neural networks. EEE Transaction on Neural Networks,1994,5(1):39~53
[32]黎明,严超华,刘高航.遗传算法优化前向神经网络结构和权重矢量.中国图象图形学报,1999,4(6):491~496
[33]张敏,赵金城.全局优化神经网络拓扑结构和权值的遗传算法.大连大学学报,1999,20(6):9~13
[34]熊凌,赵明旺.基于遗传算法的BP网络全局收敛的混合智能学习算法.武汉科技大学学报(自然科学版),2000,23(2),183~186
[35]郭晓婷,朱岩. 基于遗传算法的进化神经网络. 清华大学学报(自然 科学版),2000,40(10):116~119
[36]将雄伟,王振华,谢恒堃.基于遗传算法的神经网络在局部放电模式识别中的应用.西安交通大学学报,1999,33(12):1~4
[37]Hozumi N,Okamoto T.Discrimination of partial discharge pattern using a neural network.IEEE Trans on Electrical Insulation,1992,27(3):550~556.
[38]申敏.遗传算法与神经网络在模式分类中的应用.重庆邮电学院学报,1998,10(2):14~16
[39]Brill F Z,Brown D E and Martin M N.Fast Genetic Selection of Features for Neural Network Classifiers.IEEE Trans Neural Networks,1992(3):324~328
[40]Chen D,Giles C,Sun G,et al.Construction learning of recurrent neural networks[J].IEEE International Conference on Neural Networks,1993,3:1196~1201
[41]Daubechies I.The wavelets transform,time-frequency localization and signal analysis.IEEE Trans on Information Theory,1990,IT-36(5):961~1005
[42]Fillippo M,Domenico P.Evidence of hyperplanes in the genetic learning of neural network.Biol Cybern,1992,66(1):26~32
[43]Frean M.The upstart algorithm:A method for constructing and training feed-forward neural networks[J].Neural Computation,1990(2):198~209
[44]H Liang,I Hartimo.A feature extraction algorithm based on wavelet packet decompo,sition for heart sound signals[A].Proc of IEEE-SP Inter,Symp[C].USA:IEEE,1998:93~96
[45]Kitano H.Designing neural networks using genetic algorithm with graph generation system[J].Comples Systems,1990,4:461~476
[46]Mallat S G,Hwang W L.Singularity detection and processing with wavelet.IEEE Trans on Information Theory,1992,38(2):617~643
[47]S Chen,S A Billings,P M Grant.Non-linear System Identification Using Neural Networks[J].,1990,51(6):1191~1214
[48]Whitley D,Starkweather T and Bogart C.Genetic Algorithm and Neural Networks:Optimazing Connection and Connetivity.Parallel Comput,1990(14):347~361
[49]Yangjie Ming.Dumage Detection of Roller Bearing Using Wavelet Transform[J].I MAC,USA,1999,Feb:1~4
[50]罗键,刘军祥.一种基于遗传算法的新型神经网络设计.系统工程理论与实践,2002,10:42~47
[51]殷峻暹,陈守煜,邱菊.基于遗传与BP混合算法神经网络的预测模型及应用.大连理工大学学报,2002,42(5):594~598
附录(攻读硕士学位期间发表论文)
[1] 王英健,戎丽霞,唐贤瑛.基于矩阵分析和D-S证据理论的时空数据融合与目标识别. 长沙交通学院学报,2004(3)
PAGE
뿄
껗僚퀊뫅닅볉¯
에얺ꓔꚴ
僚?엓ꇐꢲﲰ僚쒵?ꇈ
엒ꮴ䈊쥐뻱춭싸ç
횷﮹