简介: 以漯河市污水净化中心的Carrousel氧化沟(以下简称氧化沟)系统为考察对象,针对该系统进水水质复杂,控制滞后的难点,引入人工神经网络的理论和方法,对其模拟分析,建立了基于BP网络的氧化沟系统出水COD预报模型。模型性能检验和灵敏度检验表明,建成的模型准确度高,适应性强,可直接用于该系统出水COD预报,这为氧化沟工艺在线控制提供了一条简便的途径。
关键字:人工神经网络 氧化沟系统 出水COD
The ANN Model Predicting Effluent COD of Carrousel Oxidation Ditch System.
LUOYa-tian1, LIAO Run-hua2,CHEN An1, SUN Yao-hua3, WANG Mian3
(1. School of Resource and Environmental Engineering,Wuhan University of Technology,Wuhan 430070,China; 2. School of Material Science and Engineering Jingdezzhen Ceramic Institute,Jingdezhen 333001,China; 3. Luohe Center of Wastewater treatment,Luohe 462000,China)
tract: The carrousel oxidation ditch system in Luohe Center of Wastewater Treatment is difficult to control on-line because the influent characteristics are complex and vary significantly. To resolve the problem, advanced artificial neural network (ANN) was employed to simulate the correlation between water parameters of oxidation ditch system and a BPNN model predicting effluent COD was built up. Sentivity and performance tests showed that the model can adapt to different situations and has good ability to generalize. It can be directly used to predict effluent COD concentration, which is very helpful to oxidation ditch system control on-line.
Keywords: ANN; oxidation ditch system; effluent COD
漯河市污水净化中心于2000年7月正式投产,采用的是典型的极具代表性的Carrousel氧化沟工艺,污水来源主要是屠宰、食品加工、化工和生活污水,其主要技术指标:一期工程:2000年7.7万吨/日(生活污水2万吨/日,工业污水5.7万吨/日),设计流量8万吨/日,设计的进水负荷:COD≤500mg/l,BOD5≤200mg/l,SS≤200mg/l,设计出水指标:COD≤120mg/l,BOD5≤30mg/l,SS≤30mg/l,实际出水水质状况(建模(用人工神经网络建立的氧化沟出水COD预报的模型的简称)数学数据范围,其它不完整记录中有超出以下范围的记录):SS:10~170mg/l,COD:16~77mg/l,TN:2.9~56mg/l,TP:0.03~0.91mg/l ;二期工程2010年11.8万吨/日(生活污水2.6万吨/日,工业污水9.2万吨/日)。由于进水中工业污水成分达到约74%,实际运行水质波动极大,对系统构成强烈冲击,进水COD最高记录超过600mg/l,进水SS经常维持在115~600mg/l,不同工作日进水水质强烈起伏,使工艺在线控制比较棘手,出水达标排放难以保证。对氧化沟这一复杂的活性系统,由于影响工艺过程的因素反应的复杂性和高度非线性,常规的模型适应能力有限,而以机理分析为基础的动力学模型要求信息完备,参数齐全,实际生产中不便于推广。人工神经网络(ANN)以其连续时间的动力学行为、良好的非线性品质、大规模并行分布处理、高度稳健性和学习联想能力等特点,被广泛应用于模式识别、信号处理、系统控制中。并且ANN可以不完备信息建模,不需要被辨识对象阶次结构等先验知识,建模方法简单[1-3]。本研究针对该净化中心氧化沟系统进水水质复杂、起伏大,控制滞后的难点,通过使用BP模型,直接以正常运行时的生产数据为学习样本建模,预报出水COD,详细探讨了模型设计、训练及检验等环节,建成的模型准确度较高,适应性强,可作为一种定性与定量相结合的有效工具,直接用于该系统出水COD预报。
1 模型原理及设计
1.1 BP网络模型
按误差反向传播原则建立的BP(Back Propoga--tion)学习算法,是当前ANN技术中最成功的学习算法,前馈型BP网络及在此基础上改进的神经网络,是当前应用最广泛的网络类型[4]。本研究以MATLAB环境下的神经网络工具箱与统计工具箱[5]为数学工具,编制的BP模型由三层神经元组成,其主要特点是:
1.1.1 输入层由影响出水COD的各因素组成,为使样本信息尽量丰富,并考虑到指标监测方便可行,选择以下参数作为输入矢量:X1:水温,X2:进水SS浓度,X3:进水COD浓度,X4:进水氨氮浓度,X5:MLSS,X6:MLVSS,X7:SV30(沉降30分钟体积比)。输出层产生ANN输出矢量Y,本研究希望输出的是出水COD浓度Y。隐含层层数的选择与问题的复杂性有关,隐含层层数的增加将使训练费用急剧上升,本研究采用一层隐含层,隐节点数的确定考虑到两原则:①样本数大于网络可调数[6];②几何平均规则[7]:对一个三层网络,具有n个输入节点,m个输出节点,则中间层节点数H= 。本研究取节点数4~14,以期对其在更大范围优化。图1给出了训练成功的一组网络结构。
1.1.2 以logsig或tansig函数作为隐含层激活函数,分别使用这两种函数作网络训练,择优而用。以logsig作为输出层激活函数,将输出结果控制在[0,1],式中,b为偏差值,x表示隐含层中的节点数值。
logsig函数:
tansig函数:
1.1.3 采用Levenberg-Marquart收敛规则,该规则采用了数值优化算法,可根据误差大小自动调整牛顿法与梯度法在训练中的比重,是目前最快的收敛算法,大大降低了训练费用。
1.2 训练集与检验集
ANN模型的预报能力与学习样本质量及信息量紧密相关,出水COD预报的BP网络模型(以下简称模型)样本数据取自漯河市污水净化中心2000年8月至2002年2月间生产数据,完整记录(包括全部模型输入输出参数)共89组,剔除发生生产事故(有记载的酸碱中毒、活性膨胀等)状态下记录7组,剩余82组(考虑到数据样本集规模不大,故包括了一些超标排放数据),初步确定为学习样本集。进水水质参数变化范围:水温:10.8~3℃;SS:139~1062mg/l;COD:109~694mg/l;NH4+-N:12.88~496mg/l;控制参数:SV30:12~93;MLVSS:1107~3484 mg/l;MLSS:2226~6226 mg/l。生产报表无进水水量记载,故假定每个工作日进水水量连续稳定,但建成模型检验结果反映出进水水量是一个重要模型参数,由于缺乏相关数据,使得模型性能欠佳。筛选出82组代表性数据中,通过主要成分分析及聚类分析[8],发现三组样本有离群倾向,但不太突出,不做去除,以防止信息量的损失,最终确定学习样本规模为82组。
以欧氏距离作为表征相似性的统计量,采用平均距离判断依据将原始样本分为10类,根据聚类结果,从各类中随机挑选1/3左右的样本归入检验集,剩余的归入训练集。最终确定47组用于训练,35组用于检验。聚类分析,保证了所取的训练样本分布均匀且能覆盖原始样本提供的结构信息,弥补了原始数据量较少的不足。
对训练集与检验集数据做预处理,笔者在此提出三点规范:①保持原始样本统计规律,数据拓扑结构。②绝大部分网络期望输出要在输出层激活函数的敏感区内,避免进入不应区。对logsig函数而言,敏感区为[0.15,0.85]。③网络输出逆变换不能放大误差。本研究对原始数据作如下预处理,式中x表是原始值, xmin与xmax分别表示原始值中的最小值与最大值,xnorm表示训练输入值:
1.3 建模试验要点
1.3.1 由于训练、检验样本自身含有噪声,其大小未知,故建模应以预报准确度作为首要目标,精度作为次要目标。这里引入①检验误差E:检验样本网络输出值允许误差的上限;②准确度:不大于E的检验合格率。用训练总平方误差G衡量模型精度,精度不可过高,否则会诱导网络记住噪声。如何协调精度与准确度之间的矛盾,找出二者最佳组合,尽可能达到模型性能最优化是数值试验的重中之重。
1.3.2 BP网络学习收敛速度及局部最小点的性能对初始化权值、偏差矩阵十分敏感,本研究通过加大随机初始化次数来搜索模型满意解,对给定的网络结构及参数组合实行1000次随机初始化权值、偏差矩阵搜索。
1.3.3 模型性能检验,采用四项指标[9-12]:相关系数C,均方根误差R,标准均方根误差N,平均相对误差A,如下式中x、y分别表示输入与输出样本值,下标i表示第i次训练时对应样本值,n表示训练次数, 、 表示相应样本均值,x1i表示输入第一个变量的第i个样本值,x2i类推:
对网络实际输出与期望输出(观测值)作指标检验,可反映出模型的逼近性能。
1.3.4 模型的灵敏度检验[13]:目标值在多维空间中每一点随各个自变量改变而改变的趋势。灵敏度曲线平缓表明该项输入对网络输出的影响过弱,灵敏度曲线出现突变或中断表示该项输入对网络输出的影响过强,此时模型模拟性能不稳定,碰到这两种情况,应继续搜索或调整输入变量个数重新训练。
2 模型训练及检验
建模数值试验参数调整范围设定:E:0.2~0.4;G:0.001~0.5;隐节点数H:4~14;隐含层激活函数:tansig或logsig;输出层激活函数:logsig;训练最大迭代次数:1000。从72,000次搜索训练中筛选出最佳的一组解:网络结构7-6-1(三层神经网络每层节点数), E=0.3, G=0.15,H=6,隐含层函数:tansig。模型训练经过18次迭代达到稳定,训练总平方误差0.13,图2为误差下降曲线;模型模拟及检验(预报)结果见图3。
图2 误差下降曲线
Fig 2. The Error Curve of Training
模型性能指标值见表1。
表1 模型性能指标
Tab 1 The Values of Model Performance Testing
指标 | C | R | N | A |
模拟 | 0.9517 | 5.0152 | 0.1309 | 0.1214 |
预报 | 0.7399 | 9.9225 | 0.2645 | 0.2436 |
综合 | 0.8709 | 7.5127 | 0.1978 | 0.1736 |
从学习样本集检验合格的样本中任取一组样本,对应输入矢量X1…X7分别为:{14.3,273,292,33,5479,3394,44},考察网络输出随单项输入变化而改变的趋势,灵敏度曲线见图4
图3 出水COD原始值与模拟/预报结果
Fig.3. Observed and Simulated/Predicted Results of Effluent COD
图4 模型灵敏度曲线
Fig 4. The Sentivity Curves of Model
3 讨论
3.1 学习样本的质量对模型预报精度及准确度影响极大。学习样本自身的噪声干扰降低了模型的预报精度及准确度。尽管通过主成分分析与聚类分析有效挖掘了样本信息,噪声干扰与训练样本规模较小是模型训练准确度与精度进一步提高的主要障碍。
3.2 模型性能检验基本合格,检验集对应的平均相对误差<0.25,相关系数接近0.75,标准均方根误差0.26,通过图3可看出,模型在预报区能对出水COD峰值作出正确响应,表明网络在训练中捕捉到了氧化沟系统参数间关系的本质。在E≤0.3的前提下,预报准确率达到82.9%,在E≤0.35的前提下,预报准确率达到88.6%,综合相关系数0.87,综合标准均方根误差0.19,建成的模型可行。
3.3 数值试验中,提高精度,准确度下降;降低精度,准确度上升。对含较大噪声的样本训练而言,适当降低精度,把检验重点放在准确度上是可取的。
3.4 从灵敏度曲线分析可见,出水COD对7项输入参数的灵敏度均较高,灵敏度曲线光滑,并且能定量反映出给定水质条件下出水COD与单项输入参数的相关性及单项参数对出水COD的最佳控制点。
4 结论
1 以漯河市污水净化中心氧化沟系统为考察对象,采用人工神经网络方法对其进行模拟分析,建立了氧化沟系统出水COD预报模型(以下简称预报模型)。
2 建立的预报模型,在E ≤0.3的前提下,预报准确率达到82.9%,在E≤0.35的前提下,预报准确率达到88.6%,综合相关系数0.87,综合标准均方根误差0.19。
3 建立的预报模型,出水COD对7项输入参数的灵敏度均较高,灵敏度曲线光滑,并且能定量反映出给定水质条件下出水COD与单项输入参数的相关性及单项参数对出水COD的最佳控制点,为建立水质参数的反馈控制模型,将预报与反馈控制相结合,实现氧化沟系统在线智能控制奠定了基础。
参考文献:
1 靳蕃. 神经计算智能基础原理、方法[M]. 成都: 西南交通大学出出版社,2000.
2 田禹,王宝贞,周定.人工神经网络对水处理系统建模适应性研究[J]. 环境科学学报,1999,19(1):33-36.
3 郭劲松,龙腾锐,高旭等. 间歇曝气活性系统神经网络水质模型[J]. 中国给水排水,2000,16(11):15-18.
4 杨建刚. 人工神经网络实用教程[M]. 杭州: 浙江大学出版社,2001.
5 闻新,周露,王丹力等. MATLAB神经网络应用设计[M]. 北京: 科学出版社,2000.
6 张爱茜,韩朔睽, 沈洲等. 运用回归分析与人工神经网络预测含硫芳香族化合物好氧生物降解速率常数[J].环境科学,1998,
19(1):37-40.
7 朱东海,张土乔,任爱珠等. BP神经网络用于网模拟试验时的构造参数设计[J]. 给水排水,2001,27(2):10-13.
8 苏金明,阮沈勇. MATLAB6.1实用指南(上册)[M]. 北京:电子工业出版社,2002.
9 Sang H S, Sea C O, Byung W J, etc. Prediction of Ozone Formation Based on Neural Network[J].J. Envir. Engrg.,ASCE,2000, 8:688-696.
10 . Cameron M Z, Donald H B,, Slobodan P S. Short term streamflow forecasting using artificial neural networks[J]. J.Hydro, 1999,214(1):32-48.
11 .Catherine F.B, Pierre L.C..Neural Network Modeling of Organics Removal by Activated Carbon Cloths[J].J.Envir.Engrg,2001,(10):889-894.
12 . Tay J.H, Zhang Xie-yue. Neural Fuzzy Modelling of Anaerobic Biological Wastewater Treatment Systems[J].J. Envir. Engrg.,ASCE,1999,12:1149-1159.
13 .陈念贻,钦佩,陈瑞亮等. 模式识别方法在化学化工中的应用[M].北京:科学出版社.2000.
作者简介: 罗亚田(1949-),男,贵州毕节人,武汉理工大学资源与环境工程学院副教授, 主要研究方向水污染控制工程。