二次供水流量预测模型的构建和应用

慧聪水工业网 2024-06-20 09:11 来源: 净水技术

导读:2020 年9 月,我国向国际社会作出承诺:“力争2030 年前实现碳达峰、2060 年前实现碳中和”,这标志着我国将用全球历史上最短的时间、最高的碳排放强度降幅实现从碳达峰到碳中和,也意味着全行业绿色低碳转型势在必行。 国家统计局数据显示,2022 年末我国城镇化率突破65%,城镇常住人口9.21 亿人,虽然未来城镇化速度将会放缓,但是城镇化仍然是极其重要的趋势。 供水行业作为城市基础设施和公共服务行业之一,是城市发展进程中至关重要的组成部分。 根据E20 研究院数据,2020 年我国城镇供水系统碳排放量超过0.22 亿t CO2,占全行业碳排放约0.2%。 随着城镇化的发展和居民用水需求的升级,供水行业面临碳排放压力将更加严峻。 城市建筑群中高层住宅占比越来越多,二次供水也已成为城市供水系统的重要组成部分。 以常州通用水司为例,2010 年—2022 年,水司管理的二次供水泵房数量由278 个增加到617 个,二次供水电费占企业总电费的比例由7%增加到16%。 随着每年新建二次供水设施的投运、新小区入住率的增加,这一比重还会持续增加,未来二次供水必将成为供水行业实现“双碳”目标的重要环节。

随着政府对二次供水的日益关注,多个部门先后颁布了政策文件,推进二次供水建设管理向规范化、专业化迈进,二次供水设施由供水企业统一管理也成为主流趋势。 早期二次供水设施采用分散粗放化管理方式,在建设运营过程中的不规范、不专业,设备低效运行、漏损严重等问题普遍存在,导致大批存量二次供水设施能耗畸高。 由供水企业主导,在二次供水系统设计、设备选型、运行维护等各环节实施专业精细化管理,才是促进二次供水行业降碳增效的关键。

二次供水设施中水泵是最主要的耗能设备,水泵节能是二次供水最重要的减碳途径。 在对老旧泵房运行数据分析过程中,发现实际流量常远小于设计流量,很多泵房的最大用水流量仅为设计流量的1/3~1/2,这也导致水泵“大马拉小车”的现象普遍存在。 究其根本原因在于二次供水系统设计选型的不精准,尤其是设计流量计算和选择往往不符合实际工况。 目前二次供水流量设计依据为住宅生活给水管道的设计秒流量公式,在计算过程中,由于缺乏二次供水实际流量数据的参考,系数和定额选择都留有余量,最终设计流量和实际流量出现较大偏差。 按此数据来指导机组水泵选型,结合入住率低、用水规律变化大等因素的影响,导致水泵选型普遍偏大。 通过对常州通用水司二次供水泵房运行数据分析,大量水泵60%以上时间在低效区运行,造成了巨大的能耗浪费,也存在较大的降碳空间。 因此,二次供水节能降碳的第一步是如何精准地预测二次供水流量,使系统设计、水泵选型更加切合实际工况,这也是供水企业实施二次供水专业精细化管理最关键的一步。

近年来,科研院校、设备厂家开始采用各类算法进行二次供水流量预测,目前预测方式有基于水泵运行数据预测瞬时流量、基于水箱液位预测用水量、基于单户居民用水量预测二次供水总流量等,这些预测方法主要实现单个泵房或小区用水规律的预测,达到管道漏损预警、水泵效率统计、优化水箱水质等目的,并没有解决如何优化二供系统设计的问题。 为了处理这一问题,本文对常州地区不同规模二次供水小区实际用水量数据样本进行采集汇总,通过基于遗传算法优化的BP 神经网络,学习和映射增压户数、入住率等特征数据与流量之间关系,构建了一种二次供水流量模型,并在二次供水设施旧改项目中对模型进行了应用和验证,取得了良好的节能效果。 该模型提供了一种新的流量模拟预测方式,能够在二次供水设计选型、节能研究等领域提供更精准的流量评估工具,为供水行业的数字化转型提供不竭动力,为推动经济社会资源高效利用和绿色低碳发展,助力“双碳”目标达成作出贡献。

1 研究区域及样本概况

本次研究区域为江苏常州,常州通用水司于2005 年开始参与二次供水设施的建设、改造和运维,在国内率先实现供水区域内所有住宅二次供水设施的统一管理。 目前管理的二次供水泵房共617个,分布在天宁区、钟楼区、新北区及经开区4 个市辖区,涵盖中心城区和远郊乡镇,服务用户达46.9万户,主要采用的供水方式及数量分别为:水箱变频调速式泵房共198 个,管网叠压式泵房共410 个,增压设备和高位水箱联合供水泵房共9 个。 近年来,在新建二次供水设施中,广泛采用水箱变频与管网叠压双模式供水方式,应用了数字全变频、大小泵搭配等节能技术,已取得了良好的成效。 为了进一步探索不同小区二次供水流量规律,在存量二次供水泵房中,根据增压户数、投运年限等因素选取了149个二次供水小区作为研究样本,样本的增压户数为50~3 500 户、投运年限为1~15 年。 增压设备和高位水箱联合供水方式是一种间隔补水的运行状态,不能直观反映用户用水情况。 因此,样本中主要收集水箱变频调速式、管网叠压式供水小区的相关数据,水箱变频调速供水方式主要选择水箱液位恒定、进出水流量基本一致的小区。

2 样本数据处理及模型构建方法

2.1样本的组成

数据样本主要由小区二次供水特征数据与流量数据组成:特征数据包含增压户数、投运年限、入住率等,其中增压户数是设计秒流量计算的关键参数,投运年限、入住率是影响小区实际用水量的重要因素;流量数据包含小区最高日流量、最高日最大时流量、最高日最小时流量等,这些数据可以直观反映小区给水系统的实际用水规律,是优化二次供水系统选择、设备选型、控制逻辑的基础。 这些数据来自不同数据源,经过筛选、集成、归约后,形成流量特征数据样本集,样本集持续更新积累,用于挖掘数据中包含的用水规律,进行相关性分析和流量模型建立。各类数据来源如下:

(1)供水方式、增压户数取自样本小区泵房设计参数,其中增压户数细化为单卫户数和双卫户数;

(2)入住率的基础数据来自营业管理信息系统(MIS),收集样本小区中每个二次供水用户7 月、8月水表抄录数据,为确保入住率统计的准确性,筛选出月用水量大于5 m3 的用户数,得到小区的实际入住率数据;

(3)样本小区泵房进水总管安装有远传水表,实现流量数据的连续采集存储,采集频率为每15 min 一次,通过电脑端管理软件可对流量数据批量导出,筛选出全年用水量最高日,提取当日连续流量数据。

2.2数据清洗和样本筛选

流量监测设备、远传装置、传输信号等问题会导致流量数据的缺失或异常,影响数据分析和建模的准确性,需要预先进行“清洗”。 本次收集样本中,长时间无数据、频繁缺失的样本共6 个,占总数的4%,做直接删除处理;部分样本存在数据少量缺漏的情况,采用样条插值法进行数据插值处理。

增压管网漏损会导致流量明显异常,会对分析结果造成很大影响,采用夜间最小流量分配系数α筛选出可能存在管网漏损的小区。 该系数为夜间最小流量与日平均流量的比值,本研究中将最高日最小时流量作为夜间最小流量,选取α>50%作为漏损筛选阈值,从样本库中剔除漏损小区。

2.3数据相关性分析

流量特征数据样本中有许多变量,为了判断流量数据和哪些变量相关联、关联程度如何,使用皮尔逊相关系数初步分析特征数据间的关联性,确定构建模型的可行性。 皮尔逊相关系数用于比较两个数据变量X、Y 的线性相关性,通常按系数值范围判断相关性强弱(表1),计算方法如式(1)。

表1 皮尔逊相关系数强度

二次供水流量预测模型的构建和应用

二次供水流量预测模型的构建和应用

其中:r——皮尔逊相关系数;

Xi ——第i 个变量X;

¯X——样本中变量X 的均值;

Yi ——第i 个变量Y;

¯Y——样本中变量Y 的均值。

使用皮尔逊相关系数比较时,两个变量均需为连续变量且服从正态分布,选取数据样本中增压户数、投运年限、入住率小区特征数据变量,并加入由增压户数与入住率相乘得到的实际用水户数变量,分析这些变量与最高日流量、最高日最大时流量、最高日最小时流量的相关系数。 使用Matlab 的plotmatrix 函数与corrcoef 函数,将相关性系数以矩阵图形的形式进行呈现,便于直观地分析特征数据变量与流量间的相互关系,各数据变量间散点图分布如图1(a)所示,相关性强度如图1(b)所示。

二次供水流量预测模型的构建和应用

图1 流量特征变量相互关联及强度

变量间皮尔逊相关系数如表2 所示,二次供水各类流量特征与设计增压户数、实际用水户数相关性极强,不同流量特征的相关程度也有一定规律,最高日流量、最高日最大时流量相关性较高,最高日最小时流量相关性次之。 从分析结果可以看出设计增压户数与不同流量特征已有了较高的相关性,结合入住率对实际用水户数进行校正后,相关性进一步提高,具备建构二次供水流量模型的可行性。

表2 流量特征变量相关系数

二次供水流量预测模型的构建和应用

2.4遗传算法优化BP 神经网络原理

人工神经网络最基础的单元是神经元,每个神经元接收来自其他神经元的数据,经过带有不同权重的连接传递加权求和,得到的值与神经元阈值进行对比,通过“激活函数”处理得到输出值,这个输出值又会作为下一个神经元的输入值进一步传递。神经元结构非常简单,但大量神经元构成的人工神经网络形成了一个高度非线性的模型系统,可以通过学习和迭代来处理各种复杂的问题。

BP 神经网络是人工神经网络中的一种,目前应用的范围较广,是按误差逆向传播训练的多层前馈神经网络。BP 神经网络由输入层、隐藏层和输出层组成(图2),输入层神经元数量为m,输出层神经元数量为n, 隐藏层神经元数量为l。 输入层神经元与隐藏层神经元、隐藏层神经元与输出层神经元之间初始连接权值分别为Vij、Wjk, 隐藏层神经元、输出层神经元的阈值偏置分别为γj、θk,其中i=1,2,3,…,m; j=1,2,3,…,l;k=1,2,3,…,n,激活函数为f(x)= 1/(1 + e-x)。

二次供水流量预测模型的构建和应用

图2 BP 神经网络结构

网络训练分2 个阶段:第一阶段为沿神经网络正向传播,得到输出值;第二阶段将误差沿神经网络反向传播,进行各权值和阈值偏置的修正。 经过两个阶段后即完成一次神经网络的训练,反复多次训练直到误差小于目标值完成训练,各权值及阈值偏置会固定,模型构建完成。 应用BP 神经网络时,无需知道输入值和输出值之间的数学关系,依靠批量输入值和输出值对神经网络进行训练,自动形成一个相应的数学模型,在各类预测工作中有较好地应用。

BP 神经网络初始权值、阈值为随机选择,不同初始值会造成结果偏差很大,导致难以收敛、训练时间过长或陷入局部极值等问题,也为此类神经网络留下了很大的优化空间,通过遗传算法对其进行优化便是一种较理想的解决方法。 遗传算法是一种模拟自然界生物进化过程搜索最优解的一种方法,通过数学方式将问题求解过程转化为染色体基因的选择、交叉、变异等过程,筛选出适应度较高的染色体组成新的种群,并不断进行迭代进化,直到满足目标条件,得到适应度最高的染色体即为最优解。 两种算法结合流程如图3 所示,遗传算法能够进行全局查找得到最优解,通过该算法寻找BP神经网络的最优初始阈值、权值,使BP 神经网络能克服初始阈值、权值随机选择的缺陷,以最优解开始训练、迭代,得到最终预测结果。 经遗传算法优化的BP 神经网络在收敛速度、预测精度方面都将有所提升,也成为本次模型构建的主要算法。

二次供水流量预测模型的构建和应用

图3 遗传算法优化BP 神经网络流程

2.5模型建立及评估方法

2.5.1 数据归一化

由于数据样本中各项特征变量的量纲、单位等不同,会影响数据分析的结果,通过数据归一化将各变量限定在一定范围内,如0~1,从而消除量纲、单位等影响,便于加权比较分析,归一化处理如式(2)。

二次供水流量预测模型的构建和应用

其中:X——特征变量;

Xmin ——样本中特征变量最小值;

Xmax ——样本中特征变量最大值;

Xnorm ——特征变量归一化后的值。

2.5.2 BP 神经网络参数设置

根据收集的二次供水流量特征数据样本,将增压户数、单卫户数、双卫户数、入住率作为输入变量,为提高精度,将最高日流量、最高日最大时流量、最高日最小时流量分别作为唯一输出项单独构建模型。 因此,网络输入层神经元数量m 为4,输出层神经元数量n 为1。 隐藏层神经元数量根据经验公式(α 为1~10 的常数)确定范围,通过试凑法反复比较,确定模型最佳隐藏层神经元最佳值为4。

二次供水流量预测模型的构建和应用

2.5.3 遗传算法优化BP 神经网络参数设置

(1)编码长度L= m ×l +l ×n +l +n =25,种群规模选择为20。(2)交叉操作概率取0.4,变异操作概率取0.1。(3)最大进化迭代次数为50 次。

2.5.4 误差评估函数

研究中采用两种评价方法评估模型预测值误差及精度,探究模型可用性。

(1)平均绝对误差(MAE)

MAE 为模型预测值与实际值之间绝对误差的平均值,使用绝对值避免正负误差相抵消,体现预测值与实际值之间的平均偏离距离,当无误差时值为0,计算方法如式(3)。

二次供水流量预测模型的构建和应用

其中:AMAE ——MAE 的值;

yi′——第i 个预测值;

yi ——第i 个实际值。

(2)平均绝对百分比误差(MAPE)

MAPE 为预测值与实际值误差率的平均值,体现预测值的准确性,值越小精度越高,计算方法如式(4)。

二次供水流量预测模型的构建和应用

其中:ηMAPE —— MAPE 的值。

3 模型预测结果及应用

3.1数据样本统计

研究过程中首先对汇总的143 个小区的数据样本进行清洗和筛选。 通过夜间最小流量分配系数α 计算,样本系数值中位数为18.5%,共剔除了5 个可能存在管道漏损(α>50%)的样本。 在对小区样本流量数据分析时,发现投运年限未超过2 年的新小区共26 个,由于入住率过低,最高日小时变化系数平均值为2.1,最小值为1.6,用水规律不明显。 因此,新小区特征数据不在本次流量模型构建中使用,数据样本保留并会在以后定期更新,作为将来新小区入住率变化、流量特征变化研究的基础数据,经过筛选后共保留了112 个数据样本,部分小区流量特征数据样本如表3 所示。

表3 部分小区流量特征数据样本

二次供水流量预测模型的构建和应用

3.2模型预测结果

二次供水流量模型的构建依靠Matlab 编程实现,模型训练完成后保存神经网络结构和参数,并制作小程序调用模型便于使用。 模型共使用112 个特征流量样本进行训练和验证,随机选择97 个样本作为网络训练样本,15 个样本作为预测验证样本,最高日流量、最高日最大时流量及最高日最小时流量预测误差结果如表4 所示。

表4 预测误差值

二次供水流量预测模型的构建和应用


最高日流量模型训练时,根据适应度变化曲线[图4(a)],遗传算法适应度函数值随着迭代次数增加不断下降,在10 代时适应度函数值不再变化,得最优解。预测值与实际值相对比[图4(b)],MAE 为21.46 m3/d,即最高日流量预测的平均偏差值为21.46 m3/d;MAPE 为5.46%。

二次供水流量预测模型的构建和应用


图4 最高日流量模型训练过程及预测值比较

最高日最大时流量模型训练时,根据适应度变化曲线[图5(a)],遗传算法适应度函数值随着迭代次数增加不断下降,在15 代时适应度函数值不再变化,得最优解。预测值与实际值相对比[图5(b)],MAE 为1.36 m3/h,即最高日最大时流量平均偏差值为1.36 m3/h;MAPE 为6.80%。

二次供水流量预测模型的构建和应用

图5 最高日最大时流量模型训练过程及预测值比较

最高日最小时流量模型训练时,根据适应度变化曲线[图6(a)],遗传算法适应度函数值随着迭代次数增加不断下降,在29 代时适应度函数值不再变化,得最优解。预测值与实际值相对比[图6(b)],MAE 为0.32 m3/h,即最高日最小时流量平均偏差值为0.32 m3/h;MAPE 为29.71%。

二次供水流量预测模型的构建和应用

图6 最高日最小时流量模型训练过程及预测值比较

随机选取的15 个小区进行最高日流量模型、最高日最大时流量模型预测,MAPE 均小于10%,模型具备较高可用性,对比设计秒流量方法计算值与实际值相差数倍的情况,已有了很大提升,可以为科研、设计、运维人员开展相关工作提供辅助参考。但对最高日最小流量进行模型预测时,MAPE 均高于29%,不具备可用性,还需要借助更加精确的小流量监测技术、引入更多的管网参数作为输入变量进行模型构建和优化,提升预测精度和泛化能力。

3.3模型应用及成效

3.3.1 水泵选型优化

分别选择聚怡花园增压一区、翡翠锦园增压二区进行模型应用测试,根据模型预测最大流量,优化水泵选型,两个分区主要设计参数及预测结果如表5 所示。

表5 工艺设计参数及预测结果

二次供水流量预测模型的构建和应用

聚怡花园小区的入住率达到了80%,泵房采用水箱变频调速供水方式,增压一区原设计流量为57 m3/h,供水机组水泵型号为格兰富CR32-5-2(水泵参数为流量Q=30 m3/h,扬程H=69.7 m,功率P=11 kW),数量为3 台,2 用1 备。通过对大量小区水表数据分析,由于人口的流动性,不论小区年限,每月用水量在5 m3 以上用户占比一般不超过85%,模型预测时选择入住率值为85%,输入增压户数等其他参数后,预测得最高日最大时流量为21.0 m3/h,最大瞬时流量按最大时流量1.3 倍取值为27.3 m3/h,换算成最大秒流量约为7.6 L/s。该增压分区机组实际运行扬程为50 m,结合预测流量数据,选择CR20-6(水泵参数为Q=21 m3/h,H=70.4 m,P=7.5 kW)替换原主泵,该型号水泵扬程在50 m 时,单台水泵流量可覆盖0~27.9 m3/h,水泵更换后,用水高峰时运行频率最高为47 Hz。

翡翠锦园小区的入住率仅为63%,泵房采用管网叠压供水方式,增压二区原设计流量为28 m3/h,供水机组水泵型号为格兰富CR32-5-2(水泵参数为流量Q = 30 m3/h,扬程H = 69.7 m,功率P =11 kW),数量为2 台,1 用1 备。模型预测时入住率同样取85%,以满足未来入住率增加后的供水量需求,输入增压户数等其他参数后,预测得最高日最大时流量为9.1 m3/h,最大瞬时流量按时最大时流量1.3 倍取值约为11.8 m3/h,换算成最大秒流量约为3.3 L/s。该增压分区机组实际运行扬程为78 m,市政管网日常最低可用压力H0 为25 m,实际水泵扬程Hb 需求为53 m,结合预测流量数据,选用1 台格兰富CR15-5(水泵参数为Q=17 m3/h,H=55 m,P=4 kW)替换原主泵,该水泵扬程在53 m 时,单泵流量可覆盖0~18 m3/h,在市政管网出现异常情况时,市政压力下降至15 m 时供水机组会自动停机保护,此时单泵流量仍可覆盖0~12 m3/h,满足最大流量需求,水泵更换后,用水高峰时运行频率最高为42 Hz。

3.3.2 节能效果

为了直观地比较根据流量模型优化选型后水泵的吨水电耗情况,在两个泵房内安装了Flexim Fluxus F401 超声波流量计、安科瑞DTSD1352 电能计,数据采集频次为1 次/min,记录供水机组在水泵更换前后的流量及电耗变化情况。

通过监测数据分析,聚怡花园入住率较高,实测最大流量为24.5 m3/h,已接近预测值;翡翠锦园因入住率一般,实测最大流量为8.5 m3/h,因预测时按高入住率取值,预测值留有一定余量。比较改造前后的吨水电耗(表6),聚怡花园增压一区降幅为19.0%,翡翠锦园增压二区降幅达41.8%,根据全年电量进行测算,两套分区机组每年可节省电量分别为2 400、7 000 kW·h,节能效果非常明显。

表6 改造前后能耗对比

二次供水流量预测模型的构建和应用

流量模型已运用于常州二次供水泵房旧改工程中,使系统优化、水泵选型等环节更加精准高效,促进了双模式供水、变频变压供水、多型号水泵并联运行等技术的实践完善。目前常州通用水司管理的二次供水泵房全年耗电量为2 156.25 万kW·h,通过流量模型的应用及改造工程的推进,预计平均节能率可达20%,每年可减少碳排放量4 299.56 t CO2,可产生良好的节能减排示范作用。

4 结论

(1)本次研究首次综合了典型二次供水小区的实际流量特征数据,经过数据筛选集成,基于遗传算法优化的BP 神经网络,构建二次供水流量预测模型,能够对不同规模的二次供水小区的实际最高日流量、最高日最大时流量进行预测。

(2)最高日流量、最高日最大时流量模型的MAPE 小于10%,老旧泵房普遍缺少流量计量设备,在旧改过程中应用了该模型的预测数据,取得了良好的节能效果,模型具备较好的预测精度和泛化性。

(3)未来从样本数量、变量因子及结构算法等方面对模型进一步优化,可以为二次供水设计选型、节能改造等工作提供一种更精准的流量预测方法。

(4)流量模型的应用效果在工程中得到了验证,模型的构建方法可以为行业提供新的研究思路,促进数据算法在不同供水场景的应用,助力供水企业挖掘节能潜力,使碳减排工作向精细化、智慧化迈进。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。