1.一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,包括下述步骤:(1)获取区域内多个污水厂的实时在线监测的出水水质数据,建立数据集;
(2)剔除数据集中所包含的缺失值和异常值,保留修正数据集,并将修正数据集按照不同污水厂不同出水水质指标进行标记如下:Tij表示第i个污水厂第j个出水水质指标的数据集;i=1,2,3...;j=1,2,3...;
Tj表示所有污水厂第j个出水指标的总体出水水质数据集;
(3)选择所有污水厂中第j个出水指标的总体出水水质数据集Tj,并绘制其概率密度曲线图,判断所有水厂总体的数据的统计分布类型Pj,并分析该分布的统计特征;
(4)将第i个污水厂第j个出水水质指标的数据集Tij单独进行Pj概率密度分布函数的参数估计,获取到每个污水厂的参数数据集;
(5)得到每个污水厂第j个出水水质指标的参数数据集,对不同的参数数据集设置上侧分位数a和下侧分位数b,在分位数为0-a%和b%-1的污水厂,表明其数据不正常,运行存在异常风险;在分位数a%-b%污水厂,表明其数据正常,运行管理良好;
并且根据概率密度分布函数Pj的分布特征与污水厂实际运行相结合,来表征污水厂的行为特性。
2.按照权利要求1所述的一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,所述步骤1)中,出水水质数据包括:BOD、氨氮、pH值、COD和总氮。
3.根据权利要求1所述的一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,所述步骤2)中,缺失值为数据在收集过程中导致部分数据为空值;
所述异常值为监测设备器件出现异常,产生过大的数据漂移,导致数据变化异常大或者值为负值。
4.根据权利要求1所述的一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,所述步骤4)中,通过极大似然法对每个污水厂分布类型P的概率密度函数进行参数估计,获取到所有污水厂的参数数据集,具体如下:
1)广义Gamma的概率密度分布函数f(x|α,β,γ)中Г(α)为伽玛函数,具有三个参数α、β和γ,如式(1)所示:式中,Г(α)为伽玛函数,α、β为形状参数,γ为尺度参数,x为出水水质数据;
控制其中的两个参数,做出另一个参数取不同值下函数的曲线;
2)正态分布具有两个参数σ和μ,其概率密度分布函数如公式(2):式中,σ为标准差,μ为数学期望;
控制其中的一个参数,做出另一个参数取不同值下函数的曲线。
5.根据权利要求1所述的一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,所述步骤5)中,所述上侧分位数a和下侧分位数b分别满足如下:利用分位数将污水厂进行分类:
对于出水氨氮,参数数据集A、B和C三类在分位数0-10%、10%-90%和90%-100%的污水厂分为A1、A2、A3,B1、B2、B3,C1、C2和C3九类;
A2、B2、C2位于分位数10%-90%数据污水分布集中区,为出水氨氮数据正常的污水厂;
A1、A3、B1、B3、C1、C3六类位于污水分布两侧,为出水氨氮具有异常风险的污水厂;
对于出水COD,D和E两类在分位数0-10%、10%-90%和90%-100%的污水厂分为D1、D2、D3,E1、E2和E3六类;
D2、E2位于10%-90%数据分布集中区,为出水COD数据正常的污水厂;
D1、D3、E1和E3四类位于分布两侧,为出水COD具有异常风险的污水厂。
6.根据权利要求1所述的一种基于统计分布的污水厂厂群出水分析及异常识别方法,其特征在于,所述步骤5)中,根据概率密度分布函数Pj的分布特征与污水厂实际运行相结合,来表征污水厂的行为特性如下:(1)出水COD正态分布参数σ越小,分布曲线较陡,顶部尖锐,则表示污水厂常年运行较好,数据波动范围不大;
(2)正态分布参数σ越大,分布曲线平缓,不符合正态分布,则表示出水COD的异常散乱;
(3)正态分布参数μ较小时,出水COD值主要集中在较小数值附近,则表示运行管理水平较好;
(4)正态分布参数μ较大时,可以看出出水COD值主要集中在较高数值附近,则表示出水COD较高,污水处理差。