1.一种基于长短时记忆神经网络的煤矿突水预测方法,其特征在于,包括如下步骤:步骤一,获取矿区的原始数据,原始数据包含p维的突水特征以及与每个突水特征一一对应的1维的实际突水结果,再对原始数据进行预处理,预处理时,从p维的突水特征中选取跟突水相关的n维突水特征,其中,n≤p,再将n维的突水特征及每个突水特征对应的1维的实际突水结果集合组成样本集合,然后对样本集合进行分组,再将分组后的样本集合划分为训练集和测试集;
步骤二,构建基于长短时记忆神经网络的突水预测模型,并通过步骤一得到的训练集对突水预测模型进行训练;
步骤三,待突水预测模型训练完成后,用测试集测试模型的预测准确率,在实际预测时,向突水预测模型输入一条或多条n维的突水特征,得到一条或多条1维的预测结果,预测结果为突水或不突水;
所述步骤一中,对原始数据进行预处理过程如下:
步骤1.1,将原始数据中所有的突水特征组成一个p维的突水特征集合,将原始数据中所有的实际突水结果组成一个1维的实际突水结果集合;
步骤1.2:从p维的突水特征集合中删除第i个维度,其中,i=1,2,...或p;将其余p-1个维度作为特征子集Mi,其中,i=1,2,...或p;对p维的突水特征集合重复删除维度,每次删除的维度不同,则得到特征子集M1,M2,...和Mp;将p维的突水特征集合记为特征子集M0,将M0,M1,M2,...和Mp分别和对应的实际突水结果集合组成样本子集S0,S1,S2,...,Sp;对于样本子集S0,S1,S2,...和Sp,分别采用十折交叉验证方法计算BP神经网络模型对于该样本子集的平均误差,将S0,S1,S2,...和Sp对应的平均误差分别记为X0,X1,X2,...和Xp;
步骤1.3,分别比较X1,X2,...和Xp与X0的差距,当X1,X2,...和Xp中任意一个平均误差Xi与X0相差小于预设值m时,则认为单独删除第i维特征后,不影响整体误差,则将第i维数据视为冗余特征;
若不存在冗余特征,则执行步骤1.4;
若只存在1维冗余特征,则直接将该维特征从突水特征集合中剔除,接着执行步骤1.4;
若存在多维冗余特征,则从p维突水特征集合中删除最先得到的冗余特征,得到p-1维突水特征集合,将得到的p-1维特征集合作为下一轮循环的突水特征集合,令p=p-1,重复执行步骤1.2和步骤1.3;
步骤1.4:将不存在冗余特征的n维的突水特征及每个突水特征对应的1维的实际突水结果集合组成样本集合,然后根据不同回采点和时间段对样本集合进行分组,再将分组后的样本集合划分为训练集和测试集,训练集与测试集互不相交。
2.根据权利要求1所述的煤矿突水预测方法,其特征在于,m的取值范围为1%~5%。
3.根据权利要求1所述的煤矿突水预测方法,其特征在于,所述步骤二中,基于长短时记忆神经网络的突水预测模型包括输入层、隐藏层和输出层,其中:输入层:通过该层每次向突水预测模型中输入训练集中的一组样本数据中的突水特征;
隐藏层:隐藏层包含一个LSTM单元,LSTM单元的输入输出为隐藏层的输入输出;隐藏层的输入为一个n维向量和一个2维向量,n维向量来自于输入层,2维向量来自于上一时刻的隐藏层的输出;隐藏层有两个方向的输出,一个是给输出层的2维向量,另一个是给下一时刻隐藏层的2维向量;
输出层:输出层的输入为来自隐藏层的2维向量,对隐藏层学习的结果向量进行分类,输出为1维突水结果,通过将输出的突水结果与该样本数据中的实际突水结果相比较,计算误差。
4.根据权利要求3所述的煤矿突水预测方法,其特征在于,LSTM单元包括遗忘门、输入门、输出门和单元状态c,t表示当前时刻,t-1表示上一时刻,遗忘门和输入门控制单元状态c;遗忘门决定上一时刻的单元状态ct-1有多少保留到当前时刻的单元状态ct;输入门决定了当前时刻的输入xt有多少保存到当前时刻的单元状态ct;输出门来控制单元状态ct有多少输出到当前时刻的输出ht。
5.根据权利要求4所述的煤矿突水预测方法,其特征在于,所述步骤二中,突水预测模型训练过程包括如下步骤:步骤2.1,将当前时刻的输入记为xt,上一时刻的输出记为ht-1,遗忘门的权重矩阵记为Wf,输入门的权重矩阵记为Wi,单元状态c权重矩阵记为Wc,输出门的权重矩阵记为Wo,矩阵Wfh表示Wf与上一时刻的输出项ht-1的乘积,矩阵Wfx表示Wf与输入项xt的乘积,矩阵Wih表示Wi与上一时刻的输出项ht-1的乘积,矩阵Wix表示Wi与输入项xt的乘积,矩阵Wch表示Wc与上一时刻的输出项ht-1的乘积,矩阵Wcx表示Wc与输入项xt的乘积,矩阵Woh表示Wo与上一时刻的输出项ht-1的乘积,矩阵Wox表示Wo与输入项xt的乘积;
采用MSRA初始化方法对基于LSTM的突水预测模型的权重矩阵Wfh、Wfx、Wih、Wix、Wch、Wcx、Woh和Wox分别进行初始化,以W表示突水预测模型的权重矩阵,初始化为:式中,n表示隐藏层的输入节点个数,G表示按照高斯分布取值;
步骤2.2,再将训练集中的一组数据传入输入层,训练集中的每组数据包括k条连续的突水数据,每条突水数据包括n维的突水特征和1维的实际突水结果;输入层将k条连续的突水数据中的k条n维突水特征传给隐藏层;
步骤2.3,隐藏层的LSTM单元接收到输入层传来的k条n维特突水特征,用xt表示突水预测模型中当前时刻t的输入,t∈{1,2,...,k},t的初始值取1,后续依次取2,3...和k;
步骤2.4,再计算遗忘门的值ft:
ft=σ(Wf·[ht-1,xt]+bf);
式中,[ht-1,xt]表示向量ht-1和xt连接而成的向量,bf是遗忘门的偏置项,σ是激活函数,激活函数为sigmoid函数;
步骤2.5,再计算LSTM单元当前时刻t的输入门的值it:
it=σ(Wi·[ht-1,xt]+bi);
步骤2.6,再计算LSTM单元的当前时刻t的用于描述当前输入的单元状态
式中,bc是单元状态c的偏置项;
步骤2.7,再计算LSTM单元的当前时刻t的单元状态ct:
式中,ft是遗忘门的输出值,it是输入门的输出值,是当前输入的单元状态,符号⊙表示按元素乘;
步骤2.8,再计算LSTM单元的当前时刻t的输出门的值ot:
ot=σ(Wo·[ht-1,xt]+bo);
式中,bo是输出门的偏置项;
步骤2.9,再计算LSTM单元的当前时刻t的输出值ht:
ht=ot⊙tanh(ct);
若t
步骤2.10,输出层收到隐藏层传来的最后一个时刻的输出值ht,并将隐藏层LSTM单元的最后一个时刻的输出值ht进行解码操作,转变为“0”或者“1”,“0”或者“1”为预测的突水结果,当为“0”时表示不突水,当为“1”时表示突水;
步骤2.11,将突水预测模型预测结果与实际结果相比较得到误差,使用Adam优化算法更新权重矩阵Wfh、Wfx、Wih、Wix、Wch、Wcx、Woh和Wox;
重复步骤2.2至步骤2.11,直到所有组数据都输入模型进行预测与权重调整后,完成对网络的训练。
6.根据权利要求3所述的煤矿突水预测方法,其特征在于,所述输出层为Softmax分类器。
7.根据权利要求1-6任意一项所述的煤矿突水预测方法,其特征在于,所述步骤一中,p维突水特征分别为含水层厚度、含水层水压、含水层距工作面距离、砂岩段厚度、泥岩段厚度、灰岩段厚度、煤层的煤厚度、煤层倾角、有无构造、断层落差、是否裂隙带、开采面积、采高和走向长度。