1.一种油田接转站系统碳排放预测方法,其特征在于其包括以下步骤:
步骤一:获取油田接转站系统历史碳排放总数据;
步骤二:对油田接转站系统碳排放数据进行预处理,处理掉无效数据;
步骤三:对步骤二预处理后的数据进行特征值分析,绘制特征变量相关性热图,筛选出影响特征变量,得到选取特征后的数据集,将数据集分为训练集和测试集;
步骤四:建立基于决策树的碳排放预测模型,将训练集放入基于决策树的预测模型中训练,得到训练处理好的碳排放预测模型;
2
步骤五:利用网格搜索方法进行超参数的穷举,采用绝对系数R作为评判模型的标准:
式中的n是样本个数,prey为预测数据,y为实际数据;
步骤六:采用遗传算法优化网格搜索,达到全局优化,载入步骤四训练处理好的碳排放预测模型,将训练集作为输入,以三折交叉验证得到的三个评价分数的平均值作为适应度函数,得到初始化种群P(t),再通过适应度函数进行选择种群迭代,获得新的种群P(t+2);
将训练集作为输入,以三折交叉验证得到的三个评价分数的平均值作为适应度函数,得到初始化种群P(t),再通过适应度函数进行选择种群迭代,选择的遗传算子采用轮盘赌的方法,具体表达式为:式中P为种群数,Fitnessi为适应度值, 为该种群的总适应度值,通过适
应度函数的选择会生成新的种群P(t+1),在此种群丛础上继续遗传算子操作,按照选择、交叉、变异顺序进行操作,选择是通过轮盘赌的方式进行操作,把适应度高的个体留下,相反适应度低的淘汰;交叉是将种群中的个体进行下式操作:式中xn为第n个个体,b为0‑1之间的随机数,变异则是对某个个体的某个基因进行变异操作;经过以上三种遗传算子的操作,获得新的种群P(t+2),值得指出的是种群是基于决策树预测模型的超参数,再进行三折交叉验证来验证是否满足终止条件,如果连续10个周期,模型没有明显的优化提升则设置早停或者已经种群迭代100代则设置早停,不满足上述终止条件则再次继续更新种群迭代;
步骤七:将遗传算法结合网格搜索全局寻优找到的最优结果,传回到基于决策树的碳排放预测模型中,更新模型,得到最优的基于遗传算法优化的决策树碳排放预测模型;
步骤八:训练基于遗传算法优化的决策树碳排放预测模型,交叉验证计算准确度的标准差,调整网格参数,进行训练,得到训练结果;分析训练结果,如果效果收敛,则结束训练,如果不收敛,需调整参数步骤,直至符合预测要求;
步骤九:输出数据,利用基于遗传算法优化的决策树碳排放预测模型进行油田接转站系统碳排放预测。
2.根据权利要求1所述的油田接转站系统碳排放预测方法,其特征在于:所述的绘制特征变量相关性热图的方法具体为:利用feature selection()函数,筛选出影响特征变量,影响碳排放量的因素有日耗气、计转站能量利用率、日耗电、提供的热能、压差、单位液量综合能耗、提供的压能、日输液量、单位液量集输气耗、单位液量集输电耗、油品吸收的压能、油品吸收热能、比热容、温差、密度、电能利用率、燃料发热值、热能利用率,根据相关系数图中相关系数的大小,判断出变量之间相关性的大小,相关系数越高,则变量间的线性相关程度越高,删除无关变量和目标变量,选取特征后的数据集。