欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019108972964
申请人: 西南石油大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于统计误差主动学习的井位优选方法,其特征在于:具体步骤如下:S1.提取特征:特征包括孔隙度、渗透率、净毛比、含水饱和度、构造海拔深度、原始压力和目前压力;

S2.构建误差统计主动学习分类器:包括理论标签误差统计模型和实际标签误差统计模型;

S21理论标签误差统计模型:包括定义两个标签错误统计函数,分别是基于单实例和实例对的统计函数,利用这两个统计函数分析标签统计误差与邻域之间的关系,基于该关系描述井位之间差异性信息;

S211.单实例标签错误统计方法如下:领域是标签错误统计的核心概念,实例的领域通常由距离或其他相似性指标来确定;

定义1:x∈U的领域半径为λs,那么其中,x,y:表示样本点;U:表示特征空间;d(x,y):表示x和y之间的欧式距离;λs:表示距离的变量; 表示个数的变量;∈:表示属于符号;{...}:表示集合符号;

定义2:单实例标签误差统计函数为此时,

其中,λs:表示距离的变量;es(λs):表示概率误差的变量;∑:表示求和;χ(x,λs):表示二值型的变量; 表示个数的变量;l(x),l(y):表示标签函数;∈:表示属于符号; 表示存在符号,自然而然地,es(λs)的上限是1;

S212.实例对标签错误统计方法如下:误差统计函数es(λs)考虑分类错误的上限,还需要更通用的标签错误统计方法,接下来将从实例对的角度定义一个新的标签误差统计函数;

定义3:实例对为特征空间中的任意一对点的集合,当实例对的距离小于λp时,有其中,:表示一对样本点;U×U:表示实例对的特征空间;d(x,y)是x和y之间的欧式距离;λp:表示距离的变量; 表示个数的变量;∈:表示属于符号;{...}:表示集合符号;

定义4:设λp是距离门限,实例对标签误差统计方程为其中,x,y:表示样本点;λp:表示距离的变量;ep(λp):表示概率误差的变量;l(x),l(y):表示标签函数;|…|:表示绝对值符号;∈:表示属于符号;{...}:表示集合符号;

S22实际标签误差统计模型

根据定义2和定义4,建立两个实际的统计模型,定义2考虑的是标签误差概率的上限,而定义4考虑的是一般情况下的标签误差概率,考虑并使用戴维森堡丁指数评估指标对不同井位进行分类,井位聚类性能良好,即DB<1.2;使用定义2来构建单实例的统计模型f1:如果DB≥1.2,使用定义4来构建实例对的统计模型f2:

2.根据权利要求1所述的一种基于统计误差主动学习的井位优选方法,其特征在于:S22具体步骤如下:

1)分别准备30个不同区块的井位信息数据集,用于训练两个实用模型,训练数据集具有不同的分布,实例范围从72到102,501,属性数量范围从2到1000;

2)根据数据和应用程序要求选择合适的聚类算法,使用给定的聚类算法聚类训练数据集,每个数据集形成c块,c是决策属性的类别数量;

3)计算两个实例之间的距离并将它们标准化,归一化公式如下:其中,Min和Max分别代表两个实例之间的最小和最大距离;

4)计算es(λs),ep(λp),对于每个聚类块,根据定义2和定义4,分别计算单实例和实例对的经验标签误差;

5)统计分析并获得两个经验标签误差曲线,首先,计算30个数据集的es(λs),ep(λp)并获得统计分布直方图,然后使用多项式拟合来获取经验标签误差曲线 和 两个经验标签误差函数分别为:

其中, 表示单实例标签误差经验曲线;

其中, 表示实例对标签误差经验曲线。