欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018113168831
申请人: 宁波大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-04-03
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种面向高维大数据集的加权量化哈希检索方法,其特征在于包括以下步骤:①获取由n个原始高维数据组成的原始高维数据集X并给定查询数据q,X为n×d维的矩阵,q为1×d维的向量,使用主成份分析算法对X进行降维,得到与X对应的低维向量集V,其中,V为n×c维的矩阵,c<d,vij表示原始高维数据中第i个数据第j维度在V中对应的低维向量元素,1≤i≤n,1≤j≤c,再使用主成份分析算法对q进行降维,得到与q对应的1×c维的低维向量q';

②通过迭代获取最终二进制编码矩阵B″和最终权重矩阵W”,具体过程如下:②-1设定最大迭代次数,随机给定初始二进制编码矩阵B,B∈{-1,1}n×c,随机给定初始权重矩阵W,W=diag(w1,w2,…wj…,wc),其中,wj表示第j维度的维度权重,diag()表示对角矩阵;

②-2根据哈希函数构造原理中的成对保相似性原则构造损失函数,再引入完全正交约束条件,将完全正交约束条件进行松弛化操作,从而构造出损失函数其中,||||F为取矩阵的F-范数符号, 中的2为平方符号,BT表示B的转置矩阵,I表示单位矩阵;

②-3开始迭代过程,在当前一次迭代过程中,首先保持W不变,对进行最小化求解,利用梯度下降法对B进行更新,将 最小时更新得到的B记为B′, bij表示X中第i个原始高维数据第j维度的元素在当前一次迭代过程中对应的更新后的二进制编码值;

再保持B'不变,通过对 进行最小化求解对W进行更新,将

最小时更新得到的W记为W';

②-4判断当前迭代过程的迭代次数是否达到设定的最大迭代次数,若未达到最大迭代次数,则令W=W',B=B′,返回步骤②-3开始下一次迭代过程,同时迭代次数加1,其中W=W'和B=B′中的“=”为赋值符号;若达到最大迭代次数,则将当前一次迭代过程中更新得到的W'作为最终权重矩阵W”,将当前一次迭代过程中更新得到的B′作为最终二进制编码矩阵B″;

③根据W”对B″中每个元素进行加权量化,获得加权后的二进制编码矩阵Z;

④根据W”和B″,获取 最小时的q',作为与q'对应的二进制编码q”,在Z中查找与q”的加权海明距离最近的行向量数据,将与q”的加权海明距离最近的行向量数据对应的原始高维数据作为最终的最近邻查询结果,完成对q的哈希检索过程。

2.根据权利要求1所述的一种面向高维大数据集的加权量化哈希检索方法,其特征在于所述的步骤②-1中设定的最大迭代次数为50次。