知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于稀疏哈希的大数据检索方法

￥38400

专利号： 2013104570334

申请人：广西师范大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2023-12-04

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.基于稀疏哈希的大数据检索方法，包括下述步骤：

(1)从大数据中抽样数据当做训练集X；

(2)用X训练哈希函数；

(3)对大数据集中还没得到二进制代码的实例进行二进制编码，并将编码后的大数据储存在计算机内存或者外磁盘；

(4)对新来的测试实例，首先得到它的低维实数值，然后得到它的低维二进制代码，最后，把测试实例的二进制代码跟大数据的二进制代码进行相似性搜索，得到它的相似实例。

2.根据权利要求1的方法，所述步骤（1）的训练集X的训练集大小n由确定，其中tα/2表示置信度的值，通过t分布临界值获得，ε表示设定的最大的允许误差。

3.根据权利要求1的方法，所述步骤（2）包括下述过程：A）.建立目标函数：

其中X为

训练集，B是基空间，B的每一个向量是从训练集X中训练出来的基向量，S是X被投影在基空间B上的低维实数值，λ1和λ2是通过十折交叉验证方法取得的可调参数，wi,j是X中两个实例xi和xj之间的欧式距离在高斯核上的投影，si和sj是矩阵S中的两个向量，Bi,j是矩阵B中的第i行和第j列元素，i=1,…,n表示实例的记号，j=1,…,k表示基向量的标号，n是实例的个数，k是基向量的个数，表示S中每个元素为非负；

B）.把S转换成二进制代码；

C）.建立哈希函数。

4.根据权利要求3的方法，所述过程B）中，S中非0元素转换成0，否则为1。

5.根据权利要求3的方法，所述过程C）中建立哈希函数的过程为：找到训练集X中哈希值全为1的实例为类Am1，m=1,…,d，剩余哈希值为0的实例归为类Am0，m=1,…,d，得到2d个类，哈希函数定义为：设S的维度是d，X的维度是D，D>>d，d维中每一维为一个二进制向量，为d维中每一维建立一个哈希函数，一共建立d个哈希函数；

式中，Xi是矩阵X的第i个向量，Si是矩阵S的第i个向量,i=1,…,n。

-1

6.根据权利要求1的方法，所述步骤（3）对大数据每一个实例x，通过s=(B'B+2I) B'x得到x的低维实数值，然后通过哈希函数得到它的低维二进制代码；其中，B是上面步骤定义的基空间,I是跟B同维度的单位矩阵。

7.根据权利要求1的方法，所述步骤（4）对测试数据集每一个实例xt，通过-1st=(B'B+2I) B'xt得到xt的低维实数值，然后通过哈希函数得到它的低维二进制代码；其中，B是上面步骤定义的基空间,I是跟B同维度的单位矩阵。