1.一种数据库索引构建方法,其特征在于,包括:获取训练数据集,所述训练数据集包括:N个搜索字符串以及在数据库中与每个所述搜索字符串所对应的多维列表地址,N为正整数;
对所述训练数据集进行数据处理,得到目标训练数据集;
基于所述目标训练数据集,对神经网络模型进行训练,得到用于预测搜索字符串在数据库中对应的多维列表地址的预测模型;
接收待搜索字符串,基于所述预测模型,得到目标列表地址;
基于所述目标列表地址,查找存储在所述目标列表地址中的实际物理地址;
基于所述实际物理地址,在所述数据库中,获取与所述待搜索字符串对应的内容。
2.如权利要求1所述的方法,其特征在于,所述对所述训练数据集进行数据处理,得到目标训练数据集,包括:对N个搜索字符串中每个搜索字符串进行编码和数据增强处理,得到目标训练数据集。
3.如权利要求2所述的方法,其特征在于,所述对N个搜索字符串中每个搜索字符串进行编码和数据增强处理,得到目标训练数据集,包括:对每个搜索字符串中的每个字符进行二进制编码;
从每个搜索字符串中随机选取目标字符,并将所述目标字符用不同字符替换,得到随机字符替换的搜索字符串;
将随机字符替换的搜索字符串按照目标字符串长度进行位移增强,得到目标训练数据集。
4.如权利要求1所述的方法,其特征在于,所述基于所述目标训练数据集,对神经网络模型进行训练,得到用于预测搜索字符串在数据库中对应的多维列表地址的预测模型,包括:将所述目标训练数据集输入所述神经网络模型,并对所述神经网络模型进行训练,所述神经网络模型包括残差结构层以及前馈网络层,得到用于预测搜索字符串在数据库中对应的多维列表地址的预测模型。
5.如权利要求1所述的方法,其特征在于,在所述接收待搜索字符串,基于所述预测模型,得到目标列表地址之前,还包括:获取负样本集;
基于训练数据集、目标训练数据集以及负样本集,通过所述预测模型,得到分别对应的输出结果;
基于所述输出结果,采用自监督学习的极大似然法计算得到比对损失;
基于所述比对损失,判断是否对所述预测模型进行优化调整。
6.如权利要求5所述的方法,其特征在于,所述基于所述输出结果,采用自监督学习的极大似然法计算得到比对损失,具体按照如下公式得到:其中,为训练数据集中的搜索字符串,
为目标训练数据集中的搜索字符串,为负样本集中的搜索字符串,为预测模型,q为D作为输入数据输入预测模型的输出结果, 为 作为输入数据输入预测模型的输出结果,n为C作为输入数据输入预测模型的结果, 为所述比对损失。
7.如权利要求1所述的方法,其特征在于,所述实际物理地址包括:用于精确查询的精确物理地址以及用于范围查询的空间偏移量,所述空间偏移量为与所述精确物理地址对应的邻近位置区域。
8.一种数据库索引构建装置,其特征在于,包括:第一获取模块,用于获取训练数据集,所述训练数据集包括:N个搜索字符串以及在数据库中与每个所述搜索字符串所对应的多维列表地址,N为正整数;
处理模块,用于对所述训练数据集进行数据处理,得到目标训练数据集;
训练模块,用于基于所述目标训练数据集,对神经网络模型进行训练,得到用于预测搜索字符串在数据库中对应的多维列表地址的预测模型;
得到模块,用于接收待搜索字符串,基于所述预测模型,得到目标列表地址;
查找模块,用于基于所述目标列表地址,查找存储在所述目标列表地址中的实际物理地址;
第二获取模块,用于基于所述实际物理地址,在所述数据库中,获取与所述待搜索字符串对应的内容。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1 7中任一权利要求所~述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1 7中任一权利要求所述的方法步骤。
~