1.一种基于云计算和大数据的网络信息检索系统,其特征在于,包括:信息检索数据获取模块,用于获取用户输入的用户需求数据、汽车数据库中的文本数据和汽车数据库中的图片数据;
信息检索数据提取模块,用于从所述用户输入的用户需求数据、所述汽车数据库中的文本数据和所述汽车数据库中的图片数据中提取用户需求多模态特征向量和汽车多模态关联特征向量;
检索结果生成模块,用于基于所述用户需求多模态特征向量和所述汽车多模态关联特征向量,生成检索结果;
其中,所述信息检索数据提取模块,包括:
用户需求特征提取单元,用于对所述用户输入的用户需求数据进行特征提取以得到所述用户需求多模态特征向量;
汽车文本特征提取单元,用于对所述汽车数据库中的文本数据进行特征提取以得到汽车文本语义关联特征向量;
汽车数据注意力编码单元,用于对所述汽车数据库中的图片数据进行注意力编码以得到汽车轮廓注意力特征向量;
汽车多模态关联编码单元,用于将所述汽车文本语义关联特征向量和所述汽车轮廓注意力特征向量进行关联编码以得到所述汽车多模态关联特征向量;
其中,所述用户需求特征提取单元,包括:
用户需求图片特征过滤子单元,用于将所述用户输入的用户需求数据的图像部分通过基于卷积神经网络的用户需求图像数据特征过滤器以得到用户需求图像理解特征向量;
用户需求文本语义编码子单元,用于对所述用户输入的用户需求数据的文本部分进行语义编码以得到文本需求理解特征向量;
多模态插值子单元,用于以所述用户需求图像理解特征向量作为插值单元插入到每两个所述文本需求理解特征向量之间并级联以得到所述用户需求多模态特征向量;
其中,所述用户需求文本语义编码子单元,包括:
将所述用户输入的用户需求数据的文本部分进行分词以得到用户需求数据词序列;
将所述用户需求数据词序列通过用户需求文本上下文语义编码器以得到多个文本需求理解特征向量;
其中,所述汽车文本特征提取单元,包括:
将所述汽车数据库中的文本数据通过汽车文本语义编码器以得到多个汽车文本语义特征向量;
将所述多个汽车文本语义特征向量进行级联以得到所述汽车文本语义关联特征向量;
其中,所述汽车数据注意力编码单元,包括:
从所述汽车数据库中的图片数据中提取汽车轮廓点分布直方图;
将所述汽车轮廓点分布直方图通过汽车轮廓注意力机制以得到所述汽车轮廓注意力特征向量;
其中,所述检索结果生成模块,包括:
计算所述用户需求多模态特征向量和所述汽车多模态关联特征向量之间的欧氏距离以得到汽车需求检索特征向量;
对所述汽车需求检索特征向量进行基于模型参数空间的稀疏性约束以得到稀疏优化汽车需求检索特征向量;
将所述稀疏优化汽车需求检索特征向量通过生成器,以生成检索结果;
其中,对所述汽车需求检索特征向量进行基于模型参数空间的稀疏性约束以得到稀疏优化汽车需求检索特征向量,包括:提取模型参数空间,其中,所述模型参数空间包括模型权重矩阵和模型偏置向量;
对所述模型权重矩阵和所述模型偏置向量进行基于正则化项的稀疏性约束以得到稀疏模型权重矩阵和稀疏模型偏置向量;
基于所述稀疏模型权重矩阵和所述稀疏模型偏置向量,以如下优化公式对所述汽车需求检索特征向量进行处理以得到所述稀疏优化汽车需求检索特征向量,其中,所述优化公式为:其中,
2.根据权利要求1所述的基于云计算和大数据的网络信息检索系统,其特征在于,基于所述稀疏模型权重矩阵和所述稀疏模型偏置向量,以如下优化公式对所述汽车需求检索特征向量进行处理以得到所述稀疏优化汽车需求检索特征向量,包括:创建控制器类,所述控制器类用于处理稀疏性约束请求;
响应于接收到所述稀疏性约束请求,从所述稀疏性约束请求提取所述稀疏模型权重矩阵、所述稀疏模型偏置向量和所述汽车需求检索特征向量;
使用所述控制器类,并使用所述稀疏模型权重矩阵和所述稀疏模型偏置向量,对所述汽车需求检索特征向量进行稀疏约束以得到所述稀疏优化汽车需求检索特征向量;
返回所述稀疏优化汽车需求检索特征向量。
3.一种基于云计算和大数据的网络信息检索方法,使用权利要求1所述的基于云计算和大数据的网络信息检索系统,其特征在于,包括:获取用户输入的用户需求数据、汽车数据库中的文本数据和汽车数据库中的图片数据;
从所述用户输入的用户需求数据、所述汽车数据库中的文本数据和所述汽车数据库中的图片数据中提取用户需求多模态特征向量和汽车多模态关联特征向量;
基于所述用户需求多模态特征向量和所述汽车多模态关联特征向量,生成检索结果。