知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种跨层多模型特征融合与基于卷积解码的图像描述方法

￥37100

专利号： 2020109601517

申请人：江西理工大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2023-12-11

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种跨层多模型特征融合与基于卷积解码的图像描述方法，其特征在于：包括以下步骤：

S1.首先在视觉模块，对单模型中实现低层与高层的跨层图像特征融合，然后再将多个视觉特征提取模型得到的特征图进行平均融合，同时将图像所对应的句子中包含的每个单词映射到具有De维度的嵌入空间中，得到它们的嵌入向量序列，然后经过6层因果卷积操作获得最终文本特征；

S2.将S1得到的视觉特征向量和文本特征向量注入到Attention模块中，通过构造分值图，计算得到视觉与文本融合匹配的注意力向量，并以此将视觉模块和语言模块连接起来；

S3.然后将S2中具有文本信息与图像不同区域之间相关性的注意力向量和S1中得到的文本特征向量和进行相加融合；

S4.再将S3得到的结果经过激活函数后输入另一个1×1的卷积层，其通道数为单词本的大小，最后通过softmax层得到下一个单词的预测概率，重复S1～S4步骤，直到最终生成一个完整的描述句子。

2.根据权利要求1所述的一种跨层多模型特征融合与基于卷积解码的图像描述方法，其特征在于：所述视觉模块中设置有三个VGG16结构且三个VGG16结构为图像视觉特征的提取模块，所述每个VGG16结构中都添加有跨层融合结构。

3.根据权利要求1所述的一种跨层多模型特征融合与基于卷积解码的图像描述方法，其特征在于：所述文本特征模型采用了用于机器翻译的卷积架构和用于音频生成的卷积架构，所述因果卷积模块由6层因果卷积层构成且因果卷积的卷积核宽度为3。

4.根据权利要求1所述的一种跨层多模型特征融合与基于卷积解码的图像描述方法，其特征在于：所述Attention模型为注意力机制。

5.根据权利要求1所述的一种跨层多模型特征融合与基于卷积解码的图像描述方法，其特征在于：所述预测模块为一个浅层神经网络。

推荐专利

一种特征级统计描述学习的SAR图像分类方法

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们