欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019108391379
申请人: 北京百度网讯科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种商品训练图片的获取方法,其特征在于,所述方法包括:获取电商网站中每个商品网页上的所有商品图片,并确定每个商品网页上每个商品图片的商品特征向量;

针对每个商品网页,根据所述商品网页上每个商品图片的商品特征向量,对所述商品网页上的所有商品图片进行分组,得到所述商品网页的至少一个图片组,并将所述至少一个图片组中图片数量最多的图片组作为所述商品网页的目标图片组;

根据每个商品网页的目标图片组中商品图片的商品特征向量,确定各个目标图片组的平均商品特征向量;

根据所述平均商品特征向量,对所有商品网页的目标图片组进行分类,得到至少一类图片集合;

根据所述至少一类图片集合,生成商品训练图片;

所述根据所述商品网页上每个商品图片的商品特征向量,对所述商品网页上的所有商品图片进行分组,得到所述商品网页的至少一个图片组,包括:根据所述商品网页上每个商品图片的商品特征向量,确定两两商品特征向量之间的差异度;

从所有商品特征向量中随机选择一个商品特征向量作为第一参考特征向量;

获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量;

将所述目标商品特征向量作为所述第一参考特征向量,继续执行获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量的步骤,直至不存在与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量为止;

将与所述目标商品特征向量对应的目标商品图片分到同一个图片组中;

如果所述商品网页上的所有商品图片中存在未分组的商品图片,则从未分组商品图片所对应的商品特征向量中随机选择一个第一参考特征向量,继续执行获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量的步骤,直至不存在与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量为止。

2.根据权利要求1所述的方法,其特征在于,所述确定每个商品网页上每个商品图片的商品特征向量,包括:

针对每个商品网页,对所述商品网页上的每个商品图片进行商品主体检测,以得到每个商品图片的商品主体区域;

根据预设商品模型,对每个商品图片的商品主体区域进行特征提取,以得到每个商品图片的商品特征向量。

3.根据权利要求1所述的方法,其特征在于,所述根据所述平均商品特征向量,对所有商品网页的目标图片组进行分类,得到至少一类图片集合,包括:根据每个所述目标图片组的平均商品特征向量,确定出两两平均商品特征向量之间的差异度;

从所有商品平均特征向量中随机选择一个商品片平均特征向量作为第二参考特征向量;

获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量;

将所述目标平均商品特征向量作为所述第二参考特征向量,继续执行获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量的步骤,直至不存在与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量为止;

将与所述目标平均商品特征向量对应的目标图片组分到同一类图片集合;

如果存在未分组的目标图片组,则从未分组目标图片组所对应的平均商品特征向量中随机选择一个第二参考特征向量,继续执行获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量的步骤,直至不存在与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量为止。

4.根据权利要求1所述的方法,其特征在于,所述根据所述至少一类图片集合,生成商品训练图片,包括:

根据每类图片集合中的商品图片,确定每类图片集合的商品类别;

从每类图片集合中随机选择预设数量的商品图片,作为对应商品类别的商品训练图片。

5.根据权利要求1‑4任一项所述的方法,其特征在于,所述商品图片包括商品主图,或者,所述商品图片包括商品主图和商品晒单图片。

6.一种商品训练图片的获取装置,其特征在于,所述装置包括:获取模块,用于获取电商网站中每个商品网页上的所有商品图片;

第一确定模块,用于确定每个商品网页上每个商品图片的商品特征向量;

第一处理模块,用于针对每个商品网页,根据所述商品网页上每个商品图片的商品特征向量,对所述商品网页上的所有商品图片进行分组,得到所述商品网页的至少一个图片组,并将所述至少一个图片组中图片数量最多的图片组作为所述商品网页的目标图片组;

第二确定模块,用于根据每个商品网页的目标图片组中商品图片的商品特征向量,确定各个目标图片组的平均商品特征向量;

第二处理模块,用于根据所述平均商品特征向量,对所有商品网页的目标图片组进行分类,得到至少一类图片集合;

训练图片生成模块,用于根据所述至少一类图片集合,生成商品训练图片;

所述第一处理模块,具体用于:

根据所述商品网页上每个商品图片的商品特征向量,确定两两商品特征向量之间的差异度;

从所有商品特征向量中随机选择一个商品特征向量作为第一参考特征向量;

获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量;

将所述目标商品特征向量作为所述第一参考特征向量,继续执行获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量的步骤,直至不存在与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量为止;

将与所述目标商品特征向量对应的目标商品图片分到同一个图片组中;

如果所述商品网页上的所有商品图片中存在未分组的商品图片,则从未分组商品图片所对应的商品特征向量中随机选择一个第一参考特征向量,继续执行获取与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量的步骤,直至不存在与所述第一参考特征向量的差异度小于第一差异度阈值的目标商品特征向量为止。

7.根据权利要求6所述的装置,其特征在于,所述第一确定模块,具体用于:针对每个商品网页,对所述商品网页上的每个商品图片进行商品主体检测,以得到每个商品图片的商品主体区域;

根据预设商品模型,对每个商品图片的商品主体区域进行特征提取,以得到每个商品图片的商品特征向量。

8.根据权利要求6所述的装置,其特征在于,所述第二处理模块,具体用于:根据每个所述目标图片组的平均商品特征向量,确定出两两平均商品特征向量之间的差异度;

从所有商品平均特征向量中随机选择一个商品片平均特征向量作为第二参考特征向量;

获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量;

将所述目标平均商品特征向量作为所述第二参考特征向量,继续执行获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量的步骤,直至不存在与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量为止;

将与所述目标平均商品特征向量对应的目标图片组分到同一类图片集合;

如果存在未分组的目标图片组,则从未分组目标图片组所对应的平均商品特征向量中随机选择一个第二参考特征向量,继续执行获取与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量的步骤,直至不存在与所述第二参考特征向量的差异度小于第二差异度阈值的目标平均商品特征向量为止。

9.根据权利要求6所述的装置,其特征在于,所述训练图片生成模块,包括:根据每类图片集合中的商品图片,确定每类图片集合的商品类别;

从每类图片集合中随机选择预设数量的商品图片,作为对应商品类别的商品训练图片。

10.根据权利要求6‑9任一项所述的装置,其特征在于,所述商品图片包括商品主图,或者,所述商品图片包括商品主图和商品晒单图片。

11.一种计算机设备,其特征在于,包括处理器和存储器;

其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1‑5中任一所述的商品训练图片的获取方法。

12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑5中任一所述的商品训练图片的获取方法。