1.一种确定虚拟形象的方法,包括:
响应于接收到虚拟形象生成指令,对所述虚拟形象生成指令进行解析,得到形象特征描述词;
确定与所述形象特征描述词匹配的目标原型图像;
将与所述目标原型图像关联的虚拟形象,作为符合所述生成指令的目标虚拟形象;
根据所述形象特征描述词,确定针对所述目标虚拟形象的形象驱动参数;以及根据所述形象驱动参数,控制所述目标虚拟形象呈现符合所述生成指令的形象;
其中,所述确定与所述形象特征描述词匹配的目标原型图像,包括:根据预设语义数据库,确定与所述形象特征描述词关联的描述归一化词,包括在所述形象特征描述词包括M个描述分词的情况下,根据所述语义数据库,确定与所述M个描述分词关联的N个描述归一化词,M为大于1的整数,N为小于或等于M的正整数;
利用预训练的多模态CLIP模型,在原型图像数据库中确定与所述描述归一化词匹配的所述目标原型图像,包括确定与所述N个描述归一化词中的至少部分描述归一化词匹配的目标原型图像;
其中,所述语义数据库包括至少一个描述归一化词,所述至少一个描述归一化词中的每个描述归一化词对应至少一个形象特征描述词,与同一描述归一化词对应的多个形象特征描述词互为近义词。
2.根据权利要求1所述的方法,其中,
所述根据所述形象特征描述词,确定针对所述目标虚拟形象的形象驱动参数,包括:根据所述形象特征描述词,确定与所述目标虚拟形象关联的表情特征参数;
所述根据所述形象驱动参数,控制所述目标虚拟形象呈现符合所述生成指令的形象,包括:根据所述表情特征参数,调整所述目标虚拟形象的头部位姿和面部关键点位姿,以使所述目标虚拟形象呈现符合所述生成指令的形象。
3.根据权利要求1所述的方法,其中,
所述根据所述形象特征描述词,确定针对所述目标虚拟形象的形象驱动参数,包括:根据所述形象特征描述词,确定与所述目标虚拟形象关联的话术特征参数,其中,所述话术特征参数包括声音特征参数和话术资源参数;
所述根据所述形象驱动参数,控制所述目标虚拟形象呈现符合所述生成指令的形象,包括:根据所述声音特征参数,调整所述目标虚拟形象的声音特征,以使所述目标虚拟形象基于调整后的声音特征播放所述话术资源参数所指示的话术内容。
4.根据权利要求1所述的方法,其中,
所述根据所述形象特征描述词,确定针对所述目标虚拟形象的形象驱动参数,包括:根据所述形象特征描述词,确定与所述目标虚拟形象关联的显示参数;
所述根据所述形象驱动参数,控制所述目标虚拟形象呈现符合所述生成指令的形象,包括:根据所述显示参数,从预设形象资源库中获取所述显示参数所指示的装扮素材;以及将所述装扮素材应用于所述目标虚拟形象,以使所述目标虚拟形象呈现符合所述生成指令的形象。
5.一种确定虚拟形象的装置,包括:
第一处理模块,用于响应于接收到虚拟形象生成指令,对所述虚拟形象生成指令进行解析,得到形象特征描述词;
第二处理模块,用于确定与所述形象特征描述词匹配的目标原型图像;
第三处理模块,用于将与所述目标原型图像关联的虚拟形象,作为符合所述生成指令的目标虚拟形象;
第四处理模块,用于在得到所述目标虚拟形象之后,根据所述形象特征描述词,确定针对所述目标虚拟形象的形象驱动参数;以及第五处理模块,用于根据所述形象驱动参数,控制所述目标虚拟形象呈现符合所述生成指令的形象;
其中,所述第二处理模块包括:
第一处理子模块,用于根据预设语义数据库,确定与所述形象特征描述词关联的描述归一化词;所述第一处理子模块包括:第一处理单元,用于在所述形象特征描述词包括M个描述分词的情况下,根据所述语义数据库,确定与所述M个描述分词关联的N个描述归一化词,其中,M为大于1的整数,N为小于或等于M的正整数;
第二处理子模块,用于利用预训练的多模态CLIP模型,在原型图像数据库中确定与所述描述归一化词匹配的所述目标原型图像,所述第二处理子模块包括:第二处理单元,用于确定与所述N个描述归一化词中的至少部分描述归一化词匹配的目标原型图像其中,所述语义数据库包括至少一个描述归一化词,所述至少一个描述归一化词中的每个描述归一化词对应至少一个形象特征描述词;与同一描述归一化词对应的多个形象特征描述词互为近义词。
6.根据权利要求5所述的装置,其中,
所述第四处理模块包括:
第三处理子模块,用于根据所述形象特征描述词,确定与所述目标虚拟形象关联的表情特征参数;
所述第五处理模块包括:
第四处理子模块,用于根据所述表情特征参数,调整所述目标虚拟形象的头部位姿和面部关键点位姿,以使所述目标虚拟形象呈现符合所述生成指令的形象。
7.根据权利要求5所述的装置,其中,
所述第四处理模块包括:
第五处理子模块,用于根据所述形象特征描述词,确定与所述目标虚拟形象关联的话术特征参数,其中,所述话术特征参数包括声音特征参数和话术资源参数;
所述第五处理模块包括:
第六处理子模块,用于根据所述声音特征参数,调整所述目标虚拟形象的声音特征,以使所述目标虚拟形象基于调整后的声音特征播放所述话术资源参数所指示的话术内容。
8.根据权利要求5所述的装置,其中,
所述第四处理模块包括:
第七处理子模块,用于根据所述形象特征描述词,确定与所述目标虚拟形象关联的显示参数;
所述第五处理模块包括:
第八处理子模块,用于根据所述显示参数,从预设形象资源库中获取所述显示参数所指示的装扮素材;以及第九处理子模块,用于将所述装扮素材应用于所述目标虚拟形象,以使所述目标虚拟形象呈现符合所述生成指令的形象。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~4中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1~4中任一项所述的方法。