知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种数字化场景识别的多媒体互动分析方法及云平台

￥36800

专利号： 2022107120850

申请人：晨雨初听(武汉)文化艺术传播有限公司

专利类型：发明专利

专利状态：授权未缴费

专利领域：计算；推算；计数

更新日期：2023-08-15

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种数字化场景识别的多媒体互动分析方法，其特征在于，包括以下步骤：

步骤1：统计参加多媒体会议的参会人员，并获取各参会人员对应的参会基本信息；

步骤2：获取多媒体会议对应的演讲流程，进而将多媒体会议对应的演讲流程和各参会人员对应的参会基本信息存储在参会数据库中；

步骤3：对多媒体会议室中存在的座位进行编号，并分别在各座位对应的会议桌区域设置会议话筒和摄像仪；

步骤4：在会议正式开始时，从参会数据库中提取多媒体会议对应的演讲流程，并从演讲流程中获取演讲顺序表；

步骤5：从演讲顺序表中按顺序提取各演讲参会人员的姓名和演讲时间段；

步骤6：根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制和音量控制；

步骤7：在各演讲参会人员对应的演讲时间段对会议话筒进行收音端放置参数调控。

2.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述参会基本信息包括姓名和座位号。

3.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述会议话筒包括固定底座和收音端，其中收音端可自由转动。

4.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制对应的具体控制过程参看以下步骤：A1:根据各演讲参会人员的姓名从参会数据库中筛选出各演讲参会人员对应的座位号；

A2:在各演讲参会人员对应的演讲时间段，根据各演讲参会人员对应的座位号找到该座位对应会议桌区域的会议话筒，并执行开启操作，同时对其他座位对应会议桌区域的会议话筒保持关闭状态。

5.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤6中根据各演讲参会人员的姓名和演讲时间段对会议话筒进行音量控制对应的具体控制过程参看以下步骤：B1:获取会议室的空间体积，并在会议室内按照设定的三维直角坐标系构建方式进行三维直角坐标系构建；

B2:根据构建的三维直角坐标系获取会议室空间内中心点的位置坐标及各会议话筒对应固定底座的位置坐标；

B3:根据会议室空间内中心点的位置坐标和各会议话筒对应固定底座的位置坐标计算出各会议话筒的固定位置与会议室空间内中心点之间的距离，并记为各会议话筒固定位置对应的接近距离；

B4:将会议室的空间体积与设置的各种空间体积在会议话筒处于标准固定位置下的适宜音量进行匹配，其中标准固定位置是指会议话筒固定在会议室空间内中心点位置，从中匹配出该会议室的空间体积在会议话筒处于标准固定位置下的适宜音量；

B5:将各会议话筒固定位置对应的接近距离和该会议室的空间体积在会议话筒处于标准固定位置下的适宜音量代入公式中，由此计算出各会议话筒开启时对应的适宜音量，其中q表示为会议话筒开启时对应的适宜音量，q0表示为该会议室的空间体积在会议话筒处于标准固定位置下的适宜音量，l表示为会议话筒固定位置对应的接近距离，l0表示为预设的接近距离阈值；

B6:在各演讲参会人员对应的演讲时间段实时采集该演讲参会人员所在座位对应会议话筒的实际音量，并将其调控为该会议话筒开启时对应的适宜音量。

6.根据权利要求5所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述设定的三维直角坐标系构建方式为取会议室所在地面的预设拐角作为原点，分别以会议室的长度所在方向、宽度所在方向和高度所在方向作为x轴、y轴和z轴。

7.根据权利要求1所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述收音端放置参数包括收音端垂直方向放置高度和收音端水平方向放置角度。

8.根据权利要求7所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述步骤7中在各演讲参会人员对应的演讲时间段对会议话筒进行收音端放置参数调控具体包括以下步骤：C1:在各演讲参会人员对应的演讲时间段内将该演讲参会人员记为目标演讲人员，并将目标演讲人员所在座位对应会议桌区域的会议话筒和摄像仪记为目标演讲人员对应的指定会议话筒和指定摄像仪；

C2:将目标演讲人员对应的演讲时间段按照预定义的时间间隔进行划分，得到若干采集时间点，并将各采集时间点按照时间先后顺序依次编号为1,2,...,t,...,m,进而由目标演讲人员对应的指定摄像仪在各采集时间点对目标演讲人员进行坐姿图像采集；

C3:从各采集时间点对应目标演讲人员的坐姿图像中提取有效坐姿高度；

C4:将各采集时间点对应目标演讲人员的坐姿图像聚焦在目标演讲人员的嘴部区域，进而根据构建的三维直角坐标系获取各采集时间点中目标演讲人员对应的嘴部位置三维坐标；

C5:基于目标演讲人员对应指定会议话筒的固定位置三维坐标和各采集时间点中目标演讲人员对应的嘴部位置三维坐标计算各采集时间点中指定会议话筒的固定位置与目标演讲人员嘴部位置之间的距离，并将该距离记为指定会议话筒对目标演讲人员的收音距离；

C6:根据各采集时间点对应目标演讲人员的有效坐姿高度进行坐姿高度线勾勒，进而将目标演讲人员对应指定会议话筒的固定位置向坐姿高度线进行投影，得到各采集时间点中目标演讲人员对应指定会议话筒的固定位置投影点；

C7:将各采集时间点中目标演讲人员对应的嘴部位置、指定会议话筒的固定位置和指定会议话筒的固定位置投影点构成一个收音三角形，由此根据构成的收音三角形统计各采集时间点中目标演讲人员对应指定会议话筒的收音端垂直方向需求放置角度，其计算公式为 θt表示为第t个采集时间点中目标演讲人员对应指定会议话筒的收音端垂直方向需求放置角度，ht表示为第t个采集时间点中目标演讲人员对应的有效坐姿高度，lt表示为第t个采集时间点中指定会议话筒对目标演讲人员的收音距离；

C8:以目标演讲人员对应指定会议话筒的固定底座为基点在会议桌平面上作垂线，并将该垂线记为指定话筒对应收音端的参考辅助线，进而将指定话筒对应收音端的参考辅助线映射到目标演讲人员对应的座位区域，以此形成映射辅助线；

C9:从各采集时间点对应目标演讲人员的坐姿图像中提取坐姿轮廓线，并识别出坐姿轮廓的中心线，同时在各采集时间点对应目标演讲人员的坐姿图像中将映射辅助线进行标记，形成标记后的坐姿图像；

C10:从标记后的各采集时间点对应目标演讲人员的坐姿图像中获取坐姿轮廓的中心线与映射辅助线之间的夹角，由此得到各采集时间点中目标演讲人员对应坐姿轮廓中心线与映射辅助线之间的夹角，该夹角即为各采集时间点中目标演讲人员对应指定会议话筒的收音端水平方向需求放置角度；

C11:在各采集时间点对目标演讲人员的指定会议话筒进行收音端水平方向放置角度和收音端垂直方向放置角度调控，使其分别符合收音端水平方向需求放置角度和收音端垂直方向需求放置角度。

9.根据权利要求8所述的一种数字化场景识别的多媒体互动分析方法，其特征在于：所述有效坐姿高度是指目标演讲人员嘴部到达会议桌面的高度。

10.一种数字化场景识别的多媒体互动分析云平台，其特征在于，包括以下模块：

参会人员基本信息获取模块，用于统计参加多媒体会议的参会人员，并获取各参会人员对应的参会基本信息；

参会数据库构建模块，用于获取多媒体会议对应的演讲流程，进而将多媒体会议对应的演讲流程和各参会人员对应的参会基本信息存储在参会数据库中；

会议设备设置模块，用于对多媒体会议室中存在的座位进行编号，并分别在各座位对应的会议桌区域设置会议话筒和摄像仪；

演讲顺序表提取模块，用于在会议正式开始时，从参会数据库中提取多媒体会议对应的演讲流程，并从演讲流程中获取演讲顺序表；

演讲信息提取模块，用于从演讲顺序表中按顺序提取各演讲参会人员的姓名和演讲时间段；

会议话筒开启和音量智能控制模块，用于根据各演讲参会人员的姓名和演讲时间段对会议话筒进行开闭控制和音量控制；