欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2015103946081
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于人工智能的智能机器人追踪方法,其特征在于,包括以下步骤:获取所述智能机器人所捕捉的画面图像,并对所述画面图像进行人脸检测以判断所述画面图像中是否有人脸;

如果判断所述画面图像中有人脸,则定位所述画面图像中的最大人脸,并对所述最大人脸进行身份识别;

当所述最大人脸的身份识别成功之后,获取所述最大人脸的位置坐标;以及根据所述位置坐标调整所述智能机器人以使所述最大人脸位于所述智能机器人中摄像头所捕捉的画面的正中间。

2.如权利要求1所述的方法,其特征在于,在对所述画面图像进行人脸检测以判断所述画面图像中是否有人脸之前,所述方法还包括:捕捉用户的人脸图像;

获取所述用户的人脸图像的脸部特征,并将所述用户的脸部特征作为预设脸部特征;

建立所述用户的脸部特征与用户身份的对应关系。

3.如权利要求2所述的方法,其特征在于,对所述最大人脸进行身份识别,具体包括:获取所述最大人脸的脸部特征;

判断所述最大人脸的脸部特征与所述预设脸部特征是否匹配;

如果所述最大人脸的脸部特征与所述预设脸部特征匹配,则确定所述最大人脸的身份识别成功,并根据所述对应关系确定所述最大人脸对应的用户身份。

4.如权利要求1所述的方法,其特征在于,获取所述最大人脸的位置坐标,具体包括:根据所述画面的左上顶点为原点建立平面直角坐标系,其中,所述画面的水平向右方向为所述平面直角坐标系的X轴正方向,所述画面的竖直向下方向为所述平面直角坐标系的Y轴正方向;

根据所述最大人脸和所述平面直角坐标系确定所述最大人脸的位置坐标,其中,所述位置坐标包括第一坐标点和第二坐标点,所述第一坐标点为所述最大人脸的正中央的横坐标,所述第二坐标点为所述最大人脸的正中央的纵坐标。

5.如权利要求4所述的方法,其特征在于,根据所述位置坐标调整所述智能机器人以使所述最大人脸位于所述智能机器人中摄像头所捕捉的画面的正中间,具体包括:获取所述画面的宽度和高度;

根据所述画面的宽度和高度以及所述最大人脸的所述第一坐标点和第二坐标点,分别计算所述智能机器人的水平偏移量和俯仰偏移量;

根据所述水平偏移量水平调整所述智能机器人的头部,并根据所述俯仰偏移量上下调整所述智能机器人的头部,以使所述最大人脸位于所述智能机器人中摄像头所捕捉的画面的正中间。

6.如权利要求1所述的方法,其特征在于,在获取所述智能机器人所捕捉的画面图像之前,所述方法还包括:检测所述智能机器人周围的至少一个声源;

当检测到的所述至少一个声源的其中一个声源满足预设声源条件时,对所述其中一个声源进行定位,并根据定位结果控制所述智能机器人移动至所述其中一个声源的位置;

当所述智能机器人移动至所述其中一个声源的位置时,获取所述智能机器人所捕捉的画面图像。

7.如权利要求6所述的方法,其特征在于,通过以下步骤检测所述至少一个声源的其中一个声源满足预设声源条件:获取所述其中一个声源的响度,并判断所述其中一个声源的响度是否大于响度阈值;

如果判断所述其中一个声源的响度大于所述响度阈值,则进一步判断所述其中一个声源的持续时间是否大于或等于时间阈值;以及如果判断所述其中一个声源的持续时间大于或等于所述时间阈值,则检测所述其中一个声源满足所述预设声源条件。

8.如权利要求6所述的方法,其特征在于,对所述其中一个声源进行定位,并根据定位结果控制所述智能机器人移动至所述其中一个声源的位置,具体包括:获取所述其中一个声源的第一位置坐标和所述智能机器人的第二位置坐标;

根据所述第一位置坐标和所述第二位置坐标计算所述第一位置坐标与所述第二位置坐标的水平角度差;

判断所述水平角度差是否大于水平角度阈值;

如果判断所述水平角度差大于所述水平角度阈值,则根据所述水平角度差和水平角度阈值计算所述智能机器人的身体的水平旋转角度,并根据所述身体的水平旋转角度控制所述智能机器人的身体进行水平旋转,以及根据所述水平角度阈值水平旋转所述智能机器人的头部;

如果判断所述水平角度差小于或等于所述水平角度阈值,则根据所述水平角度差控制所述智能机器人的头部水平旋转至所述其中一个声源的位置。

9.如权利要求8所述的方法,其特征在于,对所述其中一个声源进行定位,并根据定位结果控制所述智能机器人移动至所述其中一个声源的位置,还具体包括:根据所述第一位置坐标和所述第二位置坐标计算所述第一位置坐标与所述第二位置坐标的俯仰角度差;

判断所述俯仰角度差是否大于俯仰角度阈值;

如果判断所述俯仰角度差大于所述俯仰角度阈值,则根据所述俯仰角度差控制所述智能机器人的头部俯仰旋转至所述其中一个声源的位置;

如果判断所述俯仰角度差小于或等于所述俯仰角度阈值,则控制所述智能机器人的头部保持不动。

10.如权利要求1-9中任一项所述的方法,其特征在于,还包括:在所述智能机器人回复用户的请求之前,根据所述最大人脸的位置调整所述智能机器人以使所述智能机器人的身体和脸部同时面对用户。

11.一种基于人工智能的智能机器人追踪装置,其特征在于,包括:第一获取模块,用于获取所述智能机器人所捕捉的画面图像;

第一检测模块,用于对所述画面图像进行人脸检测以判断所述画面图像中是否有人脸;

识别模块,用于在所述第一检测模块判断所述画面图像中有人脸时,定位所述画面图像中的最大人脸,并对所述最大人脸进行身份识别;

第二获取模块,用于在所述最大人脸的身份识别成功之后,获取所述最大人脸的位置坐标;以及调整模块,用于根据所述位置坐标调整所述智能机器人以使所述最大人脸位于所述智能机器人中摄像头所捕捉的画面的正中间。

12.如权利要求11所述的装置,其特征在于,还包括:捕捉模块,用于捕捉用户的人脸图像;

第三获取模块,用于获取所述用户的人脸图像的脸部特征,并将所述用户的脸部特征作为预设脸部特征;

建立模块,用于建立所述用户的脸部特征与用户身份的对应关系。

13.如权利要求12所述的装置,其特征在于,所述识别模块具体用于:获取所述最大人脸的脸部特征;

判断所述最大人脸的脸部特征与所述预设脸部特征是否匹配;

如果所述最大人脸的脸部特征与所述预设脸部特征匹配,则确定所述最大人脸的身份识别成功,并根据所述对应关系确定所述最大人脸对应的用户身份。

14.如权利要求11所述的装置,其特征在于,所述第二获取模块具体用于:根据所述画面的左上顶点为原点建立平面直角坐标系,其中,所述画面的水平向右方向为所述平面直角坐标系的X轴正方向,所述画面的竖直向下方向为所述平面直角坐标系的Y轴正方向;

根据所述最大人脸和所述平面直角坐标系确定所述最大人脸的位置坐标,其中,所述位置坐标包括第一坐标点和第二坐标点,所述第一坐标点为所述最大人脸的正中央的横坐标,所述第二坐标点为所述最大人脸的正中央的纵坐标。

15.如权利要求14所述的装置,其特征在于,所述调整模块具体用于:获取所述画面的宽度和高度;

根据所述画面的宽度和高度以及所述最大人脸的所述第一坐标点和第二坐标点,分别计算所述智能机器人的水平偏移量和俯仰偏移量;

根据所述水平偏移量水平调整所述智能机器人的头部,并根据所述俯仰偏移量上下调整所述智能机器人的头部,以使所述最大人脸位于所述智能机器人中摄像头所捕捉的画面的正中间。

16.如权利要求11所述的装置,其特征在于,还包括;

第二检测模块,用于在所述第一获取模块获取所述智能机器人所捕捉的画面图像之前,检测所述智能机器人周围的至少一个声源;

控制模块,用于在所述第二检测模块检测到的所述至少一个声源的其中一个声源满足预设声源条件时,对所述其中一个声源进行定位,并根据定位结果控制所述智能机器人移动至所述其中一个声源的位置;

所述第一获取模块还用于在所述智能机器人移动至所述其中一个声源的位置时,获取所述智能机器人所捕捉的画面图像。

17.如权利要求16所述的装置,其特征在于,所述第二检测模块具体用于:获取所述其中一个声源的响度,并判断所述其中一个声源的响度是否大于响度阈值;

如果判断所述其中一个声源的响度大于所述响度阈值,则进一步判断所述其中一个声源的持续时间是否大于或等于时间阈值;以及如果判断所述其中一个声源的持续时间大于或等于所述时间阈值,则检测所述其中一个声源满足所述预设声源条件。

18.如权利要求16所述的装置,其特征在于,所述控制模块具体用于:获取所述其中一个声源的第一位置坐标和所述智能机器人的第二位置坐标;

根据所述第一位置坐标和所述第二位置坐标计算所述第一位置坐标与所述第二位置坐标的水平角度差;

判断所述水平角度差是否大于水平角度阈值;

如果判断所述水平角度差大于所述水平角度阈值,则根据所述水平角度差和水平角度阈值计算所述智能机器人的身体的水平旋转角度,并根据所述身体的水平旋转角度控制所述智能机器人的身体进行水平旋转,以及根据所述水平角度阈值水平旋转所述智能机器人的头部;

如果判断所述水平角度差小于或等于所述水平角度阈值,则根据所述水平角度差控制所述智能机器人的头部水平旋转至所述其中一个声源的位置。

19.如权利要求18所述的装置,其特征在于,所述控制模块还具体用于:根据所述第一位置坐标和所述第二位置坐标计算所述第一位置坐标与所述第二位置坐标的俯仰角度差;

判断所述俯仰角度差是否大于俯仰角度阈值;

如果判断所述俯仰角度差大于所述俯仰角度阈值,则根据所述俯仰角度差控制所述智能机器人的头部俯仰旋转至所述其中一个声源的位置;

如果判断所述俯仰角度差小于或等于所述俯仰角度阈值,则控制所述智能机器人的头部保持不动。

20.如权利要求11-19中任一项所述的装置,其特征在于,所述调整模块还用于在所述智能机器人回复用户的请求之前,根据所述最大人脸的位置调整所述智能机器人以使所述智能机器人的身体和脸部同时面对用户。