欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020110723286
申请人: 西安建筑科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于K‑means最优估计的WIFI指纹定位方法,其特征在于,包括以下步骤;

步骤1):采集RSSI数据;

步骤2):数据预处理;

步骤3):数据初始化,利用KNN算法将测试样本的位置信息进行近邻估计,补全样本信息;

步骤4):利用K‑means聚类算法进行聚类;

步骤5):输出聚类结果;

所述步骤3)数据初始化的过程中,利用KNN算法将测试样本的位置信息进行近邻估计,补全样本信息,假设待测数据的位置信息不存在,计算每个测试样本与所有训练样本强度之间的欧式距离,其中KNN算法中所用到的欧式距离公式为其中,RSSIij为第i个样本的第j个AP的信号强度值,RSSIsj为第s个样本的第j个AP的信号强度值,disti为测试样本s与训练样本i的第j个AP的强度之间的欧式距离;

最终得到m‑1个距离,将m‑1个距离从大到小进行排列,取距离最小的k个样本,计算k个样本的平均值,将平均值所对应的第i个样本的位置信息赋给待测样本,进而补全所有待测样本的位置估计信息,如下式其中,(xi,yi)分别为第i个样本的经度和纬度, 为待测样本的估计经度和纬度,从而构建出新的数据集,包含训练数据和初始化位置后的测试数据;

所述步骤4)具体步骤为:

1、输入聚类个数,随机选取K个聚类中心;

2、分配各个样本到距离最近的类中,利用公式;

其中,RSSIij为第i个训练样本的第j个AP的信号强度值,RSSIsj为第s个测试样本的第j个AP的信号强度值,disti为测试样本s与训练样本i的第j个AP的强度之间的欧式距离;

计算出在每个类内待测样本与类内已知样本强度信息之间的欧氏距离;

3、利用KNN算法在类内更新待测样本的位置信息,进一步优化位置信息;

将所得的距离按照从大到小进行排序,选取距离最小的k个样本,计算k个样本的平均值,将平均值所对应的已知样本的位置信息再次赋给待测样本,进一步优化待测样本的位置信息,如下式:其中, 分别为类内的第i个样本的经度和纬度(即位置信息), 为对应类内的待测样本的估计经度和纬度(即位置信息);

4、更新各个类中心,根据优化位置信息后的样本信息,对于所有样本点,重新计算新的聚类中心,如下式:其中,

(i) (i) (i)

其中x 为样本数据,ω(i)为x 所对应的第i个类,δ 为控制参数, 为第t次迭代的第j个聚类中心;

5、根据所设定的阈值判断迭代是否收敛,收敛公式如下:

||μt+1‑μt||<ε

其中,ε为设定的阈值,μt为第t次迭代的类中心,μt+1为第t+1次迭代的类中心,直到类中心偏移量小于设定的阈值ε时算法迭代终止,从而得到最终优化后的待测指纹的位置信息。

2.根据权利要求1所述的一种基于K‑means最优估计的WIFI指纹定位方法,其特征在于,所述步骤1)的采集RSSI数据过程中,采用UJIndoorLoc公开数据集,529属性包含WiFi指纹,获取指纹的坐标以及其他有用信息,每个WiFi指纹都可以通过检测到的无线接入点和相应的接收信号强度强度来表征,强度值表示为‑104dBm至0dbM的负整数值,正值100用于表示未检测到WAP的时间,在数据库创建期间,检测到520个不同的WAP,WiFi指纹由520个强度值组成。

3.根据权利要求2所述的一种基于K‑means最优估计的WIFI指纹定位方法,其特征在于,所述步骤2)的数据预处理步骤:(1)采用UJIndoorLoc数据集中的trainingData.csv文件,只选取强度信息和位置信息,其余信息进行删除操作;

(2)trainingData.csv文件数据集中总共包含5(0、1、2、3、4)层3栋(0、1、2)数据,选取的是第0栋第0层的数据;

(3)选取第0层第0栋的数据中,将所有在参考点处未检测到的AP信号强度值为100改为WiFi信号强度的最低值‑127;

(4)对数据集中所有样本点的经纬度分别减去取值范围的左边界,其中,经度范围为负实际值从‑7695.9387549299299000到‑7299.786516730871000,纬度范围从

4864745.7450159714到4865017.3646842018的正实际值,用新的坐标值来标定;

(5)对数据样本进行筛选,若某个AP中所有位置的信号强度均为‑127,则将该AP整列删除;若某个位置中,所有AP的有效信号强度((即非‑127)的值)少于15个,则将该样本整行删,数据集预处理完成后,则得到一个289*121的矩阵,该矩阵表示共有289个样本,每个样本具有121维属性,其中1‑119维为信号强度信息,120维和121维为位置信息,其中120维为经度信息,121维为纬度信息,将处理完成后所得数据矩阵的前150个样本作为训练集数据,剩余的139个样本作为测试数据。

4.根据权利要求1所述的一种基于K‑means最优估计的WIFI指纹定位方法,其特征在于,所述步骤4)利用K‑means聚类算法进行聚类的过程中,K‑means聚类算法是基于给定的聚类目标函数,算法采用迭代更新的方法,每一次迭代过程都是向目标函数减小的方向进行,最终聚类结果使得目标函数取得极小值,达到较好的分类效果,采用距离作为相似性的评价指标,两个对象的距离越近,其相似度就越大。