1.一种不良户外广告标语的检测与过滤方法,其特征在于,建立标语黑名单,标语黑名单中的违规标语以拼音的形式进行存储;获取户外广告的待检测标语,并转化为拼音的形式;以拼音为对象,比较待检测标语与标语黑名单中的违规标语,获得待检测标语与每个违规标语的整句相似度;如果待检测标语与某个违规标语的整句相似度高于预设的判定阈值,则判定待检测标语为不良标语,禁止播放;否则待检测标语为合格标语,直接进行播放;
比较待检测标语与标语黑名单中的违规标语的方法如下:
逐句读取标语黑名单中的违规标语,与待检测标语进行比较,直至待检测标语与某个违规标语的整句相似度高于预设的判定阈值,结束比较;如果待检测标语与所有违规标语的整句相似度均低于预设的判定阈值,则判定待检测标语为合格标语;
获得整句相似度的方法如下:
逐个读取违规标语的字符对应的拼音,与待检测标语的每个字符对应的拼音进行比较,获得字符相似度;如果字符相似度高于预设的字符阈值,则相似字符数加1;直至完成违规标语的每个字符与对待检测标语的每个字符进行比较,统计相似字符数,计算整句相似度;
获得字符相似度的方法如下:
逐个读取违规标语的字符对应的拼音的字母,与待检测标语的字符对应的拼音的每个字母进行比较,如果字母相同,则相同字母数加1;直至完成违规标语的字符对应的拼音的每个字母与待检测标语的字符对应的拼音的每个字母进行比较,统计相同字母数,计算字符相似度。
2.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,建立标语白名单,在比较待检测标语与标语黑名单中的违规标语之前,先将待检测标语与标语白名单中的合法标语进行比较,获得待检测标语与合法标语的字符匹配度;如果待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,则判定待检测标语为合格标语,直接进行播放;否则将待检测标语与标语黑名单中的违规标语进行比较。
3.根据权利要求2所述的不良户外广告标语的检测与过滤方法,其特征在于,比较待检测标语与标语白名单中的合法标语的方法如下:逐句读取标语白名单中的合法标语,与待检测标语进行比较,直至待检测标语与某个合法标语的字符匹配度高于预设的匹配阈值,结束比较;如果待检测标语与所有合法标语的字符匹配度均低于预设的匹配阈值,则将待检测标语与标语黑名单中的违规标语进行比较。
4.根据权利要求3所述的不良户外广告标语的检测与过滤方法,其特征在于,获得字符匹配度的方法如下:
逐个读取合法标语的字符,与待检测标语的每个字符进行比较,如果字符相同,则相同字符数加1;直至完成合法标语的每个字符与待检测标语的每个字符进行比较,统计相同字符数,计算字符匹配度。
5.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,如果户外广告为图像,则通过OCR识别图像中的字符,得到待检测标语;如果户外广告为文本,则读取文本中的字符,得到待检测标语。
6.根据权利要求1所述的不良户外广告标语的检测与过滤方法,其特征在于,进一步地,当户外广告的待检测标语被判定为不良标语后,输出不良标语与对应的违规标语,进行人工审核,确定判定结果是否正确;如果人工审核将判定结果由不良标语个性为合法标语,则直接进入播放,否则禁止播放。
7.一种户外广告播放系统,其特征在于,包括检测过滤服务器、屏幕,检测过滤服务器接收待播放的户外广告后,通过权利要求1至6任一项所述的检测与过滤方法对待播放的户外广告进行不良户外广告标语的检测与过滤;待播放的户外广告包括不良标语,则禁止播放,否则通过屏幕进行播放。