1.一种直播间推荐方法,用于向用户实时推荐用户当前感兴趣的直播间,其特征在于,其包括:获取每一个直播间的文字信息;
将文字信息输入分布式搜索引擎中进行分词,得到多个词组以及对应词组的权重;
为直播间ID和该直播间ID对应的词组建立倒排索引并存储至数据库;
实时监测搜索内容并获取输入语句,将所述输入语句进行拆分得到检索字词,将检索字词存入kafka消息队列中;
使用实时流处理框架storm从kafka队列获取所述检索字词,并检索数据库中的倒排序索引,按照包含检索字词在倒排序索引的权重对直播间进行排序,并推荐排序最优的预设数目的直播间。
2.如权利要求1所述的方法,其特征在于:
所述将文字信息输入分布式搜索引擎中进行分词,得到多个词组以及对应词组的权重包括:将文字信息差分为若干个语元以及语元组合起来的词组;
通过分布式搜索引擎对语元以及语元组合起来的词组进行评分,得到对应语元以及语元组合起来的词组的权重,所述权重为该语元或词组对应直播间文字信息的相关度的评分。
3.如权利要求1所示的方法,其特征在于,
所述实时检测搜索行为并获取输入语句具体为:将每次输入的语句按次存放,并获取最新的若干次输入语句。
4.如权利要求3所述的方法,其特征在于:所述索引字词存储结构为Redis数据库的sorted set结构,所述sorted set结构的double类型分数用于存放搜索时间戳。
5.如权利要求1所述的方法,其特征在于:所述文字信息包括直播间标题、直播间ID、主播ID、主播昵称。
6.如权利要求1所述的方法,其特征在于:所述使用ElasticSearch分词工具对文字信息进行拆分。
7.如权利要求1所述的方法,其特征在于:在用户界面上的部分推荐栏位显示所述排序最优的预设数目的直播间。
8.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
9.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。
10.一种直播间推荐方法系统,其特征在于,其包括:
拆分模块,用于获取所有直播间的文字信息,按照文字信息构成从复杂到简单对文字信息进行拆分,并按照复杂度逐级建立倒排序索引存入数据库;
检索模块,用于实时检测用户的搜索行为并获取用户的输入语句,将用户的输入语句进行拆分得到检索字词,将检索字词存入kafka消息队列中;
推荐模块,用于使用实时流处理框架storm从kafka队列获取所述检索字词,并检索数据库中的倒排序索引,按照包含检索字词数量从多到少对检索到的直播间进行排序,并推荐排序最前的预设数目的直播间。