1.一种基于大数据的业务信息处理方法,其特征在于,应用于计算机设备,所述方法包括:在接收到情感分析触发指示时,从业务信息大数据库中获取目标用户的目标业务信息数据;
从所述目标业务信息数据中获取若干目标业务信息文本,对所述目标业务信息文本进行表征载体挖掘,得到所述目标业务信息文本对应的全局表征载体集合;
对所述目标业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述目标业务信息文本的全局表征载体集合的若干聚焦载体段落,表征载体是对文本进行特征表示的载体;
对所述目标业务信息文本的全局表征载体集合中各个聚焦载体段落进行表征载体挖掘,得到所述目标业务信息文本的各个聚焦载体段落的文本段落向量表示;
通过所述目标业务信息文本的各个聚焦载体段落对所述目标业务信息数据的情感极性的贡献系数,对所述目标业务信息文本的全局表征载体集合的集合向量表示和各个聚焦载体段落的文本段落向量表示进行合并以获得所述目标业务信息文本的文本向量表示,聚焦载体段落是在预估目标业务信息数据的情感极性类别时,产生最大影响,也就是最需要关注的载体段落;
将各个目标业务信息文本的文本向量表示进行合并以获得所述目标业务信息数据的业务信息向量表示;
通过所述业务信息向量表示对所述目标业务信息数据进行情感极性识别,得到所述目标业务信息数据的不少于一个情感极性类别;
所述将各个目标业务信息文本的文本向量表示进行合并以获得所述目标业务信息数据的业务信息向量表示,包括:对各个目标业务信息文本的文本向量表示进行分组,得到若干分组,确定各个分组中作为分组核心的参考向量表示;
对于各个分组,获取所述分组中的参考向量表示与其余向量表示的相减结果,得到所述分组的调节向量表示;
将各个分组的调节向量表示进行合并以获得所述目标业务信息数据的业务信息向量表示;
所述对各个目标业务信息文本的文本向量表示进行分组,得到若干分组,并确定各个分组中作为分组核心的参考向量表示,包括:确定M个分组,所述M大于或等于1;
在所述目标业务信息文本的文本向量表示中确定M个文本向量表示各自作为M个分组的参考向量表示;
获取各个目标业务信息文本的文本向量表示与各个参考向量表示的空间相似性;
将各个文本向量表示分别融入与所述文本向量表示的空间相似性最高的参考向量表示对应的分组中,得到M个分组;
对于每个分组,在所述分组中识别出达到分组核心条件的文本向量表示,作为新的参考向量表示,跳转至所述获取各个目标业务信息文本的文本向量表示与各个参考向量表示的空间相似性的步骤进行循环,直到各个分组的参考向量表示达到分组停止条件以得到M个分组,以及得到各个分组中作为分组核心的参考向量表示。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述目标业务信息文本的全局表征载体集合的若干聚焦载体段落,包括:调用聚焦识别控件在所述目标业务信息文本的全局表征载体集合中按序识别,获取所述目标业务信息文本的全局表征载体集合的多个备选表征载体序列;
通过所述全局表征载体集合中各个备选表征载体序列的表征载体集合信息,对各个备选表征载体序列进行聚焦权重确定;
通过聚焦权重确定结果在所述备选表征载体序列中确定出若干聚焦载体段落;
将所述聚焦载体段落确定为备选聚焦载体段落,对所述备选聚焦载体段落进行控件选取范围微调,得到范围调节后的备选聚焦载体段落;
通过所述全局表征载体集合中范围调节后的备选聚焦载体段落的表征载体集合信息,对所述范围调节后的备选聚焦载体段落进行聚焦权重确定;
通过聚焦权重确定结果对所述范围调节后的备选聚焦载体段落进行择取,得到所述目标业务信息文本的聚焦载体段落。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标业务信息文本的全局表征载体集合中各个聚焦载体段落进行表征载体挖掘,得到所述目标业务信息文本的各个聚焦载体段落的文本段落向量表示,包括:对所述目标业务信息文本的全局表征载体集合中各个聚焦载体段落进行载体压缩,得到所述目标业务信息文本的各个聚焦载体段落的文本段落向量表示。
4.根据权利要求1所述的方法,其特征在于,所述通过所述目标业务信息文本的各个聚焦载体段落对所述目标业务信息数据的情感极性的贡献系数,对所述目标业务信息文本的全局表征载体集合的集合向量表示和各个聚焦载体段落的文本段落向量表示进行合并以获得所述目标业务信息文本的文本向量表示,包括:通过所述目标业务信息文本的各个聚焦载体段落对所述目标业务信息数据的情感极性的贡献系数,确定所述目标业务信息文本的各个聚焦载体段落对应的偏心因子,偏心因子即彼此对应的权值;
通过所述偏心因子对所述目标业务信息文本的全局表征载体集合的集合向量表示和各个聚焦载体段落的文本段落向量表示进行偏心计算,得到所述目标业务信息文本的文本向量表示。
5.根据权利要求1所述的方法,其特征在于,所述对所述目标业务信息文本进行表征载体挖掘,得到所述目标业务信息文本对应的全局表征载体集合,包括:基于情感极性识别算法对所述目标业务信息文本进行表征载体挖掘,得到所述目标业务信息文本对应的全局表征载体集合;
所述对所述目标业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述目标业务信息文本的全局表征载体集合的若干聚焦载体段落,包括:基于所述情感极性识别算法对所述目标业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述目标业务信息文本的全局表征载体集合的若干聚焦载体段落;
所述通过所述业务信息向量表示对所述目标业务信息数据进行情感极性识别,得到所述目标业务信息数据的不少于一个情感极性类别,包括:基于所述情感极性识别算法,通过所述业务信息向量表示对所述目标业务信息数据进行情感极性识别,得到所述目标业务信息数据的不少于一个情感极性类别;
所述基于情感极性识别算法,对所述目标业务信息文本进行表征载体挖掘,得到所述目标业务信息文本对应的全局表征载体集合之前,所述方法还包括:获取优化示例数据,所述优化示例数据包括示例业务信息数据的示例业务信息文本和所述示例业务信息数据对应的实际情感极性类别标签;
基于初始化的情感极性识别算法对所述示例业务信息文本进行表征载体挖掘,得到所述示例业务信息文本对应的全局表征载体集合,对所述示例业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述示例业务信息文本的全局表征载体集合的若干预估聚焦载体段落;
对所述示例业务信息文本的全局表征载体集合中各个预估聚焦载体段落进行表征载体挖掘,得到所述示例业务信息文本的各个预估聚焦载体段落的文本段落向量表示;
通过所述示例业务信息文本的各个预估聚焦载体段落对所述示例业务信息数据的情感极性的贡献系数,对所述示例业务信息文本的全局表征载体集合的集合向量表示和各个预估聚焦载体段落的文本段落向量表示进行合并以获得所述示例业务信息文本的文本向量表示;
将各个示例业务信息文本的文本向量表示进行合并以获得所述示例业务信息数据的业务信息向量表示;
通过所述业务信息向量表示,确定所述示例业务信息数据在各个预设情感极性类别上的预估可信系数;
获取所述预估可信系数和所述示例业务信息数据的实际情感极性类别标签之间的第一代价;
通过所述第一代价对情感极性识别算法的参数进行调节,得到收敛后的情感极性识别算法。
6.根据权利要求5所述的方法,其特征在于,所述通过所述第一代价对情感极性识别算法的参数进行调节,得到收敛后的情感极性识别算法之前,所述方法还包括:获取所述第一代价对所述示例业务信息数据的业务信息向量表示的变化率变量,通过所述变化率变量生成所述示例业务信息数据的示例业务信息文本的全局表征载体集合对应的类别激活映射图;
通过所述示例业务信息数据的预估可信系数,确定所述示例业务信息数据的情感极性类别;
如果所述示例业务信息数据的情感极性类别与所述实际情感极性类别标签匹配,通过所述类别激活映射图获取所述示例业务信息文本的全局表征载体集合的聚焦载体段落,将获取的所述聚焦载体段落确定成所述示例业务信息文本的实际聚焦载体段落;
如果所述示例业务信息数据的情感极性类别与所述实际情感极性类别标签不匹配,通过所述类别激活映射图获取所述示例业务信息文本的全局表征载体集合的非聚焦载体段落,将获取的所述非聚焦载体段落确定成所述示例业务信息文本的假聚焦载体段落;
所述通过所述第一代价对情感极性识别算法的参数进行调节,得到收敛后的情感极性识别算法,包括:通过所述实际聚焦载体段落和所述假聚焦载体段落,获取所述示例业务信息文本的预估聚焦载体段落的第二代价;
通过所述第一代价和所述第二代价对情感极性识别算法的参数进行调节,得到收敛后的情感极性识别算法。
7.根据权利要求6所述的方法,其特征在于,所述通过所述实际聚焦载体段落和所述假聚焦载体段落,获取所述示例业务信息文本的预估聚焦载体段落的第二代价,包括:通过所述示例业务信息文本的预估聚焦载体段落和所述实际聚焦载体段落的段落相交范围值,确定所述预估聚焦载体段落的实际聚焦载体段落可信系数;
通过所述示例业务信息文本的预估聚焦载体段落和所述假聚焦载体段落的段落相交范围值,确定所述预估聚焦载体段落的实际聚焦载体段落可信系数;
通过情感极性识别算法,通过所述预估聚焦载体段落的表征载体集合信息,确定所述预估聚焦载体段落为实际聚焦载体段落的预估可信系数;
通过所述预估聚焦载体段落的预估可信系数和对应的实际聚焦载体段落可信系数,获取所述预估聚焦载体段落的情感极性识别代价;
通过所述实际聚焦载体段落可信系数不小于可信系数临界值的预估聚焦载体段落,在所述示例业务信息文本的全局表征载体集合中的位置和所述实际聚焦载体段落在所述示例业务信息文本的全局表征载体集合中的位置,获取所述预估聚焦载体段落的预测代价;
将所述情感极性识别代价和所述预测代价进行合并以获得所述示例业务信息文本的预估聚焦载体段落的第二代价。
8.一种业务信息处理装置,其特征在于,包括:
业务数据获取模块,用于在接收到情感分析触发指示时,从业务信息大数据库中获取目标用户的目标业务信息数据;
表征载体挖掘模块,用于从所述目标业务信息数据中获取若干目标业务信息文本,对所述目标业务信息文本进行表征载体挖掘,得到所述目标业务信息文本对应的全局表征载体集合;
聚焦段落确定模块,用于对所述目标业务信息文本的全局表征载体集合进行聚焦载体段落确定,得到所述目标业务信息文本的全局表征载体集合的若干聚焦载体段落;
段落向量确定模块,用于对所述目标业务信息文本的全局表征载体集合中各个聚焦载体段落进行表征载体挖掘,得到所述目标业务信息文本的各个聚焦载体段落的文本段落向量表示;
文本向量确定模块,用于通过所述目标业务信息文本的各个聚焦载体段落对所述目标业务信息数据的情感极性的贡献系数,对所述目标业务信息文本的全局表征载体集合的集合向量表示和各个聚焦载体段落的文本段落向量表示进行合并以获得所述目标业务信息文本的文本向量表示;
文本向量合并模块,用于将各个目标业务信息文本的文本向量表示进行合并以获得所述目标业务信息数据的业务信息向量表示;
情感极性识别模块,用于通过所述业务信息向量表示对所述目标业务信息数据进行情感极性识别,得到所述目标业务信息数据的不少于一个情感极性类别。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
以及一个或多个存储器,其中所述存储器中存储有计算机可读代码,所述计算机可读代码在由所述一个或多个处理器运行时,使得所述一个或多个处理器执行如权利要求1~7中任一项所述的方法。