1.一种基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:包括:数据获取模块,被配置为:获取待处理的文本数据,对获取的文本数据进行预处理;
词嵌入模块,被配置为:根据预处理后的文本数据和预设词嵌入模型,得到词嵌入向量;
情感值特征向量获取模块,被配置为:根据预处理后的文本数据、预设情感词典和预设语义规则,得到文本的情感值特征向量;
单词级特征向量获取模块,被配置为:提取文本数据中的词性特征向量,与词嵌入向量拼接后,得到单词级别的特征向量表示;
句子级特征向量获取模块,被配置为:提取文本数据中的词频特征向量,与情感值特征向量拼接后,得到句子级别的特征向量表示;
分类模块,被配置为:根据单词级别的特征向量表示、句子级别的特征向量表示以及预设CNN‑BiLSTM网络模型,得到最终的分类结果。
2.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
分类模块中,将单词级别的特征向量表示和句子级别的特征向量表示,分别输入到预设卷积神经网络中,将两个卷积神经网络输出的高层特征进行融合后输入到预设Bi‑LSTM网络模型中,得到分类结果。
3.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
对获取的文本数据进行预处理,包括:从文本数据中提取标题、内容和标签,去除由于已删除内容而缺少的数据以及不相关数据,将文本数据转换为小写字母。
4.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
采用Word2vec词嵌入模型生成嵌入向量。
5.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
利用扩充后的SenticNet4情感词典,根据情感词典中每个单词的情感极性值和预设语义规则,进行句子情感值计算,得到文本的情感值特征向量。
6.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
语义规则,包括:
若文本数据中出现感叹号或者问号,文本或句子的情感极性增强;
或者,
若句子同时含有大小写,全部大写的单词情感强度增强;
或者,
若句子中的情感词前面存在程度副词,文本或句子的情感极性增强。
7.如权利要求1所述的基于多模态特征和语义规则的文本抑郁倾向检测系统,其特征在于:
语义规则,还包括:
如果句子中存在转折连词,只考虑转折连词后面的句子情感极性;
或者,
如果句子中存在否定词,考虑否定词相关联的词的相反情感极性;
或者,
如果句子为反问句,将句中情感词乘以相应的权值;
或者,
如果句子中包含表情符号,根据表情符号所代表的含义判断句子或文本的情感极性。
8.一种基于多模态特征和语义规则的文本抑郁倾向检测方法,其特征在于:包括以下过程:
获取待处理的文本数据,对获取的文本数据进行预处理;
根据预处理后的文本数据和预设词嵌入模型,得到词嵌入向量;
根据预处理后的文本数据、预设情感词典和预设语义规则,得到文本的情感值特征向量;
提取文本数据中的词性特征向量,与词嵌入向量拼接后,得到单词级别的特征向量表示;
提取文本数据中的词频特征向量,与情感值特征向量拼接后,得到句子级别的特征向量表示;
根据单词级别的特征向量表示、句子级别的特征向量表示以及预设CNN‑BiLSTM网络模型,得到最终的分类结果。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求8所述的基于多模态特征和语义规则的文本抑郁倾向检测方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求8所述的基于多模态特征和语义规则的文本抑郁倾向检测方法中的步骤。