1.一种基于深度强化学习的云边协同文档分类系统,其特征在于,包括:机器文档关键词分析模块,机器文档摘要分析模块,机器文档内容分类模块,人工分类模块,文档分类效率评价模块,专家文档分类模块,结果存储模块和机器在线学习模块;
所述机器文档关键词分析模块,用于利用训练好的关键词提取模型得到待分类文档的文档关键词;
所述机器文档摘要分析模块,用于利用训练好的摘要生成模型得到待分类文档的文档摘要;
所述机器文档内容分类模块,用于利用所述文档关键词和所述文档摘要得到待分类文档的第一分类标签;
所述人工分类模块,用于提供所述待分类文档的文档摘要、文档关键词和第一分类标签来辅助文档分类人员进行文档分类得到第二分类标签;
所述文档分类效率评价模块,用于记录文档分类人员在所述人工分类模块进行文档分类时的效率参数,并计算分类效率值;分类效率值超过设定阈值时,将第二分类标签作为最终分类标签,与待分类文档及文档摘要、文档关键词一起发送到结果存储模块;将分类效率值小于设定阈值的待分类文档及文档摘要、文档关键词和第一分类标签发到专家文档分类模块;
所述专家文档分类模块,用于将所述待分类文档的文档摘要、文档关键词和第一分类标签呈现给专家来进行文档分类得到第三分类标签;将第三分类标签作为最终分类标签,与专家进行过文档分类得到的已分类文档、文档摘要和文档关键词一起发送到结果存储模块;
所述结果存储模块,用于存储已分类的文档,文档摘要,文档关键词,第一分类标签,第二分类标签,第三分类标签,最终分类标签,效率参数和分类效率值;
所述机器在线学习模块,用于定期,或者当结果存储模块中新增的已分类文档及文档摘要、文档关键词和最终分类标签达到设定数量时使用已分类文档及文档摘要、文档关键词和最终分类标签作为训练集更新关键词提取模型、摘要生成模型和文档分类模型的参数;统计所有已分类文档中最终分类标签与第一分类标签相同的文档的比例作为文档分类模型的正确率,当正确率低于设定正确率时使用已分类文档及文档摘要、文档关键词和最终分类标签作为训练集更新关键词提取模型、摘要生成模型和文档分类模型的参数;
其中,所述机器文档内容分类模块采用训练好的文档分类模型对待分类文档进行分类得到的第一分类标签;文档分类模型为SVM模型、KNN模型、决策树模型或基于循环神经网络的分类模型。
2.如权利要求1所述的一种基于深度强化学习的云边协同文档分类系统,其特征在于,所述效率参数包括文档分类时间、文档分类变更次数、模型最高分类标签概率和人工标签分类概率;
其中,模型最高分类标签概率,是计算机预处理模块处理当前文档对应于各个分类的概率最大值;人工标签分类概率= 1/分类标签总数。
3.如权利要求2所述的一种基于深度强化学习的云边协同文档分类系统,其特征在于,所述计算分类效率值,使用的计算方式如下:若时间耗费比<0.3,则分类效率值=0.8;
否则,分类效率值=时间权值*exp(‑文档分类变更次数)*模型最高分类标签概率*人工标签分类概率;
其中,时间耗费比=文档分类时间/文档分类平均时间,时间权值=exp(1‑时间耗费比);
exp(x)表示e的x次方;模型最高分类标签概率,是计算机预处理模块处理当前文档对应于各个分类的概率最大值。
4.一种云边协同文档分类方法,其特征在于,基于所述权利要求1~3任一所述的云边协同文档分类系统,包括以下步骤:S1,输入待分类文档到机器文档关键词分析模块、机器文档摘要分析模块;
S2,机器文档关键词分析模块、机器文档摘要分析模块根据所述待分类文档得到文档摘要、文档关键词;
S3,机器文档内容分类模块根据所述文档摘要、文档关键词和待分类文档得到第一分类标签;
S4,文档分类人员在人工分类模块上根据所述文档摘要、文档关键词和第一分类标签选择文档分类标签得到第二分类标签;
S5,文档分类效率评价模块根据统计的效率参数计算分类效率值,若分类效率值低于设定阈值则转入步骤S6,否则转入步骤S7;
S6,专家在专家文档分类模块中为所述待分类文档选择文档分类标签得到第三分类标签;
S7,结果存储模块存储已分类文档及文档摘要、文档关键词和最终分类标签;
S8,机器在线学习模块使用结果存储模块中的已分类文档及文档摘要、文档关键词和最终分类标签作为训练集对关键词提取模型、摘要生成模型和文档分类模型的参数进行训练;
所述最终分类标签是:若待分类文档只经过人工分类模块而未经过专家分类模块,则最终分类标签为第二分类标签;若待分类分档经过了专家分类模块,则最终分类标签为第三分类标签。
5.如权利要求4所述的一种云边协同文档分类方法,其特征在于,所述对关键词提取模型、摘要生成模型和文档分类模型的参数进行训练,包括:对各条数据的样本惩罚因子的处理如下:
若文档未经过专家分类模块,即第三分类标签为空,且第二分类标签与第一分类标签不是完全一致,且效率参数中的时间耗费比<0.3,则将样本惩罚因子设为α;
若文档经过了专家分类模块,即第三分类标签不为空或最终分类标签与第三分类标签完全一致,且第三分类标签与第一分类标签不一致,则将样本惩罚因子设为β;
其他文档数据样本惩罚因子设为γ;
其中,1≤γ≤2,2γ≤α≤4γ,2α≤β≤4α。