欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2024119298745
申请人: 北京前往科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-31
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种面向档案管理的电子信息数据分类方法,其特征在于,所述方法包括:获取每个待分类的人员档案的电子信息数据,对所述电子信息数据进行预处理,以得到所述电子信息数据中的各个分词对应的词向量;

将当前任务的信息和所述待分类的人员档案的电子信息数据输入已训练好的分类网络中,输出在所述当前任务的条件下,对所述待分类的人员档案对应人员的各个技能的任务需求指数;

根据对所述待分类的人员档案对应人员的各个技能的任务需求指数、所述各个分词对应的词向量、所述电子信息数据和所述当前任务所需的技能,获取各个所述待分类的人员档案对应人员对所述当前任务所需的各个技能的技能掌握水平和所述当前任务的条件下各个所述待分类的人员档案对应人员的学习能力;

其中,获取各个所述待分类的人员档案对应人员对所述当前任务所需的各个技能的技能掌握水平的方法为:对每一个所述待分类的人员档案的电子信息数据以及所述当前任务所需的每一个技能执行如下步骤:根据各个文本分词对应的词向量和当前电子信息数据,计算所述当前电子信息数据中的个人技能模块内,各个所述文本分词与当前技能关键词的余弦相似度;所述当前电子信息数据为当前待分类的人员档案的电子信息数据,所述文本分词表示所述当前电子信息数据中的分词;所述当前技能关键词为所述当前任务所需的当前技能对应的关键词;

根据所述当前电子信息数据中的个人技能模块和目标分词获取所述当前待分类的人员档案对应人员对所述当前技能的掌握位置系数;所述目标分词为最大的所述余弦相似度对应的所述文本分词;

根据所述当前电子信息数据中的工作经历模块和所述目标分词,获取所述当前技能在所述工作经历模块的各个工作经历中的技能掌握程度和技能必要程度;

根据所述技能掌握程度和所述技能必要程度,获取所述当前待分类的人员档案对应人员对所述当前技能的技能客观掌握水平;

根据所述掌握位置系数和所述技能客观掌握水平,获取所述当前待分类的人员档案对应人员对所述当前技能的技能掌握水平;

其中,获取所述当前任务的条件下各个所述待分类的人员档案对应人员的学习能力的方法为:对每一个所述待分类的人员档案的电子信息数据执行如下步骤:获取所述当前电子信息数据中的年龄数据;

获取所述当前电子信息数据中的教育经历部分包括的所述文本分词的第六数量;

根据所述年龄数据和所述第六数量获取第一学习能力;

获取各个所述工作经历的工作时长;

根据各个所述工作经历的工作时长、各个所述工作经历包括的所有技能的数量、所有所述技能必要程度以及所有所述技能客观掌握水平,计算各个所述工作经历体现的学习能力;

根据所述第一学习能力和各个所述工作经历体现的学习能力获取所述当前电子信息数据体现的学习能力;

将各个所述技能对应的所述任务需求指数按照预设顺序排序,得到第一序列;

将所述当前电子信息数据中对各个所述技能的所述技能掌握水平按照所述预设顺序排序,得到第二序列;

获取所述第一序列和所述第二序列的相关系数;

根据所述当前电子信息数据体现的学习能力和所述相关系数,获取所述当前任务的条件下所述当前待分类的人员档案对应人员的学习能力;

根据所述当前任务所需的技能、所述技能掌握水平和所述学习能力,获取每两个所述待分类的人员档案的电子信息数据的聚类距离;

根据所述聚类距离对各个所述待分类的人员档案的电子信息数据进行聚类处理;

保存所述聚类结果。

2.根据权利要求1所述的一种面向档案管理的电子信息数据分类方法,其特征在于,所述对所述电子信息数据进行预处理,以得到所述电子信息数据中的各个分词对应的词向量,包括:对所述电子信息数据中的文本进行分词处理得到所述文本对应的分词;

去除各个所述分词中的停用词;

对去除所述停用词后的各个所述分词进行中文词形还原处理;

将进行中文词形还原处理后的各个所述分词转化为词向量。

3.根据权利要求1所述的一种面向档案管理的电子信息数据分类方法,其特征在于,所述将当前任务的信息和所述待分类的人员档案的电子信息数据输入已训练好的神经网络中之前,所述方法还包括:获取样本集,所述样本集包括:所述当前任务的信息、预设待分类的人员档案对应人员档案所属领域的样本技能关键词,以及标注的各个所述样本技能关键词的预设任务需求指数;

将所述样本集划分为训练集与验证集;

将所述训练集输入原始分类网络中,对所述原始分类网络采用梯度下降法进行迭代训练,通过预设损失函数和所述验证集更新所述原始分类网络中的参数;

在所述预设损失函数收敛时,停止对所述原始分类网络的迭代训练,得到已训练好的所述分类网络。

4.根据权利要求1所述的一种面向档案管理的电子信息数据分类方法,其特征在于,所述根据所述当前电子信息数据中的个人技能模块和所述目标分词获取所述当前待分类的人员档案对应人员对所述当前技能的掌握位置系数,包括:获取目标段落中,所述目标分词之前的所有所述文本分词的第一数量以及所述目标段落包括的所有所述分词的第二数量;所述目标段落为所述个人技能模块中所述目标分词所在的段落;

获取所述个人技能模块中,所述目标段落的之前的先前段落数,以及所述个人技能模块中的总段落数;

根据所述第一数量、所述第二数量、所述先前段落数和所述总段落数获取所述当前待分类的人员档案对应人员对所述当前技能的掌握位置系数。

5.根据权利要求4所述的一种面向档案管理的电子信息数据分类方法,其特征在于,根据所述当前电子信息数据中的工作经历模块和所述目标分词,获取所述当前技能在所述工作经历模块的各个工作经历中的技能掌握程度和技能必要程度,包括:获取所述工作经历模块中的各个段落中包括的所有所述文本分词的第三数量;

计算所述工作经历模块中的各个段落中的各个所述文本分词的词向量之间的信息熵;

根据所述第三数量和所述信息熵,获取各个所述工作经历体现的所述技能掌握程度;

获取所述目标分词在所述工作经历模块中出现的目标段落;

获取所述目标分词在各个所述目标段落中所处的目标句子;

获取各个所述目标句子中包含的所述文本分词的第四数量;

获取各个所述目标句子中包含的其他所述技能关键词对应的所述文本分词的第五数量;

根据所述第四数量和所述第五数量获取所述当前技能在各个所述工作经历中的所述技能必要程度。

6.根据权利要求1所述的一种面向档案管理的电子信息数据分类方法,其特征在于,所述根据所述技能、所述技能掌握水平和所述学习能力,获取每两个所述待分类的人员档案的电子信息数据的聚类距离,包括:对每两个待分类的人员档案的电子信息数据执行如下步骤:

获取两个所述待分类的人员档案对应人员相同的所述技能;

在两个所述待分类的人员档案对应人员相同的所述技能中,获取包含于所述当前任务所需的技能中的目标技能;

根据所述目标技能、两个所述待分类的人员档案对应人员的对各个所述目标技能的所述技能掌握水平和两个所述待分类的人员档案对应人员的学习能力,获取两个所述待分类的人员档案的电子信息数据的聚类距离。

7.一种面向档案管理的电子信息数据分类系统,其特征在于,所述系统包括:第一获取模块,用于获取每个待分类的人员档案的电子信息数据,对所述电子信息数据进行预处理,以得到所述电子信息数据中的各个分词对应的词向量;

第二获取模块,用于将当前任务的信息和所述待分类的人员档案的电子信息数据输入已训练好的分类网络中,输出在所述当前任务的条件下,对所述待分类的人员档案对应人员的各个技能的任务需求指数;

第三获取模块,用于根据对所述待分类的人员档案对应人员的各个技能的任务需求指数、所述各个分词对应的词向量、所述电子信息数据和所述当前任务所需的技能,获取各个所述待分类的人员档案对应人员对所述当前任务所需的各个技能的技能掌握水平和所述当前任务的条件下各个所述待分类的人员档案对应人员的学习能力;

其中,获取各个所述待分类的人员档案对应人员对所述当前任务所需的各个技能的技能掌握水平的方法为:对每一个所述待分类的人员档案的电子信息数据以及所述当前任务所需的每一个技能执行如下步骤:根据各个文本分词对应的词向量和当前电子信息数据,计算所述当前电子信息数据中的个人技能模块内,各个所述文本分词与当前技能关键词的余弦相似度;所述当前电子信息数据为当前待分类的人员档案的电子信息数据,所述文本分词表示所述当前电子信息数据中的分词;所述当前技能关键词为所述当前任务所需的当前技能对应的关键词;

根据所述当前电子信息数据中的个人技能模块和目标分词获取所述当前待分类的人员档案对应人员对所述当前技能的掌握位置系数;所述目标分词为最大的所述余弦相似度对应的所述文本分词;

根据所述当前电子信息数据中的工作经历模块和所述目标分词,获取所述当前技能在所述工作经历模块的各个工作经历中的技能掌握程度和技能必要程度;

根据所述技能掌握程度和所述技能必要程度,获取所述当前待分类的人员档案对应人员对所述当前技能的技能客观掌握水平;

根据所述掌握位置系数和所述技能客观掌握水平,获取所述当前待分类的人员档案对应人员对所述当前技能的技能掌握水平;

其中,获取所述当前任务的条件下各个所述待分类的人员档案对应人员的学习能力的方法为:对每一个所述待分类的人员档案的电子信息数据执行如下步骤:获取所述当前电子信息数据中的年龄数据;

获取所述当前电子信息数据中的教育经历部分包括的所述文本分词的第六数量;

根据所述年龄数据和所述第六数量获取第一学习能力;

获取各个所述工作经历的工作时长;

根据各个所述工作经历的工作时长、各个所述工作经历包括的所有技能的数量、所有所述技能必要程度以及所有所述技能客观掌握水平,计算各个所述工作经历体现的学习能力;

根据所述第一学习能力和各个所述工作经历体现的学习能力获取所述当前电子信息数据体现的学习能力;

将各个所述技能对应的所述任务需求指数按照预设顺序排序,得到第一序列;

将所述当前电子信息数据中对各个所述技能的所述技能掌握水平按照所述预设顺序排序,得到第二序列;

获取所述第一序列和所述第二序列的相关系数;

根据所述当前电子信息数据体现的学习能力和所述相关系数,获取所述当前任务的条件下所述当前待分类的人员档案对应人员的学习能力;第四获取模块,用于根据所述当前任务所需的技能、所述技能掌握水平和所述学习能力,获取每两个所述待分类的人员档案的电子信息数据的聚类距离;

聚类处理模块,用于根据所述聚类距离对各个所述待分类的人员档案的电子信息数据进行聚类处理;

保存模块,用于保存所述聚类结果。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的面向档案管理的电子信息数据分类方法的步骤。