知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种基于深度学习的大学生专业推荐方法

面议

专利号： 2019102939089

申请人：淮阴工学院

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2025-03-25

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于深度学习的大学生专业推荐方法，其特征在于，具体步骤如下：(1)对学生的基本信息和核心课程信息进行数据预处理得到数据集Student、Course以及Rating；

(2)搭建深度学习神经网络模型；

(2.1)设置嵌入矩阵的维度为embedim＝32；

(2.2)设置StuID的个数为stu_max,性别Gender不同的个数为gender_max,入学年份EnterYear不同的个数为enteryear_max,院系Profession不同的个数为profession_max；

(2.3)设置核心课程的CourseID的个数为Courseid_max,核心课程名称KCMC的个数为KCMC_max；

(2.4)设置文本卷积的活动窗口每次滑动2，3，4，5个词语，卷积核数目filter_number＝8；

(2.5)迭代次数为100次，批训练数目为256，正则化dropout为0.5，学习效率LearningRate为0.0001；

(2.6)搭建Student特征对象的神经网络模型(2.7)在神经网络第一层运用了嵌入层，维度分别为(N,32)和(N,16)；

(2.8)从嵌入层索引出特征之后，将各特征传入第一层全连接层，运用ReLU作为激活函数；

(2.9)将得到的特征传入第二层全连接层，输出200个单元个数，运用tanh作为激活函数；

(2.10)搭建核心课程Course特征对象的神经网络模型；

(2.11)在神经网络第一层运用了嵌入层，维度分别为(N,32)；

(2.12)将核心课程所属的一个或多个专业的多个嵌入向量做加和，即对特征矩阵求和；

(2.13)对核心课程名KCMC进行文本卷积；

(2.14)从嵌入矩阵中得到核心课程名对应的各个词语的嵌入向量；

(2.15)选择不同尺寸的卷积核Window_size；

(2.16)2<＝Window_size<＝5；

(2.17)对文本嵌入层使用卷积核做卷积和最大池化；

(2.18)Window_size＝Window_size+1，如果Window_size<＝5则返回步骤(2.16)，否则执行步骤(2.19)；

(2.19)运用dropout层防止过拟合；

(2.20)将核心课程CourseID和核心课程所属专业Genres作第一层全连接，运用ReLU作为激活函数；

(2.21)由第一层全连接得到的特征与核心课程名KCMC作第二层全连接，运用tanh作为激活函数；

(3)构建Tensorflow计算图；

(3.1)为Student数据集里的StuID，Gender，EnterYear以及Profession设置占位符；

(3.2)为Course数据集中的CourseID，KCMC以及Genres设置占位符；

(3.3)为目标预测成绩target，学习效率LearningRate以及正则化dropout设置占位符；

(3.4)获取输入的占位符、Student数据集中的4个嵌入向量以及Course数据集中的3个嵌入向量；

(3.5)得到学生Student和核心课程Course的特征；

(3.6)将学生信息特征和核心课程信息特征做矩阵乘法得到一个预测的成绩CJ；

(3.7)计算MSE损失；

(3.8)利用AdamOptimizer优化器优化损失值；

(4)获取到学生信息特征和核心课程信息特征训练神经网络模型；

(5)生成学生信息特征矩阵和核心课程特征矩阵；

(6)给学生推荐专业；

(6.1)计算当前所选的核心课程与整个核心课程特征矩阵的余弦相似度；

(6.2)取相似度最大的随机选择的top_k个核心课程；

(6.3)通过对所选的top_k个核心课程进行专业映射，得到每个核心课程所对应的多个专业；

(6.4)每次重复选择的专业就在此专业上加1个权重，最终得到top_x个专业。

2.根据权利要求1所述的一种基于深度学习的大学生专业推荐方法，其特征在于，所述步骤(1)中得到数据集Student、Course以及Rating的具体步骤如下：(1.1)定义Student为学生信息数据集，Course为核心课程数据集，Rating为课程成绩数据集，定义StuID、Gender、EnterYear、Profession分别为学生学号、学生性别、学生入学年份以及学生所属院系；定义CourseID、KCMC、Genres、CJ为核心课程ID、核心课程名称、核心课程所属的一个或多个专业以及成绩；并且满足关系Student＝{StuID,Gender,EnterYear,Profession}，Course＝{CourseID,KCMC,Genres}，Rating＝{StuID,CourseID,CJ}；

(1.2)读取Student中的Gender属性中的数据，将性别‘男’转换为数字1，性别‘女’转换为数字0；读取Course数据集中Genres属性中的数据，将其中属于文本数据类型的专业名称Pro1转换为数字字典D1，最后将D1转换为等长的数字列表D2，利用‘’对应的数字填充空白部分，长度为18；同理，在处理Course数据集中KCMC属性中的数据时，将其中属于文本数据类型的核心课程名称Course1转换为数字字典D3，最后将D3转换为等长的数字列表D4，利用‘’对应的数字填充空白部分，长度为15；

(1.3)合并数据集Student，Course以及Rating，得到Pandas对象Data；

(1.4)将Rating表拆分为X和Y两张表，X＝{StuID,CourseID}，Y＝{CJ}。

3.根据权利要求1所述的一种基于深度学习的大学生专业推荐方法，其特征在于，所述步骤(4)中获取到学生信息特征和核心课程信息特征训练神经网络模型的具体步骤如下：(4.1)搜索相关数据给tensorboard画图使用；

(4.2)跟踪数据的梯度值和稀疏性；

(4.3)定义循环变量g和损失值grandiens,循环变量g用来遍历损失值grandiens；

(4.4)如果g＝＝none，则执行步骤(4.6)，否则执行步骤(4.5)；

(4.5)根据损失值grandiens绘出loss的直方图和显示标量信息；

(4.6)输出模型运行时间，训练损失值以及迭代次数；

(4.7)定义循环变量i，定义迭代次数为epochs,i用来遍历迭代次数epochs,初始变量i＝0；

(4.8)如果i<＝100，则执行步骤(4.9)，否则执行步骤(4.40)；

(4.9)将数据集分为训练集和测试集，测试集占0.2，训练集占0.8，随机种子不固定；

(4.10)批量读取数据，每次256条；